• Nenhum resultado encontrado

Inferência Estatística. Medidas de Tendência Central Medidas de Variação Medidas de Posição

N/A
N/A
Protected

Academic year: 2021

Share "Inferência Estatística. Medidas de Tendência Central Medidas de Variação Medidas de Posição"

Copied!
32
0
0

Texto

(1)

Inferência Estatística

– Medidas de Tendência Central –

– Medidas de Variação –

– Medidas de Posição –

(2)

Característica amostra população

 

Somatório de um conjunto de valores

Valores individuais dos dados x i x i

Número de valores (tamanho do conjunto) n N

Média aritmética  Desvio padrão s   2 s 2 Variância Range (amplitude) R - x

Notações Estatísticas

(3)

Medidas de Tendência Central

 Média

 Mediana

 Moda

(4)

Média

Média aritmética, ou simplesmente média, de um

conjunto de valores é o valor obtido somando-se todos eles e dividindo-se o total pelo número de valores.

 É , de modo geral, a mais importante de todas as

mensurações numéricas descritivas.

 Propriedade: centro do conjunto de dados, no sentido de

que é um ponto de equilíbrio dos mesmos.

Notação: se média é calculada sobre uma amostra

μ se a média é calculada sobre toda a população

x

(5)

Mediana

A mediana de um conjunto de valores é o valor do meio desse conjunto, quando os valores estão dispostos em ordem crescente (ou decrescente).

 Se o número de valores for ímpar, a mediana é o

número localizado exatamente no meio da lista

 Se o número de valores for par, a mediana é a média

dos dois valores do meio.

(6)

Moda

A moda de um conjunto de dados é o valor que ocorre com maior freqüência

 Quando dois valores ocorrem com a mesma freqüência

máxima, cada um deles é uma moda, e o conjunto se diz bimodal.

 Quando nenhum valor é repetido, o conjunto não tem

moda.

(7)

Ponto Médio

O ponto médio é o valor que está a meio caminho entre o maior e o menor valor.

 Para obter o ponto médio, soma-se esses valores

(8)

Observação

Como vimos, há diferentes maneiras de definir o centro de um conjunto de dados.

Ao nos referirmos ao valor médio de um conjunto de dados, devemos ser precisos, mencionando o termo exato como média, mediana, moda ou ponto médio.

(9)

Média de uma tabela de freqüências

 Quando os dados estão resumidos em uma tabela de

freqüências, podemos aproximar a média substituindo os limites de classes pelos pontos médios das classes e supondo que todos os elementos da classe se

concentrem no respectivo ponto médio.

 O número de valores é igual à soma das freqüências

f

f x

.

x

x = ponto médio de cada classe

f = freqüência

(10)

Exemplo

Das diferentes medidas de tendência central

apresentadas, a moda é a única que pode ser usada com dados em nível nominal de mensuração.

Exemplo: Um estudo sobre tempos de reação abrangeu 30 canhotos, 50 destros e 20 ambidestros. Embora não

possa tomar a média numérica dessas características, podemos afirmar que a moda é destra, que é a

(11)

Comparação entre média, mediana e

moda

(12)

Assimetria

 Uma distribuição de dados é simétrica quando a metade

esquerda é aproximadamente a imagem-espelho da metade direita.

média=moda=mediana

(13)

Assimetria

média moda mediana média moda mediana

Assimétrica para a esquerda (negativamente assimétrica) média e mediana à esquerda da moda

Assimétrica para a direita (positivamente assimétrica) média e mediana à direita da moda

(14)

Exercícios

 Tempo de espera (em minutos) de clientes

Banco 1 (fila única) 6,5 6,6 6,7 6,8 7,1 7,3 7,4 7,7 7,7 7,7 Banco 2 (fila múltipla) 4,2 5,4 5,8 6,2 6,7 7,7 7,7 8,5 9,3 10,0

Banco 1 e 2: média=7,15 mediana= 7,20 moda=7,7

ponto médio=7,10

Tempo de espera no banco praticamente o mesmo.

Por que os clientes preferem a fila única?

(15)

Medidas de variação

 Amplitude

 Desvio-padrão

(16)

Amplitude

A amplitude de um conjunto de dados é a diferença entre o maior valor e o menor valor.

Desvantagem: não leva em conta todos os valores Exemplo Banco 1: 7,7 – 6,5 = 1,2 min

Banco 2: 10,0 – 4,2 = 5,8 min

 Banco 2 maior variação

(17)

Desvio-padrão de uma amostra

O desvio-padrão de um conjunto de valores amostrais é uma medida de variação dos valores em relação à média

 É a mais importante e mais útil medida de variação  Leva em conta todos os valores

 É expresso na mesma unidade dos dados originais

1

n

x

x

s

n 1 i 2 i

 x média da amostra xi valores: i =1 ,... , n n: tamanho da amostra

Exemplo Banco 1: 0,48 min Banco 2: 1,82 min

(18)

Desvio-padrão de uma amostra

 

1

2

2

 

n

x

s

n

x

i

(19)

Desvio-padrão da população ?

Por

que N e não N-1???

N x n 1 i 2 i

      média da população xi valores: i =1 ,... , N N: tamanho da população

Exemplo: se os 10 valores do exemplo dos bancos

constituíssem uma população, o desvio-padrão seria: Banco 1: 0,45 min

(20)

Variância

1

n

x

x

s

n 1 i 2 i 2

 s2:variância amostral

N

x

n i i

1 2 2

2 : variância populacional

Outra notação: SD (standard deviation) para o desvio-padrão Var para variância

ou ou

 

N

x

N

x

i

 

2 2 2

 

1

2 2 2

 

n

x

S

n

x

i

(21)

Variância

1

n

x

x

s

n 1 i 2 i 2

 s2 : variância amostral

N

x

n 1 i 2 i 2

 2 : variância populacional

Outra notação: SD (standard deviation) para o desvio-padrão Var para variância

(22)

Exercícios

Com base nos dados abaixo:

a) Construa uma tabela com quatro classes de grupos, com

frequência absoluta e relativa de cada classe.

b) Determine a moda, média, desvio-padrão e variância dos

valores apresentados

Em uma determinada sala de aula de engenharia da Fainor existem 10 alunos, os mesmos possuem as seguintes idades: 17,18,18,19,19,20,22,25,26,30.

(23)

Resolução:

 Primeiramente vamos atender o enunciado da questão que

diz na letra a o seguinte - Construa uma tabela com quatro

classes de grupos, com frequência absoluta(Fa) e relativa

de cada classe.

 Então vamos dividir os dados em quatro grupos ou classes da

maneira que eu quiser desde que todos os elementos sejam incluídos. Como por exemplo:

17,18,18,19,19,20,22,25,26,30

 Classe 1: 17├ 19 (17,18,18) total (Fa) 3 elementos;

 Classe 2: 19├ 22 (19,19,20) total (Fa) 3 elementos;

 Classe 3: 22├ 25 (22) total (Fa) 1 elementos e

(24)

Resolução:

 Agora que já dividimos em classes e determinamos a Fa

vamos determinar a frequência relativa (Fr). Fr é calculada pela divisão da Fa pelo tamanho da amostra que neste caso é 10.

 Classe 1: 17├ 19 (17,18,18) total (Fa) 3 elementos;

 Classe 2: 19├ 22 (19,19,20) total (Fa) 3 elementos;

 Classe 3: 22├ 25 (22) total (Fa) 1 elementos e

 Classe 4: 25├ 31 (25,26,30) total (Fa) de 3 elementos  Calculemos:

 Classe 1 Fr = 3/10 => 0,30  Classe 2 Fr = 3/10 => 0,30  Classe 3 Fr = 1/10 => 0,10  Classe 4 Fr = 3/10 => 0,30

(25)

Resolução:

 Agora que já temos todos os elementos para construção

da nossa tabela vamos a ela.

 Para construirmos uma tabela devemos lembrar dos

(26)

Resolução:

Classes de idades Frequência Absoluta Frequência Relativa (%) 17├ 19 3 30 19├ 22 3 30 22├ 25 1 10 25├ 31 3 30 Total 10 100

Titulo: Classes de idades dos alunos de uma determinada sala de aula de engenharia da Fainor e suas frequências absolutas e relativas

(27)

Resolução:

 Letra b do exercício (Determine a moda, média, desvio-padrão e variância ...);  Primeiramente a Moda (M) que para resolver basta listar em ordem crescente

os valores e verificar qual ou quais possuem as maiores frequências

17,18,18,19,19,20,22,25,26,30 17 = 1; 18 = 2; ---maior frequência 19 = 2;--- maior frequência 20 = 1; 22 = 1; 25 = 1; 26 = 1; 30 = 1

Temos duas idades com frequências superiores as demais, ou seja, esses valores são a moda. Como são dois valores dizemos que é bimodal.

(28)

Resolução:

 Letra b do exercício (Determine a moda, média, variância e desvio-padrão...);  Agora vamos a Média ( ) que consiste em somar todos os valores no caso as

idades e dividir pelo total de idades, ou seja, 10 neste caso.

=17+18+18+19+19+20+22+25+26+30 10 = 214=> 21,4  10 X

X

X

(29)

Resolução:

 Agora vamos a variância como sugestão recomendo fazer uma tabela simples de resolução que ajuda muito.

Idades x2 --- 17 289 --- 18 324 --- 18 324 --- 19 361 --- 19 361 --- 20 400 --- 22 484 --- 25 625 --- 26 676 --- 30 900 = 214 --- = --- 4.744  2 i xxi

 

N

x

N

x

i

 

2 2 2

(30)

Resolução:

 Agora basta substituir os valores na formula, lembrando que neste caso estamos usando a formula para população e não a de amostra

 

N

x

N

x

i

 

2 2 2

 2 i xxi = 214 = 4.744 N = 10 = 4.744 – (214) 2/10 10 = 4.744 – (45796)/10 10 = 4.744 – 4579,60 10 = 164,40

(31)

Resolução:

 Agora só falta fazer o desvio padrão que é simplesmente a raiz quadrada da variância  2 i xxi = 214 = 4.744 N = 10 = 4.744 – (214) 2/10 10 = 4.744 – (45796)/10 10 = 4.744 – 4579,60 10 = 164,40 10 = 16,44 variância

 

N

x

s

N

x

i

 

2 2 Raiz de 16,44 = 4.06 Desvio Padrão

(32)

Exercícios

Determine a amplitude, a variância e o desvio-padrão dos conjuntos de dados

1. resíduos de nitrato (em Kg por hectare) como parte da chuva ácida em Massachusetts de julho a setembro de 2003.

6,40 5,21 4,66 5,24 6,96 5,53 8,23 6,80 5,78 6,00 5,41 2. Pesos (em Kg) de papel e plástico descartados em

residências durante uma semana.

Papel: 9,55 6,38 2,80 6,98 6,33 6,16 10,00 12,29 Plástico: 2,19 2,10 1,41 0,63 0,92 1,40 1,74 2,87

Referências

Documentos relacionados

Os testes de desequilíbrio de resistência DC dentro de um par e de desequilíbrio de resistência DC entre pares se tornarão uma preocupação ainda maior à medida que mais

Sobre estas perspectivas procuro levantar alguns questionamentos durante esta investigação, tais como: a distopia relaciona com a realidade extra fílmicas do presente

O presente Termo Aditivo a Convenção Coletiva de Trabalho abrangerá a(s) categoria(s) EM INTERSECÇÃO COM O QUE CONSTA DOS REGISTROS SINDICAIS DAS PARTES, OU SEJA,

Diante dessa necessidade verificável de inserir as novas TICs no contexto educacional, assim como os gêneros digitais, já que o ensino de línguas, conforme os Parâmetros

Em conseqüência da minha presença a várias sessões recentes, durante as quais os Srs. Crookes e Varley dirigiram uma fraca corrente elétrica através do corpo

...negativos. As taxas de juros de longo prazo subiram no mês em função do aumento da incerteza global com a eleição de Trump e deterioração da estabilidade política no Brasil.

Já vimos que a mediana divide a sequência em duas partes que possuem 50% dos dados, mas existem outras divisões dos valores que podem apresentar quaisquer

Peso líquido 12 kg Dimensões (CxPxA) 530 x 450 x 165 mm PORTUGUÊS Armazenamento do pente e medida de documentos Suporte de documentos (tampa) Guia de bordas