Inferência Estatística
–
– Medidas de Tendência Central –
– Medidas de Variação –
– Medidas de Posição –
Característica amostra população
Somatório de um conjunto de valores
Valores individuais dos dados x i x i
Número de valores (tamanho do conjunto) n N
Média aritmética Desvio padrão s 2 s 2 Variância Range (amplitude) R - x
Notações Estatísticas
Medidas de Tendência Central
Média Mediana
Moda
Média
Média aritmética, ou simplesmente média, de um
conjunto de valores é o valor obtido somando-se todos eles e dividindo-se o total pelo número de valores.
É , de modo geral, a mais importante de todas as
mensurações numéricas descritivas.
Propriedade: centro do conjunto de dados, no sentido de
que é um ponto de equilíbrio dos mesmos.
Notação: se média é calculada sobre uma amostra
μ se a média é calculada sobre toda a população
x
Mediana
A mediana de um conjunto de valores é o valor do meio desse conjunto, quando os valores estão dispostos em ordem crescente (ou decrescente).
Se o número de valores for ímpar, a mediana é o
número localizado exatamente no meio da lista
Se o número de valores for par, a mediana é a média
dos dois valores do meio.
Moda
A moda de um conjunto de dados é o valor que ocorre com maior freqüência
Quando dois valores ocorrem com a mesma freqüência
máxima, cada um deles é uma moda, e o conjunto se diz bimodal.
Quando nenhum valor é repetido, o conjunto não tem
moda.
Ponto Médio
O ponto médio é o valor que está a meio caminho entre o maior e o menor valor.
Para obter o ponto médio, soma-se esses valores
Observação
Como vimos, há diferentes maneiras de definir o centro de um conjunto de dados.
Ao nos referirmos ao valor médio de um conjunto de dados, devemos ser precisos, mencionando o termo exato como média, mediana, moda ou ponto médio.
Média de uma tabela de freqüências
Quando os dados estão resumidos em uma tabela de
freqüências, podemos aproximar a média substituindo os limites de classes pelos pontos médios das classes e supondo que todos os elementos da classe se
concentrem no respectivo ponto médio.
O número de valores é igual à soma das freqüências
f
f x
.
x
x = ponto médio de cada classef = freqüência
Exemplo
Das diferentes medidas de tendência central
apresentadas, a moda é a única que pode ser usada com dados em nível nominal de mensuração.
Exemplo: Um estudo sobre tempos de reação abrangeu 30 canhotos, 50 destros e 20 ambidestros. Embora não
possa tomar a média numérica dessas características, podemos afirmar que a moda é destra, que é a
Comparação entre média, mediana e
moda
Assimetria
Uma distribuição de dados é simétrica quando a metade
esquerda é aproximadamente a imagem-espelho da metade direita.
média=moda=mediana
Assimetria
média moda mediana média moda medianaAssimétrica para a esquerda (negativamente assimétrica) média e mediana à esquerda da moda
Assimétrica para a direita (positivamente assimétrica) média e mediana à direita da moda
Exercícios
Tempo de espera (em minutos) de clientes
Banco 1 (fila única) 6,5 6,6 6,7 6,8 7,1 7,3 7,4 7,7 7,7 7,7 Banco 2 (fila múltipla) 4,2 5,4 5,8 6,2 6,7 7,7 7,7 8,5 9,3 10,0
Banco 1 e 2: média=7,15 mediana= 7,20 moda=7,7
ponto médio=7,10
Tempo de espera no banco praticamente o mesmo.
Por que os clientes preferem a fila única?
Medidas de variação
Amplitude Desvio-padrão
Amplitude
A amplitude de um conjunto de dados é a diferença entre o maior valor e o menor valor.
Desvantagem: não leva em conta todos os valores Exemplo Banco 1: 7,7 – 6,5 = 1,2 min
Banco 2: 10,0 – 4,2 = 5,8 min
Banco 2 maior variação
Desvio-padrão de uma amostra
O desvio-padrão de um conjunto de valores amostrais é uma medida de variação dos valores em relação à média
É a mais importante e mais útil medida de variação Leva em conta todos os valores
É expresso na mesma unidade dos dados originais
1
n
x
x
s
n 1 i 2 i
x média da amostra xi valores: i =1 ,... , n n: tamanho da amostraExemplo Banco 1: 0,48 min Banco 2: 1,82 min
Desvio-padrão de uma amostra
1
22
n
x
s
n
x
i
Desvio-padrão da população ?
Por
que N e não N-1???
N x n 1 i 2 i
média da população xi valores: i =1 ,... , N N: tamanho da populaçãoExemplo: se os 10 valores do exemplo dos bancos
constituíssem uma população, o desvio-padrão seria: Banco 1: 0,45 min
Variância
1
n
x
x
s
n 1 i 2 i 2
s2:variância amostral
N
x
n i i
1 2 2
2 : variância populacionalOutra notação: SD (standard deviation) para o desvio-padrão Var para variância
ou ou
N
x
N
x
i
2 2 2
1
2 2 2
n
x
S
n
x
iVariância
1
n
x
x
s
n 1 i 2 i 2
s2 : variância amostral
N
x
n 1 i 2 i 2
2 : variância populacionalOutra notação: SD (standard deviation) para o desvio-padrão Var para variância
Exercícios
Com base nos dados abaixo:
a) Construa uma tabela com quatro classes de grupos, com
frequência absoluta e relativa de cada classe.
b) Determine a moda, média, desvio-padrão e variância dos
valores apresentados
Em uma determinada sala de aula de engenharia da Fainor existem 10 alunos, os mesmos possuem as seguintes idades: 17,18,18,19,19,20,22,25,26,30.
Resolução:
Primeiramente vamos atender o enunciado da questão que
diz na letra a o seguinte - Construa uma tabela com quatro
classes de grupos, com frequência absoluta(Fa) e relativa
de cada classe.
Então vamos dividir os dados em quatro grupos ou classes da
maneira que eu quiser desde que todos os elementos sejam incluídos. Como por exemplo:
17,18,18,19,19,20,22,25,26,30
Classe 1: 17├ 19 (17,18,18) total (Fa) 3 elementos;
Classe 2: 19├ 22 (19,19,20) total (Fa) 3 elementos;
Classe 3: 22├ 25 (22) total (Fa) 1 elementos e
Resolução:
Agora que já dividimos em classes e determinamos a Fa
vamos determinar a frequência relativa (Fr). Fr é calculada pela divisão da Fa pelo tamanho da amostra que neste caso é 10.
Classe 1: 17├ 19 (17,18,18) total (Fa) 3 elementos;
Classe 2: 19├ 22 (19,19,20) total (Fa) 3 elementos;
Classe 3: 22├ 25 (22) total (Fa) 1 elementos e
Classe 4: 25├ 31 (25,26,30) total (Fa) de 3 elementos Calculemos:
Classe 1 Fr = 3/10 => 0,30 Classe 2 Fr = 3/10 => 0,30 Classe 3 Fr = 1/10 => 0,10 Classe 4 Fr = 3/10 => 0,30
Resolução:
Agora que já temos todos os elementos para construção
da nossa tabela vamos a ela.
Para construirmos uma tabela devemos lembrar dos
Resolução:
Classes de idades Frequência Absoluta Frequência Relativa (%) 17├ 19 3 30 19├ 22 3 30 22├ 25 1 10 25├ 31 3 30 Total 10 100Titulo: Classes de idades dos alunos de uma determinada sala de aula de engenharia da Fainor e suas frequências absolutas e relativas
Resolução:
Letra b do exercício (Determine a moda, média, desvio-padrão e variância ...); Primeiramente a Moda (M) que para resolver basta listar em ordem crescente
os valores e verificar qual ou quais possuem as maiores frequências
17,18,18,19,19,20,22,25,26,30 17 = 1; 18 = 2; ---maior frequência 19 = 2;--- maior frequência 20 = 1; 22 = 1; 25 = 1; 26 = 1; 30 = 1
Temos duas idades com frequências superiores as demais, ou seja, esses valores são a moda. Como são dois valores dizemos que é bimodal.
Resolução:
Letra b do exercício (Determine a moda, média, variância e desvio-padrão...); Agora vamos a Média ( ) que consiste em somar todos os valores no caso as
idades e dividir pelo total de idades, ou seja, 10 neste caso.
=17+18+18+19+19+20+22+25+26+30 10 = 214=> 21,4 10 X
X
X
Resolução:
Agora vamos a variância como sugestão recomendo fazer uma tabela simples de resolução que ajuda muito.
Idades x2 --- 17 289 --- 18 324 --- 18 324 --- 19 361 --- 19 361 --- 20 400 --- 22 484 --- 25 625 --- 26 676 --- 30 900 = 214 --- = --- 4.744 2 i x xi
N
x
N
x
i
2 2 2
Resolução:
Agora basta substituir os valores na formula, lembrando que neste caso estamos usando a formula para população e não a de amostra
N
x
N
x
i
2 2 2
2 i x xi = 214 = 4.744 N = 10 = 4.744 – (214) 2/10 10 = 4.744 – (45796)/10 10 = 4.744 – 4579,60 10 = 164,40Resolução:
Agora só falta fazer o desvio padrão que é simplesmente a raiz quadrada da variância 2 i x xi = 214 = 4.744 N = 10 = 4.744 – (214) 2/10 10 = 4.744 – (45796)/10 10 = 4.744 – 4579,60 10 = 164,40 10 = 16,44 variância
N
x
s
N
x
i
2 2 Raiz de 16,44 = 4.06 Desvio PadrãoExercícios
Determine a amplitude, a variância e o desvio-padrão dos conjuntos de dados
1. resíduos de nitrato (em Kg por hectare) como parte da chuva ácida em Massachusetts de julho a setembro de 2003.
6,40 5,21 4,66 5,24 6,96 5,53 8,23 6,80 5,78 6,00 5,41 2. Pesos (em Kg) de papel e plástico descartados em
residências durante uma semana.
Papel: 9,55 6,38 2,80 6,98 6,33 6,16 10,00 12,29 Plástico: 2,19 2,10 1,41 0,63 0,92 1,40 1,74 2,87