Aula Introdutória Aula Introdutória
Autoria de
Prof. Carlos Alberto (Caio) Dantas
FORMATAÇÃO & DESIGN Cléber da Costa Figueiredo figuecl@usp.br Thiago Rodrigo Alves Carneiro thiagorodrigo@ime.usp.br
• A Estatística originou-se com a coleta e construção de tabelas de dados para o governo.
• A situação evoluiu e esta coleta de dados representa somente um dos aspectos da Estatística.
O Que é Estatística?
O Que é Estatística?
Estatística Estatística
População Características
Amostra
Informações contidas nos dados
Conclusões sobre as
características da população
Técnicas de amostragem
Análise descritiva Inferência
estatística
Amostragem Amostragem
É a area da Estatística que trata da obtenção de amostras que sejam
representativas da população
Exemplos de utilização: Pesquisa de Mercado, Pesquisa de opinião pública,
Ensaios de medicamentos e em
praticamente todo experimento.
Estatística
Estatística Descritiva Descritiva
A disponibilidade de uma
grande quantidade de dados e de métodos computacionais
muito eficientes revigorou esta
área da Estatística.
Inferência Estatística Inferência Estatística
A inferência estatística procura com base nos dados amostrais tirar conclusões sobre a
população.
Probabilidade Probabilidade
A inferência estatística baseia-
se na Teoria das Probabilidades que constrói modelos para os
fenômenos aleatórios, isto é ,
aqueles em que está presente a
incerteza.
Exemplo: Intenção de
Exemplo: Intenção de voto voto
Numa pesquisa eleitoral, um
Instituto de Pesquisa procura, com base nos resultados de um
levantamento aplicado a uma amostra da população, prever o
resultado da eleição.
Considere o Candidato “A”
Considere o Candidato “A”
Denomine por a proporção de pessoas que votarão em “A” na eleição.
Denomine por a proporção de pessoas no levantamento de opinião (amostra) que expressam intenção de voto em “A”.
^ p
p
Podemos usar o valor de Podemos usar o valor de para estimar a proporção para estimar a proporção
da população.
da população.
p ^ p
Estimação
Estimação
Evolução da intenção de voto para prefeito de São Paulo Evolução da intenção de voto para prefeito de São Paulo realizada entre os dias 29 e 30 de outubro de 2004 (2º Turno).
realizada entre os dias 29 e 30 de outubro de 2004 (2º Turno).
Pesquisa contratada pela TV Globo, em % do total de votos.Pesquisa contratada pela TV Globo, em % do total de votos.
A pesquisa ouviu 2.000 eleitores - Margem de erro de 2 % com A pesquisa ouviu 2.000 eleitores - Margem de erro de 2 % com
95% de confiança.
95% de confiança.
Estatística Descritiva Estatística Descritiva
Etapa inicial da análise utilizada para descrever e
resumir os dados
Exemplo Exemplo
Arquivo
Arquivo Pulse Pulse do Minitab do Minitab
Refere-se a um experimento feito por alunos.
Cada aluno registrou sua altura, peso, sexo, hábito de fumar, nível de atividade física
usual e pulsação em repouso.
Então todos eles jogaram moedas e aqueles que tiraram cara fizeram corrida estacionária
por um minuto.
Depois disso todos os alunos mediram
novamente sua pulsação.
Informações do arquivo
Informações do arquivo Pulse Pulse
Information of the worksheet Information of the worksheet
Column Count
Column Count Name Name C1 92 Pulse1 C1 92 Pulse1 C2 92 Pulse2 C2 92 Pulse2
C3 92 Ran (1:correu, 2:não correu) C3 92 Ran (1:correu, 2:não correu)
C4 92 Smokes (1:fumante, 2:não fumante) C4 92 Smokes (1:fumante, 2:não fumante)
C5 92 Sex (1:masculino, 2:feminino) C5 92 Sex (1:masculino, 2:feminino)
C6 92 Height C6 92 Height C7 92 Weight C7 92 Weight
C8 92 Activity (1:leve, 2:moderada, 3:forte) C8 92 Activity (1:leve, 2:moderada, 3:forte)
(Pulsação antes de correr) (Pulsação antes de correr) (Pulsação depois de correr) (Pulsação depois de correr)
MTB > INFO
MTB > INFO
Pulse1 Pulse2 Ran Smokes Sex Height Weight ActivityPulse1 Pulse2 Ran Smokes Sex Height Weight Activity 64 88 1 2 1 66.00 140 2
64 88 1 2 1 66.00 140 2 58 70 1 2 1 72.00 145 2 58 70 1 2 1 72.00 145 2 62 76 1 1 1 73.50 160 3 62 76 1 1 1 73.50 160 3 66 78 1 1 1 73.00 190 1 66 78 1 1 1 73.00 190 1 64 80 1 2 1 69.00 155 2 64 80 1 2 1 69.00 155 2 74 84 1 2 1 73.00 165 1 74 84 1 2 1 73.00 165 1 84 84 1 2 1 72.00 150 3 84 84 1 2 1 72.00 150 3 68 72 1 2 1 74.00 190 2 68 72 1 2 1 74.00 190 2 62 75 1 2 1 72.00 195 2 62 75 1 2 1 72.00 195 2
...
...
Informações do arquivo Pulse
Informações do arquivo Pulse
Diâmetro
Diâmetro AlturaAltura VolumeVolume
8,3 70 10,3 12,9 85 33,8
8,6 65 10,3 13,3 86 27,4
8,8 63 10,2 13,7 71 25,7
10,5 72 16,4 13,8 64 24,9
10,7 81 18,8 14,0 78 34,5
10,8 83 19,7 14,2 80 31,7
11,0 66 15,6 14,5 74 36,3
11,0 75 18,2 16,0 72 38,3
11,1 80 22,6 16,3 77 42,6
11,2 75 19,9 17,3 81 55,4
11,3 79 24,2 17,5 82 55,7
11,4 76 21,0 17,9 80 58,3
11,4 76 21,4 18,0 80 51,5
11,7 69 21,3 18,0 80 51,0
12,0 75 19,1 20,6 87 77,0
12,9 74 22,2
Arquivo “Trees” do Minitab
Arquivo “Trees” do Minitab
Classificação Classificação
NOMINAL NOMINAL NOMINAL NOMINAL ORDINAL ORDINAL ORDINAL ORDINAL QUALITATIVA
QUALITATIVA QUALITATIVA QUALITATIVA
QUANTITATIVA QUANTITATIVA QUANTITATIVA QUANTITATIVA
CONTÍNUA CONTÍNUA CONTÍNUA CONTÍNUA DISCRETA DISCRETA DISCRETA DISCRETA
peso, altura
número de filhos, número de carros sexo, cor dos olhos
classe social, grau de instrução
Variável Variável
Qualquer característica associada a uma população.
Variáveis Quantitativas Variáveis Quantitativas
Mínimo, Máximo, Moda, Média, Mediana, Quartis
Amplitude, Intervalo-Interquartil, Variância, Desvio Padrão, Coeficiente de Variação
MEDIDAS DE POSIÇÃO:
MEDIDAS DE DISPERSÃO:
Máximo (max):
Máximo (max): a maior observação a maior observação Mínimo (min):
Mínimo (min): a menor observação a menor observação Moda (mo):
Moda (mo): é o valor (ou atributo) que é o valor (ou atributo) que ocorre com maior frequência.
ocorre com maior frequência.
Medidas de Posição Medidas de Posição
Ex.: 4, 5, 4, 6, 5, 8, 4 Ex.: 4, 5, 4, 6, 5, 8, 4
mo = 4 mo = 4 max = 8
max = 8 min = 4 min = 4
Ex: 2, 5, 3, 7, 8
2+5+3+7+8
5 = 5
n x n
x x
x x x
n
i i
n
1
2 3...
1Média Média
- X =
Valor que deixa
Valor que deixa 50% 50% das observações à sua esquerda das observações à sua esquerda
Ex(A): 2, 5, 3, 7, 8
Dados ordenados: 2, 3, 5, 7, 8 Md = 5
Ex(B): 3, 5, 2, 1, 8, 6
Dados ordenados: 1, 2, 3, 5, 6, 8 Md = (3 + 5) / 2 = 4
Mediana (Md) Mediana (Md)
A mediana pode ser obtida ordenando-se os dados e A mediana pode ser obtida ordenando-se os dados e
encontrando-se o valor que corresponde a posição encontrando-se o valor que corresponde a posição
(n+1)/2, se
(n+1)/2, se n n for ímpar. for ímpar.
Se Se n n for par, a mediana corresponde a média for par, a mediana corresponde a média
aritmética dos valores da posição anterior e posterior aritmética dos valores da posição anterior e posterior
a (n+1)/2.
a (n+1)/2.
Primeiro Quartil (Q1):
Primeiro Quartil (Q1): valor que deixa 25% valor que deixa 25%
das observações à sua esquerda.
das observações à sua esquerda.
Terceiro Quartil (Q3):
Terceiro Quartil (Q3): valor que deixa 75% valor que deixa 75%
das observações à sua esquerda.
das observações à sua esquerda.
Ex(A): 1,9 2,0 2,1 2,5 3,0 3,1 3,3 3,7 6,1 7,7 Md = 3,05 Q1 = 2,05 Q3 = 4,9
Ex(B): 0,9 1,0 1,7 2,9 3,1 5,3 5,5 12,2 12,9 14,0 33,6 Md = 5,3 Q1 = 1,7 Q3 = 12,9
1º e 3º Quartil
1º e 3º Quartil
Grupo 1: 3,4,5,6,7 Grupo 2: 1, 3, 5, 7, 9 Grupo 3: 5,5,5,5,5
Temos: x
1= x
2= x
3= 5 md
1= md
2= md
3= 5 Exemplo: Considere as notas de um teste de Exemplo: Considere as notas de um teste de
3 grupos de alunos 3 grupos de alunos
G 1 0 10
* * * * *
G 2 0 * * * * * 10
G 3 0 10
*
*
*
*
*
Amplitude (A): máximo - mínimo [máx - min]
Amplitude (A): máximo - mínimo [máx - min]
Medidas de Dispersão Medidas de Dispersão
Finalidade: encontrar um valor que resuma a Finalidade: encontrar um valor que resuma a
variabilidade de um conjunto de dados variabilidade de um conjunto de dados
Para os grupos anteriores, temos:
Para os grupos anteriores, temos:
Grupo 1, A = 4
Grupo 1, A = 4
Grupo 2, A = 8
Grupo 2, A = 8
Grupo 3, A = 0
Grupo 3, A = 0
É a diferença entre o terceiro quartil e o primeiro quartil, ou seja, Q3 - Q1
Ex.(A): 1,9 2,0 2,1 2,5 3,0 3,1 3,3 3,7 6,1 7,7
Q1 = 2,05 e Q3= 4,9 Q3 - Q1 = 4,9 - 2,05 = 2,85
Intervalo-Interquartil
Intervalo-Interquartil
n
x x
n
x x
x x
x x
n i
i
n
12 2
2 2
2 2 1
) ) (
( ...
) (
)
(
Variância ão
DesvioPadr
Variância e Desvio Padrão
Variância e Desvio Padrão
Grupo 1: 3,4,5,6,7 Grupo 2: 1, 3, 5, 7, 9 Grupo 3: 5,5,5,5,5
Temos: x
1= x
2= x
3= 5 md
1= md
2= md
3= 5 Exemplo: Considere as notas de um teste de Exemplo: Considere as notas de um teste de
3 grupos de alunos 3 grupos de alunos
G 1 0 10
* * * * *
G 2 0 * * * * * 10
G 3 0 10
*
*
*
*
*
Variância para os Grupos 1, 2 e 3 Variância para os Grupos 1, 2 e 3
G1:
2= 2,0 = 1, 41
G2:
2= 8 = 2,83
G3:
2= 0 = 0
Fórmulas Alternativas Fórmulas Alternativas
n 2
1 i
i n
1 i
2 i n 2
1 i
2 i 2
n x x 1
n 1
x n n x
1
Exemplo: Considere o grupo G1
2,05 125 10
5 135 5 1
5 5 135
1
135 49
36 25
16 9
7 6
5 4
3
2 2
2 2
2 2
2 1
2
n i
xi
• é uma medida de dispersão relativa é uma medida de dispersão relativa
• elimina o efeito da magnitude dos dados elimina o efeito da magnitude dos dados
• exprime a variabilidade em relação à média exprime a variabilidade em relação à média
%
100
x CV
Coeficiente de Variação (CV)
Coeficiente de Variação (CV)
Exemplo 1 Exemplo 1
Altura e peso de alunos
Altura 1,143m 0,063m 5,5%
Peso 50 kg 6kg 12%
Média
DesvioPadrão Coef. de VariaçãoConclusão: Os alunos são duas vezes mais
dispersos quanto ao peso do que quanto à altura
Exemplo 2 Exemplo 2
Alturas de meninos e homens adultos de uma população.
Conclusão: Em relação às médias, as alturas dos
homens e dos meninos apresentam variabilidade quase iguais.
Desvio
Padrão Coef. De
Variação Média