Estat´ıstica B´asica

(1)

Estat´ıstica B´ asica

Silvia Emiko Shimakura & Paulo Justiniano Ribeiro Junior Departamento de Estat´ıstica-UFPR

Email: [email protected]

Resumo Resumo

Este curso apresenta uma introdu¸cão aos métodos estat´ısticos para modelagem de dados. Neste curso, o aluno pensará em problemas práticos de uma forma quantitativa e ganhará um entendimento dos princ´ıpios básicos em estat´ıstica. A obten¸cão de um conhecimento sólido das idéias básicas dará ao aluno confian¸ca para abordar métodos estat´ısticos mais avan¸cados que podem ser encontrados no futuro.

Conte´ udo

1. Introdu¸c˜ao: Por que Estat´ıstica?

2. Estat´ısticas Descritivas: sumário de dados, gráfico de barras, gráfico de setores, histograma, ramo-e-folhas, mediana, moda, desvio padrão, amplitude inter-quartis,...

3. Popula¸coes e amostras: usando amostras para aprender sobre a popula¸cão 4. Intervalos de confian¸ca: estimando a média populacional a partir de uma amostra 5. Testes de hipóteses: idéia básica e testes para uma amostra

6. Compara¸cão de dois grupos: As mensura¸cões num grupo tendem a ser maiores em média do que em outro?

7. Correla¸c˜ao: verificando se os valores de duas quantidades tendem a ser rela- cionadas

8. Regress˜ao: descrevendo como o comportamento de uma quantidade muda com o valor da outra

(2)

1 Introdu¸c˜ ao

1.1 O que ´ e Estat´ıstica?

Primeiro deve-se estabelecer o que se deseja dizer com “estat´ıstica”. Ela tem pelo menos trˆes significados:

1. cole¸cão de informa¸cões numéricas oudados,

2. medidas resultantes de um conjunto de dados, como por exemplo médias, 3. métodos usados na coleta e interpreta¸cão de dados.

Qual ´e o papel da estat´ıstica na ciˆencia?

• Na ciência, são realizados estudos experimentais ou observacionais, levando à cole¸cão de dadosnuméricos.

• O propósito da investiga¸cão é responder umaquestão cient´ıfica.

• O padrão de varia¸cãonos dados faz com que a resposta não seja óbvia.

• Em geral, a disciplina deestat´ısticarefere-se a métodos para coleta e descri¸cão dos dados, e então a verifica¸cão da for¸ca da evidência nos dados pró ou contra as idéias cient´ıficas. A presen¸ca de uma varia¸cão não previs´ıvel nos dados faz disso uma tarefa pouco trivial.

1.2 Varia¸c˜ ao Amostral

Alguns exemplos em que a varia¸c˜ao est´a presente nos dados podem ser encontrados em Landim (1997).

(3)

2 Estat´ıstica Descritiva

2.1 Tipos de dado

A interpreta¸cão das listas de números a olho é muito dif´ıcil. Ao invés disso, dever´ıamos produzir um resumo verbalounuméricoe/ou usarmétodos gráficospara descrever os pontos principais dos dados.

O m´etodo mais apropriado depender´a da natureza dos dados, e aqui podemos distinguir dois tipos principais:

1. Dados qualitativos ou categ´oricos que podem ser:

(a) nominais, por exemplo

• sexo: masculino, feminino

• classifica¸c˜ao de f´osseis

(b) ordinais, i.e. categorias ordenadas, tais como

• salinidade: baixa, m´edia, alta

• abundˆancia: dominante, abundante, frequente, ocasional, raro 2. Dados quantitativos ou num´ericosque podem ser:

(a) discretos, i.e. contagens ou n´umero inteiros, por exemplo

• n´umero de ovos postos pela tartaruga marinha

• n´umero de ataques de asma no ano passado

(b) cont´ınuos, i.e. medidas numa escala cont´ınua, tais como

• volume, ´area, peso, massa

• velocidade de corrente

As distin¸cões são menos r´ıgidas do que a descri¸cão acima insinua. Por exemplo, em geral tratar´ıamos idade como uma variável cont´ınua, mas se a idade for registrada pelo ano mais próximo, podemos trata-la como discreta, e se separarmos a amostra em

“crian¸cas”, “adultos jovens”, “idade média”, “velhos”, por exemplo, então temos faixa etária como uma variável ordenada categórica. No entanto, é recomendado em geral manter os dados em sua forma original, categorizando-os somente para propósitos de apresenta¸cão.

(4)

2.2 Dados qualitativos

Para sumarizar dados qualitativos numericamente, utiliza-secontagens, propor¸cões, percentagens, taxas por 1000, taxas por 1.000.000 etc., dependendo da escala apropriada. Por exemplo, se encontrarmos que 70 de 140 estudantes de geologia são homens, poder´ıamos relatar a taxa como uma propor¸cão (0,5) ou, provavelmente ainda melhor, como um percentual (50%). Se encontrarmos que 7 de uma amostra de 5000 pessoas são portadores de uma doen¸ca rara poder´ıamos expressar isto como uma propor¸cão observada (0,0014) ou percentual (0,14%), mas melhor seria 1,4 casos por mil.

2.2.1 Tabulando dados

Frequentemente o primeiro passo da descri¸cão de dados é criar uma tabela de frequência.

Por exemplo, as esp´ecies de “woodlice” caindo numa armadilha foram:

Species tally ni ni/N pi Percentage

Oniscus ||||||||||||||| 12 12/27 0.444 44.4%

Porcellio |||||||| 8 8/27 0.296 29.6%

Philoscia ||||| 5 5/27 0.185 18.5%

Armadilidium || 2 2/27 0.074 7.4%

N = 27 Σpi= 1

Num relatório, a segunda coluna não seria mostrada, e os dados seriam sumarizados num formato mais simples como mostrado abaixo. Se o maioria dos dados caem em poucas categorias, então é conveniente colapsar algumas das categorias com somente uma ou duas observa¸cões em outra categoria chamada “outros”.

Table showing the species of 27 woodlice that fell in a pit-fall trap:

Species Frequency Percentage

Oniscus 12 44.4%

Porcellio 8 29.6%

Philoscia 5 18.5%

Armadilidium 2 7.4%

Tabelas simples como esta s˜ao na maioria das vezes suficientes para descrever dados qualitativos especialmente quando existem somente duas ou trˆes categorias.

(5)

2.2.2 Resumindo numericamente

Considere o seguinte conjunto de dados que mostra os escores de abundância médios DAFORde ocorrência deNardus strictaem 100 áreas investigadas em Exmoor.

Dominante 8 Abundante 33 Frequente 32 Ocasional 17

Raro 10

A moda de um conjunto de dados categóricos é a categoria que tem o maior percentual de dados. Ela deve ser usada cuidadosamente como uma medida resumo global porque é muito dependente da forma como os dados são categorizados. Para os dados de “woodlice” a moda éOniscus. Para os dados acima, a categoria modal é

“Abundante”, mas por muito pouco.

A mediana, bem como a moda, podem ser calculadas paradados ordenados.

Este é valor do “meio”, mais comumente usado para dados quantitativos. A mediana não faz sentido para os dados “woodlice”. Para os dados de abundância, a categoria mediana é “Frequente”, porque 50% dos dados estão em categorias superiores, e menos do que 50% estão em categorias inferiores. A mediana é maisrobustado que a moda pois é menos sens´ıvel à categoriza¸cão adotada.

2.2.3 Gr´aficos de Barras

Dados qualitativos, particularmente quando as categorias são ordenadas, são usualmente bem ilustrados num simplesgráfico de barrasonde a altura da barra é igual

`a frequˆencia.

Rare Occasional Frequent Abundant Dominant

0102030

Frequency

(6)

2.2.4 Gr´afico de setores

Gráfico de setorestambém podem ser úteis para apresenta¸cão de dados categóricos ordenados. Os setores do gráfico são desenhados de tal forma que eles tenham área proporcional à frequência. Então para os dados “woodlice”, os ângulos seriam 0.444× 360 = 160^◦ paraOniscus, etc.

Oniscus

Porcellio Philoscia

Armadilidium

2.3 Dados quantitativos

2.3.1 Histograma

De longe o método mais comum de apresenta¸cão de dados numéricos é ohistograma, relacionado com o gráfico de barras para dados categóricos. As áreas dos retângulos resultantes devem ser proporcionais à frequência.

Algumas vezes é conveniente agregar classes de frequência nos extremos da distribui¸cão de forma que os intervalos tenham larguras diferentes. Cuidado ao fazer isso - um intervalo que é duas vezes a largura de um outro deve tem altura igual

à metada de sua frequência (para preservar a área contida dentro do intervalo) Da mesma forma um intervalo que é três vezes a largura dos outros deve ter um ter¸co da altura de sua frequência observada.

Exemplo. 150 peixes mortos foram encontrados v´ıtimas de contamin¸c˜ao do rio e seus comprimentos foram medidos em mil´ımetros. As medidas foram expressas na forma de tabela de frequˆencia.

Comprimento do peixe (mm) Frequˆencia

100-109 7

110-119 16

120-129 19

130-139 31

140-149 41

150-159 23

160-169 10

(7)

100 120 140 160 180

010203040

Fish lengths (mm)

Frequency

O histograma constru´ıdo desses dados ´e mostrado na Figura.

Gr´afico de Ramos-e-Folhas

Um método gráfico que merece ser mais amplamente utilizado quando a quantidade de dados não é muito grande é o gráfico deramos-e-folhascomo ilustrado a seguir.

Exemplo. Um estudo geoqu´ımico realizado utilizando amostras compostas de sedimentos de corrente com granulometria de 100-150meshe profundidade de 40cm, provenientes de riachos correndo sobre granulitos, revelou os seguintes resultados em ppm de Cr

10.6 14.1 13.7 15.2 15.4 12.5 12.9 14.3 13.0 12.6 12.0 14.0 10.0 18.2 11.5 9.4 16.5 13.7 14.7 16.6 11.4 18.4 17.4 11.1 15.8 17.0 13.6 16.6 11.8 15.8 13.5

Uma vez que a escala tenha sido determinada, a qual define os “ramos” à esquerda da linha veritcal, podemos facilmente escrever os dados no gráfico de ramos-e-folhas como no diagrama esquerdo; como um refinamento podemos então ordenar as “folhas”

no diagrama `a direita:

9 4

10 6 0

11 5 4 1 8

12 5 9 6 0

13 7 0 7 6 5

14 1 3 0 7

15 2 4 8 8

9 4

10 0 6

11 1 4 5 8

12 0 5 6 9

13 0 5 6 7 7

14 0 1 3 7

15 2 4 8 8

(8)

folhas devem ter um único d´ıgito). Nota: é importante escrever as folhas em colunas igualmente espa¸cadas, caso contrário pode resultar uma figura distorcida.

O gr´afico de ramos-e-folhas fornece um resumo visual dos dados sem que haja de fato a perda de qualquer informa¸c˜ao.

Compare-o com um histograma para os mesmos dados:

8 10 12 14 16 18 20

012345

Concentracao de Cr (ppm)

Frequency

(9)

2.3.2 Resumindo numericamente

Para resumir numericamente dados quantitativos o objetivo é escolher medidas apro- priadas de loca¸cão (“qual o tamanho dos números involvidos?”) e de dispersão (“quanta varia¸cão existe?”) para os tipos de dados.

Existem três escolhas principais para a medida de loca¸cão, a chamada “3 Ms”, as quais estão ligadas a certas medidas de dispersão como segue:

M ‘Dispers˜ao’

média(o valor ‘médio’) desvio padrão mediana(o valor do ‘meio’) IQR

moda (o valor ‘mais comum’) propor¸cão 2.3.3 Média, variância e desvio padrão

Para resumir dados quantitativos aproximadamente simétricos, é usual calcular a médiaaritmética como uma medida de loca¸cão. Se x1, x2, . . . , xn são os valores dos dados, então podemos escrever a média como

x= x1+x2+. . .+xn

n =

P_n

i=1xi

n ,

onde ‘P_n

i=1xi=x1+x2+. . .+xn’ e frequentemente ´e simplificada paraP xi ou at´e mesmoP

xque significa ‘adicione todos os valores dex’.

Avariânciaé definida como o ‘desvio quadrático médio da média’ e é calculada de uma amostra de dados como

s²= P_n

i=1(xi−x)²

n−1 =

P_n

i=1(x²_i)−nx² (n−1) .

A segunda versão é mais fácil de ser calculada, embora muitas calculadoras têm fun¸cões prontas para o cálculo de variâncias, e é raro ter que realisar todos os passos manualmente. Comumente as calculadoras fornecerão a raiz quadrada da variância, o desvio padrão, i.e.

s=√

variˆancia =√ s² a qual ´e medida nas mesmas unidades dos dados originais.

Uma inform¸cão útil é que para qualquer conjunto de dados, pelo menos 75% deles fica dentro de uma distância de 2 desvio padrão da média, i.e. entre ¯x−2se ¯x+ 2s.

Exemplo. Sete homens foram pesados, e os resultados em kg foram:

57.0, 62.9, 63.5, 64.1, 66.1, 67.1, 73.6.

Am´edia´e 454.3/7 = 64.9 kg,

avariânciaé (29635.05−454.3²/7)/6 = 25.16 kg² e odesvio padrãoé√

25.16 = 5.02 kg.

(10)

definidos como os valores abaixo dos quais estão um quarto e três quartos, respectivamente, dos dados. Estes três valores são frequentemente usados para resumir os dados juntamente com o m´ınimo e o máximo. Eles são obtidos ordenando os dados do menor para o maior, e então conta-se o número apropriado de observa¸cões: ou seja

é ⁿ⁺¹₄ , ⁿ⁺¹₂ e ³⁽ⁿ⁺¹⁾₄ para o quartil inferior, mediana e quartil superior, respectivamente. Para um número par de observa¸cões, a mediana é a média dos valores do meio (e analogamente para os quartis inferior e superior).

A medidade de dispersão é aamplitude inter-quartis, IQR = Q3−Q1, i.e. é a diferen¸ca entre o quartil superior e o inferior.

Exemplo. O n´umero de crian¸cas em 19 fam´ılias foi

0, 1, 1, 2, 2, 2, 2, 2, 3, 3, 3, 4, 4, 5, 6, 6, 7, 8, 10 Amediana´e o (19+1) / 2 = 10^ovalor, i.e. 3 crian¸cas.

O quartilinferioresuperiorsão os valores 5ôe 15ô, i.e. 2 e 6 crian¸cas, portanto amplitude inter-quartil é de 4 crian¸cas. Note que 50% dos dados estão entre os quartis inferior e superior.

(11)

2.3.5 Box-and-Whisker Plots

Box-and-Whisker plots ou simplesmente box-plots são simples representa¸cões dia- gramáticas dos cinco números sumários: (m´ınimo, quartil inferior, mediana, quartil superior, máximo). Um box-plot para os dados geoqu´ımicos fica como mostrado a seguir.

10 12 14 16 18

2.3.6 A moda

Nem todos os conjuntos de dados são suficientemente balanceados para o cálculo da média ou mediana. Algumas vezes, especialmente para dados de contagem, um único valor domina a amostra. A medida de loca¸cão apropriada é então a moda, a qual é o valor que ocorre com maior frequência. A propor¸cão da amostra a qual toma este valor modal deveria ser utilizada no lugar de uma medida formal de dispersão.

Algumas vezes, podemos distinguir claramente ‘picos’ na frequência dos valores registrados. Neste caso (chamado bimodal) dever´ıamos apresentar ambas as local- iza¸cões. Dados deste tipo são particularmente dif´ıceis de resumir (e analisar).

Exemplo. Dez pessoas registraram o n´umero de copos de cerveja que eles tomaram num determinado s´abado:

0, 0, 0, 0, 0, 1, 2, 3, 3, 6

A moda ´e 0 copos de cerveja, a qual foi obtida pela metade da amostra. Poderiamos adicionar mais informa¸c˜ao separando a amostra e dizendo que daqueles que tomaram cerveja a mediana foi de 3 copos.

(12)

2.4 Dados m´ ultiplos

Os resultados de um estudo tipicamente envolverão mais do que uma única amostra de dados como discutido até aqui. Representa¸cões gráficas são úteis para comparar grupos de dados ou para verificar se exitem rela¸cões entre eles. Existem muitas possibilidades, mas a mais adequada dependerá das peculiaridades de cada conjunto de dados.

Além dos exemplos abaixo, podemos criar combina¸cões de métodos já discutidos.

Por exemplo, se medirmos as alturas e pesos de uma amostra de pessoas, podemos produzir box-plots de altura lado a lado para homens e mulheres, ou gráficos ramo-e- folhas lado a lado (com as alturas dos homens à esquerda do ramo, e as alturas das mulheres à direita), ou um histograma acima do outro (com a mesma escala no eixo x de forma que eles possam ser facilmente comparados). Para um número diferente de grupos, uma série de box-plots verticais funciona bem como um s´ımples resumo dos dados.

Para combina¸cões de dados categóricos, uma série de gráficos de setores podem ser produzidos, i.e. dois gráficos de setores, um para homens e um para mulheres.

2.4.1 Gr´aficos de pontos

Para avaliar se existe uma rela¸cão entre duas variáveis cont´ınuas, podemos produzir umgráfico de pontos. É importante que o eixo x fa¸ca sentido. Em geral faz pouco sentido unir os pontos, exceto onde o eixo x representa tempo (veja abaixo). S´ımbolos diferentes podem ser usados para diferentes grupos para adicionar uma nova dimensão ao gráfico. O gráfico abaixo mostra alturas e pesos de estudantes do sexo masculino e feminino.

M M

M

M M

M

M M

M

Height (cm)

Weight (kg)

140 150 160 170 180 190 200

405060708090

F F

FF F

F F

F F F

F F

F

Para mais do que duas vari´aveis, pode-se produzir gr´aficos entre todos os pares

(13)

Abaixo mostramos as temperaturas di´arias m´edias em Philadelphia, USA nos dois primeiros meses de 1980.

•

• ••

•

• ••

•

•••

•••••

•

• •• ••• • •

• •• • • • •

• • •

• •

••

•

• •

•

• •

•

•••

Day

Average temperature

0 10 20 30 40 50 60

-10-505

(14)

2.4.3 Ladder plot

O ladder plot não é um gráfico do tipo padrão mas pode ser útil para visualizar dados pareados. Considere o seguinte exemplo.

Um ornitologista deseja saber se um determinado local é usado por pássaros mi- gratórios de uma certa ra¸ca para engorda antes de migrar. Ele captura alguns pássaros em Agosto e pesa-os, então em Setembro ele tenta re-capturar os mesmos pássaros e faz novas medidas. Ele re-capturou 10 dos pássaros duas vezes, ambos em Agosto e Setembro. A tabela abaixo mostra as massas desses pássaros.

Mass in August (g) Mass in September (g)

10.3 12.2

11.4 12.1

10.9 13.1

12.0 11.9

10.0 12.0

11.9 12.9

12.2 11.4

12.3 12.1

11.7 13.5

12.0 12.3

O ladder plot destes dados fica como segue:

Mass (g) of bird 10111213

August September

•

• •

•

• •

•

• •

•

E muito mais fácil ver do gráfico do que da tabela que os pássaros tendem a engor-´ dar, e que aqueles que não engordaram tenderam a ser os maiores que provavelmente

(15)

2.5 Exerc´ıcios 1

1. Descreva de forma concisa os seguintes dados usando suas palavras e algumas estat´ısticas descritivas, apontando caracter´ısticas principais observadas.

(a) As notas (de um total de 100 e ordenadas por tamanho) de 20 estudantes de estat´ıstica no primeiro exame do semestre:

30 35 37 40 40 49 51 54 54 55

57 58 60 60 62 62 65 67 74 89

(b) O n´umero de faltas de 20 trabalhadores num ano (ordenados por tamanho):

0 0 0 0 0 0 0 1 1 1

2 2 3 3 4 5 5 5 8 45

(c) O n´umero de exemplares de um jornal mensal em particular lidos por 20 pessoas num ano:

0 1 11 0 0 0 2 12 0 0

12 1 0 0 0 0 12 0 11 0

2. Produza um gráfico ramos-e-folhas para apresenta¸cão dos dados de altura (em metros) de 20 mulheres sendo estudadas para uma certa condi¸cão médica.

1.52 1.60 1.57 1.52 1.60 1.75 1.73 1.63 1.55 1.63 1.65 1.55 1.65 1.60 1.68 2.50 1.52 1.65 1.60 1.65

3. Os dados a seguir fornecem a concentra¸c˜ao de um determinado poluente (ppm) em 8 pontos de um afluente medidos antes e uma hora depois de um acidente ambiental:

Before After 4.67 5.44 4.97 6.11 5.11 6.49 5.17 6.61 5.33 6.67 6.22 6.67 6.50 6.78 7.00 7.89

Fa¸ca um gr´afico destes dados, e use o gr´afico para ajudar a avaliar se o acidente provocou um aumento significativo nos n´ıveis do poluente no afluente.

4. A tabela abaixo fornece o n´umero de grˆanulos de arenito por cm³em 20 amostras tomadas de uma certa localidade (A) e 20 amostras tomadas de uma outra localidade (B).

(16)

A B

171 397 116 375

431 795 375 440

288 257 151 192

1283 902 752 503

554 1621 979 1252

295 1004 208 688

568 1378 426 771

958 435 675 377

2415 1104 410 700

1212 396 736 315

(a) Calcule as m´edias e desvios-padr˜ao desses duas amostras.

(b) Fa¸ca histogramas dos dois conjuntos de dados, e compare-os.

(c) Qual ´e o m´ınimo, m´aximo, mediana, quartil inferior e quartil superior de cada grupo?

(d) Usando sua resposta ao item (c), construa boxplots para os dois conjuntos de dados - um diretamento acime do outro, ou lado a lado para facilitar a compara¸c˜ao.

(e) Para cada grupo, o dado é aproximadamente simétrico ou assimétrico? Se assimétrico, em que dire¸cão?

(f) Você acha que existe uma diferen¸ca real entre os números de grânulos de arenito nas duas localidades, ou você acha que as diferen¸cas observadas poderiam ter simplesmente ocorrido como uma consequência dos grupos consistirem de somente 20 amostras cada?

(g) Descreva as principais caracter´ısticas dos dados em uma ou duas senten¸cas.

5. O percentual de a¸c´ucar e sal em 9 cereais matinais mais populares foram medidos, com os seguintes resultados:

Cereal a¸c´ucar sal

1 19 8

2 36 5

3 3 10

4 8 4

5 26 6

6 16 6

7 8 9

8 10 3

9 54 3

(a) Fa¸ca um gráfico desses dados para investigar a rela¸cão entre o conteúdo de a¸cúcar e sal nos cereais matinais.

(b) Comente brevemente qualquer padr˜ao observado nos dados.

(17)

3 Popula¸c˜ oes e amostras

3.1 Inferˆ encia estat´ıstica

Inferência estat´ısticaé o processo pelo qual estat´ısticos tiram conclusões acerca da popula¸cãousando informa¸cão de umaamostra.

Você pode estar familiar com o termo ‘popula¸cão’ num sentido biológico/geológico.

Em estat´ıstica, o termo não se refere necessariamente a pessoas, plantas, animais, etc. Ele poderia também se referir, por exemplo, a fósseis, rochas e sedimentos num determinado local, etc.

Apopula¸cãose refere a todos os casos ou situa¸cões as quais o pesquisador quer fazer inferências ou estimativas. Diferentes pesquisadores podem querer fazer in- ferências acerca da concentra¸cão de poluentes num determinado len¸col freático; predi- zer a quantidade de petróleo num po¸co a ser perfurado e assim por diante.

Note que o investigador não está interessado em todos os aspectos da popula¸cão.

O pesquisador pode n˜ao estar interessado em estudar a concentra¸c˜ao de todos os tipos de poluentes, somente alguns poluentes mais importantes para seu estudo.

Umaamostraé um subconjunto da popula¸cão usado para obter informa¸cão acerca do todo.

Mas exatamente por quê tomamos uma amostra? Por quê não usamos a popula¸cão toda?

• custo alto para obter informa¸c˜ao da popula¸c˜ao toda

• tempo muito longo para obter informa¸c˜ao da popula¸c˜ao toda

• algumas vezes imposs´ıvel, por exemplo, estudo de polui¸c˜ao atmosf´erica

• algumas vezes logicamente imposs´ıvel, por exemplo, em ensaios destrutivos.

(18)

Caracter´ısticas de uma popula¸cão que diferem de um indiv´ıduo para outro e as quais temos interesse em estudar são chamadas variáveis. Exemplos são comprimento, massa, idade, temperatura, número de ocorrências, etc. Cada unidade (mem- bro) da popula¸cão que é escolhido como parte de uma amostra fornece uma medida de uma ou mais variáveis, chamadasobserva¸cões.

3.2 Princ´ıpios de estima¸c˜ ao

Utilizamos estimativas de uma amostra como nosso “melhor chute” para os verdadeiros valores populacionais. Exemplos são a média amostral, o desvio padrão amostral, a mediana amostral, os quais estimam a verdadeira média, desvio padrão e mediana da popula¸cão (que são desconhecidos). Os verdadeiros (desconhecidos) valores populacionais são chamados parâmetros.

Note que estat´ısticas são usualmente representadas por letras Romanas, (por exemplo, ¯x para a média amostral, s para o desvio padrão amostral), enquanto que parâmetros são usualmente representados por letras Gregas (por exemplo, µ para a média populacional,σpara o desvio padrão populacional).

E claro que à medida que a amostra aumenta, mais informa¸cão nós teremos acerca´ da popula¸cão de interesse, e portanto mais precisa serão as estimativas dos parâmetros de interesse.

(19)

3.3 Obtendo uma amostra

Obtemos uma amostra para fazer inferências de uma popula¸cão. Nossas inferências são válidas somente se a amostra é representativa da popula¸cão. Na prática não existe forma de garantir isto sem ter informa¸cão da popula¸cão inteira para comparar com a amostra. E em tais circunstâncias não haveria necessidade de amostragem!

Ao invés disso, podemos assegurar que não existem v´ıcios sistemáticos em nossa amostra através de uma sele¸cão aleatória dos membros da popula¸cão. Umaamostra aleatória independenteé uma amostra selecionada de tal forma que

1. todos os membros da popula¸c˜ao tˆem a mesma chance de serem selecionados;

2. cada combina¸c˜ao poss´ıvel de um dado n´umero de membros tem a mesma chance de ser selecionada.

Em princ´ıpio, a melhor forma de obter uma amostra aleatória de tamanhoné ter uma lista de todos os membros da popula¸cão, dar a todos um número digamos de 1 a N, e então escolher aleatoriamente nnúmeros de 1 aN para definir a amostra. É claro que na prática isto não é exequ´ıvel, especialmente quando a popula¸cão é infinita.

Na maioria dos casos é dif´ıcil obter amostras aleatórias. Considere o seguinte diagrama que mostra a ‘popula¸cão’ de circulos. Pense neles como se fossem grânulos de tamanhos diferentes. O diâmetro médio destes circulos é mm.

Suponha que selecionemos uma amostra de 5 destes c´ırculos jogando um lápis sobre o papel repetidamente até que tenhamos atingido 5 circulos. Qual é o diâmetro médio de nossos 5 circulos? O valor está perto de mm?

(20)

No exemplo acima, o esquema amostral causou um v´ıcio. Um v´ıcio similar seria obtido por exemplo na amostragem de um particular tipo de animal – pode ser que os animais que se consegue capturar e medir são aqueles que não podem correr tão rápido, ou ao usar uma armadinha, você pode amostrar somente os animais mais famintos, etc.

Sempre que uma amostra é obtida, o processo de amostragem deve estar bem documentado de tal forma que quais inferências retiradas acerca da popula¸cão pode avaliadas à luz da estratégia amostral.

(21)

4 Distribui¸c˜ oes te´ oricas de frequˆ encias

Como visto na Se¸cão 2, as distribui¸cões dos dados podem ter uma variedade de formas, incluindo formas simétricas e não simétricas. Introduziremos aqui alguns dos modelos matemáticos mais comumente usados para tais dados.

4.1 A distribui¸c˜ ao Normal

Adistribui¸cão Normalé a mais familiar das distribui¸cões de probabilidade e também uma das mais importantes em estat´ıstica. Esta distribui¸cão tem uma forma de sino.

x

f(x)

-4 -2 0 2 4

0.00.10.20.30.4

A equa¸cão da curva Normal é especificada usando 2 parâmetros: a média populacional µ, e o desvio padrão populacional σ, ou equivalentemente a variância populacionalσ². Denotamos N(µ, σ²) à curva Normal com médiaµe variânciaσ². A média refere-se ao centro da distribui¸cão e o desvio padrão ao espalhamento de curva.

A distribui¸cão normal é simétrica em torno da média o que implica que e média, a mediana e a moda são todas coincidentes. Para referência, a equa¸cão da curva é

f(x) = 1

p(2πσ²)exp

½

−(x−µ)² 2σ²

¾

. (1)

Felizmente, você não tem que memorizar esta equa¸cão. O importante é que você entenda como a curva é afetada pelos valores numéricos de µeσ. isto é mostrado no diagrama abaixo.

(22)

x

f(x)

0 5 10

0.00.20.40.60.8

N(0,1) N(3,1)

N(6,.25)

N(6,4)

Range Proportion

µ±1σ 68.3%

µ±2σ 95.5%

µ±3σ 99.7%

Este resultado é usado da seguinte maneira. Suponha que os comprimentos de um particular tipo de peixe podem ser descritos por uma distribui¸cão normal, com média 140mm e desvio padrão 15mm. Podemos calcular a propor¸cão dos peixes que têm comprimentos entre 110 e 170mm, por exemplo, como a propor¸cão da área sob a curva entre 110 e 170mm.

Ent˜ao em nosso exemplo, cerca de 95% dos peixes tem comprimentos entre 110mm e 170mm.

Na prática desejamos calcular probabilidades para diferentes valores deµeσ. Para isso, a variávelXcuja distribui¸cão éN(µ, σ²) é transformada numa forma padronizada Z com distribui¸cão N(0,1) (distribui¸cão normal padrão) pois tal distribui¸cão é tabelada. A quantidade Zé dada por

Z =X−µ

σ (2)

Exemplo: A concentra¸cão de um poluente em água liberada por uma fábrica tem distribui¸cão N(8,1.5). Qual a chance, de que num dado dia, a concentra¸cão do poluente exceda o limite regulatório de 10 ppm?

A solu¸cão do problema resume-se em determinar a propor¸cão da distribui¸cão que está acima de 10 ppm, ieP(X >10). Usando a estat´ıstica z temos:

P(X >10) =P(Z > 10−8

) =P(Z >1.33) = 1−P(Z≤1.33) = 0.09 (3)

(23)

4.2 A distribui¸c˜ ao Binomial

Suponha que n experimentos independentes, ou ensaios, são executados, onde n é um número fixo, e que cada experimento resulta num “sucesso” com proabilidadepe numa “falha” com probabilidade 1−p. O número total de sucessos,X, é uma variável aleatória com parâmetros nep.

Por exemplo, uma moeda é lan¸cada 10 vezes e o número total de caras é contado (aqui “cara” é um sucesso).

A probabilidade queX=k, denotada porP(k), pode ser encontrada como:

P(X =k) = P(k) = n!

k!(n−k)!p^k(1−p)^n−k. (4) Amédiade um variável aleatória Binomial énpe avariânciaénp(1−p).

Considere o seguinte exemplo. Suponha que num pedigree humano envolvendo albinismo (o qual é recessivo), nós encontremos um casamento no qual sabe-se que ambos os parceiros são heterozigotos para o gene albino. De acordo com a teoria Mendeliana, a probabilidade de que um filho desse casal seja albino é um quarto.

(Então a probabilidade de não ser albino é ³₄.)

Agora considere o mesmo casal com 2 crian¸cas. A chance de que ambas sejam albinas ´e (¹₄)² = ₁₆¹ = 0.0625. A desma forma, a chance de ambas serem normais ´e (³₄)² = ₁₆⁹ = 0.5625. Portanto, a probabilidade de que somente uma seja um albina deve ser 1−₁₆¹ −₁₆⁹ = ₁₆⁶ = ³₈ = 0.375. Alternativamente, poderiamos ter usado a formula acima comn= 2,p= ¹₄, and k= 1.

Se agora considerarmos a fam´ılia comn= 5 crian¸cas, as probabilidades de existam k= 0,1,2, . . . ,5 crian¸cas albinas, onde a probabilidade de albinismo ´ep= ¹₄, s˜ao dadas por

P(k) = 5!

k!(5−k)!

µ1 4

¶_kµ 3 4

¶_5−k

(5) as quais ficam como segue.

0 1 2 3 4 5

0.00.10.20.30.4

(24)

4.3 A distribui¸c˜ ao Poisson

Uma outra distribui¸cão comum é a distribui¸cão Poisson, e é frequentemente usada para modelar dados de contagem, por exemplo, para descrever o número de nmetóides encontrados em amostras de solo, o número diário de novos casos de câncer de mama, ou o número de células contadas usando um hemocitrômetro. O histograma abaixo mostra o número de organismos encontrados em cada um de 400 quadrados pequenos.

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

020406080

A distribui¸cão Poisson tem um parâmetro, λ, e a probabilidade de obter exata- mente xindiv´ıduos é dada por

P(x) = λ^xe^−λ

x! . (6)

Quando λ= 4.68, por exemplo, a distribui¸c˜ao fica como segue.

0.050.100.15

(25)

4.4 Exerc´ıcios 2

1. Considere uma distribui¸cão normal com média 10 e desvio padrão 3.

(a) Desenhe um esbo¸co desta distribui¸c˜ao.

(b) Qual é a propor¸cão da área sob a curva entre 7 e 13?

2. Usinas nucleares que utilizam água para refrigera¸cão de seus condensadores algumas vezes liberam água quente em rios, lagos ou oceanos. Sabe-se que a água quente acima de certa temperatura tem um efeito indesejado sobre plantas e animais que vivem nesses ambientes. Suponha que a alta temperatura liberada por uma certa usina nuclear tem uma distribui¸cão Normal com média 5^◦C e um desvio padrão de 0.5^◦C.

(a) Fa¸ca um esbo¸co da distribui¸c˜ao.

(b) Qual o percentual de dias nos quais o aumento da temperatura ´e maior do que 5.5^◦C?

3. Os pulsos em repouso de 920 pessoas sadias foram tomados, e uma m´edia de 72.9 batidas por minuto (bpm) e um desvio padr˜ao de 11.0 bpm foram obtidos.

Um histograma dos dados mostra uma clara forma normal. Dˆe uma amplitude de referˆencia de 95% para pulsos em repouso de pessoas sadias com base nesses dados.

4. Você leva se cachorro o veterinário e descobre através de um exame de ultra- sonografia que ela está grávida com uma ninhada de 8 filhotes.

(a) Qual ´e a probabilidade de que exatamente 3 dos filhotes sejam fˆemeas?

(b) Qual é a probabilidade de que existam um número igual de machos e fêmeas?

(c) Qual ´e a probabilidade de que existam mais machos do fˆemeas?

5. Um investigador está interessado no número de ovos depositados por uma espécie de pássaro. Na primavera, ele procura e acha 80 ninhos. O número médio de ovos por ninho foi 3.8 e o desvio padrão foi 1.9. Porque a variância é aproximadamente igual á média, ele acha que pode ser razoável descrever o número de ovos por ninho como tendo uma distribui¸cão Poisson com média 3.8.

(a) Fa¸ca o gr´afico dessa distribui¸c˜ao como em suas notas de aula.

(b) Se esta realmente representa a distribui¸c˜ao populacional, qual seria a proa- bilidade de encontrar um ninho com mais do que 5 ovos?

(c) Qual seria a probabilidade de n˜ao encontrar nenhum ovo num ninho?

(26)

5 Intervalos de Confian¸ca

5.1 A id´ eia b´ asica de intervalos de confian¸ca

Suponha que estejamos interessados num parâmetro populacional verdadeiro (mas desconhecido) θ. Podemosestimaro parâmetroθusando informa¸cão de nossa amostra. Chamamos o único número que representa o valor mais plaus´ıvel do parâmetro (baseado nos dados amostrais) de umaestimativa pontualdeθ. Contudo, sabemos que o valor estimado na maior parte das vezes não será exatamente igual ao valor verdadeiro. Então, também seria interessante encontrar umintervalo de confian¸ca que forne¸ca um intervalo de valores plaus´ıveis para o parâmetro baseado nos dados amostrais.

Umintervalo de confian¸ca de 95%para um parˆametro populacional fornece um intervalo no qual estariamos 95% confiantes de cobertura

do verdadeiro valor do parˆametro.

Tecnicamente, 95% de todos os intervalos de confian¸ca que construirmos conterão o verdadeiro valor do parâmetro (dado que todas as suposi¸cões envolvidas estejam corretas). Então se obtivermos um intervalo de confian¸ca para o parâmetro θ para cada uma dentre 100 amostras aleatórias da popula¸cão, somente 5, em média destes intervalos de confian¸ca não conterão θ.

Podemos obter intervalos de confian¸ca de 95% para:

médias, diferen¸cas de médias, propor¸cões, diferen¸cas em propor¸cões, etc.

Podemos tamb´em criar intervalos de confian¸ca de 90%, 99%, 99.9%, etc, mas os intervalos de confian¸ca de 95% s˜ao os mais utilizados.

(27)

5.2 Teorema Central do Limite

Uma razão para a distribui¸cão Normal ser considerada tão importante é porquequal- quer que sejaa distribui¸cão da variável de interessepara grande amostras, a distribui¸cão das médias amostrais serão aproximadamente normalmente distribu´ıdas, e tenderão a uma distribui¸cão normal à medida que o tamanho de amostra crescer. Então podemos ter uma variável original com uma distribui¸cão muito diferente da Normal (pode até mesmo ser discreta), mas se tomarmos várias amostras grandes desta distribui¸cão, e então fizermos um histograma das médias amostrais, a forma se parecerá como uma curva Normal.

A distribui¸cão da média amostral ¯X é aproximadamente Normal com médiaµe desvio padrãoσ/√

n.

Aquiµ eσsão a média e o desvio padrão populacionais das medidas individuais X, ené o tamanho amostral. Denota-se

X¯ ∼N(µ, σ²/n).

A aproxima¸c˜ao para a normal melhora `a medida que o tamanho amostral cresce.

Este resultado é conhecido como oTeorema Central do Limitee é notável porque permite-nos conduzir alguns procedimentos de inferência sem qualquer conhecimento da distribui¸cão da popula¸cão.

5.3 Exemplo simulado

Podemos ilustrar o Teorema Central do Limite por um exemplo simulado. O diagrama na próxima página sumariza os resultados de um experimento no qual foi utilizado um computador para gerar 2000 observa¸cões de duas distribui¸cões bem diferentes (linha superior). Nós então geramos uma amostra de tamanho 2 de cada distribui¸cão e calculamos a média. Este procedimento foi repetido 1999 vezes e a segunda linha mostra os histogramas das médias resuktantes das amostras de tamanho dois. Isto foi repetido com média amostrais onde as amostras são de tamanhos 5 (terceira linha) e 10 (quarta linha).

Note como a forma da distribui¸cão muda à medida que se muda de uma linha para a próxima, e como as duas distribui¸cões em cada linha tornam-se mais similares nas suas formas à medida que o tamanho das amostras aumenta. Ainda mais, cada distribui¸cão parece mais e mais com uma distribui¸cão Normal. Não é necessário uma amostra de tamanho muito grande para ver uma forma Normal.

As média populacionais para as duas distribui¸cões são 5 e 3 respectivamente. Note como, quanto maior o tamanho de amostra mais perto as médias amostrais tendem a estar da média populacional.

(28)

0 2 4 6 8 10

0100200300400

x

0 2 4 6 8 10

0100200300400

y

0 2 4 6 8 10

0100200300400

(x1+x2)/2

0 2 4 6 8 10

0100200300400

(y1+y2)/2

0 2 4 6 8 10

0100200300400

(x1+x2+..+x5)/5

0 2 4 6 8 10

0100200300400

(y1+y2+..+y5)/5

200300400 200300400

(29)

5.4 Intervalos de confian¸ca de 95% para uma m´ edia

Na se¸cão anterior vimos que para uma amostra suficientemente grande a distribui¸cão das médias amostrais em torno da média populacional é Normal com desvio padrão σ/√

n. Chamamos deσ/√

noerro padrão(SE) da média, uma vez que quanto menor seu valos. tanto mais próximas estarão as médias amostrais da média populacionalµ (i.e. tanto menor será oerro).

m´edia populacional = µ desvio padr˜ao populacional = σ

S.E. da m´edia = σ/√ n

Isto significa que 68.3% de todas as médias amostrais cairão dentro de ±1 SE da média populacionalµ. Similarmente 95% de todas as médias amostrais cairão dentro de±1.96×SE deµ.

ent˜ao intervalos da forma

(¯x−1.96× σ

√n , x¯+ 1.96× σ

√n) conter˜ao a verdadeira m´edia populacional µ95% das vezes.

Umproblemacom a constru¸cão de tais intervalos é que não sabemos o verdadeiro desvio padrão populacional σ. Para grandes tamanhos amostrais, contudo, o desvio padrão amostralsserá uma boa estimativa deσ. Portanto, podemos substituirσpor sde modo que podemos calcular o erro padrão como

SE = s/√ n,

e um intervalo de confian¸ca de aproximadamente 95% paraµ´e:

(¯x−1.96× s

√n , ¯x+ 1.96× s

√n).

Este tipo de intervalo de confian¸ca para a média pode ser usado para grandes amostras, independentemente da distribui¸cão da variável original.

(30)

5.5 intervalos de confian¸ca mais exatos

Para amostras pequenas, onde s ´e uma estimativa menos confi´avel de σ, devemos construir nosso intervalo de confian¸ca de uma forma ligeiramente diferente.

Ao invés de usar o valor 1.96, usamos um valor ligeiramente maior para refletir nossa redu¸cão na confian¸ca. Obtemos o valor requerido da tabela de distribui¸cão t.

Tomamos o valor correspondente à linha r = n−1 graus de liberdade. Note que quanto menorn, maiores os valores det. Então um intervalo de confian¸ca exato é

(¯x−t_(n−1,0.05)× s

√n , ¯x+t_(n−1,0.05)× s

√n).

Note ainda que `a medida quencresce, o valor det torna-se pr´oximo a 1.96.

Repareque se a distribui¸cão da variável original é muito distante de ser normal- mente distribu´ıda, e o tamanho amostral é muito pequeno, então as médias amostrais não terão uma distribui¸cão aproximadamente normal e portanto este tipo de intervalo de confian¸ca não será muito preciso e não deveria ser utilizado.

(31)

A distribui¸c˜ ao t

Valores detpara que P(|T |> t) =p, ondeT tem um distribui¸c˜aoT de Student comrgraus de liberdade.

p

0.20 0.10 0.05 0.01 0.001

1 3.078 6.314 12.706 63.657 636.619 2 1.886 2.920 4.303 9.925 31.599 3 1.638 2.353 3.182 5.841 12.924 4 1.533 2.132 2.776 4.604 8.610 5 1.476 2.015 2.571 4.032 6.869 6 1.440 1.943 2.447 3.707 5.959 7 1.415 1.895 2.365 3.499 5.408 8 1.397 1.860 2.306 3.355 5.041 9 1.383 1.833 2.262 3.250 4.781 10 1.372 1.812 2.228 3.169 4.587 11 1.363 1.796 2.201 3.106 4.437 12 1.356 1.782 2.179 3.055 4.318 13 1.350 1.771 2.160 3.012 4.221 14 1.345 1.761 2.145 2.977 4.140 15 1.341 1.753 2.131 2.947 4.073 16 1.337 1.746 2.120 2.921 4.015 r 17 1.333 1.740 2.110 2.898 3.965 18 1.330 1.734 2.101 2.878 3.922 19 1.328 1.729 2.093 2.861 3.883 20 1.325 1.725 2.086 2.845 3.850 21 1.323 1.721 2.080 2.831 3.819 22 1.321 1.717 2.074 2.819 3.792 23 1.319 1.714 2.069 2.807 3.768 24 1.318 1.711 2.064 2.797 3.745 25 1.316 1.708 2.060 2.787 3.725 26 1.315 1.706 2.056 2.779 3.707 27 1.314 1.703 2.052 2.771 3.690 28 1.313 1.701 2.048 2.763 3.674 29 1.311 1.699 2.045 2.756 3.659 30 1.310 1.697 2.042 2.750 3.646 40 1.303 1.684 2.021 2.704 3.551 50 1.299 1.676 2.009 2.678 3.496 60 1.296 1.671 2.000 2.660 3.460 70 1.294 1.667 1.994 2.648 3.435 80 1.292 1.664 1.990 2.639 3.416 90 1.291 1.662 1.987 2.632 3.402 100 1.290 1.660 1.984 2.626 3.390

∞ 1.282 1.645 1.960 2.576 3.291

(32)

5.6 Exemplos

5.6.1 Diˆametro de ´arvores castanheiras

A seguir encontra-se uma amostra de 10 árvores castanheiras todas com 8 anos de idade numa certa floresta. O diâmetro (polegadas) das árvores foram medidos à uma altura de 3 pés:

19.4 21.4 22.3 22.1 20.1 23.8 24.6 19.9 21.5 19.1

Queremos encontrar um intervalo de confian¸ca de 95% para o verdadeiro diâmetro médio de todas as árvores castanheiras dessa idade na floresta. Usando uma calcu- ladora, encontramos que ¯x= e que s= . O erro padrão é portanto:

SE = s

√n = .

Temos uma amostra de tamanhon= 10, ent˜ao da tabela da distribui¸c˜aottemos que t= .

Então o intervalo de confian¸ca de 95% para a média populacional é

¯

x±t×SE

Portanto estamos 95% confiantes de que o diâmetro médio da popula¸cão da qual a amostra foi retirada está entre e .

Quais suposi¸c˜oes foram feitas? Podemos checar essas suposi¸c˜oes?

5.6.2 Comprimento de plantas

Temos medidas dos comprimentos de 100 plantas que nasceram de sementes que foram plantadas ao mesmo tempo. Um histograma dos dados tem uma forma aproximadamente normal, e a média amostral e o desvio padrão amostral foram 74mm and 2.34mm, respectivamente. Construa um intervalo de confian¸ca para o comprimento médio populacional de plantes dessa mesma espécie.

(33)

5.7 Exerc´ıcios 3

1. Os pulsos em repouso de 920 pessoas sadias foram tomados, e uma m´edia de 72.9 batidas por minuto (bpm) e um desvio padr˜ao de 11.0 bpm foram obtidos.

Construa um intervalo de confian¸ca de 95% para a pulsa¸c˜ao m´edia em repouso de pessoas sadias com base nesses dados.

2. Tendo sido medido o eixo maior de 9 grãos de quartzo de um corpo arenoso em uma lâmina de arenito, obteve-se um comprimento amostral médio de 1,5mm e um desvio padrão de 0,3mm. Deseja-se construir um intervalo de confian¸ca para o comprimento médio dos grãos de quartzo do corpo arenoso.

3. Os QIs de 181 meninos com idades entre 6-7 anos de Curitiba foram medidos.

O QI m´edio foi 108.08, e o desvio padr˜ao foi 14.38.

• Calcule um intervalo de confian¸ca de 95% para o QI m´edio populacional dos meninos entre 6-7 anos de idade em Curitiba usando estes dados.

• Interprete o intervalo de confian¸ca com palavras.

• Foi necessário assumir que os QIs têm distribui¸cão normal neste caso? Por quê?

4. A seguinte tabela mostra os QIs de crian¸cas por classe social dos pais.

Classe social M´edia DP N´umero Limite inferior Limite superior

I Profissional 112.27 13.16 30 107.36 117.18

II Gerencial 112.65 11.01 78

IIIa N˜ao-Manual

(cl´erico) 108.86 13.94 28

IIIb Manual

(com pr´atica) 104.38 14.41 152

IV Manual

(com pouca pr´atica) 96.97 10.13 37

V Manual

(sem pr´atica) 98.85 14.02 20

• Complete as duas ´ultimas colunas, as quais contem intervalos de confian¸ca de 95% para o QI m´edio. Ilustre os IC graficamente.

• Comente os padrões gerais que você vê.

(34)

5.8 Intervalos de confian¸ca para uma propor¸c˜ ao

Pesquisadores frequentemente expressam a frequência de ocorrência de um item numa amostra como uma propor¸cão do total. Por exemplo, uma amostra de larvas de mosquito coletadas de um lago com água limpa parada contem 80 larvas das quais 60 sãoAedes detritus. A propor¸cão daquela espécie na amostra é 60/80 = 0.75 ou 75%.

Considerando esta amostra uma amostra aleatória, esta propor¸cão é uma estimativa da propor¸cão total populacional. Outras amostras forneceriam estimativas ligeiramente diferentes daquela propor¸cão.

Sejano tamanho da amostra e sejaxo n´umero observado do evento de interesse.

Então estimamos a propor¸cão populacional pcom a propor¸cão observada ˆp=x/n.

Da mesma forma que um conjunto de médias amostrais são distribu´ıdas nas prox- imidades da média populacional, as propor¸cões amostrais ˆpsão distribu´ıdas ao redor da verdadeira propor¸cão populacional p. Devido ao Teorema Central do Limite, para ngrande epnão muito próximo de 0 ou 1, a distribui¸cão de ˆpserá aproximadamente normalmente distribu´ıda com média pe um desvio padrão dado por

rp(1−p)

n .

Chamamos SE=

qp(1−p)

n de erro padrão da propor¸cão amostral. Podemos usar isto na constru¸cão de um intervalo de confian¸ca para a verdadeira propor¸cãop.

Um intervalo de confian¸ca de aproximadamente 95% parap´e portanto (ˆp−1.96×SE , pˆ+ 1.96×SE)

onde

SE =

rp(1ˆ −p)ˆ

n .

Note que n˜ao sabemos o verdadeiro valor dep, e portanto usamos ˆpna f´ormula acima para estimar SE.

Uma regra geral é que este intervalo de confian¸ca é válido quando quando temos ambosnˆpen(1−p) maiores do que digamos 10.ˆ

Em alguns livros o divisor n−1 é utlizado. Não se preocupe quanto a isso; o intervalo resultante não será notavelmente diferente.

5.8.1 Exemplo

Calcule um intervalo de confian¸ca de 95% para a propor¸c˜ao de larvas de mosquito no lago da esp´ecie Aedes detritus. Interprete os resultados.

(35)

5.9 Compara¸c˜ ao de intervalos de confian¸ca

Suponha que tenhamos dois ou mais grupos separados, por exemplo, machos e fˆemeas.

Algumas vezes pode-se construir um intervalo de confian¸ca de 95% para a média para cada um dos grupos, e então contrói-se um gráfico com esses intervalos contra um eixo comum para verificar se existe uma interse¸cão (i.e. existem alguns valores em comum).

Se os intervalos não se sobrepõem, então temos (pelo menos) 95% de confian¸ca de que as verdadeiras médias não são iguais. Embora estes gráficos sejam úteis para visualiza¸cão, utilizaremos um aboradgem mais formal (veja Se¸cão 7) para construir um intervalo de confian¸ca para a diferen¸ca entre duas médias ou a diferen¸ca entre duas propor¸cões.

5.9.1 Exemplo

Considere os dados de um estudo investigando a existência de um balan¸co entre a propor¸cão de peixes machos e fêmeas de uma certa espécie em dois lagos distintos.

A propor¸c˜ao observada de machos capturados no primeiro lago foi 74.4% dentre 43 capturados e no segundo foi 60% dentre 50. Podemos agora construir intervalos de confian¸ca para as percentagens correspondente nas popula¸c˜oes dos dois lagos.

5.10 Exerc´ıcios 4

1. Um amigo sugere que você lance uma moeda para ajudar você a tomar uma decisão muito importante, o resultado também o afetará. Seu amigo sugere que você escolha cara para tomar a decisão A, e coroa para tomar a decisão B a qual é a preferida por ele. O único problema é que seu amigo insiste que você use uma moeda “da sorte” dele. Você fica um pouco suspeito e decide fazer um experimento enquanto seu amigo não está olhando. Você lan¸ca a moeda 40 vezes e cara aparece somente 13 vezes. Construa um intervalo de 95% de confian¸ca para a verdadeira propor¸cão de carasppara ajudá-lo a decidir se você acredita ou não que a moeda é balanceada. O que você conclui?

2. Numa pesquisa eleitoral, 57 dentre 150 entrevistados afirmaram que votariam no candidato X. Com uma confian¸ca de 90%, o que você pode dizer acerca da propor¸cão real de votos aquele candidato terá?

3. Dentre 100 peixes capturados num certo lago, 18 não estavam apropriados para consumo devido aos n´ıveis de polui¸cão do ambiente. Construa um intervalo de confian¸ca de 99% para a correspondente verdadeira propor¸cão.

(36)

6 Testes de Hip´ oteses

6.1 Introdu¸c˜ ao e nota¸c˜ ao

Em geral, intervalos de confian¸ca são a forma mais informativa de apresentar os acha- dos pricipais de um estudo. Contudo, algumas vezes existe um particular interesse em decidir sobre a verdade ou não de uma hipótese espec´ıfica (se dois grupos têm a mesma média ou não, ou se o parâmetro populacional tem um valor em particular ou não). Teste de hipóteses fornece-nos a estrutura para que fa¸camos isto. Veremos que intervalos de confian¸ca e testes de hipóteses estão intimamente relacionados.

6.1.1 Os p´assaros migrat´orios engordam antes de migrar?

Considere os dados coletados pelo ornitologista na página 15. Achamos apropriado apresentar os dados na forma de um ladder plot. Agora é natural perguntar se em média estes pássaros engordam entre Agosto e Setembro. Somente 10 pássaros foram capturados e seu peso médio nas duas ocasiões foram 11.47 e 12.35 então o peso médio aumentou para esta amostra em particular. (Note que o mesmo conjunto de pássaros foram medidos ambas as vezes.) Podemos generalizar para o resto dos pássaros que não foram capturados? Será que esta diferen¸ca poderia ser devida simplesmente ao acaso?

Queremostestar a hipótese nula (H0) de que, em média, não existe mudan¸ca no peso dos pássaros. Assumiremos que os 10 pássaros foram uma amostra aleatória de todos os pássaros migradores daquela espécie e usaremos primeiramente o que aprendemos sobre intervalos de confian¸ca para responder nossas perguntas.

Primeiro vamos calcular as mudan¸cas de peso (Setembro-Agosto):

1.9 0.7 2.2 −0.1 2.0 1.0 −0.8 −0.2 1.8 0.3

Seja µ a mudan¸ca média de peso na popula¸cão. Então nossa hipótese nula H0 e a hipótese alternativaH1podem ser escritas como segue:

H0: µ = 0, H1: µ 6= 0.

Um procedimento útil é calcular um intervalo de confian¸ca para a média populacional µcomo descrito na Se¸cão 5.5, e ver ser o intervalo inclui 0 como um valor plaus´ıvel.

Agoran= 10, ¯x= 0.88 es= 1.065 para as diferen¸cas, ent˜ao SE =s/√

n= 1.065/√

10 = 0.337,

e um valor-tde 2.262 ´e obtido da colunaP = 0.05 e linhar=n−1 = 9. Um intervalo de confian¸ca de 95% paraµ´e portanto

(0.88−2.262×0.337, 0.88 + 2.262×0.337) = (0.12, 1.64).

O intervalo não contem o valor 0, fornecendo evidências contra a hipótese nula.

(37)

Podemos dizer: “existem evidências significativas (P < 0.05) de que, em média, os pássaros da espécie estudada mudam de peso de Agosto para Setembro. Estamos 95% confiantes de que em média os pesos aumentam por um montante entre 0.12 e 1.64 gramas.”

Mas e o intervalo de 99%? Será que ele conteria o valor 0? Este intervalo seria mais amplo e então é mais provável que ele contenha 0. Se ele não incluir 0, isto indicaria uma evidência ainda mais forte contraH0.

Calculando o intervalo de confian¸ca exatamente da mesma forma, exceto que desta vez precisamos olhar na colunaP = 0.01 para obtert= 3.250:

(0.88−3.250×0.337, 0.88 + 3.250×0.337) = (−0.21, 1.97).

Como esperado, este ´e mais amplo, e agora inclui o valor 0.

Podemos agora dizer: “não existem evidências significativas ao n´ıvel de 1% de que, em média, os pássaros da espécie estudada mudam de peso de Agosto para Setembro.”

O que nós acabamos de fazer foi conduzir um teste perfeitamente válido para a hipótese nula usando intervalos de confian¸ca. Podemos fazer o teste mais rapidamente e obter exatamente as mesmas conclusões pelo seguinte procedimento:

• Calcule t = (¯x−0)/SE= 0.88/0.337 = 2.61, o n´umero de erros padr˜ao que ¯x dista de 0.

• Compare este valor det com aqueles na linhar=n−1 = 9 da tabela.

• Para este exemplo,t= 2.61 o qual está entre os valores nas colunasP = 0.01 e P = 0.05. Então nosso valor deve corresponder a umP entre estes e portanto devemos ter 0.01 < P <0.05. (P é a probabilidade de observar um valor de t tão grande ou mais extremo do que 2.61 seµ= 0.)

(38)

6.2 Procedimento geral de teste

1. Estabele¸ca ahip´otese nula, H₀ e a hip´otese alternativa H₁.

2. Decida qual otestea ser usado, checando se este ´e v´alido para o seu problema.

3. Calcule aestat´ıstica de teste, T.

4. Encontre a probabilidade (p-valor) de observar um valor tão extremo ou maior do que Tsea hipótese nula é de fato verdadeira. Você precisará se referir aosval- ores cr´ıticosnas tabelas estat´ısticas as quais fornecemp-valores correspondendo aos valores das estat´ıstica de teste.

5. Avalie a for¸ca da evidência contra H0.(Quanto menorp-valor, tanto mais evidência contra a hipótese nula.) Se necesário, decida se esta é evidência suficiente para rejeitar(ounão rejeitar) a hipótese nula.

6. Estabele¸ca asconclus˜oeseinterpreta¸c˜aodos resultados.

Op-valor é a probabilidade de observar dados tão extremos quanto os obtidos se a hipótese nula é verdadeira. Note as seguintes interpreta¸cões dep-valores:

P ≥ 0.10 N˜ao existe evidˆencia contra H0

P < 0.10 Fraca evidˆencia contra H0

P < 0.05 Evidˆencia significativa. . .

P < 0.01 Evidˆencia altamente significativa. . . P < 0.001 Evidˆencia muito altamente significativa. . .

Esteja ciente da diferen¸ca entre significância estat´ıstica e significância prática. Um efeito pode ser estatisticamente significante mas não ter qualquer importância prática e vice-versa. Por exemplo, um estudo muito grande pode estimar a diferen¸ca entre a média de peso de plantas como sendo 0.0001 gramas e concluir que a diferen¸ca

é estat´ısticamente significativa (p < 0.05). Contudo, na prática, esta diferen¸ca é neglig´ıvel e provavelmente de pouca importância prática.

(39)

6.3 Teste para uma m´ edia

Na Se¸cão 5.1.1 conduzimos, através de um exemplo, o chamadoteste-tpara uma única média. Os passos principais de tal test-t para uma amostra aleatóriax1, x2, . . . , xnde uma popula¸cão com médiaµsão dados a seguir:

1. Estabele¸ca a hipótese nula, H0: µ=µ0, e a hipótese alternativa H1: µ6=µ0. 2. Calcule a média amostral ˆµ= ¯xe o desvio padrão amostrals.

3. Calcule o erro padr˜ao, SE=s/√ n.

4. Calcule a estat´ıstica de testet= (ˆµ−µ0)/SE. Este é o número de erros padrão que ˆµdista do valor de hipóteseµ0.

5. Encontre op-valor da distribui¸c˜aot, comr=n−1 graus de liberdade, da tabela usando os valores absolutos da estat´ıstica de teste.

6. Estabele¸ca conclus˜oes e interprete os resultados.

6.4 Teste para uma propor¸c˜ ao

Agora suponha que tenhamos um valor hipot´etico p0 para uma propor¸c˜ao. Podemos realisar um teste de H0:p=p0 praticamente da mesma forma que o test-t acima. A dualidade com intervalos de confian¸ca segue exatamente da mesma forma.

Suponha que tenhamos uma amostra aleatória de tamanho nde uma popula¸cão de interesse onde a verdadeira propor¸cão de membros numa categoria em particular é p. A hipótese nula é H0: p=p0. Se o número observado na categoria de interesse é x, então um teste da hipótese é como segue:

1. Estabele¸ca a hipótese nula, H0: p=p0, e a hipótese alternativa H1: p6=p0. 2. Calcule a propor¸cão amostral ˆp=x/n.

3. Calcule o erro padr˜ao, SE=p ˆ

p(1−p)/n.ˆ

4. Calcule t = (ˆp−p0)/SE, o número de erros padrão que ˆp dista do valor de hipótese p0.

5. Encontre op-valor usando o valor absoluto da estat´ıstica de teste da tabela da distribui¸c˜ao normal (ou equivalentemente datcomr=∞graus de liberdade).

Uma regra geral é que este teste é válido quando quando temos ambosnˆpen(1−p)ˆ maiores do que digamos 10.

6.4.1 Exemplo

Referindo-se ao exemplo da Se¸cão 5.8, suponha que alguém tenha sugerido de ex- periências passadas que 60% das larvas de mosquito no lago deveriam ser da espécie Aedes detritus. Foram encontrados 60 desse tipo de uma amostra de 80. Os dados suportam esta hipóteste?

(40)

6.5 Decis˜ oes e poder

Ao tomar uma decisão a favor ou contra uma hipótese existem dois tipos de erros que você pode cometer. Você pode rejeitar a hipótese nula quando de fato ela é verdadeira (erro tipo I) ou você pode falhar em rejeitar H0 quando de fato ela é falsa (erro tipo II). Existe um balan¸co entre esses dois tipos de erros, no sentido de que ao tentar-se minizar a possibilidade de um tipo, aumenta-se a probabilidade do outro. Frequentemente denotamos as probabilidades destes dois erros como α e β respectivamente.

Decis˜ao

Verdade Aceitar H0 Rejeitar H0

H0 verdadeiro — Erro Tipo I

(1−α) (α)

H0falso Erro Tipo II —

β (1−β)

Opoderde um teste é a probabilidade de rejeitar a hipótese nula quando esta é de fato falsa. Isto é igual a 1−β. Em geral, quanto maior o tamanho da amostra, maior o poder do teste. É desejável decidir sobre um tamanho de amostra conveniente antes de conduzir um estudo de forma que o resultados do teste de hipótese terá poder suficiente para responder a questão cient´ıfica de interesse.

6.6 Dimensionamento de amostras

Vimos no Cap´ıtulo 5 e nas se¸cões anteriores deste cap´ıtulo como construir intervalos e testes de hipóteses para os principais parâmetros populacionais. Em todos os, su- pusemos dado o n´ıvel de confian¸ca desses intervalos e testes. Evidentemente, o n´ıvel de confian¸ca deve ser fixado de acordo com a probabilidade de acerto que se deseja ter na estima¸cão por intervalo e testes. Sendo conveniente, o n´ıvel de confian¸ca pode ser aumentado até tão próximo de 100% quanto se queira, mas isso resultará em intervalos de amplitude cada vez maiores (e testes com poderes cada vez menores), o que significa perda de precisão na estima¸cão. É claro que seria desejável termos intervalos com alto n´ıvel de confian¸ca e pequena probabilidade de erro e grande precisão.

Isso por´em requer uma amostra suficientemente grande, pois, paranfixo, confian¸ca e precis˜ao variam em sentidos opostos.

Veremos a seguir como determinar o tamanho das amostras necessárias nos casos de estima¸cão da média ou de uma propor¸cão populacional. Vimos na Se¸cão 5.4 que o intervalo de confian¸ca de 95% para a média µda popula¸cão quando σé conhecido tem semi-amplitudeddada pela expressão

d=z σ

√n,

onde z = 1.96 para uma confian¸ca de 95%. Ora, o problema então resolvido foi, fixados o n´ıvel de confian¸ca (1−α= 0.95) en, determinard. Mas, é evidente dessa expressão que podemos resolver outro problema. Fixados, d e o n´ıvel de confian¸ca, determinar n, que é o problema da determina¸cão do tamanho de amostra necessário