Estatística: Revelando o Poder dos Dados Lock5
Seção 3.2
Compreensão e
Interpretação dos
Estatística: Revelando o Poder dos Dados
Sumário
Estimativas de intervalo Estimativa intervalar com base na margem de
erro
Intervalo de confiança
Intervalo de confiança de 95% usando o
erro-padrão
Compreendendo intervalos de confiança Interpretações erradas comuns
Estatística: Revelando o Poder dos Dados
Plano de Saúde-Empresa
Um relatório de uma pesquisa Gallup em 2011
com base em uma amostra aleatória de n = 147.291 adultos diz
“Quarenta e cinco por cento dos adultos
americanos relataram obter o plano de saúde de um empregador…”
Qual a precisão de 45%???
http://www.gallup.com/poll/148079/Employer-Based-Health-Insurance-Declines-Further.aspx
Estatística: Revelando o Poder dos Dados
Estimativa Intervalar
Uma estimativa intervalar fornece um intervalo de valores plausíveis
Estatística: Revelando o Poder dos Dados
Margem de Erro
Uma forma comum para uma estimativa intervalar é
estatística ± margem de erro
onde a margem de erro reflete a precisão
da estatística amostral como uma estimativa de ponto para o parâmetro.
Estatística: Revelando o Poder dos Dados
Plano de Saúde-Empresa
“Quarenta e cinco por cento dos adultos americanos relataram obter o plano de saúde de um
empregador…”
Mais tarde no relatório, diz
“a margem máxima de erro de amostragem é de 1 ponto percentual”
Estimativa intervalar: 45% 1% = [44%, 46%]
A porcentagem de adultos americanos recebendo seu
plano de saúde de um empregador estará provavelmente entre 44% e 46%
Estatística: Revelando o Poder dos Dados
Mensagens de Texto
• Uma amostra aleatória de 2011 de n = 755 usuários de telefone celular dos EUA com idade acima de 18
anos descobriu que o número médio de mensagens de texto enviadas ou recebidas por dia é de 41,5
mensagens, com uma margem de erro de 12,2.
• Forneça uma estimativa intervalar para o número médio de mensagens de texto enviadas ou recebidas por dia para usuários adultos de telefone celular nos
EUA. 41.5 12.2
= (29.3, 53.7)
Smith, A. “Americans and Text Messaging,” Pew Research Center,
http://www.pewinternet.org/Reports/2011/Cell-Phone-Texting-2011/Main-Report/How-Americans-Use-Text-Messaging.aspx, accessed 9/19/11.
Estatística: Revelando o Poder dos Dados
Sondagem Eleitoral
http://www.realclearpolitics.com/epolls/2012/president/us/general_election_romney_vs_obama-1171.html
Por que a margem de erro é menor para a pesquisa
Estatística: Revelando o Poder dos Dados
Sondagem Eleitoral
Usando a pesquisa Gallup, calcule uma estimativa de
intervalo para a proporção de eleitores registrados que planejam votar em Obama.
Estatística: Revelando o Poder dos Dados
Sondagem Eleitoral
A eleição presidencial de 2012 já aconteceu,
então essa é uma das raras situações em que realmente conhecemos o verdadeiro
parâmetro populacional, p!
Na eleição real, 50,4% votaram em Obama.
Sua estimativa intervalar contém o parâmetro
Estatística: Revelando o Poder dos Dados
Margem de Erro
• Como determinamos a margem de erro??? • Podemos usar a dispersão da distribuição amostral (o erro padrão) para determinar a margem de erro de uma estatística
Estatística: Revelando o Poder dos Dados
Intervalo de Confiança
Um intervalo de confiança para um
parâmetro é um intervalo calculado a partir de dados da amostra por um método que irá
incluir o parâmetro para uma proporção especificada de todas as amostras possíveis
A taxa de sucesso (proporção de todas as amostras
cujos intervalos contêm o parâmetro) é conhecida
como nível de confiança
Um intervalo de confiança de 95% deverá conter o
Estatística: Revelando o Poder dos Dados
Intervalos de Confiança
StatKey O parâmetro é fixo A estatística é aleatória (depende da amostra) O intervalo é aleatório (depende da estatística) 95% dos intervalos de confiança de 95% incluirão o verdadeiro parâmetroEstatística: Revelando o Poder dos Dados
Se você tivesse acesso à distribuição
amostral, como você encontraria a
margem de erro para garantir que os
intervalos do formulário
estatística ± margem de erro
capturaria o parâmetro para 95% de todas
as amostras?
(Dica: lembre-se da regra de 95% do capítulo 2)
Estatística: Revelando o Poder dos Dados
Intervalo de Confiança de 95%
Se a distribuição amostral é relativamente simétrica e em forma de sino, um intervalo
de confiança de 95% pode ser estimado usando
Estatística: Revelando o Poder dos Dados
Economia
Uma pesquisa com 1.502 americanos em janeiro de 2012
descobriu que 86% consideram a economia uma "prioridade máxima" para o presidente e o congresso.
O erro-padrão para esta estatística é de 0,01.
Qual é o intervalo de confiança de 95% para a proporção verdadeira de todos os americanos que consideravam a economia uma “prioridade máxima” naquela época?
http://www.people-press.org/2012/01/23/public-priorities-deficit-rising-terrorism-slipping/ estatística ± 2×EP 0,86 ± 2×0,01 0,86 ± 0,02 [0,84; 0,88]
Estatística: Revelando o Poder dos Dados
Compreendendo Intervalos de Confiança
95% de todas as amostras produzem
intervalos que contêm o parâmetro
verdadeiro, por isso dizemos que temos “95% de certeza” ou “95% de confiança” de que um intervalo contém a verdade.
“Temos 95% de confiança de que a proporção real de todos os americanos que consideraram a economia como "prioridade máxima" em
Estatística: Revelando o Poder dos Dados
Carbono na Biomassa Florestal
Os cientistas que esperam reduzir o desmatamentoestimam que o carbono armazenado em florestas tropicais na América Latina, África subsaariana e sudeste da Ásia tem uma biomassa total de 247 gigatoneladas.
Para chegar a esta estimativa, eles primeiro estimam a
quantidade média de carbono por quilômetro quadrado.
Com base em uma amostra de tamanho n = 4079 lotes
de inventário, a média da amostra é ҧ𝑥 = 11.600
toneladas com um erro-padrão de 1000 toneladas.
Forneça e interprete um intervalo de confiança de 95%.
Saatchi, S.S. et. al. “Benchmark Map of Forest Carbon Stocks in Tropical Regions Across Three Continents,” Proceedings of the National Academy of Sciences, 5/31/11.
Estatística: Revelando o Poder dos Dados
Carbono na Biomassa Florestal
95% IC: 11.600 21.000 = [9.600; 13.600]
Temos 95% de confiança de que a quantidade média de
carbono armazenada em cada quilômetro quadrado de floresta tropical está entre 9.600 e 13.600 toneladas.
Estatística: Revelando o Poder dos Dados
Proporção de Caras
p = Proporção de vezes que uma moeda da cara
Sabemos p = 0,5, mas vamos fingir que não sabemos
disso e queremos estimar
Jogue uma moeda 25 vezes e calcule sua proporção
Estatística: Revelando o Poder dos Dados
Proporção de Caras
Crie uma distribuição amostral para calcular o
Estatística: Revelando o Poder dos Dados
Interpretações Erradas Comuns
• Interpretação incorreta 1: “Um intervalo de confiança
de 95% contém 95% dos dados na população”
• Interpretação incorreta 2: "Tenho 95% de certeza de
que a média de uma amostra cairá dentro de um intervalo de confiança de 95% para a média"
• Interpretação incorreta 3: “A probabilidade de o
parâmetro populacional estar nesse intervalo de confiança de 95% específico é de 0,95”
Estatística: Revelando o Poder dos Dados
Intervalos de Confiança
População Amostra Amostra Amostra Amostra Amostra Amostra . . . Calcule estatística para cada amostraDistribuição Amostral
Erro-Padrão (EP):
desvio-padrão da distribuição amostral
Margem de Erro (ME)
(95% IC: ME = 2×EP)
Estatística: Revelando o Poder dos Dados
Resumo
• Para criar um intervalo de confiança de 95% para um parâmetro:
o Pegue muitas amostras aleatórias da população e
calcule a estatística amostral para cada amostra
o Calcule o erro-padrão como o desvio-padrão de
todas essas estatísticas
o Use a estatística 2EP
Estatística: Revelando o Poder dos Dados