1
INTERVALO DE CONFIANÇA (IC)
Para estabelecermos um intervalo de confiança utilizaremos a seguinte estratégia
Na distribuição acima, a empresa poderá estar 90 % confiante de que o índice médio de economia de estará entre 28,1 e 34,1.
Considerando os dados acima pode-se estabelecer que tem-se 90% de confiabilidade de que o índice médio de economia de combustível para toda linha de automóvel de passeio do fabricante está entre 28,1 e 34,1 milhas por galão.
Estudaremos a técnica de inferência estatística – usar amostras estatísticas para estimar o valor de um parâmetro populacional desconhecido. Neste campo, estabeleceremos como usar amostras estatísticas para fazer a estimativa do parâmetro populacional quando o tamanho da amostra for pelo menos 30 ou quando a população é normalmente distribuída e o desvio 𝜎 é conhecido.
1.1. INTERVALO DE CONFIANÇA PARA A MÉDIA (AMOSTRAS GRANDES)
Estimativa Pontual: É um valor único estimado para um parâmetro populacional. A estimativa pontual
menos tendenciosa de uma média populacional é a média amostral 𝑥 . Exemplo:
Pesquisadores de mercado usam o número de frases por anúncio como medida de legibilidade de anúncios de revistas. A seguir, representamos uma amostra aleatória do número de frases encontrado em 50 anúncios. Encontre a estimativa pontual da média populacional .
2
Solução:
A média amostral dos dados é:
𝑥 = 𝑥 𝑛 =
620
50 = 12,4
Então, a estimativa pontual para o comprimento da média de todos os anúncios de revista é 12,4 frases
1.2. ESTIMATIVA INTERVALAR
É um intervalo, ou amplitude de valores, usado para estimar um parâmetro populacional. Para formar uma estimativa intervalar, use a estimativa pontual como centro do intervalo e depois adicione e subtraia a margem de erro. Por exemplo, se a margem de erro for 2,1, então uma estimativa intervalar seria dada por 12,4 2,1 ou 10,3 < < 14,5. A estimativa pontual e a estimativa intervalar estão a seguir:
Antes de encontrar a margem de erro para uma estimativa intervalar, devemos primeiro determinar o grau de confiabilidade que sua estimativa intervalar contenha a média populacional .
É a probabilidade de que o intervalo estimado contenha o parâmetro populacional
O nível de confiança c é a área sob a curva normal padrão entre os valores críticos, −𝑧𝑐 𝑒 𝑧𝑐. A
área remanescente é 1 – c, então a área em cada cauda é 1
3 Por exemplo, se c = 90%, então 5% da área está à esquerda −𝑧𝑐 = −1,645 e 5% está à direita de
𝑧𝑐 = 1,645
Considerando c = 90%
C = 0,90 Área na região central da curva
1 – c = 1- 0,90 = 0,10 Área nas regiões extremas (cauda) 1
2 1 − 𝑐 = 0,05
Área em cada cauda
−𝑧𝑐 = −1,645 Valor crítico separando a cauda esquerda
𝑧𝑐 = 1,645 Valor crítico separando a cauda direita
Usaremos níveis de confiança, interligados com os seguintes níveis de confiança:
Nível de Confiança 𝒁𝑪
90 % 1,645
95 % 1,96
99 % 2,575
A diferença entre a estimativa pontual e o valor real do parâmetro é chamada de erro de
amostragem.
Quando temos estimado, o erro de amostragem é a diferença de 𝑥 − 𝜇. Na maioria dos casos, é claro, é desconhecido e 𝑥 varia de amostra para amostra. O valor máximo para o erro poderá ser calculado se o nível de confiança e a distribuição de amostragem forem conhecidos.
1.3. MARGEM DE ERRO
Também denotado por erro máximo da estimativa ou tolerância de erro (E) é a maior distância entre o ponto de estimativa e o valor do parâmetro que se está estimando
𝐸 = 𝑍𝐶𝜎𝑥 = 𝑍𝐶
𝜎 𝑛
Para utilizar tal técnica, assume-se que o desvio padrão da amostra é conhecido. Esse caso é raro, mas quando n 30, o desvio padrão da amostra S pode ser usado no lugar de
Exemplo 1 :
Pesquisadores de mercado usam o número de frases por anúncio como medida de legibilidade de anúncios de revistas. A seguir, representamos uma amostra aleatória do número de frases encontrado em 50 anúncios.Considerando um nível de confiança de 95% e o desvio padrão da amostra é aproximadamente 5,0. CALCULE a Margem de Erro no intuito de encontrar a média de frases em todos os anúncios de revistas.
4
Solução:
Passo 1:
i) Como foi estabelecido um nível de confiança de 95%, temos que o z-escore será de 1,96 (ou seja, 95% da área abaixo da curva normal padrão está dentro de 1,96 desvios padrões da média); ii) Como n 30 podemos utilizar o desvio padrão S no lugar de
iii) Sabemos também que n = 50
Passo 2:
Calculando o Erro amostral teremos: 𝐸 = 𝑍𝐶 𝜎 𝑛
𝐸 = 1,96 5
50≅ 1,4
Passo 4:
1.4. INTERVALO DE CONFIANÇA PARA A MÉDIA POPULACIONAL
Um intervalo de confiança c para a média populacional é: 𝑥 − 𝐸 < 𝜇 < 𝑥 + 𝐸
A probabilidade de que o intervalo de confiança contenha 𝜇 é c
Passos para encontrar um intervalo de confiança para a média populacional ( n 30) ou é conhecido como uma população normalmente distribuída.
Encontrar a estatística amostral e 𝑥 𝑥 = 𝑥 𝑛 Especifique , se for conhecido. Caso contrário,
encontre o desvio padrão amostral S e use-o
como uma estimativa para 𝑆 =
𝑥 − 𝑥 2
𝑛 − 1 Encontre o valor crítico 𝑍𝐶 que corresponda ao
nível de confiança dado
Use a tabela Normal Padrão
Encontrar a margem de erro 𝐸 = 𝑍
𝐶
𝜎 𝑛 Encontre os extremos esquerdo e direito e
forme o intervalo de confiança
Extremo esquerdo: 𝑥 − 𝐸 Extremo direito: 𝑥 + 𝐸
5
CONSTRUINDO UM INTERVALO DE CONFIANÇA
Exemplo 2:
Utilizando os dados do Exemplo 1 construa um intervalo de confiança de 95% para a média do número de frases em todos os anúncios da revista.
Solução: Sendo 𝐸 = 1,96 5 50 ≅ 1,4 𝑥 = 𝑥 𝑛 = 620 50 = 12,4
O intervalo de confiança será: 𝐼𝐶 = 11,0; 13,8 𝐸𝑥𝑡𝑟𝑒𝑚𝑜 𝑒𝑠𝑞𝑢𝑒𝑟𝑑𝑜: 𝑥 − 𝐸 = 12,4 − 1,4 = 11,0 𝐸𝑥𝑡𝑟𝑒𝑚𝑜 𝑑𝑖𝑟𝑒𝑖𝑡𝑜 ∶ 𝑥 + 𝐸 = 12,4 + 1,4 = 13,8
CONSTRUINDO UM INTERVALO DE CONFIANÇA COM 𝝈 CONHECIDO
O diretor de admissão de uma faculdade deseja estimar a idade média de todos os estudantes matriculados. Em uma amostra aleatória de 20 estudantes, a idade média encontrada é 22,9 anos. Baseado em estudos anteriores, o desvio padrão conhecido é 1,5 anos e a população é normalmente distribuída. Construa um intervalo de confiança de 90% para a média de idade da população. Solução: Usando n = 20, 𝑛 = 20 𝑎𝑛𝑜𝑠, 𝑥 = 22,9 𝑎𝑛𝑜𝑠, 𝜎 = 1,5 𝑎𝑛𝑜𝑠, 𝑧0,90 = 1,645 𝑖) 𝐸𝑟𝑟𝑜 𝑎𝑚𝑜𝑠𝑡𝑟𝑎𝑙: 1,6451,5 20≅ 0,60 𝑖𝑖) 𝐸𝑥𝑡𝑟𝑒𝑚𝑜 𝑒𝑠𝑞𝑢𝑒𝑟𝑑𝑜: 𝑥 − 𝐸 = 22,9 − 0,60 = 16,9 𝐸𝑥𝑡𝑟𝑒𝑚𝑜 𝑑𝑖𝑟𝑒𝑖𝑡𝑜 ∶ 𝑥 + 𝐸 = 22,9 + 0,60 = 23,5
6
TAMANHO DA AMOSTRA
Para a mesma amostra estatística, conforme o nível de confiança aumenta, o intervalo de confiança fica mais largo. Conforme o intervalo de confiança fica mais largo, a precisão da estimativa decresce. Uma maneira de aumentar a precisão de uma estimativa sem decrescer o nível de confiança é aumentar o tamanho da amostra. Mas, qual o tamanho de amostra necessário para garantir certo nível de confiança para uma margem de erro dada?
Dado o nível de confiança c e uma margem de erro E, o tamanho mínimo da amostra n necessário para estimar a média populacional 𝜇 é:
𝑛 = 𝑍𝑐𝜎 𝐸
2
Se 𝜎 for desconhecido, você pode estimá-lo usando s, dado que você tenha uma amostra preliminar com pelo menos 30 membros.
Exemplo 3:
Considerando os dados do exemplo 1, DETERMINE quantos anúncios da revista devem ser incluídos na amostra se você quer estar 95% confiante de que a média amostral esteja dentro de uma frase da média populacional?
Solução:
Considerando 𝑐 = 0,95, 𝑍𝑐 = 1,96, 𝜎 ≈ 𝑠 ≈ 5,0 𝑒 𝐸 = 1, você pode encontra o tamanho mínimo
de amostra n: 𝑛 = 𝑍𝑐𝜎 𝐸 2 = 1,96 ∙ 5,0 1 2 = 96,04
Quando necessário arredonde a quantidade de amostras no intuito de obter número inteiro, neste caso a quantidade mínima de amostras será 97.
7
INTERVALOS DE CONFIANÇA PARA MÉDIA (AMOSTRAS PEQUENAS)
Existem situações em que temos o desvio padrão da população desconhecido e por diversos fatores não é possível coletar amostras de tamanha 30 ou mais. Se a variável aleatória for normalmente distribuída, ou aproximadamente normalmente distribuída, pode-se utilizar a distribuição t.
Se a distribuição de uma variável aleatória x for aproximadamente normal, então:
𝑡 = 𝑥 − 𝜇𝑥 𝑛 O que corresponde a uma distribuição t
Valores críticos de t são denotados por 𝑡𝑐. Diversas propriedades da distribuição t estão a seguir.
1. A distribuição t tem forma de sino e é simétrica sobre a média.
2. A distribuição t é uma família de curvas, cada uma determinada por um parâmetro chamado de grau de liberdade. Os graus de liberdade são o número de escolhas livres deixas depois que uma amostra estatística tal como 𝑥 é calculada. Quando usamos a distribuição t para estimar a média da população, os graus de liberdade são iguais ao tamanho da amostra menos um:
𝑔. 𝑙. = 𝑛 − 1 3. A área total sob a curva é 1 ou 100%
4. A média, a mediana e a moda da distribuição t são iguais a zero.
5. Conforme os graus de liberdade aumentam, a distribuição t aproxima a distribuição normal. Depois de 30 g.l. a distribuição t está muito próxima à distribuição normal padrão z.
Exemplo 4:
Encontre o valor crítico 𝑡𝑐 para uma confiança de 95 % quando o tamanho da amostra é 15.
Em razão de n = 15, os graus de liberdade são: g.l. = n -1 = 15 – 1 = 14
Uma parte da Tabela da distribuição t é mostrada abaixo. Considerando g.l. = 14 e c = 0,95, o valor
8 Observando a tabela, você pode ver que 𝑡𝑐 = 2,145. O gráfico abaixo demonstra a distribuição t
para 14 graus de liberdade, c = 0,95 e 𝑡𝑐 = 2,145. A interpretação do gráfico é que 95% da área
sob a curva da distribuição t com 14 graus de liberdade está entre 𝑡 = ±2,145
INTERVALOS DE CONFIANÇA E A DISTRIBUIÇÃO t
Construir um intervalo de confiança usando a distribuição t é similar a construir um intervalo de confiança usando a distribuição normal – ambos usam uma estimativa pontual 𝑥 e um margem de erro E.
INSTRUÇÕES
Em palavras Simbolos
1. Identifique a amostra estatística 𝑛, 𝑥 𝑒 𝑠
𝒙 = 𝒙
𝒏 ; 𝒔 =
𝒙 − 𝒙 𝟐
𝒏 − 𝟏
2. Identifique os graus de liberdade, o nível
de confiança c e os valores críticos 𝑡𝑐
g.l. = n -1
3. Encontre a margem de erro E 𝐸 = 𝑇
𝐶
𝑠 𝑛 4. Encontre os extremos esquerdo e
direito e forme os intervalos de confiança
𝐸𝑥𝑡𝑟𝑒𝑚𝑜 𝑒𝑠𝑞𝑢𝑒𝑟𝑑𝑜: 𝑥 − 𝐸 𝐸𝑥𝑡𝑟𝑒𝑚𝑜 𝑑𝑖𝑟𝑒𝑖𝑡𝑜 ∶ 𝑥 + 𝐸 Intervalo: 𝑥 − 𝐸 < 𝜇 < 𝑥 + 𝐸
9
CONSTRUINDO UM INTERVALO DE CONFIANÇA
Exemplo 5:
Considere uma seleção de 16 cafeterias para a medição da temperatura do café vendido em cada uma delas. A média de temperatura da amostra é de 162,0 ℉ com desvio padrão de 10,0 ℉. Encontre um intervalo de 95% para a temperatura média. Assuma que as temperaturas são normalmente distribuídas.
Solução:
i) Sabendo que 𝑛 = 16; 𝑥 = 162,0; 𝑠 = 10,0; 𝑐 = 0,95 𝑒 𝑔. 𝑙. = 16 − 1 = 15 ii) Utilizando a Tabela de Distribuição t temos que 𝑡𝑐 = 2,131
iii) A margem de erro no intervalo de confiança de 95% é: 𝐸 = 2,131 10
16≈ 5,3 iv) O intervalo de confiança será:
Interpretação: Com 95 % de confiança, podemos dizer que a média da temperatura do café