INTERVALO DE CONFIANÇA (IC)
Para estabelecermos um intervalo de confiança utilizaremos a seguinte estratégia
Na distribuição acima, a empresa poderá estar 90 % confiante de que o índice médio de economia de estará entre 28,1 e 34,1.
Considerando os dados acima pode-se estabelecer que tem-se 90% de confiabilidade de que o índice médio de economia de combustível para toda linha de automóvel de passeio do fabricante está entre 28,1 e 34,1 milhas por galão. Estudaremos a técnica de inferência estatística – usar amostras estatísticas para estimar o valor de um parâmetro populacional desconhecido. Neste campo, estabeleceremos como usar amostras estatísticas para fazer a estimativa do parâmetro populacional quando o tamanho da amostra for pelo menos 30 ou quando a população é normalmente distribuída e o desvio
σ
é conhecido.1.1. INTERVALO DE CONFIANÇA PARA A MÉDIA (AMOSTRAS GRANDES) Estimativa Pontual: É um valor único estimado para um parâmetro populacional. A estimativa pontual menos tendenciosa de uma média populacional é a média amostral
´
x
.Exemplo:
Pesquisadores de mercado usam o número de frases por anúncio como medida de legibilidade de anúncios de revistas. A seguir, representamos uma amostra aleatória do número de frases encontrado em 50 anúncios. Encontre a estimativa pontual da média populacional .
Solução:
A média amostral dos dados é:
´
x=
∑
x
n
=
620
50
=12,4
Então, a estimativa pontual para o comprimento da média de todos os anúncios de revista é 12,4 frases
1.2. ESTIMATIVA INTERVALAR
É um intervalo, ou amplitude de valores, usado para estimar um parâmetro populacional. Para formar uma estimativa intervalar, use a estimativa pontual como centro do intervalo e depois adicione e subtraia a margem de erro. Por exemplo, se a margem de erro for 2,1, então uma estimativa intervalar seria dada por 12,4 2,1 ou 10,3 < < 14,5. A estimativa pontual e a estimativa intervalar estão a seguir:
Antes de encontrar a margem de erro para uma estimativa intervalar, devemos primeiro determinar o grau de confiabilidade que sua estimativa intervalar contenha a média populacional .
É a probabilidade de que o intervalo estimado contenha o parâmetro populacional
O nível de confiança c é a área sob a curva normal padrão entre os valores críticos, −zce zc . A área remanescente é 1 – c, então a área em cada cauda é
1
2
(1−c )
.Por exemplo, se c = 90%, então 5% da área está à esquerda
−
z
c=−1,645
e 5% está à direita dez
c=1,645
Considerando c = 90%
C = 0,90 Área na região central da curva
1 – c = 1- 0,90 = 0,10 Área nas regiões extremas (cauda)
1
2
(
1−c )=0,05
Área em cada cauda
−
z
c=−1,645
Valor crítico separando a cauda esquerdaz
c=1,645
Valor crítico separando a cauda direita Usaremos níveis de confiança, interligados com os seguintes níveis de confiança: Nível de Confiança ZC 90 % 1,645 95 % 1,96 99 % 2,575A diferença entre a estimativa pontual e o valor real do parâmetro é chamada de erro de amostragem.
Quando temos estimado, o erro de amostragem é a diferença de
´
x−μ
. Na maioria dos casos, é claro, é desconhecido e´
x
varia de amostra para amostra. O valor máximo para o erro poderá ser calculado se o nível de confiança e a distribuição de amostragem forem conhecidos.1.3. MARGEM DE ERRO
Também denotado por erro máximo da estimativa ou tolerância de erro (E) é a maior distância entre o ponto de estimativa e o valor do parâmetro que se está estimando
E=Z
Cσ
´x=
Z
Cσ
√
n
Para utilizar tal técnica, assume-se que o desvio padrão da amostra é conhecido. Esse caso é raro, mas quando n 30, o desvio padrão da amostra S pode ser usado no lugar de
Exemplo 1 :
Pesquisadores de mercado usam o número de frases por anúncio como medida de legibilidade de anúncios de revistas. A seguir, representamos uma amostra aleatória do número de frases encontrado em 50 anúncios.Considerando um nível de confiança de 95% e o desvio padrão da amostra é aproximadamente 5,0. CALCULE a Margem de Erro no intuito de encontrar a média de frases em todos os anúncios de revistas.
Solução: Passo 1:
i) Como foi estabelecido um nível de confiança de 95%, temos que o z-escore será de 1,96 (ou seja, 95% da área abaixo da curva normal padrão está dentro de 1,96 desvios padrões da média);
ii) Como n 30 podemos utilizar o desvio padrão S no lugar de iii) Sabemos também que n = 50
Passo 2:
Calculando o Erro amostral teremos:
E=Z
Cσ
√
n
E=1,96
5
√
50
≅1,4
Passo 4:1.4. INTERVALO DE CONFIANÇA PARA A MÉDIA POPULACIONAL Um intervalo de confiança c para a média populacional é:
´
x−E<μ< ´x +E
A probabilidade de que o intervalo de confiança contenha μ é c
Passos para encontrar um intervalo de confiança para a média populacional ( n 30) ou é conhecido como uma população normalmente distribuída.
Encontrar a estatística amostral e
´
x
´x=∑
nxEspecifique , se for conhecido. Caso contrário, encontre o desvio padrão amostral S e use-o como uma estimativa para
S=
√
∑
(
x−´x )
2
n−1
Encontre o valor críticoZ
C quecorresponda ao nível de confiança dado
Encontrar a margem de erro
E=Z
Cσ
√
n
Encontre os extremos esquerdo edireito e forme o intervalo de confiança
Extremo esquerdo: ´x−E
Extremo direito:
´
x+E
Intervalo: ´x−E<μ< ´x +ECONSTRUINDO UM INTERVALO DE CONFIANÇA Exemplo 2:
Utilizando os dados do Exemplo 1 construa um intervalo de confiança de 95% para a média do número de frases em todos os anúncios da revista. Solução: Sendo
E=1,96
5
√
50
≅1,4
´ x=∑
x n = 620 50 =12,4O intervalo de confiança será:
IC=(11,0;13,8)
Extremoesquerdo : ´x−E=12,4−1,4=11,0
Extremodireito : ´x +E=12,4+1,4=13,8
CONSTRUINDO UM INTERVALO DE CONFIANÇA COM σ CONHECIDO O diretor de admissão de uma faculdade deseja estimar a idade média de todos os estudantes matriculados. Em uma amostra aleatória de 20 estudantes, a idade média encontrada é 22,9 anos. Baseado em estudos anteriores, o desvio padrão conhecido é 1,5 anos e a população é normalmente distribuída. Construa um intervalo de confiança de 90% para a média de idade da população.
Solução:
Usando n = 20,
n=20 anos , ´x=22,9 anos , σ =1,5 anos , z
0,90=1,645
i
¿
Erro amostral :1,645
1,5
ii
¿
Extremoesquerdo : ´x −E=22,9−0,60=22,3
Extremodireito : ´x +E=22,9+0,60=23,5
TAMANHO DA AMOSTRA
Para a mesma amostra estatística, conforme o nível de confiança aumenta, o intervalo de confiança fica mais largo. Conforme o intervalo de confiança fica mais largo, a precisão da estimativa decresce. Uma maneira de aumentar a precisão de uma estimativa sem decrescer o nível de confiança é aumentar o tamanho da amostra. Mas, qual o tamanho de amostra necessário para garantir certo nível de confiança para uma margem de erro dada?
Dado o nível de confiança c e uma margem de erro E, o tamanho mínimo da amostra n necessário para estimar a média populacional μ é:
n=
(
Z
cσ
E
)
2
Se σ for desconhecido, você pode estimá-lo usando s, dado que você tenha uma amostra preliminar com pelo menos 30 membros.
Exemplo 3:
Considerando os dados do exemplo 1, DETERMINE quantos anúncios da revista devem ser incluídos na amostra se você quer estar 95% confiante de que a média amostral esteja dentro de uma frase da média populacional?
Solução:
Considerando
c=0,95, Z
c=1,96, σ ≈ s ≈ 5,0 e E=1
, você pode encontra o tamanho mínimo de amostra n:n=
(
Zcσ E)
2 =(
1,96 ∙5,0 1)
2 =96,04Quando necessário arredonde a quantidade de amostras no intuito de obter número inteiro, neste caso a quantidade mínima de amostras será 97.
Existem situações em que temos o desvio padrão da população desconhecido e por diversos fatores não é possível coletar amostras de tamanha 30 ou mais. Se a variável aleatória for normalmente distribuída, ou aproximadamente normalmente distribuída, pode-se utilizar a distribuição t.
Se a distribuição de uma variável aleatória x for aproximadamente normal, então:
t=
x −μ
´
x
√
n
O que corresponde a uma distribuição t
Valores críticos de t são denotados por tc . Diversas propriedades da distribuição t estão a seguir.
1. A distribuição t tem forma de sino e é simétrica sobre a média.
2. A distribuição t é uma família de curvas, cada uma determinada por um parâmetro chamado de grau de liberdade. Os graus de liberdade são o número de escolhas livres deixas depois que uma amostra estatística tal como ´x é calculada. Quando usamos a distribuição t para estimar a média da população, os graus de liberdade são iguais ao tamanho da amostra menos um:
g .l .=n−1
3. A área total sob a curva é 1 ou 100%
4. A média, a mediana e a moda da distribuição t são iguais a zero.
5. Conforme os graus de liberdade aumentam, a distribuição t aproxima a distribuição normal. Depois de 30 g.l. a distribuição t está muito próxima à distribuição normal padrão z.
Exemplo 4:
Encontre o valor crítico tc para uma confiança de 95 % quando o tamanho da amostra é 15.
Em razão de n = 15, os graus de liberdade são: g.l. = n -1 = 15 – 1 = 14
Uma parte da Tabela da distribuição t é mostrada abaixo. Considerando g.l. = 14 e c = 0,95, o valor crítico tc é mostrado pela áreas destacadas na tabela.
Observando a tabela, você pode ver que tc=2,145 . O gráfico abaixo demonstra a distribuição t para 14 graus de liberdade, c = 0,95 e tc=2,145 . A interpretação do gráfico é que 95% da área sob a curva da distribuição t com 14 graus de liberdade está entre t=± 2,145
INTERVALOS DE CONFIANÇA E A DISTRIBUIÇÃO t
Construir um intervalo de confiança usando a distribuição t é similar a construir um intervalo de confiança usando a distribuição normal – ambos usam uma estimativa pontual
´
x
e um margem de erro E.INSTRUÇÕES
Em palavras Simbolos
1. Identifique a amostra estatística
n , ´x e s
x=
∑
x
n
;s=
√
∑
(
x−´x )
2n−1
2. Identifique os graus de liberdade,o nível de confiança c e os valores críticos tc
3. Encontre a margem de erro E
E=T
Cs
√
n
4. Encontre os extremos esquerdoe direito e forme os intervalos de confiança
Extremoesquerdo : ´x−E
Extremodireito : ´x +E
Intervalo: ´x−E<μ< ´x +ECONSTRUINDO UM INTERVALO DE CONFIANÇA Exemplo 5:
Considere uma seleção de 16 cafeterias para a medição da temperatura do café vendido em cada uma delas. A média de temperatura da amostra é de
162,0℉ com desvio padrão de 10,0℉ . Encontre um intervalo de 95% para
a temperatura média. Assuma que as temperaturas são normalmente distribuídas.
Solução:
i) Sabendo que
n=16 ; ´x =162,0; s=10,0 ;c=0,95 e g . l.=16−1=15
ii) Utilizando a Tabela de Distribuição t temos que tc=2,131iii) A margem de erro no intervalo de confiança de 95% é:
E=2,131
10
√
16
≈ 5,3
iv) O intervalo de confiança será:
Interpretação: Com 95 % de confiança, podemos dizer que a média da temperatura do café vendido está entre 156,7℉ e 167,3℉ .