Centro Federal de Educa¸c˜ao Tecnol´ogica Celso Suckow da Fonseca – CEFET/RJ Disciplina: Metodos Estat´ısticos
Prof. Anna Regina Corbo
CAP´ITULO 0: Teoria da Estima¸c˜ao
E o processo que consiste em utilizar dados amostrais para obter valores de parˆ´ ametros populacionais desconhecidos.
Estimador: ´e toda a estat´ıstica amostral que tem um parˆametro correspondente na popula¸c˜ao.
Por exemplo: ¯x´e estimador de µ; s´e estimador de σ.
Estimador n˜ao-tendencioso: Seθ ´e um parˆametro e ˆθ´e seu estimador, dizemos que θˆ´e um estimador n˜ao-tendencioso de θ seE[ˆθ] =θ.
Estimativa: ´e o valor num´erico do estimador.
As estimativas obtidas podem ser:
Pontuais: o parˆametro ´e estimado unicamente pelo valor do estimador.
Intervalar: o parˆametro ´e estimado atrav´es de um intervalo de valores, onde o esti- mador ´e seu valor central.
1 Intervalos de Confian¸ ca
A estima¸c˜ao por intervalos consiste no estabelecimento de limites inferior e superior para o parˆametro que se deseja estimar.
Ao construir o intervalo [lim inf; lim sup] devemos associar a ele umgrau de riscopara o valor real do parˆametro n˜ao pertencer a este intervalo. Este grau de risco ´e expresso em termos de probabilidade, isto ´e, podemos estabelecer um erro aceit´avel(por exemplo, 1%
ou 5%).
A precis˜ao do intervalo ´e o complementar do grau de risco. Este grau de risco ´e chamado de n´ıvel de significˆancia e ´e notado por α.
Ograu de precis˜ao´e o complementar do n´ıvel de significˆancia e ´e notado por 1−α.
Sejaθ um parˆametro em estudo.
[ ˆθ1 6θ 6θˆ2] ´e um intervalo de confian¸ca.
Caracter´ısticas:
1. O tamanho da amostra afeta a precis˜ao do intervalo. Se n ´e grande ⇒ a precis˜ao ´e melhor.
2. O tamanho do intervalo tamb´em depende do n´ıvel de significˆanciaα desejado.
2 Intervalo de confian¸ ca para a m´ edia da popula¸ c˜ ao com variˆ ancia conhecida
Sejam X ∼N(µ, σ2) e ¯X ∼ µ,σn2
. Temos que Z = X−µ
σ e Zx¯ = x¯−µ σ/√
n. Sejazα
2 tal que P(Z 6zα
2) = 1−α
2 (obtido pela tabela da distribui¸c˜ao normal padr˜ao).
Ent˜ao, temos que:
P(−zα
2 6Z 6zα
2) = 1−α Deste modo, temos:
P(−zα
2 6Zx¯ 6zα
2) = 1−α P
−zα
2 6 x¯−µ σ/√
n 6zα
2
= 1−α P
−zα
2 · σ
√n 6x¯−µ6zα
2 · σ
√n
= 1−α P
−¯x−zα
2 · σ
√n 6−µ6−¯x+zα
2 · σ
√n
= 1−α P
¯ x−zα
2 · σ
√n 6µ6x¯+zα
2 · σ
√n
= 1−α
Este ´e o intervalo de confian¸ca 1−α para a m´edia se x´e a m´edia de uma amostra aleat´oria de tamanho n, proveniente de uma popula¸c˜ao com variˆancia conhecida σ2.
Exemplo 1 Considere uma amostra de 100 elementos extra´ıda de uma popula¸c˜ao aproxima- damente normal, cujo desvio-padr˜ao ´e igual a 2,0, que forneceu m´edia x¯= 35,6. Construir um intervalo de 95% de confian¸ca para a m´edia desta popula¸c˜ao.
Exemplo 2 A taxa de queima de um combust´ıvel num determinado ve´ıculo ´e normalmente distribu´ıda, com desvio-padr˜ao de 2 cm/s. Num experimento com 25 amostras, foi obtido uma taxa m´edia amostral de 51,3 cm/s. Determine o intervalo de 99% de confian¸ca para a taxa m´edia populacional de queima.
3 Intervalo de confian¸ ca para a m´ edia quando a variˆ ancia populacional ´ e desconhecida
3.1 A distribui¸c˜ao t-Student
Considere a distribui¸c˜ao t-Student (similar a distribui¸c˜ao normal, por´em com o uso de s ao inv´es de σ). Logo,
Z¯x= X¯ −µ σ/√
n =⇒Tα
2;n−1 = X¯ −µ s/√
n Isto ´e, quando ny∞ temos que T yZ pois syσ.
Usando a tabela t-Student Se α= 0,05 e n = 20 ent˜aotα
2;n−1 =t0,025;19 = 2,09.
3.2 Construindo o intervalo de confian¸ca
Queremos construir um intervalo de confian¸ca para a m´edia onde a variˆancia populacional σ2 ´e desconhecida.
Seja, ent˜ao,
P −tα
2;n−1 6T 6tα
2;n−1
= 1−α P
−tα
2;n−1 6 x¯−µ s/√
n 6tα
2;n−1
= 1−α P
−tα
2;n−1 · s
√n 6x¯−µ6tα
2;n−1· s
√n
= 1−α P
¯ x−tα
2;n−1· s
√n 6µ6x¯+tα
2;n−1· s
√n
= 1−α
Este ´e o intervalo de confian¸ca 1−α para a m´edia se x´e a m´edia de uma amostra aleat´oria de tamanho n, proveniente de uma popula¸c˜ao com variˆancia desconhecida σ2.
Exemplo 3 Considerando que uma amostra de 4 elementos extra´ıda de uma popula¸c˜ao nor- mal forneceu m´edia 8,20e desvio-padr˜ao 0,40, construir um intervalo de 99% de confian¸ca para a m´edia dessa popula¸c˜ao.
Exemplo 4 Os resultados de testes de consumo de energia com geladeiras foram registrados na tabela abaixo. Com base nestes valores, responda: entre que valores est´a a m´edia da popula¸c˜ao com grau de precis˜ao de 95%?
4 Intervalo de confian¸ ca para a variˆ ancia populacional
4.1 A distribui¸c˜ao χ2 (Qui-Quadrado)
Seja X uma amostra tal queX ∼N(µ, σ2).
Sabe-se que a variˆancia amostral ´e dada por s2 =
P(xi−¯x)2 n−1 . Ent˜ao,
s2 σ2 =
P(xi−¯x)2 n−1
σ2 =
P(xi−x)¯ 2 n−1 · 1
σ2 =
P(xi−x)¯ 2 (n−1)·σ2 onde σ2 ´e a variˆancia populacional de X.
Por´em,
P(xi−x)¯ 2
σ2 ∼χ2n−1 tem distribui¸c˜ao Qui-Quadrado se X ∼N(µ, σ2).
Logo,
P(xi−x)¯ 2
(n−1)·σ2 = 1 n−1·
P(xi−x)¯ 2
σ2 = 1
n−1 ·χ2n−1 Ou seja,
s2
σ2 = 1
n−1 ·χ2n−1
Como utilizar a tabela da distribui¸c˜ao Qui-Quadrado?
Dados de entrada: n,α n´ıvel de significˆancia =⇒ valor de referˆenciaχ2n−1,α.
Exemplo 5 Buscar na tabela χ2, os valores relativos `a distribui¸c˜ao amostral inferior e su- perior para:
a)n= 8 e α = 0,05
b)n= 30 e α= 0,1
4.2 Intervalo de confian¸ca para a variˆancia
Seja s2
σ2 = 1
n−1 ·χ2n−1 =⇒ s2(n−1)
σ2 =χ2n−1 Considere o intervalo:
P(χ2inf 6χ2 6χ2sup) = 1−α
onde:
χ2inf =χ2n−1,1−α 2
χ2sup=χ2n−1,α
2
Ent˜ao:
P(χ2inf 6χ2 6χ2sup) = 1−α
P
χ2inf 6 s2(n−1)
σ2 6χ2sup
= 1−α
P 1
χ2inf > σ2
s2(n−1) > 1 χ2sup
!
= 1−α
P s2(n−1)
χ2inf >σ2 > s2(n−1) χ2sup
!
= 1−α
P s2(n−1)
χ2sup 6σ2 6 s2(n−1) χ2inf
!
= 1−α
Este ´e o intervalo de 1−αde confian¸ca para a variˆancia populacional com base em uma amostra de tamanho n.
Exemplo 6 Uma amostra de 11 elementos extra´ıda de uma popula¸c˜ao com distribui¸c˜ao normal forneceu variˆancia de 7,08. Construir um intervalo de 90% de confian¸ca para a variˆancia desta popula¸c˜ao.
5 Estimativa da Propor¸ c˜ ao Populacional
Quando analisamos determinado fenˆomeno, podemos avaliar a propor¸c˜ao de sucessos e falhas na popula¸c˜ao total.
Tomemos como sucessos o evento X e como falha o evento Y = complementar de X.
P(X) = π P(Y) = 1−π
Dada uma amostra X0 queremos estimar a propor¸c˜ao populacional π atrav´es da pro- por¸c˜ao amostral p.
Para amostras “grandes” (em geral quando n > 30) podemos supor que elas tenham distribui¸c˜ao normal. Deste modo, o intervalo de 1−α de confian¸ca para a propor¸c˜ao popu- lacional π, com base em uma amostra de tamanho n, ´e dado por:
P p−zα
2 ·
rp(1−p)
n 6π6p+zα
2 ·
rp(1−p) n
!
= 1−α
Exemplo 7 Em 50 lances de uma moeda, foram obtidas 30 caras. A partir de um intervalo de confian¸ca de 98%, podemos dizer que a moeda ´e honesta?