Introdu¸c˜ ao ` a probabilidade e estat´ıstica II
Intervalos de confian¸ca para a m´edia amostral
Prof. Alexandre G Patriota Sala: 298A
Email: patriota@ime.usp.br Site: www.ime.usp.br/∼patriota
Revis˜ ao
I Define-se o problema de interesse e Coleta-se os dados,
I Estat´ıstica descritiva (histogramas, m´edias, variˆancias, quantis, gr´aficos, etc),
I Baseando-se no histograma pode-se propor um modelo estat´ıstico adequado (fun¸c˜oes densidades de probabilidade ou fun¸c˜oes de probabilidade),
I Estima-se os parˆametros do modelo estat´ıstico utilizando algum m´etodo de estima¸c˜ao (m´axima verossimilhan¸ca, m´ınimos quadrados, m´etodos dos momentos).
I Nesta aula veremos como construir estimadores intervalares.
Caso normal
SejaX1, . . . ,Xn uma amostra aleat´oria deX tal queX ∼N(µ, σ2).
Vimos que:
X¯ e SX2 s˜ao os estimadores de m´axima verossimilhan¸ca paraµ e σ2, respectivamente.
Dizemos que estes s˜ao os estimadores pontuais paraµe σ2. Podemos criar estimadores intervalares. Para isso devemos analisar as distribui¸c˜oes dos estimadores.
Distribui¸c˜ ao da m´ edia - Caso normal
SejaX1, . . . ,Xn uma amostra aleat´oria deX tal queX ∼N(µ, σ2).
Vimos que:
A m´edia amostral tem distribui¸c˜ao normal EXATA
√n( ¯X −µ)
√
σ2 ∼N(0,1)
Ou seja, temos a distribui¸c˜ao exata de ¯X (caso em que as vari´aveis X1, . . . ,Xn s˜ao normais)
Probabilidades da m´ edia amostral
Se os dados tem distribui¸c˜ao normal, ent˜ao ¯X ∼N(µ, σ2/n).
DefinaσX2¯ =σ2/n
Podemos calcular ent˜ao probabilidades do tipo P(|X¯ −µ| ≤)
Ou seja, a probabilidade de que a distˆancia da m´edia amostral e a verdadeira m´edia n˜ao exceda . Podemos re-escrever em termos de de desvios-padr˜ao da m´edia amostral ¯X:
P
|X¯ −µ| ≤kσX¯
Ou seja, a probabilidade de que a distˆancia da m´edia amostral e a verdadeira m´edia n˜ao exceda k desvios-padr˜ao de ¯X
Intervalo de confian¸ca para a m´ edia – Variˆ ancia conhecida
Um intervalo de confian¸ca para a m´edia populacional ´e obtido fixando o valor deγ (coeficiente de confian¸ca) e calculando o valor dek tal que
P
|X¯ −µ| ≤kσX¯
=γ Note que:
P
−kσX¯ ≤X¯ −µ≤kσX¯
=γ
P
−k ≤ X¯ −µ σX¯
≤k
=P(−k ≤Z ≤k) =γ
Assim, dadoγ, podemos encontrar o valor dek na tabela normal.
Intervalo de confian¸ca para a m´ edia – Variˆ ancia conhecida
Note que:
P
−kσX¯ ≤X¯ −µ≤kσX¯
=γ
P
X¯ −kσX¯ ≤µ≤X¯ +kσX¯
=γ
Assim, o intervalo de confian¸ca (com coeficiente de confian¸caγ) ´e IC(µ, γ%) =
X¯ −kσX¯; ¯X +kσX¯
Note quek depende diretamente de γ, poisP(−k ≤Z ≤k) =γ.
Podemos simplesmente chamar dek =zγ/2.
Intervalos de confian¸ca para a m´ edia populacional - Caso normal - Variˆ ancia conhecida
SeX1, . . . ,Xn ´e uma amostra aleat´oria de X ∼N(µ, σ2), ent˜ao um intervalo de confian¸ca, com coeficiente de confian¸ca γ, para a m´edia populacionalµquando a variˆancia σ2 ´econhecida, ´e dado por
IC(µ, γ%) =
X¯ −zγ/2σX¯; ¯X +zγ/2σX¯
em que
σX¯ = rσ2
n e P(−zγ/2≤Z ≤zγ/2) =γ
Interpreta¸c˜ ao do IC
Se repetirmos o experimento v´arias vezes e contruirmos intervalos de confian¸caIC(µ, γ%) para cada um destes experimentos, esperamos queγ% destes intervalos de confian¸ca contenham o verdadeiro valor da m´edia populacional.
Na pr´atica fazemos apenas um experimento e portanto teremos apenas um intervalo. Consideramos, ent˜ao, que a verdadeira m´edia est´a contida neste intervalo.
Interpreta¸c˜ ao gr´ afica
Fonte: Bussab, W.O. e Morettin, P.A. (2012). Estat´ıstica B´asica.
Exemplo
Uma m´aquina enche sacos de a¸cucar com um desvio-padr˜ao de 10 gramas. Inicialmente a m´aquina estava regulada para, em m´edia, encher pacotes com 1 quilo.
Suspeita-se que ela se desregulou e desejamos verificar qual o novo valor de m´edia populacional.
Uma amostra de 50 pacotes apresentou m´edia amostral de 987 gramas. Construa um intervalo de 95% de confian¸ca supondo que a variabilidade do processo ´e a mesma.
Solu¸c˜ ao:
Note queσX¯ = √10n = √10
50 =√ 2
Pela tabela normal: P(−1,96≤Z ≤1,96) = 0,95.
PortantoIC(µ,95%) = [987−1,96√
2; 987 + 1,96√ 2]
IC(µ,95%) = [984,23; 989,77]
Ou seja, o intervalo de confian¸ca de 95% n˜ao cont´em o valor esperado (1000 gramas). Conclu´ımos que a m´aquina est´a desregulada com um grau de 95% de confian¸ca.
Exerc´ıcio
Assuma queX ∼N(µ,100).
Qual deve ser o tamanho de uma amostra para que a diferen¸ca da m´edia amostral e m´edia populacional, em valor absoluto, seja menor do que 1, com coeficiente de confian¸ca igual a: 95% e 99%
Intervalos de confian¸ca para a m´ edia populacional - Caso normal - Variˆ ancia desconhecida
A teoria desenvolvida nos slides anteriores considerou que a
variˆancia era conhecida. Utilizamos o seguinte fato na deriva¸c˜ao do intervalo de confian¸ca:
√n( ¯X −µ)
√
σ2 ∼N(0,1)
Precisamos substituirσ2 por algum estimador. Um candidato inicial seriaSX2.
√n( ¯X −µ)
√?
Qual ´e a quantidade que devemos colocar em “?” ?
Resultados – caso normal
SeX1, . . . ,Xn s˜ao vari´aveis independentes e identicamente distribu´ıdas de acordo comX ∼N(µ, σ2).
Resultado 1: temos que ( ¯X−µ) e
n
X
i=1
(Xi −X¯)2 s˜ao independentes.
Resultado 2: temos que 1 σ2
n
X
i=1
(Xi −X¯)2∼χ2(n−1)
Distribui¸c˜ ao da variˆ ancia amostral – caso normal
SejaX1, . . . ,Xn uma amostra aleat´oria deX tal queX ∼N(µ, σ2).
O estimador de m´axima verossimilhan¸ca paraσ2 ´e SX2 = 1
n
n
X
i=1
(Xi −X¯)2.
I Utilizando os Resultados 1 e 2, calcule a esperan¸ca, variˆancia, vi´es e erro quadr´atico m´edio deSX2.
I Defina ˜SX2 = n−11 Pn
i=1(Xi−X¯)2. Calcule sua esperan¸ca, variˆancia, vi´es e erro quadr´atico m´edio.
Intervalos de confian¸ca para a m´ edia populacional - Caso normal - Variˆ ancia desconhecida
Note que seZ ∼N(0,1) e Y ∼χ2(k) s˜ao independentes, ent˜ao Z
pY/k ∼t(k)
Temos, portanto,
√n( ¯X −µ) qS˜X2
=
√n( ¯X√−µ)
σ2
q˜
SX2 σ2
∼t(n−1)
A constru¸c˜ao do intervalo de confian¸ca quando a variˆancia ´e desconhecida ´e feita de maneira similar ao caso de variˆancias conhecidas.
Intervalos de confian¸ca para a m´ edia populacional - Caso normal - Variˆ ancia desconhecida
SeX1, . . . ,Xn ´e uma amostra aleat´oria de X ∼N(µ, σ2), ent˜ao um intervalo de confian¸ca, com coeficiente deγ% de confian¸ca, para a m´edia populacionalµquando a variˆancia σ2 ´edesconhecida, ´e dado por
IC(µ, γ%) =
X¯ −tγ/2 s
S˜X2
n ; ¯X +tγ/2 s
S˜X2 n
em que
P(−tγ/2 ≤T ≤tγ/2) =γ
eT tem distribui¸c˜ao t-Student comn−1 graus de liberdade.
Quandon >30 podemos aproximar para a distribui¸c˜ao normal.
Exemplo
Da popula¸c˜aoX ∼N(µ, σ2) retirou-se uma amostra de tamanho 10.
Obteve-se ¯x = 48 e sX2 = 120 (variˆancia amostral com denominadorn−1).
Fa¸ca intervalos de confian¸ca paraµconsiderando os seguintes coeficientes de confian¸ca: 90%, 95% e 99%.
Intervalos de confian¸ca APROXIMADO para a m´ edia populacional - Caso geral
SejaX a vari´avel populacional de interesse com distribui¸c˜ao qualquer, tal que tenha esperan¸caEθ(X) =µ e a variˆancia exista e seja finita Varθ(X) =σ2 <∞.
Pelo Teorema do Limite Central:
√n( ¯X −µ)
√
σ2 ≈N(0,1)
Se substituirmosσ2 por um estimador consistente ˆσ2, ent˜ao temos tamb´em que:
√n( ¯X −µ)
√ ˆ
σ2 ≈N(0,1)
quandon´e grande. A aproxima¸c˜ao ´e v´alida tanto para ˆσ2=SX2 quanto para ˆσ2 = ˜SX2.
Intervalos de confian¸ca APROXIMADO para a m´ edia populacional - Caso geral
SeX1, . . . ,Xn´e uma amostra aleat´oria deX, tal que E(X) =µe Var(X) =σ2 <∞, ent˜ao um intervalo de confian¸ca aproximado, com coeficiente deγ% de confian¸ca, para a m´edia populacionalµ,
´e dado por
IC(µ, γ%)≈
X¯ −zγ/2 rσˆ2
n ; ¯X +zγ/2 rσˆ2
n
em que
P(−zγ/2 ≤Z ≤zγ/2) =γ eZ tem distribui¸c˜ao normal padr˜ao.
Intervalos de confian¸ca para a propor¸c˜ ao populacional
SeX1, . . . ,Xn´e uma amostra aleat´oria deX ∼Ber(θ),
distribui¸c˜ao de Bernoulli, ent˜ao podemos criar dois intervalos de confian¸ca aproximados:
Otimista:
IC(θ, γ%)≈
X¯ −zγ/2
rX¯(1−X¯)
n ; ¯X +zγ/2
rX¯(1−X¯) n
Conservador (pessimista):
IC(θ, γ%)≈
X¯ −zγ/2 r 1
4n; ¯X +zγ/2 r 1
4n
Exerc´ıcio
A pesquisa foi realizada entre os dias 08 e 09 de setembro com 2.046 entrevistados em 56 munic´ıpios de S˜ao Paulo. As seguintes frequˆencias foram observadas para os cadidatos `a presidˆencia:
Marina Silva (PSB) 40%
Dilma (PT) 26%
A´ecio Neves (PSDB) 16%
Pastor Everaldo (PSC) 2%
Eduardo Jorge (PV) 1%
Luciana Genro (PSOL) 1%
Outros 1%
Suponha que a amostra obtida ´e aleat´oria. Que tipo de intervalo de confian¸ca deve ser feito, exato ou aproximado?
Construa IC (conservadores e optimistas) com coeficientes de confian¸ca de 95% e 99% para cada caso.