CURSO DE MESTRADO EM MATEM ´ATICA E ESTAT´ISTICA / UFPA Disciplina: Estat´ıstica Matem´atica Prof: Regina Tavares
1. INTRODUC¸ ˜AO
1.1. Inferˆencia Estat´ıstica:
Objetivo: fazer afirma¸c˜oes sobre caracter´ısticas de uma popula¸c˜ao a partir dos resultados de uma amostra.
PROBLEMAS: Estima¸c˜ao e Teste de Hip´oteses
1.2. Popula¸c˜ao e Amostra:
Defini¸c˜ao 1 (Popula¸c˜ao): O conjunto de valores de uma caracter´ıstica (observ´avel) as- sociada a uma cole¸c˜ao de indiv´ıduos ou objetos de interesse ´e dito ser uma popula¸c˜ao.
Defini¸c˜ao 2(Amostra): ´E qualquer subconjunto da popula¸c˜ao.
Defini¸c˜ao 3(Amostra Aleat´oria): Uma sequˆenciaX1, X2,· · · , Xndenvari´aveis aleat´orias (v.a.) independentes e identicamente distribu´ıdas (i.i.d.) com fun¸c˜ao densidade de prob- abilidade (f.d.p.) ou, no caso discreto, fun¸c˜ao de probabilidade (f.p.) f(x|θ) ´e dita ser uma amostra aleat´oria (a.a.) de tamanho n da distribui¸c˜ao de X.
“POPULAC¸ ˜AO” ⇐⇒ X: vari´avel de interesse observada
1.3. Estat´ısticas e Parˆametros:
Defini¸c˜ao 4(Estat´ıstica): Umaestat´ıstica´e uma caracter´ıstica da amostra, ou seja, uma estat´ıstica T ´e uma fun¸c˜ao de X1, X2,· · · , Xn,T =f(X1, X2,· · · , Xn).
As estat´ısticas mais comuns s˜ao:
• X = (1/n)Pn
i=1Xi : m´edia amostral
• σˆ2 = (1/n)Pn
i=1(Xi−X)2 : variˆancia amostral
• S2 = (1/(n−1))Pn
i=1(Xi−X)2 : variˆancia amostral
• X˜ = med(X1, X2,· · ·, Xn) : mediana amostral
• X(1) = m´ın(X1, X2,· · · , Xn) : o menor valor da amostra
• X(n) = m´ax(X1, X2,· · · , Xn) : o maior valor da amostra
Defini¸c˜ao 5 (Parˆametro): Um parˆametro´e uma medida usada para descrever uma car- acter´ıstica da popula¸c˜ao.
Tabela 1: S´ımbolos mais comuns Estat´ıstica Parˆametro
M´edia X µ
Variˆancia S2 σ2
No de elementos n N
Propor¸c˜ao pˆ p
1.4. Fun¸c˜ao de Verossimilhan¸ca:
Defini¸c˜ao 6(Fun¸c˜ao de verossimilhan¸ca) : A fun¸c˜ao de densidade (ou de probabilidade) conjunta da amostra ´e denominada fun¸c˜ao de verossimilhan¸ca de θ, correspondente `a amostra observada x= (x1, x2,· · · , xn), e ser´a denotada por
L(θ;x) =
n
Y
i=1
f(xi|θ) =f(x1|θ).f(x2|θ)· · ·f(xn|θ) (1)
1.5. Principais Modelos de Probabilidade:
Seja X uma vari´avel aleat´oria cont´ınua (ou discreta) com f.d.p. (ou f.p.) f(x|θ). Neste caso, θ ´e o parˆametro associado ao modelo de probabilidade da vari´avel aleat´oria X.
Defini¸c˜ao 7 (Suporte de um modelo): O conjunto A(x) = {x : f(x|θ) > 0} ´e denomi- nado o suporte da v.a. X.
Defini¸c˜ao 8(Espa¸co Param´etrico): O conjunto Θ dos valores poss´ıveis deθ´e denominado Espa¸co Param´etrico.
1.5.1 - Modelos Discretos:
a) Distribui¸c˜ao Uniforme Discreta: X ∼U D(1, N)
Todos os valores de X tˆem igual probabilidade de ocorrˆencia.
f(x|N) =P(X =x|N) = 1
N, x= 1,2,· · · , N (N−inteiro) E(X) = N + 1
2 V ar(X) = (N + 1)(N −1) 12
b) Distribui¸c˜ao de Bernoulli: X ∼Bernoulli(θ)
X ´e uma v.a. dicotˆomica (ou bin´aria): X = 0 (”fracasso”) ouX = 1 (”sucesso”).
f(x|θ) =P(X =x|θ) = θx(1−θ)1−x, x= 0,1 0< θ <1 E(X) = θ V ar(X) =θ(1−θ)
c) Distribui¸c˜ao Binomial: X ∼Bin(n, θ)
Xrepresenta o node ”sucessos”emnrepeti¸c˜oes independentes de uma v.a. Bernoulli(θ).
f(x|θ) = P(X =x|θ) = µn
x
¶
θx(1−θ)n−x, x= 0,1,· · · , n 0< θ <1 E(X) =nθ V ar(X) =nθ(1−θ)
d) Distribui¸c˜ao Geom´etrica: X ∼G(θ)
X representa o no de repeti¸c˜oes necess´arias at´e a ocorrˆencia do primeiro ”sucesso”.
f(x|θ) = P(X =x|θ) =θ(1−θ)x−1, x= 1,2,· · · 0< θ <1 E(X) = 1
θ V ar(X) = 1−θ θ2 e) Distribui¸c˜ao Binomial Negativa: X ∼BN(r, θ)
X representa o no de repeti¸c˜oes necess´arias at´e a ocorrˆencia dor-´esimo ”sucesso”.
f(x|θ) = P(X =x|θ) =
µx−1 r−1
¶
θr(1−θ)x−r, x=r, r+ 1,· · · 0< θ <1
E(X) = r(1−θ)
θ +r V ar(X) = r(1−θ) θ2 f) Distribui¸c˜ao de Poisson: X ∼P(θ)
f(x|θ) =P(X =x|θ) = e−θθx
x! , x= 0,1,· · · θ >0
E(X) =θ V ar(X) = θ
1.5.2 - Modelos Cont´ınuos:
a) Distribui¸c˜ao Uniforme: X ∼U(θ1, θ2) f(x|θ1, θ2) = 1
θ2 −θ1
, θ1 < x < θ2 − ∞< θ1 < θ2 <+∞ E(X) = θ1+θ2
2 V ar(X) = (θ2−θ1)2 12 b) Distribui¸c˜ao Normal: X ∼N(µ, σ2)
f(x|µ, σ2) = 1
√2πσ exp
½
−(x−µ)2 2σ2
¾
, −∞< x <+∞ − ∞< µ <+∞ σ >0 E(X) = µ V ar(X) =σ2
c) Distribui¸c˜ao Exponencial: X ∼Exp(θ)
f(x|θ) =θe−θx, x >0 θ > 0 E(X) = 1
θ V ar(X) = 1 θ2 d) Distribui¸c˜ao Gama: X ∼Gama(α, β)
f(x|α, β) = βα
Γ(α) xα−1e−βx, x >0 α >0 β >0 E(X) = α
β V ar(X) = α β2 onde Γ(a) =R∞
0 ua−1e−udu, paraa >0, ´e denominada fun¸c˜ao Gama.
e) Distribui¸c˜ao Beta: X ∼Beta(a, b) f(x|a, b) = Γ(a+b)
Γ(a)Γ(b) xa−1(1−x)b−1, 0< x <1 a >0 b >0 E(X) = a
a+b V ar(X) = ab
(a+b)2(a+b+ 1) f) Distribui¸c˜ao Qui-quadrado: X ∼χ2n
f(x|n) = (1/2)n/2
Γ(n/2) xn2−1e−x2, x >0 n≥1 (inteiro)
E(X) =n V ar(X) = 2n
g) Distribui¸c˜ao F-Snedecor: X ∼Fm,n
f(x|m, n) = Γ(m+n2 )
Γ(m/2)Γ(n/2)(m
n)m/2 xm2−1³ 1 + m
n x´−m+n2
, x >0 m, n≥1(inteiros)
E(X) = n
n−2 V ar(X) = 2n2(m+n−2) m(n−2)2(n−4) h) Distribui¸c˜ao t-Student: X ∼tn
f(x|n) = Γ(n+12 ) Γ(n/2)
√1 nπ
µ 1 + x2
n
¶−n+12
, −∞< x < +∞ n≥1(inteiro) E(X) = 0 V ar(X) = n
n−2 1.5.3 - Alguns resultados importantes:
1 - Se X ∼N(µ, σ2) e Y =aX+b, ent˜ao Y ∼N(aµ+b, a2σ2).
2 - Se Z ∼N(0,1), ent˜ao Z2 ∼χ21.
3 - Seja X ∼Beta(a, b). Se a=b= 1, ent˜ao X ∼U(0,1).
4 - Se X ∼Fm,n, ent˜ao X1 ∼Fn,m. 5 - Seja X ∼Gama(α, β).
i) se α = 1, ent˜aoX ∼Exp(β);
ii) se α = k2 eβ = 12, ent˜ao X ∼χ2k.
6 - Sejam Xi ∼N(µi, σi2), i= 1,· · · , n, vari´aveis independentes, ent˜ao
n
X
i=1
Xi ∼ N(
n
X
i=1
µi,
n
X
i=1
σ2i).
7 - Sejam Xi ∼Gama(αi, β),i= 1,· · · , n, vari´aveis independentes, ent˜ao i) Pn
i=1Xi ∼ Gama(Pn
i=1αi , β);
ii) PnX1
i=1Xi ∼Beta(α1 , Pn j=2αj).
8 - Sejam Xi ∼χ2ki, i= 1,· · · , n, vari´aveis independentes, ent˜ao
n
X
i=1
Xi ∼ χ2r, com r=
n
X
i=1
ki.
9 - Sejam X∼χ2m e Y ∼χ2n vari´aveis independentes, ent˜ao W = X/m
Y /n ∼Fm,n.
10 - Sejam Z ∼N(0,1) e Y ∼χ2n vari´aveis independentes, ent˜ao U = Z
pY /n ∼tn.
11 - Sejam Xi ∼Exp(θ), i= 1,2,· · · , n, v.a.’s independentes, ent˜ao
n
X
i=1
Xi ∼ Gama(n, θ).
12 - Sejam Xi ∼P(θ), i= 1,2,· · ·, n, v.a.’s independentes, ent˜ao
n
X
i=1
Xi ∼ P(nθ).
1.6. Distribui¸c˜oes Amostrais X: vari´avel de interesse
θ: parˆametro desconhecido da distribui¸c˜ao deX
T =f(X1, X2,· · · , Xn): estat´ıstica escolhida para fornecer informa¸c˜ao sobreθ
AMOSTRAS
POPULAÇÂO 1
2 . . . k X
t11
t1 t
t2
tk
• T ´e uma vari´avel aleat´oria !
• Qual a distribui¸c˜ao de T quando (X1, X2,· · · , Xn) assume todos os valores poss´ıveis ? (Distribui¸c˜ao amostral de T)
1.6.1 - Teoremas de Convergˆencia
Teorema 1 : (Lei Fraca dos Grandes N´umeros)
Seja (X1, X2,· · · , Xn) uma a.a. de tamanho n de uma popula¸c˜ao X com m´edia e variˆancia finitas, dadas por E(X) = µ e V ar(X) = σ2. Sejam ǫ > 0 e 0 < δ < 1. Se n > σ2δǫ2, ent˜ao
P(|Xn−µ|< ǫ)≥1−δ ou seja, Xn converge em probabilidade para µ.
Teorema 2 : (Teorema Central do Limite)
Seja X1, X2,· · · , Xn,· · · uma sequˆencia de v.a.’s independentes com E(Xi) = µi e V ar(Xi) = σ2i <∞,i= 1,2,· · ·, e sejaX =X1+X2+· · ·+Xn. Ent˜ao, sob determinadas condi¸c˜oes gerais,
Zn= X−Pn i=1µi pPn
i=1σi2 tem aproximadamente distribui¸c˜ao Normal padr˜ao.
Teorema 3 : (Distribui¸c˜ao Amostral da M´edia)
Para amostras aleat´orias (X1, X2,· · · , Xn) retiradas de uma popula¸c˜ao X com m´edia E(X) =µe variˆanciaV ar(X) = σ2, a distribui¸c˜ao amostral da m´ediaXn= X1+X2n+···+Xn aproxima-se de uma distribui¸c˜ao normal com m´edia E(Xn) = µ e variˆancia V ar(Xn) = σ2/n.
• Sabemos que a soma de normais independentes ´e normal, mas o TCL ´e mais forte pois afirma que as vari´aveis originais n˜ao precisam ter distrib. normal, ´e necess´ario apenas que tenham variˆancia finita.
• Xn∼N(µ, σ2/n).
1.6.2 - Distribui¸c˜ao Amostral da M´edia
Corol´ario 1: Seja (X1, X2,· · ·, Xn) uma a.a. de uma popula¸c˜ao X, com E(X) = µ e V ar(X) =σ2 <∞. Para n grande, temos
Xn−µ
σ/√n ∼N(0,1)
• Algumas situa¸c˜oes onde teremos uma distribui¸c˜ao exata paraXn: i) X ∼N ormal(µ, σ2) (X1, X2,· · · , Xn): a.a da popula¸c˜aoX Neste caso, a distribui¸c˜ao exata para a m´edia amostral ´e dada por
Xn ∼N(µ, σ2/n)
ii)X ∼Exp(θ) (X1, X2,· · · , Xn): a.a. da popula¸c˜aoX Neste caso, a distribui¸c˜ao exata para a m´edia amostral ´e dada por
Xn∼Gama(n, nθ)
iii) X ∼Bernoulli(θ) (X1, X2,· · ·Xn): a.a. da popula¸c˜aoX Neste caso, a distribui¸c˜ao exata para a m´edia amostral ´e dada por
f(xn|θ) = P(Xn =xn) = n!
(nxn)!(n−nxn)! θnxn(1−θ)n−nxn
xn= 0,n1,n2,· · · ,1 iv) X ∼P(θ) (X1, X2,· · ·Xn): a.a. da popula¸c˜ao X
Neste caso, a distribui¸c˜ao exata para a m´edia amostral ´e dada por f(xn|θ) =P(Xn=xn) = e−nθ(nθ)nxn
(nxn)! xn = 0, 1 n, 2
n,· · ·
1.6.3 - Distribui¸c˜ao Amostral da Propor¸c˜ao
X ∼Bernoulli(θ) (X1, X2,· · ·Xn): a.a. da popula¸c˜aoX
θ : propor¸c˜ao de indiv´ıduos portadores de determinada caracter´ıstica na popula¸c˜ao.
E(Xi) = θ V ar(Xi) =θ(1−θ) i= 1,2,· · · , n
Sn=Pn
i=1Xi : total de indiv´ıduos portadores da caracter´ıstica na amostra ˆ
p= Snn : propor¸c˜ao de indiv´ıduos portadores da caracter´ıstica na amostra Portanto, Sn =Pn
i=1Xi ∼Bin(n, θ), e temos P(Sn=k) = n!
k!(n−k)! θk(1−θ)n−k k = 0,1,· · · , n
Logo,
P µ
ˆ p= k
n
¶
= n!
k!(n−k)! θk(1−θ)n−k k= 0,1,· · · , n
(Distribui¸c˜ao amostral exata para p)ˆ
Agora, ˆp= Snn = P
n i=1Xi
n =Xn, e pelo TCL temos que para n grande ˆ
p∼N µ
θ,θ(1−θ) n
¶
(Distribui¸c˜ao amostral aproximada para p)ˆ
1.6.4 - Distribui¸c˜ao Amostral da Variˆancia
X : popula¸c˜ao (X1, X2,· · ·Xn): a.a. da popula¸c˜aoX Queremos obter a distribui¸c˜ao de S2 = n−11
Pn
i=1(Xi−X)2, a variˆancia amostral.
Teorema 4: Seja (X1, X2,· · ·Xn) uma a.a. de X ∼N(µ, σ2), ent˜ao i) X ePn
i=1(Xi−X)2 s˜ao independentes;
ii) Pn i=1
(Xi−X)2
σ2 ∼χ2n−1
Teorema 5 (inferˆencia sobre σ2): Seja (X1, X2,· · ·Xn) uma a.a. de X ∼ N(µ, σ2), ent˜ao
i) E(S2) =σ2; ii) (n−σ1)S2 2 ∼χ2n−1
Corol´ario 2 (Compara¸c˜ao de variˆancias): Sejam (X1, X2,· · ·Xn) uma a.a. de X ∼ N(µx, σ2) e (Y1, Y2,· · ·Ym) uma a.a. deY ∼N(µy, σ2). Se as duas amostras s˜ao indepen- dentes, ent˜ao
i) σ12
Pn
i=1(Xi−X)2 ∼χ2n−1; ii) σ12
Pm
i=1(Yi−Y)2 ∼χ2m−1; iii) P
n
i=1(Xi−X)2/n Pm
i=1(Yi−Y)2/m ∼Fn−1,m−1
Corol´ario 3 (inferˆencia sobreµ): Se (X1, X2,· · ·Xn) ´e uma a.a. deX ∼N(µ, σ2), ent˜ao T =
√n(X−µ)/σ q(1/σ2)Pn
i=1(Xi−X)2 n−1
=
√n(X−µ)/σ qS2
σ2
=
√n(X−µ)
S ∼tn−1
1.6.5 - Distribui¸c˜ao amostral do M´aximo e do M´ınimo
EXEM P LO: Seja (X1, X2, X3, X4) uma amostra aleat´oria da popula¸c˜ao X ∼ Exp(5).
Encontre a distribui¸c˜ao deX(4) = m´ax (X1, X2, X3, X4) e deX(1) = m´ın (X1, X2, X3, X4).
X ∼Exp(5) =⇒
f(x) = 5e−5x, x >0 (f.d.p. de X)
FX(s) = P(X ≤s) = 1−e−5s, s >0 (f.d.a. de X)
(X1, X2, X3, X4) ´e uma a.a. de X, ent˜ao Xi ∼Exp(5), ∀i= 1,2,3,4
• Vamos obter a f.d.a. de X(4) = m´ax (X1, X2, X3, X4):
FX(4)(t) = P(X(4) ≤t) = P(m´ax (X1, X2, X3, X4)≤t) Agora,
m´ax (X1, X2, X3, X4)≤t ⇐⇒ X1 ≤t, X2 ≤t, X3 ≤teX4 ≤t Portanto,
FX(4)(t) = P(X1 ≤t)P(X2 ≤t)P(X3 ≤t)P(X4 ≤t)
= (1−e−5t)4, t >0 Logo, a f.d.p. deX(4) ´e dada por:
fX(4)(t) = dFX(4)(t)
dt = 4(1−e−5t)3×5e−5t = 20e−5t(1−e−5t)3
• Vamos obter a f.d.a. de X(1) = m´ın (X1, X2, X3, X4):
FX(1)(u) = P(X(1) ≤u) =P(m´ın (X1, X2, X3, X4)≤u)
= 1−P(m´ın (X1, X2, X3, X4)> u)