Objetivo: fazer afirmações sobre características de uma população a partir dos resultados de uma amostra.

(1)

CURSO DE MESTRADO EM MATEM ÁTICA E ESTATÍSTICA / UFPA Disciplina: Estat´ıstica Matemática Prof: Regina Tavares

1. INTRODUC¸ ˜AO

1.1. Inferˆencia Estat´ıstica:

Objetivo: fazer afirma¸c˜oes sobre caracter´ısticas de uma popula¸c˜ao a partir dos resultados de uma amostra.

PROBLEMAS: Estima¸c˜ao e Teste de Hip´oteses

1.2. Popula¸c˜ao e Amostra:

Defini¸cão 1 (Popula¸cão): O conjunto de valores de uma caracter´ıstica (observável) as- sociada a uma cole¸cão de indiv´ıduos ou objetos de interesse é dito ser uma popula¸cão.

Defini¸cão 2(Amostra): É qualquer subconjunto da popula¸cão.

Defini¸cão 3(Amostra Aleatória): Uma sequênciaX₁, X₂,· · · , X_ndenvariáveis aleatórias (v.a.) independentes e identicamente distribu´ıdas (i.i.d.) com fun¸cão densidade de probabilidade (f.d.p.) ou, no caso discreto, fun¸cão de probabilidade (f.p.) f(x|θ) é dita ser uma amostra aleatória (a.a.) de tamanho n da distribui¸cão de X.

“POPULAÇ ÃO” ⇐⇒ X: variável de interesse observada

1.3. Estat´ısticas e Parˆametros:

Defini¸cão 4(Estat´ıstica): Umaestat´ısticaé uma caracter´ıstica da amostra, ou seja, uma estat´ıstica T é uma fun¸cão de X1, X2,· · · , Xn,T =f(X1, X2,· · · , Xn).

As estat´ısticas mais comuns s˜ao:

• X = (1/n)Pn

i=1X_i : m´edia amostral

• σˆ² = (1/n)Pn

i=1(Xi−X)² : variˆancia amostral

• S² = (1/(n−1))Pn

i=1(Xi−X)² : variˆancia amostral

• X˜ = med(X1, X2,· · ·, Xn) : mediana amostral

(2)

• X(1) = m´ın(X1, X2,· · · , Xn) : o menor valor da amostra

• X(n) = m´ax(X1, X2,· · · , Xn) : o maior valor da amostra

Defini¸cão 5 (Parâmetro): Um parâmetroé uma medida usada para descrever uma caracter´ıstica da popula¸cão.

Tabela 1: S´ımbolos mais comuns Estat´ıstica Parˆametro

M´edia X µ

Variˆancia S² σ²

N^o de elementos n N

Propor¸c˜ao pˆ p

1.4. Fun¸c˜ao de Verossimilhan¸ca:

Defini¸cão 6(Fun¸cão de verossimilhan¸ca) : A fun¸cão de densidade (ou de probabilidade) conjunta da amostra é denominada fun¸cão de verossimilhan¸ca de θ, correspondente à amostra observada x= (x1, x2,· · · , xn), e será denotada por

L(θ;x) =

n

Y

i=1

f(xi|θ) =f(x1|θ).f(x2|θ)· · ·f(xn|θ) (1)

1.5. Principais Modelos de Probabilidade:

Seja X uma variável aleatória cont´ınua (ou discreta) com f.d.p. (ou f.p.) f(x|θ). Neste caso, θ é o parâmetro associado ao modelo de probabilidade da variável aleatória X.

Defini¸c˜ao 7 (Suporte de um modelo): O conjunto A(x) = {x : f(x|θ) > 0} ´e denominado o suporte da v.a. X.

Defini¸cão 8(Espa¸co Paramétrico): O conjunto Θ dos valores poss´ıveis deθé denominado Espa¸co Paramétrico.

(3)

1.5.1 - Modelos Discretos:

a) Distribui¸c˜ao Uniforme Discreta: X ∼U D(1, N)

Todos os valores de X tˆem igual probabilidade de ocorrˆencia.

f(x|N) =P(X =x|N) = 1

N, x= 1,2,· · · , N (N−inteiro) E(X) = N + 1

2 V ar(X) = (N + 1)(N −1) 12

b) Distribui¸c˜ao de Bernoulli: X ∼Bernoulli(θ)

X é uma v.a. dicotômica (ou binária): X = 0 (”fracasso”) ouX = 1 (”sucesso”).

f(x|θ) =P(X =x|θ) = θ^x(1−θ)¹⁻^x, x= 0,1 0< θ <1 E(X) = θ V ar(X) =θ(1−θ)

c) Distribui¸c˜ao Binomial: X ∼Bin(n, θ)

Xrepresenta o n^ode ”sucessos”emnrepeti¸c˜oes independentes de uma v.a. Bernoulli(θ).

f(x|θ) = P(X =x|θ) = µn

x

¶

θ^x(1−θ)ⁿ⁻^x, x= 0,1,· · · , n 0< θ <1 E(X) =nθ V ar(X) =nθ(1−θ)

d) Distribui¸c˜ao Geom´etrica: X ∼G(θ)

X representa o nô de repeti¸cões necessárias até a ocorrência do primeiro ”sucesso”.

f(x|θ) = P(X =x|θ) =θ(1−θ)^x⁻¹, x= 1,2,· · · 0< θ <1 E(X) = 1

θ V ar(X) = 1−θ θ² e) Distribui¸c˜ao Binomial Negativa: X ∼BN(r, θ)

X representa o nô de repeti¸cões necessárias até a ocorrência dor-ésimo ”sucesso”.

f(x|θ) = P(X =x|θ) =

µx−1 r−1

¶

θ^r(1−θ)^x⁻^r, x=r, r+ 1,· · · 0< θ <1

E(X) = r(1−θ)

θ +r V ar(X) = r(1−θ) θ² f) Distribui¸c˜ao de Poisson: X ∼P(θ)

f(x|θ) =P(X =x|θ) = e⁻^θθ^x

x! , x= 0,1,· · · θ >0

(4)

E(X) =θ V ar(X) = θ

1.5.2 - Modelos Cont´ınuos:

a) Distribui¸c˜ao Uniforme: X ∼U(θ₁, θ₂) f(x|θ1, θ2) = 1

θ2 −θ1

, θ1 < x < θ2 − ∞< θ1 < θ2 <+∞ E(X) = θ1+θ2

2 V ar(X) = (θ2−θ1)² 12 b) Distribui¸c˜ao Normal: X ∼N(µ, σ²)

f(x|µ, σ²) = 1

√2πσ exp

½

−(x−µ)² 2σ²

¾

, −∞< x <+∞ − ∞< µ <+∞ σ >0 E(X) = µ V ar(X) =σ²

c) Distribui¸c˜ao Exponencial: X ∼Exp(θ)

f(x|θ) =θe⁻^θx, x >0 θ > 0 E(X) = 1

θ V ar(X) = 1 θ² d) Distribui¸c˜ao Gama: X ∼Gama(α, β)

f(x|α, β) = β^α

Γ(α) x^α⁻¹e⁻^βx, x >0 α >0 β >0 E(X) = α

β V ar(X) = α β² onde Γ(a) =R^∞

0 uâ⁻¹e⁻ûdu, paraa >0, é denominada fun¸cão Gama.

e) Distribui¸c˜ao Beta: X ∼Beta(a, b) f(x|a, b) = Γ(a+b)

Γ(a)Γ(b) x^a⁻¹(1−x)^b⁻¹, 0< x <1 a >0 b >0 E(X) = a

a+b V ar(X) = ab

(a+b)²(a+b+ 1) f) Distribui¸c˜ao Qui-quadrado: X ∼χ²_n

f(x|n) = (1/2)^n/2

Γ(n/2) xⁿ²⁻¹e⁻^x², x >0 n≥1 (inteiro)

(5)

E(X) =n V ar(X) = 2n

g) Distribui¸c˜ao F-Snedecor: X ∼Fm,n

f(x|m, n) = Γ(^m+n₂ )

Γ(m/2)Γ(n/2)(m

n)^m/2 x^m²⁻¹³ 1 + m

n x´⁻^m+n₂

, x >0 m, n≥1(inteiros)

E(X) = n

n−2 V ar(X) = 2n²(m+n−2) m(n−2)²(n−4) h) Distribui¸c˜ao t-Student: X ∼tn

f(x|n) = Γ(ⁿ⁺¹₂ ) Γ(n/2)

√1 nπ

µ 1 + x²

n

¶⁻ⁿ⁺¹₂

, −∞< x < +∞ n≥1(inteiro) E(X) = 0 V ar(X) = n

n−2 1.5.3 - Alguns resultados importantes:

1 - Se X ∼N(µ, σ²) e Y =aX+b, ent˜ao Y ∼N(aµ+b, a²σ²).

2 - Se Z ∼N(0,1), ent˜ao Z² ∼χ²₁.

3 - Seja X ∼Beta(a, b). Se a=b= 1, ent˜ao X ∼U(0,1).

4 - Se X ∼Fm,n, ent˜ao _X¹ ∼Fn,m. 5 - Seja X ∼Gama(α, β).

i) se α = 1, ent˜aoX ∼Exp(β);

ii) se α = ^k₂ eβ = ¹₂, ent˜ao X ∼χ²_k.

6 - Sejam Xi ∼N(µi, σ_i²), i= 1,· · · , n, vari´aveis independentes, ent˜ao

n

X

i=1

Xi ∼ N(

n

X

i=1

µi,

n

X

i=1

σ²_i).

7 - Sejam Xi ∼Gama(αi, β),i= 1,· · · , n, vari´aveis independentes, ent˜ao i) Pn

i=1Xi ∼ Gama(Pn

i=1αi , β);

ii) ^Pⁿ^X¹

i=1Xi ∼Beta(α₁ , Pn j=2α_j).

8 - Sejam Xi ∼χ²_k_i, i= 1,· · · , n, vari´aveis independentes, ent˜ao

n

X

i=1

Xi ∼ χ²_r, com r=

n

X

i=1

ki.

(6)

9 - Sejam X∼χ²_m e Y ∼χ²_n vari´aveis independentes, ent˜ao W = X/m

Y /n ∼Fm,n.

10 - Sejam Z ∼N(0,1) e Y ∼χ²_n vari´aveis independentes, ent˜ao U = Z

pY /n ∼tn.

11 - Sejam X_i ∼Exp(θ), i= 1,2,· · · , n, v.a.’s independentes, ent˜ao

n

X

i=1

Xi ∼ Gama(n, θ).

12 - Sejam Xi ∼P(θ), i= 1,2,· · ·, n, v.a.’s independentes, ent˜ao

n

X

i=1

Xi ∼ P(nθ).

1.6. Distribui¸c˜oes Amostrais X: vari´avel de interesse

θ: parˆametro desconhecido da distribui¸c˜ao deX

T =f(X1, X2,· · · , Xn): estat´ıstica escolhida para fornecer informa¸c˜ao sobreθ

AMOSTRAS

POPULAÇÂO 1

2 . . . k X

t1₁

t₁ t

t2

tk

• T é uma variável aleatória !

• Qual a distribui¸c˜ao de T quando (X1, X2,· · · , Xn) assume todos os valores poss´ıveis ? (Distribui¸c˜ao amostral de T)

(7)

1.6.1 - Teoremas de Convergˆencia

Teorema 1 : (Lei Fraca dos Grandes N´umeros)

Seja (X1, X2,· · · , Xn) uma a.a. de tamanho n de uma popula¸cão X com média e variância finitas, dadas por E(X) = µ e V ar(X) = σ². Sejam ǫ > 0 e 0 < δ < 1. Se n > ^σ²_δ^ǫ², então

P(|Xn−µ|< ǫ)≥1−δ ou seja, Xn converge em probabilidade para µ.

Teorema 2 : (Teorema Central do Limite)

Seja X1, X2,· · · , Xn,· · · uma sequência de v.a.’s independentes com E(Xi) = µi e V ar(Xi) = σ²_i <∞,i= 1,2,· · ·, e sejaX =X1+X2+· · ·+Xn. Então, sob determinadas condi¸cões gerais,

Zn= X−Pn i=1µ_i pPn

i=1σ_i² tem aproximadamente distribui¸c˜ao Normal padr˜ao.

Teorema 3 : (Distribui¸c˜ao Amostral da M´edia)

Para amostras aleatórias (X1, X2,· · · , Xn) retiradas de uma popula¸cão X com média E(X) =µe variânciaV ar(X) = σ², a distribui¸cão amostral da médiaXn= ^X¹^+X²_n⁺^···^+Xⁿ aproxima-se de uma distribui¸cão normal com média E(Xn) = µ e variância V ar(Xn) = σ²/n.

• Sabemos que a soma de normais independentes é normal, mas o TCL é mais forte pois afirma que as variáveis originais não precisam ter distrib. normal, é necessário apenas que tenham variância finita.

• Xn∼N(µ, σ²/n).

1.6.2 - Distribui¸c˜ao Amostral da M´edia

Corol´ario 1: Seja (X1, X2,· · ·, Xn) uma a.a. de uma popula¸c˜ao X, com E(X) = µ e V ar(X) =σ² <∞. Para n grande, temos

Xn−µ

σ/√n ∼N(0,1)

(8)

• Algumas situa¸cões onde teremos uma distribui¸cão exata paraXn: i) X ∼N ormal(µ, σ²) (X1, X2,· · · , Xn): a.a da popula¸cãoX Neste caso, a distribui¸cão exata para a média amostral é dada por

Xn ∼N(µ, σ²/n)

ii)X ∼Exp(θ) (X1, X2,· · · , Xn): a.a. da popula¸cãoX Neste caso, a distribui¸cão exata para a média amostral é dada por

Xn∼Gama(n, nθ)

iii) X ∼Bernoulli(θ) (X1, X2,· · ·Xn): a.a. da popula¸cãoX Neste caso, a distribui¸cão exata para a média amostral é dada por

f(xn|θ) = P(Xn =xn) = n!

(nxn)!(n−nxn)! θ^nxⁿ(1−θ)ⁿ⁻^nxⁿ

xn= 0,_n¹,_n²,· · · ,1 iv) X ∼P(θ) (X1, X2,· · ·Xn): a.a. da popula¸c˜ao X

Neste caso, a distribui¸cão exata para a média amostral é dada por f(xn|θ) =P(Xn=xn) = e⁻^nθ(nθ)^nxⁿ

(nxn)! xn = 0, 1 n, 2

n,· · ·

1.6.3 - Distribui¸c˜ao Amostral da Propor¸c˜ao

X ∼Bernoulli(θ) (X₁, X₂,· · ·X_n): a.a. da popula¸c˜aoX

θ : propor¸c˜ao de indiv´ıduos portadores de determinada caracter´ıstica na popula¸c˜ao.

E(X_i) = θ V ar(X_i) =θ(1−θ) i= 1,2,· · · , n

S_n=Pn

i=1X_i : total de indiv´ıduos portadores da caracter´ıstica na amostra ˆ

p= ^S_nⁿ : propor¸c˜ao de indiv´ıduos portadores da caracter´ıstica na amostra Portanto, S_n =Pn

i=1X_i ∼Bin(n, θ), e temos P(S_n=k) = n!

k!(n−k)! θ^k(1−θ)ⁿ⁻^k k = 0,1,· · · , n

(9)

Logo,

P µ

ˆ p= k

n

¶

= n!

k!(n−k)! θ^k(1−θ)ⁿ⁻^k k= 0,1,· · · , n

(Distribui¸c˜ao amostral exata para p)ˆ

Agora, ˆp= ^S_nⁿ = ^P

n i=1Xⁱ

n =X_n, e pelo TCL temos que para n grande ˆ

p∼N µ

θ,θ(1−θ) n

¶

(Distribui¸c˜ao amostral aproximada para p)ˆ

1.6.4 - Distribui¸c˜ao Amostral da Variˆancia

X : popula¸cão (X1, X2,· · ·Xn): a.a. da popula¸cãoX Queremos obter a distribui¸cão de S² = _n−¹1

Pn

i=1(Xi−X)², a variˆancia amostral.

Teorema 4: Seja (X1, X2,· · ·Xn) uma a.a. de X ∼N(µ, σ²), ent˜ao i) X ePn

i=1(Xi−X)² s˜ao independentes;

ii) Pn i=1

(Xi−X)²

σ² ∼χ²_n−1

Teorema 5 (inferˆencia sobre σ²): Seja (X1, X2,· · ·Xn) uma a.a. de X ∼ N(µ, σ²), ent˜ao

i) E(S²) =σ²; ii) ⁽ⁿ⁻_σ^1)S2 ² ∼χ²_n−1

Corolário 2 (Compara¸cão de variâncias): Sejam (X1, X2,· · ·Xn) uma a.a. de X ∼ N(µx, σ²) e (Y1, Y2,· · ·Ym) uma a.a. deY ∼N(µy, σ²). Se as duas amostras são independentes, então

i) _σ¹2

Pn

i=1(Xi−X)² ∼χ²_n−1; ii) _σ¹2

Pm

i=1(Yi−Y)² ∼χ²_m−1; iii) ^P

n

i=1(Xi−X)²/n Pm

i=1(Yi−Y)²/m ∼Fn−1,m−1

(10)

Corolário 3 (inferência sobreµ): Se (X1, X2,· · ·Xn) é uma a.a. deX ∼N(µ, σ²), então T =

√n(X−µ)/σ q(1/σ²)Pn

i=1(Xi−X)² n−1

=

√n(X−µ)/σ qS²

σ²

=

√n(X−µ)

S ∼tn−1

1.6.5 - Distribui¸c˜ao amostral do M´aximo e do M´ınimo

EXEM P LO: Seja (X1, X2, X3, X4) uma amostra aleat´oria da popula¸c˜ao X ∼ Exp(5).

Encontre a distribui¸c˜ao deX(4) = m´ax (X1, X2, X3, X4) e deX(1) = m´ın (X1, X2, X3, X4).

X ∼Exp(5) =⇒







f(x) = 5e⁻^5x, x >0 (f.d.p. de X)

FX(s) = P(X ≤s) = 1−e⁻^5s, s >0 (f.d.a. de X)

(X1, X2, X3, X4) ´e uma a.a. de X, ent˜ao Xi ∼Exp(5), ∀i= 1,2,3,4

• Vamos obter a f.d.a. de X₍₄₎ = m´ax (X₁, X₂, X₃, X₄):

F_X(4)(t) = P(X₍₄₎ ≤t) = P(m´ax (X₁, X₂, X₃, X₄)≤t) Agora,

m´ax (X₁, X₂, X₃, X₄)≤t ⇐⇒ X₁ ≤t, X₂ ≤t, X₃ ≤teX₄ ≤t Portanto,

FX(4)(t) = P(X1 ≤t)P(X2 ≤t)P(X3 ≤t)P(X4 ≤t)

= (1−e⁻^5t)⁴, t >0 Logo, a f.d.p. deX(4) ´e dada por:

fX(4)(t) = dFX(4)(t)

dt = 4(1−e⁻^5t)³×5e⁻^5t = 20e⁻^5t(1−e⁻^5t)³

• Vamos obter a f.d.a. de X(1) = m´ın (X1, X2, X3, X4):

FX(1)(u) = P(X(1) ≤u) =P(m´ın (X1, X2, X3, X4)≤u)

= 1−P(m´ın (X1, X2, X3, X4)> u)