• Nenhum resultado encontrado

Objetivo: fazer afirmações sobre características de uma população a partir dos resultados de uma amostra.

N/A
N/A
Protected

Academic year: 2022

Share "Objetivo: fazer afirmações sobre características de uma população a partir dos resultados de uma amostra."

Copied!
10
0
0

Texto

(1)

CURSO DE MESTRADO EM MATEM ´ATICA E ESTAT´ISTICA / UFPA Disciplina: Estat´ıstica Matem´atica Prof: Regina Tavares

1. INTRODUC¸ ˜AO

1.1. Inferˆencia Estat´ıstica:

Objetivo: fazer afirma¸c˜oes sobre caracter´ısticas de uma popula¸c˜ao a partir dos resultados de uma amostra.

PROBLEMAS: Estima¸c˜ao e Teste de Hip´oteses

1.2. Popula¸c˜ao e Amostra:

Defini¸c˜ao 1 (Popula¸c˜ao): O conjunto de valores de uma caracter´ıstica (observ´avel) as- sociada a uma cole¸c˜ao de indiv´ıduos ou objetos de interesse ´e dito ser uma popula¸c˜ao.

Defini¸c˜ao 2(Amostra): ´E qualquer subconjunto da popula¸c˜ao.

Defini¸c˜ao 3(Amostra Aleat´oria): Uma sequˆenciaX1, X2,· · · , Xndenvari´aveis aleat´orias (v.a.) independentes e identicamente distribu´ıdas (i.i.d.) com fun¸c˜ao densidade de prob- abilidade (f.d.p.) ou, no caso discreto, fun¸c˜ao de probabilidade (f.p.) f(x|θ) ´e dita ser uma amostra aleat´oria (a.a.) de tamanho n da distribui¸c˜ao de X.

“POPULAC¸ ˜AO” ⇐⇒ X: vari´avel de interesse observada

1.3. Estat´ısticas e Parˆametros:

Defini¸c˜ao 4(Estat´ıstica): Umaestat´ıstica´e uma caracter´ıstica da amostra, ou seja, uma estat´ıstica T ´e uma fun¸c˜ao de X1, X2,· · · , Xn,T =f(X1, X2,· · · , Xn).

As estat´ısticas mais comuns s˜ao:

• X = (1/n)Pn

i=1Xi : m´edia amostral

• σˆ2 = (1/n)Pn

i=1(Xi−X)2 : variˆancia amostral

• S2 = (1/(n−1))Pn

i=1(Xi−X)2 : variˆancia amostral

• X˜ = med(X1, X2,· · ·, Xn) : mediana amostral

(2)

• X(1) = m´ın(X1, X2,· · · , Xn) : o menor valor da amostra

• X(n) = m´ax(X1, X2,· · · , Xn) : o maior valor da amostra

Defini¸c˜ao 5 (Parˆametro): Um parˆametro´e uma medida usada para descrever uma car- acter´ıstica da popula¸c˜ao.

Tabela 1: S´ımbolos mais comuns Estat´ıstica Parˆametro

M´edia X µ

Variˆancia S2 σ2

No de elementos n N

Propor¸c˜ao pˆ p

1.4. Fun¸c˜ao de Verossimilhan¸ca:

Defini¸c˜ao 6(Fun¸c˜ao de verossimilhan¸ca) : A fun¸c˜ao de densidade (ou de probabilidade) conjunta da amostra ´e denominada fun¸c˜ao de verossimilhan¸ca de θ, correspondente `a amostra observada x= (x1, x2,· · · , xn), e ser´a denotada por

L(θ;x) =

n

Y

i=1

f(xi|θ) =f(x1|θ).f(x2|θ)· · ·f(xn|θ) (1)

1.5. Principais Modelos de Probabilidade:

Seja X uma vari´avel aleat´oria cont´ınua (ou discreta) com f.d.p. (ou f.p.) f(x|θ). Neste caso, θ ´e o parˆametro associado ao modelo de probabilidade da vari´avel aleat´oria X.

Defini¸c˜ao 7 (Suporte de um modelo): O conjunto A(x) = {x : f(x|θ) > 0} ´e denomi- nado o suporte da v.a. X.

Defini¸c˜ao 8(Espa¸co Param´etrico): O conjunto Θ dos valores poss´ıveis deθ´e denominado Espa¸co Param´etrico.

(3)

1.5.1 - Modelos Discretos:

a) Distribui¸c˜ao Uniforme Discreta: X ∼U D(1, N)

Todos os valores de X tˆem igual probabilidade de ocorrˆencia.

f(x|N) =P(X =x|N) = 1

N, x= 1,2,· · · , N (N−inteiro) E(X) = N + 1

2 V ar(X) = (N + 1)(N −1) 12

b) Distribui¸c˜ao de Bernoulli: X ∼Bernoulli(θ)

X ´e uma v.a. dicotˆomica (ou bin´aria): X = 0 (”fracasso”) ouX = 1 (”sucesso”).

f(x|θ) =P(X =x|θ) = θx(1−θ)1x, x= 0,1 0< θ <1 E(X) = θ V ar(X) =θ(1−θ)

c) Distribui¸c˜ao Binomial: X ∼Bin(n, θ)

Xrepresenta o node ”sucessos”emnrepeti¸c˜oes independentes de uma v.a. Bernoulli(θ).

f(x|θ) = P(X =x|θ) = µn

x

θx(1−θ)nx, x= 0,1,· · · , n 0< θ <1 E(X) =nθ V ar(X) =nθ(1−θ)

d) Distribui¸c˜ao Geom´etrica: X ∼G(θ)

X representa o no de repeti¸c˜oes necess´arias at´e a ocorrˆencia do primeiro ”sucesso”.

f(x|θ) = P(X =x|θ) =θ(1−θ)x1, x= 1,2,· · · 0< θ <1 E(X) = 1

θ V ar(X) = 1−θ θ2 e) Distribui¸c˜ao Binomial Negativa: X ∼BN(r, θ)

X representa o no de repeti¸c˜oes necess´arias at´e a ocorrˆencia dor-´esimo ”sucesso”.

f(x|θ) = P(X =x|θ) =

µx−1 r−1

θr(1−θ)xr, x=r, r+ 1,· · · 0< θ <1

E(X) = r(1−θ)

θ +r V ar(X) = r(1−θ) θ2 f) Distribui¸c˜ao de Poisson: X ∼P(θ)

f(x|θ) =P(X =x|θ) = eθθx

x! , x= 0,1,· · · θ >0

(4)

E(X) =θ V ar(X) = θ

1.5.2 - Modelos Cont´ınuos:

a) Distribui¸c˜ao Uniforme: X ∼U(θ1, θ2) f(x|θ1, θ2) = 1

θ2 −θ1

, θ1 < x < θ2 − ∞< θ1 < θ2 <+∞ E(X) = θ12

2 V ar(X) = (θ2−θ1)2 12 b) Distribui¸c˜ao Normal: X ∼N(µ, σ2)

f(x|µ, σ2) = 1

√2πσ exp

½

−(x−µ)22

¾

, −∞< x <+∞ − ∞< µ <+∞ σ >0 E(X) = µ V ar(X) =σ2

c) Distribui¸c˜ao Exponencial: X ∼Exp(θ)

f(x|θ) =θeθx, x >0 θ > 0 E(X) = 1

θ V ar(X) = 1 θ2 d) Distribui¸c˜ao Gama: X ∼Gama(α, β)

f(x|α, β) = βα

Γ(α) xα1eβx, x >0 α >0 β >0 E(X) = α

β V ar(X) = α β2 onde Γ(a) =R

0 ua1eudu, paraa >0, ´e denominada fun¸c˜ao Gama.

e) Distribui¸c˜ao Beta: X ∼Beta(a, b) f(x|a, b) = Γ(a+b)

Γ(a)Γ(b) xa1(1−x)b1, 0< x <1 a >0 b >0 E(X) = a

a+b V ar(X) = ab

(a+b)2(a+b+ 1) f) Distribui¸c˜ao Qui-quadrado: X ∼χ2n

f(x|n) = (1/2)n/2

Γ(n/2) xn21ex2, x >0 n≥1 (inteiro)

(5)

E(X) =n V ar(X) = 2n

g) Distribui¸c˜ao F-Snedecor: X ∼Fm,n

f(x|m, n) = Γ(m+n2 )

Γ(m/2)Γ(n/2)(m

n)m/2 xm21³ 1 + m

n x´m+n2

, x >0 m, n≥1(inteiros)

E(X) = n

n−2 V ar(X) = 2n2(m+n−2) m(n−2)2(n−4) h) Distribui¸c˜ao t-Student: X ∼tn

f(x|n) = Γ(n+12 ) Γ(n/2)

√1 nπ

µ 1 + x2

n

n+12

, −∞< x < +∞ n≥1(inteiro) E(X) = 0 V ar(X) = n

n−2 1.5.3 - Alguns resultados importantes:

1 - Se X ∼N(µ, σ2) e Y =aX+b, ent˜ao Y ∼N(aµ+b, a2σ2).

2 - Se Z ∼N(0,1), ent˜ao Z2 ∼χ21.

3 - Seja X ∼Beta(a, b). Se a=b= 1, ent˜ao X ∼U(0,1).

4 - Se X ∼Fm,n, ent˜ao X1 ∼Fn,m. 5 - Seja X ∼Gama(α, β).

i) se α = 1, ent˜aoX ∼Exp(β);

ii) se α = k2 eβ = 12, ent˜ao X ∼χ2k.

6 - Sejam Xi ∼N(µi, σi2), i= 1,· · · , n, vari´aveis independentes, ent˜ao

n

X

i=1

Xi ∼ N(

n

X

i=1

µi,

n

X

i=1

σ2i).

7 - Sejam Xi ∼Gama(αi, β),i= 1,· · · , n, vari´aveis independentes, ent˜ao i) Pn

i=1Xi ∼ Gama(Pn

i=1αi , β);

ii) PnX1

i=1Xi ∼Beta(α1 , Pn j=2αj).

8 - Sejam Xi ∼χ2ki, i= 1,· · · , n, vari´aveis independentes, ent˜ao

n

X

i=1

Xi ∼ χ2r, com r=

n

X

i=1

ki.

(6)

9 - Sejam X∼χ2m e Y ∼χ2n vari´aveis independentes, ent˜ao W = X/m

Y /n ∼Fm,n.

10 - Sejam Z ∼N(0,1) e Y ∼χ2n vari´aveis independentes, ent˜ao U = Z

pY /n ∼tn.

11 - Sejam Xi ∼Exp(θ), i= 1,2,· · · , n, v.a.’s independentes, ent˜ao

n

X

i=1

Xi ∼ Gama(n, θ).

12 - Sejam Xi ∼P(θ), i= 1,2,· · ·, n, v.a.’s independentes, ent˜ao

n

X

i=1

Xi ∼ P(nθ).

1.6. Distribui¸c˜oes Amostrais X: vari´avel de interesse

θ: parˆametro desconhecido da distribui¸c˜ao deX

T =f(X1, X2,· · · , Xn): estat´ıstica escolhida para fornecer informa¸c˜ao sobreθ

AMOSTRAS

POPULAÇÂO 1

2 . . . k X

t11

t1 t

t2

tk

• T ´e uma vari´avel aleat´oria !

• Qual a distribui¸c˜ao de T quando (X1, X2,· · · , Xn) assume todos os valores poss´ıveis ? (Distribui¸c˜ao amostral de T)

(7)

1.6.1 - Teoremas de Convergˆencia

Teorema 1 : (Lei Fraca dos Grandes N´umeros)

Seja (X1, X2,· · · , Xn) uma a.a. de tamanho n de uma popula¸c˜ao X com m´edia e variˆancia finitas, dadas por E(X) = µ e V ar(X) = σ2. Sejam ǫ > 0 e 0 < δ < 1. Se n > σ2δǫ2, ent˜ao

P(|Xn−µ|< ǫ)≥1−δ ou seja, Xn converge em probabilidade para µ.

Teorema 2 : (Teorema Central do Limite)

Seja X1, X2,· · · , Xn,· · · uma sequˆencia de v.a.’s independentes com E(Xi) = µi e V ar(Xi) = σ2i <∞,i= 1,2,· · ·, e sejaX =X1+X2+· · ·+Xn. Ent˜ao, sob determinadas condi¸c˜oes gerais,

Zn= X−Pn i=1µi pPn

i=1σi2 tem aproximadamente distribui¸c˜ao Normal padr˜ao.

Teorema 3 : (Distribui¸c˜ao Amostral da M´edia)

Para amostras aleat´orias (X1, X2,· · · , Xn) retiradas de uma popula¸c˜ao X com m´edia E(X) =µe variˆanciaV ar(X) = σ2, a distribui¸c˜ao amostral da m´ediaXn= X1+X2n+···+Xn aproxima-se de uma distribui¸c˜ao normal com m´edia E(Xn) = µ e variˆancia V ar(Xn) = σ2/n.

• Sabemos que a soma de normais independentes ´e normal, mas o TCL ´e mais forte pois afirma que as vari´aveis originais n˜ao precisam ter distrib. normal, ´e necess´ario apenas que tenham variˆancia finita.

• Xn∼N(µ, σ2/n).

1.6.2 - Distribui¸c˜ao Amostral da M´edia

Corol´ario 1: Seja (X1, X2,· · ·, Xn) uma a.a. de uma popula¸c˜ao X, com E(X) = µ e V ar(X) =σ2 <∞. Para n grande, temos

Xn−µ

σ/√n ∼N(0,1)

(8)

• Algumas situa¸c˜oes onde teremos uma distribui¸c˜ao exata paraXn: i) X ∼N ormal(µ, σ2) (X1, X2,· · · , Xn): a.a da popula¸c˜aoX Neste caso, a distribui¸c˜ao exata para a m´edia amostral ´e dada por

Xn ∼N(µ, σ2/n)

ii)X ∼Exp(θ) (X1, X2,· · · , Xn): a.a. da popula¸c˜aoX Neste caso, a distribui¸c˜ao exata para a m´edia amostral ´e dada por

Xn∼Gama(n, nθ)

iii) X ∼Bernoulli(θ) (X1, X2,· · ·Xn): a.a. da popula¸c˜aoX Neste caso, a distribui¸c˜ao exata para a m´edia amostral ´e dada por

f(xn|θ) = P(Xn =xn) = n!

(nxn)!(n−nxn)! θnxn(1−θ)nnxn

xn= 0,n1,n2,· · · ,1 iv) X ∼P(θ) (X1, X2,· · ·Xn): a.a. da popula¸c˜ao X

Neste caso, a distribui¸c˜ao exata para a m´edia amostral ´e dada por f(xn|θ) =P(Xn=xn) = e(nθ)nxn

(nxn)! xn = 0, 1 n, 2

n,· · ·

1.6.3 - Distribui¸c˜ao Amostral da Propor¸c˜ao

X ∼Bernoulli(θ) (X1, X2,· · ·Xn): a.a. da popula¸c˜aoX

θ : propor¸c˜ao de indiv´ıduos portadores de determinada caracter´ıstica na popula¸c˜ao.

E(Xi) = θ V ar(Xi) =θ(1−θ) i= 1,2,· · · , n

Sn=Pn

i=1Xi : total de indiv´ıduos portadores da caracter´ıstica na amostra ˆ

p= Snn : propor¸c˜ao de indiv´ıduos portadores da caracter´ıstica na amostra Portanto, Sn =Pn

i=1Xi ∼Bin(n, θ), e temos P(Sn=k) = n!

k!(n−k)! θk(1−θ)nk k = 0,1,· · · , n

(9)

Logo,

P µ

ˆ p= k

n

= n!

k!(n−k)! θk(1−θ)nk k= 0,1,· · · , n

(Distribui¸c˜ao amostral exata para p)ˆ

Agora, ˆp= Snn = P

n i=1Xi

n =Xn, e pelo TCL temos que para n grande ˆ

p∼N µ

θ,θ(1−θ) n

(Distribui¸c˜ao amostral aproximada para p)ˆ

1.6.4 - Distribui¸c˜ao Amostral da Variˆancia

X : popula¸c˜ao (X1, X2,· · ·Xn): a.a. da popula¸c˜aoX Queremos obter a distribui¸c˜ao de S2 = n11

Pn

i=1(Xi−X)2, a variˆancia amostral.

Teorema 4: Seja (X1, X2,· · ·Xn) uma a.a. de X ∼N(µ, σ2), ent˜ao i) X ePn

i=1(Xi−X)2 s˜ao independentes;

ii) Pn i=1

(XiX)2

σ2 ∼χ2n1

Teorema 5 (inferˆencia sobre σ2): Seja (X1, X2,· · ·Xn) uma a.a. de X ∼ N(µ, σ2), ent˜ao

i) E(S2) =σ2; ii) (nσ1)S2 2 ∼χ2n1

Corol´ario 2 (Compara¸c˜ao de variˆancias): Sejam (X1, X2,· · ·Xn) uma a.a. de X ∼ N(µx, σ2) e (Y1, Y2,· · ·Ym) uma a.a. deY ∼N(µy, σ2). Se as duas amostras s˜ao indepen- dentes, ent˜ao

i) σ12

Pn

i=1(Xi−X)2 ∼χ2n1; ii) σ12

Pm

i=1(Yi−Y)2 ∼χ2m1; iii) P

n

i=1(XiX)2/n Pm

i=1(YiY)2/m ∼Fn1,m1

(10)

Corol´ario 3 (inferˆencia sobreµ): Se (X1, X2,· · ·Xn) ´e uma a.a. deX ∼N(µ, σ2), ent˜ao T =

√n(X−µ)/σ q(1/σ2)Pn

i=1(XiX)2 n1

=

√n(X−µ)/σ qS2

σ2

=

√n(X−µ)

S ∼tn1

1.6.5 - Distribui¸c˜ao amostral do M´aximo e do M´ınimo

EXEM P LO: Seja (X1, X2, X3, X4) uma amostra aleat´oria da popula¸c˜ao X ∼ Exp(5).

Encontre a distribui¸c˜ao deX(4) = m´ax (X1, X2, X3, X4) e deX(1) = m´ın (X1, X2, X3, X4).

X ∼Exp(5) =⇒

f(x) = 5e5x, x >0 (f.d.p. de X)

FX(s) = P(X ≤s) = 1−e5s, s >0 (f.d.a. de X)

(X1, X2, X3, X4) ´e uma a.a. de X, ent˜ao Xi ∼Exp(5), ∀i= 1,2,3,4

• Vamos obter a f.d.a. de X(4) = m´ax (X1, X2, X3, X4):

FX(4)(t) = P(X(4) ≤t) = P(m´ax (X1, X2, X3, X4)≤t) Agora,

m´ax (X1, X2, X3, X4)≤t ⇐⇒ X1 ≤t, X2 ≤t, X3 ≤teX4 ≤t Portanto,

FX(4)(t) = P(X1 ≤t)P(X2 ≤t)P(X3 ≤t)P(X4 ≤t)

= (1−e5t)4, t >0 Logo, a f.d.p. deX(4) ´e dada por:

fX(4)(t) = dFX(4)(t)

dt = 4(1−e5t)3×5e5t = 20e5t(1−e5t)3

• Vamos obter a f.d.a. de X(1) = m´ın (X1, X2, X3, X4):

FX(1)(u) = P(X(1) ≤u) =P(m´ın (X1, X2, X3, X4)≤u)

= 1−P(m´ın (X1, X2, X3, X4)> u)

Referências

Documentos relacionados

dois gestores, pelo fato deles serem os mais indicados para avaliarem administrativamente a articulação entre o ensino médio e a educação profissional, bem como a estruturação

relacionado diretamente com a realização de direitos e garantias fundamentais constitucionalmente previstas, como o adequado gerenciamento dos bens e valores públicos..

Estudar o efeito da plastificação do ATp com glicerol nas características físico-químicas da blenda PLA/ATp; Analisar a mudança na cristalinidade dos laminados submetidos a

Algumas sementes e castanhas vão ficar só nessa etapa de hidratação pois já passaram por um processo térmico no caso de algumas castanhas e nozes, outras sementes descascadas

Principais mudanças na PNAB 2017  Estratégia Saúde da Família/Equipe de Atenção Básica  Agentes Comunitários de Saúde  Integração da AB e Vigilância 

Apesar dos esforços para reduzir os níveis de emissão de poluentes ao longo das últimas décadas na região da cidade de Cubatão, as concentrações dos poluentes

Here, we aim to understand how expression of RA degradation enzymes (Cyp26) can be correlated with RA distribution and functions during amphioxus (B. lanceolatum)

Para analisar as Componentes de Gestão foram utilizadas questões referentes à forma como o visitante considera as condições da ilha no momento da realização do