• Nenhum resultado encontrado

Lista de Exercicios 2

N/A
N/A
Protected

Academic year: 2022

Share "Lista de Exercicios 2"

Copied!
16
0
0

Texto

(1)

Introcu¸c˜ao `a Inferˆencia Estat´ıstica.

Departamento de F´ısica ´e Matem´atica. USP-RP.

Prof. Rafael A. Rosales

10 de outubro de 2007

Lista de Exercicios 2

Intervalos de Confianc ¸a. Testes de Hip´ oteses.

1 Intervalos de Confian¸ ca

Exerc´ıcio 22. Por analog´ıa a produtos similares, o tempo de rea¸c˜ao de um novo medicamento pode ser considerado como tendo distribui¸c˜ao normal Φ(µ,4) (a m´edia ´e desconhecida). Vinte pacientes foram sorteados, receberam o medica- mento e tiveram seu tempo de rea¸c˜ao anotado. Os dados foram os seguintes: 2,9;

3,4; 3,5; 4,1; 4,6; 4,7; 4,5; 3,8; 5,3; 4,9; 4,8; 5,7; 5,8; 5,0; 3,4; 5,9; 6,3; 4,6; 5,5 e 6,2.

Obtenha intervalos de confian¸ca para o tempo m´edio de rea¸c˜ao para: (i) γ=96%, (ii) γ=75%.

Exerc´ıcio 23. Uma amostra de 25 observa¸c˜oes de uma normal Φ(µ,16) foi cole- tada e forneceu uma m´edia amostral de 8. Construa intervalos com confian¸ca 80%, 85%, 90% e 95% para a m´edia populacional. Comente as diferen¸cas encontradas.

Exerc´ıcio 24. Ser´a coletada uma amostra de uma popula¸c˜ao normal com desvio padr˜ao igual a 9. Para uma confian¸ca de γ=90%, determine a amplitude do intervalo de confian¸ca para a m´edia populacional nos casos em que o tamanho da amostra ´e 30, 50 ou 100. Comente as diferen¸cas.

Exerc´ıcio 25. Numa pesquisa com 50 eleitores, o candidato J. J. obteve 0,34 da preferˆencia dos eleitores. Construa, para a confian¸ca 94%, os intervalos oti- mista e conservador de confian¸ca para a propor¸c˜ao de votos a serem recebidos pelo candidato mencionado, supondo que a elei¸c˜ao fosse nesse momento.

Exerc´ıcio 26. Desejamos coletar uma amostra de uma vari´avel aleat´oria X com distribui¸c˜ao normal de m´edia desconhecida e variˆancia 30. Qual deve ser o tamanho da amostra para que, com 0,92 de probabilidade, a m´edia amostral n˜ao difira da m´edia da popula¸c˜ao por mais de 3 unidades?

Exerc´ıcio 27. Interprete e comente as afirma¸c˜oes: (i) A m´edia de sal´ario inicial para rec´em formados em Economia est´a entre 7 e 9 sal´arios m´ınimos com confian¸ca 95%. (ii) Quanto maior for o tamanho da amostra, maior ´e a probabilidade da m´edia amostral estar pr´oxima da verdadeira m´edia.

(2)

Exerc´ıcio 28. O intervalo [35,21; 35,99], com confian¸ca 95% foi constru´ıdo a partir de uma amostra de tamanho 100, para a m´ediaµde uma popula¸c˜ao normal com desvio padr˜ao igual a 2. (i) Qual e o valor encontrado para a m´edia dessa amostra? (ii) Se utiliz´assemos essa mesma amostra, mas uma confian¸ca de 90%, qual seria o novo intervalo de confian¸ca?

Exerc´ıcio 29. Antes de uma elei¸c˜ao, um determinado partido est´a interessado em estimar a probabilidade p de eleitores favor´aveis ao seu candidato. Uma amostra piloto de tamanho 100 revelou que 60% dos eleitores eram favor´aveis ao candidato.

(i) Utilizando a informa¸c˜ao da amostra piloto, determine o tamanho da amostra para que, com 0,8 de probabilidade, o erro cometido na estima¸c˜ao seja no m´aximo 0,05. (ii) Se na amostra final, com tamanho obtido em (i), observou-se que 51%

dos eleitores eram favor´aveis ao candidato, construa um intervalo de confian¸ca para p, com confian¸ca 95%.

Exerc´ıcio 30. O tempo de emiss˜ao de extratos, em segundos, pelo caixa eletrˆonico de um banco foi modelado segundo a distribui¸c˜ao exponencial com parˆametro 1/40. Para uma amostra aleat´oria de 50 clientes que solicitaram extratos: (i) Qual ´e a probabilidade do segundo cliente sorteado na amostra demorar mais de 30 segundos na sua solicita¸c˜ao? (ii) Determine a probabilidade de que o intervalo m´edio de emiss˜ao, entre os clientes amostrados, seja inferior a 35 segundos.

1.1 Intervalo para µ

1

− µ

2

Exerc´ıcio 31. A fim de conhecer o poss´ıvel v´ınculo entre o conte´udo de fluoruro da ´agua pot´avel e o cˆancer, Yiamouyiannis e Burk (77) registraram as taxas de mortes por cˆancer (n´umero de mortes por 105 habitantes) desde 1952 at´e 1969 em 20 cidades americanas selecionadas: as 10 maiores cidades com ´agua fluorurada e as 10 maiores sem ´agua fluorurada para 1969. Maritz e Jarrett (App. Stats. 83) utilizaram os dados obtidos por Yiamouyiannis e Burk para calcular, para cada cidade, a taxa anual de aumento na taxa de mortes por cˆancer durante o per´ıodo de 18 anos para cada um dos quatro grupos de idades: menores de 25, 25-44, 45-64, e 65 ou maiores. Os dados para o grupo de idades de 45 a 64 anos ´e apresentada na tabela 1.1. (i) Construir um intervalo de confian¸ca de 95% para a diferen¸ca entre os incrementos anuais m´edios nas taxas de mortes por cˆancer em cidades com ´agua fluorurada e n˜ao fluorurada. (ii) Interpretar o intervalo obtido em (i).

(iii) Quais s˜ao os supostos necess´arios para construir o intervalo? Vocˆe acredita que os supostos s˜ao satisfeitos neste caso?

1.2 Intervalo para p

1

− p

2

Exerc´ıcio 32. De acordo com o estudo da pesquisa de mercado dos serv´ı¸cos de consultor´ıa em engenharia a empresas industriais no Meio Oeste (USA), exerc´ıcio

(3)

Fluorurada N˜ao Fluorurada

Cidade ITAM Cidade ITAM

Chicago 1,0640 Los ´Angeles 0,8875 Filadelphia 1,4118 Boston 1,7358 Baltimore 2,1115 New Orleans 1,0165 Cleveland 1,9401 Seattle 0,4923 Washington 3,8772 Cincinatti 4,0155 Milwaukee -0,4561 Atlanta -1.1744 San Luis 4,8359 Kansas City 2,8132 San Francisco 1,8875 Columbus 1,7451 Pittsburg 4,4964 Newark -0,5676 Buffalo 1,4045 Portland 2,4471 Tabela 1: ITAM: incremento na taxa anual de mortes

2.49, quarenta empresas que participaram de uma enquete (20 grandes e 20 pe- quenas) indicaram que elas n˜ao precisavam dos serv´ıcios externos de consultor´ıa.

A principal ra¸c˜ao foi que estas sempre obtinham ajuda de consultar´ıa sempre que necess´ario. Entretanto, duas vezes mais empresas grandes (12) que pequenas (6) citaram este motivo . Establecer um intervalo de confian¸ca de 90% para a dife- ren¸ca nas porcentagens das empresas grandes e as pequenas que citam a ajuda das oficinas corporativas.

2 Testes de Hip´ oteses

2.1 Teste para µ

Exerc´ıcio 33. Uma vari´avel aleat´oria tem distribui¸c˜ao normal e desvio padr˜ao igual a 12. Estamos testando se sua m´edia ´e igual ou ´e diferente de 20 e coletamos uma amostra de 100 valores dessa vari´avel, obtendo uma m´edia amostral de 17,4.

(i) Formule as hip´oteses. (ii) Obtenha a regi˜ao cr´ıtica e dˆe a conclus˜ao do teste para os seguintes n´ıveis de significˆancia: 1%, 2%, 4%, 6% e 8%.

Exerc´ıcio 34. Para uma vari´avel aleat´oria com densidade normal e desvio padr˜ao 5, o teste da m´edia µ=10 contra µ=14, teve a regi˜ao cr´ıtica dada por {x ∈ R : x >12}para uma amostra de tamanho 25. Determine as probabilidades dos erros tipo I e II.

Exerc´ıcio 35. Uma m´aquina deve produzir pe¸cas com diˆametro de 2 cm. En- tretanto, varia¸c˜oes acontecem e vamos assumir que o diˆametro dessas pe¸cas siga o modelo Normal com variˆancia igual a 0,09 cm2. Para testar se a m´aquina est´a

(4)

bem regulada, uma amostra de 100 pe¸cas ´e coletada. (i) Formule o problema como um teste de hip´oteses. (ii) Qual seria a regi˜ao cr´ıtica seα= 0,02? (iii) se a regi˜ao de aceita¸c˜ao fosse {x∈ R|1,956x62,05}, qual seria o n´ıvel de significˆancia do teste? Nesse caso, determine a probabilidade do erro tipo II se µ=1,95 cm. (iv) Se para essa amostra ¯x= 1,94; qual a decis˜ao em (ii)?, em (iii)?

Exerc´ıcio 36. Um estudo foi desenvolvido para avaliar o sal´ario de empregadas dom´esticas na cidade de S˜ao Paulo. Foram sorteadas e entrevistadas 200 traba- lhadoras. Admita que o desvio padr˜ao dessa vari´avel na cidade ´e de 0,8 sal´arios m´ınimos. (i) Vocˆe conhece a distribui¸c˜ao do estimador ¯X? Se n˜ao, ´e poss´ıvel fazer alguma suposi¸c˜ao?

Exerc´ıcio 37. A vida m´edia de uma amostra de 100 lˆampadas de certa marca ´e 1615 horas. Por similaridade com outros processos de fabrica¸c˜ao, supomos o desvio padr˜ao igual a 120 horas. Utilizando α=5%, desejamos testar se a dura¸c˜ao m´edia de todas as lˆampadas dessa marca ´e igual ou ´e diferente de 1600 horas. Qual ´e a conclus˜ao? Determine tamb´em a probabilidade do erro tipo II, se a m´edia fosse 1620 horas.

Exerc´ıcio 38. Uma amostra com 10 observa¸c˜oes de uma vari´avel aleat´oria normal forneceu m´edia de 5,5 e variˆancia de 4. Deseja-se testar, ao n´ıvel de significˆancia de 5%, se a m´edia na popula¸c˜ao ´e igual ou ´e menor que 6. Qual ´e a conclus˜ao?

Exerc´ıcio 39. Um criador tem constatado uma propor¸c˜ao de 10% do rebanho com verminose. O veterin´ario alterou a dieta dos animais e acredita que a doen¸ca diminuiu de intensidade. Um exame em 100 cabe¸cas do rebanho, escolhidas ao acaso, indicou 8 delas com verminose. Ao n´ıvel de 8%, h´a ind´ıcios de que a propor¸c˜ao diminuiu?

Exerc´ıcio 40. Considere o teste p= 0,6 contrap6= 0,6. Sendo n= 100, indique a probabilidade de erro tipo I para as seguintes regi˜oes cr´ıticas: (i) RC = {x ∈ R|x <0,56 ou x >0,64}, (ii) RC ={x∈R|x <0,54 oux >0,66}.

2.2 Testes t-Student : teste e intervalo para µ com σ

2

des- conhecida

Exerc´ıcio 41. Com aux´ılio da tabelat-Student calcule (se necess´ario, aproxime):

(i) P(−3,365 6 t5 6 3,365). (ii) P(|t8| < 1,4). (iii) P(−1,1 6 t14 < 2,15).

(iv) a : P(t9 > a) = 0,02. (v) b : P(t16 6 b) = 0,05. (vi) c: P(|t11| 6 c) = 0,1.

(vii)d:P(|t21|> d) = 0,05.

Exerc´ıcio 42. Uma amostra de 20 observa¸c˜oes de uma vari´avel com distribui¸c˜ao normal foi colhida, obtendo-se desvio padr˜ao 1,1. No teste µ=5 contra µ >5, foi estabelecida a regi˜ao critica{t∈R|t >2,033}. Determine a probabilidade do erro tipo I.

(5)

Exerc´ıcio 43. A porcentagem anual m´edia da receita municipal empregada em saneamento b´asico em pequenos munic´ıpios de um estado tem sido 8% (admita que esse ´ındice se comporte segundo um modelo normal). O governo pretende melhorar esse ´ındice e, para isso, ofereceu alguns incentivos. Para verificar a efic´acia dessa atitude, sorteu 10 cidades e observou as porcentagens 8, 12, 16, 9, 11 e 12. Os dados trazem evidˆencia de melhoria, ao n´ıvel de 2%? Caso altere a m´edia, dˆe um intervalo de confian¸ca para anova m´edia.

2.3 N´ıvel Descritivo

Exerc´ıcio 44. Um pesquisador est´a realizando um teste para a m´edia e obteve n´ıvel descritivo igual a 0,035. Ele aceitar´a a hip´otese nula para n´ıveis de signi- ficˆancia superiores ou inferiores `a 0,035?

2.4 Teste χ

2

: Testes e intervalos para a Variˆ ancia

Exerc´ıcio 45. Para cada uma das seguintes combina¸c˜oes de a e gl (graus de libertade), calcular o valor deχ2aque uma ´areaano extremo direito da distribui¸c˜ao χ2, i.e., P(X 6) = a.

(i). a= 0,05, gl = 7 (ii). a= 0,1, gl = 16 (iii).a= 0,01, gl = 10 (iv). a= 0,025, gl = 8 (v). a= 0,005, gl= 5.

Exerc´ıcio 46. O tempo de certo evento observado em 18 provas forneceu as quan- tidades: ¯x= 334,8 (ns), S = 6,3 (ns). (i) Obtenha um intervalo de confian¸ca de 95% para o verdadeiro devio padr˜ao dos tempos.

2.5 Teste F (Fisher-Snedecor): σ

21

22

Exerc´ıcio 47. Supondo X ∼F(a, b), encontre xc tal que: (i) P(X >xc) = 0,05 com a=18, b=3. (ii) P(X > xc) = 0,05 com a=3, b=18. (iii) P(X > xc) = 0,05 coma=180,b=192. (iv)P(X >xc) = 0,95 coma=5,b=12. (v)P(X >xc) = 0,95 com a=30, b=40.

Exerc´ıcio 48. Uma panificadora produz determinado tipo de p˜ao, cujo peso m´edio

´e de 190 gramas, com desvio padr˜ao de 18 gramas. Devido a mudan¸cas na pol´ıtica cambial, que ocasionou aumento no pre¸co do trigo, alguns ingredientes da receita foram substitu´ıdos. Uma equipe do governo resolveu verificar se a variabilidade no peso do produto aumentou e escolheu, aleatoriamente, 16 unidades, medindo o peso de cada uma. O peso m´edio obtido da amostra foi de 102 gramas e o desvio padr˜ao foi de 24,5 gramas. Qual ´e a conclus˜ao paraα = 10%.

Exerc´ıcio 49. Uma linha de montagem produz pe¸cas cujos pesos, em gramas, obedecem ao modelo normal com variˆancia 30 g2. Os equipamentos foram mo- dernizados e, para verificar se o processo continua sob controle, foi tomada uma

(6)

amostra de 23 pre¸cas, que forneceu s2 = 40 g2. Existem evidˆencias indicando que a variˆancia mudou, considerando α=10%.

Exerc´ıcio 50. Queremos comparar trˆes hospitais, a trav´es da satisfa¸c˜ao demons- trada por pacientes quanto ao atendimento, durante o per´ıodo de interna¸c˜ao. Para tanto, foram selecionados, aleatoriamente, pacientes com grau de enfermidade se- melhante. Cada paciente preencheu um question´ario e as respostas geraram ´ındices variando de 0 a 100, indicando o grau de satisfa¸c˜ao. Os resultados foram

Hospital

A B C

n 10 15 13

¯

x 80,7 59,0 72,3

s2(x) 113,3 101,4 106,5

(i) Baseando-se nos dados apresentados, teste a igualdade das variˆancias para os hospitais A e B. Useα= 0,10. (ii) Teste se as m´edias populacionais s˜ao iguais.

Qual sua conclus˜ao? Useα= 0,05.

3 Extras

Exerc´ıcio 51. Sejam ¯X1 e S12 a m´edia e a variˆancia amostrais de n1 observa¸c˜oes de uma popula¸c˜ao com m´edia µ1 e variˆancia σ12. Da forma an´aloga consideramos X¯2, S22,n2222. Estabelecer um intervalo de confian¸ca paraµ12. Sugest˜ao:

partir do estat´ıstico

Z = ( ¯X1+ ¯X2) + (µ12) rσ12

n1 + σ22 n2

.

Demonstrar que se n1 → ∞ e n2 → ∞, ent˜ao Z ∼Φ(z; 0,1). [Sugest˜ao: Obtenha E[ ¯X1+ ¯X2] eV ar[ ¯X1+ ¯X2], e lembrar o TCL para a soma de v.as padronizadas]

Exerc´ıcio 52. Sea X1, X2, . . . , Xn uma amostra de uma popula¸c˜ao Poisson(λ).

Se utiliza ¯X como um estimador para λ. Obtenha um intervalo de confian¸ca de (1−α)% para λ. [Sugest˜ao, considerar o estimador,

Z = X¯ −λ pλ/n e demostre queZ ∼Φ(z; 0,1) se n→ ∞.]

4 Complementos

Esta se¸c˜ao apresenta diversos resultados sobre a origem de varias distribui¸c˜oes amostrais utilizadas em aula. O seu estudo ´e opcional e so devera ser considerado numa segunda leitura.

(7)

4.1 Distribui¸ c˜ oes Gamma e χ

2

Apresentamos dois distribui¸c˜oes essenciais no estudo das distribui¸c˜oes amostrais de ¯X e S2.

SeX´e normal padr˜ao, qual ser´a a distribui¸c˜ao deX2? Encontraremos primeiro a fun¸c˜ao de distribui¸c˜ao de Y = X2, FY. Obviamente FY(y) = 0 se y < 0. Se y≥0, ent˜ao

FY(y) =P(Y ≤y) = P(X2 ≤y) =P(−√

y≤X ≤√ y)

= Z +

y

y

√1

2πe−x2/2dx= 2 Z y

0

√1

2πe−x2/2dx.

Consideramos a seguir a seguinte troca de vari´avel, x=√

t, ent˜ao FY(y) =

Z y 0

√1

2πt12e−t/2dt.

A densidade deY, fY, ´e a derivada de FY com respeito a y, fY(y) =

( 1

y12e−y/2, sey >0, 0, caso contr´ario.

Esta densidade ´e um membro da “familia de distribui¸c˜oes gamma”. Antes de definirmos esta fam´ılia lembramos a defini¸c˜ao da fun¸c˜ao gamma, muito utilizada em analise. A fun¸c˜ao Γ : (0,+∞)→[0,+∞) dada por

Γ(x) = Z +∞

0

tx−1e−tdt, x >0,

´e conhecida como a fun¸c˜ao gamma. Utilizando integra¸c˜ao por partes ´e poss´ıvel mostrar que Γ(x+ 1) = xΓ(x) para qualquer x > 0, e portanto como um caso particular obtemos que Γ(n+ 1) =n! para n ∈N.

Exerc´ıcio 53. Mostre que Γ(1/2) = √ π.

Defini¸c˜ao 1. A vari´avel aleat´oria X tem distribui¸c˜ao gamma com parˆametros α eβ >0 se a sua densidade ´e dada por

fX(x) =

 1

βαΓ(α)xα−1e−x/β, sex≥0,

0, caso contr´ario.

Segue imediatamente deste defini¸c˜ao, do exerc´ıcio 53´e do exposto nesta se¸c˜ao que se X ´e normal padr˜ao, ent˜ao X2 tem distribui¸c˜ao gamma com parˆametros α= 1/2 e β= 2 (justifique isto!).

(8)

Exerc´ıcio 54. (i) Mostre que a fun¸c˜ao geradora de momentos de uma vari´avel aleat´oria gamma ´e dada por

M(t) = 1 (1−βt)α,

sendo queM(t) esta definida no dom´ınio (−∞,β1). [Dica: considerex=βu e logo a troca de vari´avel u= v/(1−βt)]. (ii) Utilizando M(t) mostre que EX = αβ e Var(X) =αβ2.

Proposi¸c˜ao 1. SejamX1, . . . , Xn vari´aveis aleat´orias independentes gamma com parˆametrosαi,β respectivamente. A vari´avel aleat´oriaX1+. . . Xntem distribui¸c˜ao gamma com parˆametros α1+. . .+αn e β.

Demonstra¸c˜ao. Lembramos que seX1 eX2 s˜ao vari´aveis aleat´orias independentes ent˜ao a fun¸c˜ao geradora deZ =X1+X2 ´e simplesmenteMZ(t) =MX1(t)MX2(t).

Temos ent˜ao que

MX1+...+Xn(t) = MX1(t)· · ·MXn(t) = 1

(1−βt)α1 · · · 1 (1−βt)αn

= 1

(1−βt)α1+...+αn,

a qual ´e a fun¸c˜ao geradora de uma vari´avel aleat´oria gamma com parˆametros α1+. . .+αn e β.

Suponhamos agora que X1, . . . , Xn ´e uma amostra i.i.d. de uma popula¸c˜ao normal padr˜ao. Neste caso diante ao exposto temos que X12, . . . , Xn2 s˜ao indepen- dentes e com distribui¸c˜ao gamma com α = 1/2 e β = 2. Da proposi¸c˜ao acima temos que

X12+. . . Xn2 ∼gamman 2,2

. (1)

Exerc´ıcio 55. (i) Suponha que X e Y s˜ao independentes e com distribui¸c˜ao χ2 comn graus de liberdade e χ2 com mgraus de liberdade respectivamente. Mostre queX+Y tem distribui¸c˜ao χ2 com n+m graus de liberdade. (ii) Suponha agora que X e eX+Y s˜ao χ2 com m e n, m < n, graus de liberdade. Mostre que Y ´e χ2 com n−m graus de liberdade.

Defini¸c˜ao 2. Uma vari´avel aleat´oria tem distribui¸c˜aoχ2comngraus de liberdade se esta tem distribui¸c˜ao gamma com parˆametros α=n/2 e β = 2.

Esta terminologia introduzida pelo estat´ıstico Britˆanico K. Pearson (1857-1936) ainda ´e utilizada hoje em dia. A figura4.1 mostra a densidade χ2 para diferentes graus de liberdade.

O interesse inicial na distribui¸c˜aoχ2 `e que esta esta relacionada a distribui¸c˜ao amostral de S2. Com o prop´osito de mostrarmos esta rela¸c˜ao utilizaremos o se- guinte resultado.

(9)

0 10 20 30 40 50 60 70

0.000.020.040.060.080.10

Figura 1: densidade χ2 para 10 (linha continua), 30 e 50 graus de liberdade.

Teorema 1. Seja X1, . . . , Xn uma amostra i.i.d. de uma popula¸c˜ao normal. Os estimadores X¯ e S2 s˜ao independentes.

Este Teorema permite obter a distribui¸c˜ao amostral deS2 no caso quando s˜ao consideradas amostras i.i.d. de uma popula¸c˜ao normal.

Teorema 2. SejaX1, . . . , Xn,n≥2, uma amostra i.i.d. de uma popula¸c˜ao normal com m´edia µe variˆancia σ2. A vari´avel aleat´oria

V = (n−1)S2 σ2

apresenta distribui¸c˜ao χ2 com n−1 graus de liberdade.

Demonstra¸c˜ao. Observamos que cada uma das vari´aveis aleat´orias (Xi−µ)/σs˜ao independentes e normais padr˜ao. Neste caso, diretamente de (1) temos que

n

X

i=1

Xi−µ σ

2

tem distribui¸c˜ao χ2 com n graus de liberdade.

SeX1, . . . , Xn´e uma amostrai.i.d. de uma popula¸c˜aoN(µ, σ2), segue das pro- priedades da distribui¸c˜ao normal que a vari´avel aleat´oria √

n( ¯X−µ)/σ ´e N(0,1). T.I.6.6 Portanton( ¯X−µ)22 tem distribui¸c˜aoχ2 com 1 grau de liberdade.

(10)

Observamos agora que

n

X

i=1

Xi−µ σ

2

=

n

X

i=1

(Xi−X)¯ 2 σ2 +n

X¯ −µ σ

2

= (n−1)S2

σ2 +nX¯ −µ σ

2

.

Segue ent˜ao do Teorema 1 e do exerc´ıcio55(ii) que (n−1)S22 tem distribui¸c˜ao χ2 com n−1 graus de liberdade.

4.2 Distribui¸ c˜ ao t (t-Student)

Estudamos a continua¸c˜ao a distribui¸c˜ao da vari´avel aleat´oria T =√

nX¯−µ S

,

obtida ao considerar uma amostra i.i.d. de uma popula¸c˜ao normal. Observamos primeiro a seguinte representa¸c˜ao paraT,

X¯ −µ S/√

n =

X¯ −µ σ/√

n · σ S =

X¯ −µ σ/√

n .

rS2 σ2. SeZ = X¯ −µ

σ/√

n e V = (n−1)S2

σ2 , ent˜ao X¯ −µ

S/√

n = Z

pV /(n−1).

Observamos queZ tem distribui¸c˜aoN(0,1) eV tem distribui¸c˜aoχ2comn−1 graus de liberdade, e tamb´em que o par de vari´aveis aleat´orias Z,V s˜ao independentes.

O seguinte resultado determina a distribui¸c˜ao do quociente Z/p V /n.

Proposi¸c˜ao 2. Seja Z com distribui¸c˜ao N(0,1) e V com distribui¸c˜ao χ2 com n graus de liberdade. Se Z e V s˜ao independentes, ent˜ao a vari´avel aleat´oria

T = Z

pV /n

tem densidade de probabilidade f dada por

f(x) = Γ(n+12 )

√πnΓ(n2)

1 + x2 n

n+12

para todo x∈R. (2)

(11)

Demonstra¸c˜ao. Calculamos primeiro a densidade deU =√

V. Temos que a fun¸c˜ao de distribui¸c˜ao de U ´e dada por

FU(a) =P(U ≤a) = P(Y ≤a2) = Z a2

0

1

2n/2Γ(n/2)xn2−1e−x/2dx sea >0.

Tomandox=u2 obtemos FU(a) =

Z a 0

2

2n/2Γ(n/2)un−1e−u2/2du se a >0.

Se derivamos respeito de a obtemos a densidade de U, fU(u) =

 2

2n/2Γ(n/2)un−1e−u2/2, seu >0,

0, seu≤0.

Calculamos agora a distribui¸c˜ao de probabilidade de Z/U. A tal fim observa- mos que

P Z

U ≤a

=P(Z ≤aU) =P (Z, U)∈Ga ,

onde Ga = {(x, u) ∈ R2 : u > 0 e x ≤ au}. Devido a independˆencia de Z e U, temos que a densidade conjunta de (Z, U) ´e

fZ,U(x, u) =

fZ(x)fU(u) = 1

√2πe−x2/2 2

2n/2Γ(n2)un−1e−u2/2, se u >0,

0, se u≤0.

Conseq¨uentemente, P

Z U ≤a

= Z Z

Ga

fZ(x)fU(u)dxdu,

e trocando a ordem das integrais, paraa 6= 0, P

Z U ≤a

= Z +∞

0

Z au

−∞

fZ(x)fU(u)dx

du

= Z +∞

0

fU(u) Z au

−∞

√1

2πe−x2/2dx

du.

Mantendo u fixo e trocandox=ut na integral mais interna resulta em P

Z U ≤a

= Z +∞

0

fU(u) Z a

−∞

√1

2πe−(ut)2/2u dt

du

= Z a

−∞

Z +∞

0

fU(u) 1

√2πe−(ut)2/2u du

dt,

(12)

sendo que a ultima igualdade resulta ao trocar novamente a ordem de integra¸c˜ao.

Temos ent˜ao, da ´ultima igualdade, que a densidade de Z/U pode ser escrita como fZ/U(a) =

Z +∞

0

fU(u) 1

√2πe−(au)2/2u du

= Z +∞

0

2 2n/2

2πΓ(n2)une−(1+a2)u2/2du.

Se agora consideramos a trocau=v/√

1 +a2 na ultima integral obtemos fZ/U(a) = (1 +a2)−(n+1)/2 2

2n/2

2πΓ(n2) Z +∞

0

vne−v2/2dv.

Substituindo v = √

2s, a integral a direita pode ser expressada em termos da fun¸c˜ao gamma como

Z +∞

0

vne−v2/2dv = 2n/2√ 2 2

Z +∞

0

sn212e−sds

= 2n/2√ 2

2 Γn+ 1 2

,

e assim,

fZ/U(a) = Γ

n+1 2

√πΓ(n2)(1 +a2)−(n+1)/2. Por ultimo derivamos agora a densidade de Z/p

V /n. Observamos que,

Z

pV /n =√ n Z

√V =√ nZ

U, e ent˜ao finalmente a distribui¸c˜ao de √

nZ/U ´e

f(a) = Γ

n+1 2

√πnΓ(n2)

1 + a2 n

−(n+1)/2

.

Defini¸c˜ao 3. Uma vari´avel aleat´oria tem distribui¸c˜ao tcom n graus de liberdade se a sua densidade ´e dada pela lei em (2).

A distribui¸c˜ao t foi descrita inicialmente por William S. Gosset (1876-1937).

Gosset trabalhava numa cervejaria a qual proibia que os seus empleados publi- cassem o seu trabalho cient´ıfico. Devido a isto Gosset publico os seus trabalhos utilizando o pseudˆonimo “Student”. Em honra ao seu descobridor hoje em dia a distribui¸c˜aot tamb´em ´e conhecida como a “distribui¸c˜ao Student” (ou t-Student).

Esta distribui¸c˜ao ´e apresentada na figura 4.2.

(13)

−4 −2 0 2 4

0.00.10.20.30.4

−4 −2 0 2 4

−6−5−4−3−2−1

Figura 2: esquerda: densidade t de Student para 5 (linha continua), 10, 20 e 30 graus de liberdade, e direita: mesmas densidades com ordenas algor´ıtmicas para enfatizar a diferen¸ca nas caudas. A fim de estabelecer uma compara¸c˜ao, a densidade normal padr˜ao tamb´em se encontra graficada, sendo que esta ´e a densidade com a menor probabilidade nas caudas.

4.3 Distribui¸ c˜ ao F

Sejam X e Y duas popula¸c˜oes e SX2, XY2 os estimadores das variˆancias σX2 e σY2. Desejamos estudar o quociente σ2XY2 e a tal fim determinamos a distribui¸c˜ao de

SX2σX2 SY2σY2 . Esta vari´avel aleat´oria tem “distribui¸c˜ao F”.

Defini¸c˜ao 4. A vari´avel aleat´oria X apresenta distribui¸c˜ao F com m graus de liberdade no numerados engraus de liberdade no denominador se a sua densidade

´e dada por

f(x) =





Γ(m+n2 ) Γ(m2)Γ(n2)

m n

m/2

xm2−1

1 + m nx

m+n

2 , sex >0,

0, sex≤0.

A distribui¸c˜aoF ´e tamb´em conhecida como a distribui¸c˜ao de Fisher em honra a Sir Ronald A. Fisher (1890–1962).

Teorema 3. Sejam U e V duas vari´aveis aleat´orias com distribui¸c˜ao χ2 de m e n graus de liberdade respectivamente. Se U e V s˜ao independentes, ent˜ao

U/m V /n

(14)

0 1 2 3 4

0.00.51.01.5

Figura 3: densidadesF(m, n) para v´arios valores demen(linha continua (50,50), ponteada (30,30) e linha interrompida (10,1000)).

tem distribui¸c˜ao F com m graus de liberdade no numerador en graus de liberdade no denominador.

Demonstra¸c˜ao. Encontramos primeiro a distribui¸c˜ao deU/V. Devido a queU >0 eV >0, temos que

P U

V ≤a

= 0, se a≤0.

No caso a >0 temos P

U V ≤a

=P(U ≤aV) = P (U, V)∈A ,

onde A = {(u, v) : u ≤ av eu, v ≥ 0} ⊂ R2. Seguindo o mesmo argumento utilizado para derivar a distribui¸c˜ao de Z/U na Proposi¸c˜ao2, temos

P U

V ≤a

= Z Z

A

1

2m+n2 Γ(m2)Γ(n2)um2−1vn2−1e−u/2e−v/2du dv.

SejaC−1 = 2m+n2 Γ(m2)Γ(n2). Se trocamos a ordem de integra¸c˜ao na ultima integral obtemos

P U

V ≤a

=C Z +∞

0

Z av 0

um2−1vn2−1e−u/2e−v/2du

dv.

Se deixamosv fixo e consideramos a trocau=vt na integral mais interna obtemos

(15)

que o lado direito da ultima igualdade ´e C

Z +∞

0

Z a 0

vm2−1vn2−1tm2−1e−vt/2e−v/2v dt

dv

=C Z a

0

Z +∞

0

vm+n2 −1tm2−1e−(1+t)v/2dv

dt.

Parat fixo consideramos agora a troca v = 2s/(1 +t), C

Z a 0

Z +∞

0

2 1 +t

m+n2

tm2−1sm+n2 −1e−sds

dt

=C Z a

0

2 1 +t

m+n2

tm2−1dt

Z +∞

0

sm+n2 −1e−sds

=C Z a

0

2m+n2

(1 +t)m+n2 tm2−1dt

Γm+n 2

.

Desta forma, P

U V ≤a

= Γ(m+n2 ) Γ(m2)Γ(n2)

Z a 0

tm2−1(1 +t)m+n2 dt.

Se derivamos agora respeito deaobtemos a densidade de probabilidade ˜f deU/V, f˜(a) =

( Γ(m+n

2 )

Γ(m2)Γ(n2)am2−1(1 +a)m+n2 , se a≥0,

0, caso contr´ario.

Num segundo passo, calculamos a distribui¸c˜ao de U/mV /n, isto ´e, U/m

V /n = n m

U V .

Lembramos que se X ´e uma vari´avel aleat´oria com densidade fX, ent˜aoY =bX, b6= 0, tem densidade

fY(y) = 1

|p|fX(y/p)

Ent˜ao a densidade f de U/mV /n segue da densidade de U/V,

f(a) =

Γ(m+n2 ) Γ(m2)Γ(n2)

m n

m2

am2−1

1 + mnam+n2

, se a≥0,

0, caso contr´ario.

Esta express˜ao corresponde a densidadeF commgraus de liberdade no numerador en no denominador.

(16)

Exerc´ıcio 56. Mostre o seguinte resultado.

Proposi¸c˜ao 3. Seja X uma vari´avel aleat´oria com distribui¸c˜ao F com m graus de liberdade no numerador e n graus de liberdade no denominador. A vari´avel aleat´oria 1/X tem distribui¸c˜ao F com n graus de liberdade no numerador e m graus de liberdade no denominador.

Referências

Documentos relacionados

Uma amostra com 10 observa¸ c˜ oes de uma vari´ avel aleat´ oria normal forneceu m´ edia de 5,5 e variˆ ancia de 4.. Um criador tem constatado uma propor¸ c˜ ao de 10% do rebanho

Desejamos coletar uma amostra de uma vari´ avel aleat´ oria X com distribui¸ c˜ ao normal de m´ edia desconhecida e variˆ ancia 30.. Qual deve ser o tamanho da amostra para que,

Local de realização da avaliação: Centro de Aperfeiçoamento dos Profissionais da Educação - EAPE , endereço : SGAS 907 - Brasília/DF. Estamos à disposição

A taxa do INR ideal para os paci- entes com disfunção ventricular e insuficiência cardíaca também não foi estimada por meio de estudos prospectivos e randomizados, e a taxa

Neste trabalho, foram estudadas as plântulas e plantas jovens de Erythrina speciosa (Phaseoleae), Holocalyx balansae e Sophora tomentosa (Sophoreae), Swartzia langsdorffii

Algumas sementes e castanhas vão ficar só nessa etapa de hidratação pois já passaram por um processo térmico no caso de algumas castanhas e nozes, outras sementes descascadas

Assim em vez de usar a escala de B maior imaginei este B maior sendo o tal 5º Grau da Escala de Em

Em decorrência dos referidos acordos de colaboração, foram tomados 19(dezenove) termos de colaboração de MÔNICA MOURA, 10(dez) de JOÃO SANTANA e 04(quatro) termos