Introcu¸c˜ao `a Inferˆencia Estat´ıstica.
Departamento de F´ısica ´e Matem´atica. USP-RP.
Prof. Rafael A. Rosales
10 de outubro de 2007
Lista de Exercicios 2
Intervalos de Confianc ¸a. Testes de Hip´ oteses.
1 Intervalos de Confian¸ ca
Exerc´ıcio 22. Por analog´ıa a produtos similares, o tempo de rea¸c˜ao de um novo medicamento pode ser considerado como tendo distribui¸c˜ao normal Φ(µ,4) (a m´edia ´e desconhecida). Vinte pacientes foram sorteados, receberam o medica- mento e tiveram seu tempo de rea¸c˜ao anotado. Os dados foram os seguintes: 2,9;
3,4; 3,5; 4,1; 4,6; 4,7; 4,5; 3,8; 5,3; 4,9; 4,8; 5,7; 5,8; 5,0; 3,4; 5,9; 6,3; 4,6; 5,5 e 6,2.
Obtenha intervalos de confian¸ca para o tempo m´edio de rea¸c˜ao para: (i) γ=96%, (ii) γ=75%.
Exerc´ıcio 23. Uma amostra de 25 observa¸c˜oes de uma normal Φ(µ,16) foi cole- tada e forneceu uma m´edia amostral de 8. Construa intervalos com confian¸ca 80%, 85%, 90% e 95% para a m´edia populacional. Comente as diferen¸cas encontradas.
Exerc´ıcio 24. Ser´a coletada uma amostra de uma popula¸c˜ao normal com desvio padr˜ao igual a 9. Para uma confian¸ca de γ=90%, determine a amplitude do intervalo de confian¸ca para a m´edia populacional nos casos em que o tamanho da amostra ´e 30, 50 ou 100. Comente as diferen¸cas.
Exerc´ıcio 25. Numa pesquisa com 50 eleitores, o candidato J. J. obteve 0,34 da preferˆencia dos eleitores. Construa, para a confian¸ca 94%, os intervalos oti- mista e conservador de confian¸ca para a propor¸c˜ao de votos a serem recebidos pelo candidato mencionado, supondo que a elei¸c˜ao fosse nesse momento.
Exerc´ıcio 26. Desejamos coletar uma amostra de uma vari´avel aleat´oria X com distribui¸c˜ao normal de m´edia desconhecida e variˆancia 30. Qual deve ser o tamanho da amostra para que, com 0,92 de probabilidade, a m´edia amostral n˜ao difira da m´edia da popula¸c˜ao por mais de 3 unidades?
Exerc´ıcio 27. Interprete e comente as afirma¸c˜oes: (i) A m´edia de sal´ario inicial para rec´em formados em Economia est´a entre 7 e 9 sal´arios m´ınimos com confian¸ca 95%. (ii) Quanto maior for o tamanho da amostra, maior ´e a probabilidade da m´edia amostral estar pr´oxima da verdadeira m´edia.
Exerc´ıcio 28. O intervalo [35,21; 35,99], com confian¸ca 95% foi constru´ıdo a partir de uma amostra de tamanho 100, para a m´ediaµde uma popula¸c˜ao normal com desvio padr˜ao igual a 2. (i) Qual e o valor encontrado para a m´edia dessa amostra? (ii) Se utiliz´assemos essa mesma amostra, mas uma confian¸ca de 90%, qual seria o novo intervalo de confian¸ca?
Exerc´ıcio 29. Antes de uma elei¸c˜ao, um determinado partido est´a interessado em estimar a probabilidade p de eleitores favor´aveis ao seu candidato. Uma amostra piloto de tamanho 100 revelou que 60% dos eleitores eram favor´aveis ao candidato.
(i) Utilizando a informa¸c˜ao da amostra piloto, determine o tamanho da amostra para que, com 0,8 de probabilidade, o erro cometido na estima¸c˜ao seja no m´aximo 0,05. (ii) Se na amostra final, com tamanho obtido em (i), observou-se que 51%
dos eleitores eram favor´aveis ao candidato, construa um intervalo de confian¸ca para p, com confian¸ca 95%.
Exerc´ıcio 30. O tempo de emiss˜ao de extratos, em segundos, pelo caixa eletrˆonico de um banco foi modelado segundo a distribui¸c˜ao exponencial com parˆametro 1/40. Para uma amostra aleat´oria de 50 clientes que solicitaram extratos: (i) Qual ´e a probabilidade do segundo cliente sorteado na amostra demorar mais de 30 segundos na sua solicita¸c˜ao? (ii) Determine a probabilidade de que o intervalo m´edio de emiss˜ao, entre os clientes amostrados, seja inferior a 35 segundos.
1.1 Intervalo para µ
1− µ
2Exerc´ıcio 31. A fim de conhecer o poss´ıvel v´ınculo entre o conte´udo de fluoruro da ´agua pot´avel e o cˆancer, Yiamouyiannis e Burk (77) registraram as taxas de mortes por cˆancer (n´umero de mortes por 105 habitantes) desde 1952 at´e 1969 em 20 cidades americanas selecionadas: as 10 maiores cidades com ´agua fluorurada e as 10 maiores sem ´agua fluorurada para 1969. Maritz e Jarrett (App. Stats. 83) utilizaram os dados obtidos por Yiamouyiannis e Burk para calcular, para cada cidade, a taxa anual de aumento na taxa de mortes por cˆancer durante o per´ıodo de 18 anos para cada um dos quatro grupos de idades: menores de 25, 25-44, 45-64, e 65 ou maiores. Os dados para o grupo de idades de 45 a 64 anos ´e apresentada na tabela 1.1. (i) Construir um intervalo de confian¸ca de 95% para a diferen¸ca entre os incrementos anuais m´edios nas taxas de mortes por cˆancer em cidades com ´agua fluorurada e n˜ao fluorurada. (ii) Interpretar o intervalo obtido em (i).
(iii) Quais s˜ao os supostos necess´arios para construir o intervalo? Vocˆe acredita que os supostos s˜ao satisfeitos neste caso?
1.2 Intervalo para p
1− p
2Exerc´ıcio 32. De acordo com o estudo da pesquisa de mercado dos serv´ı¸cos de consultor´ıa em engenharia a empresas industriais no Meio Oeste (USA), exerc´ıcio
Fluorurada N˜ao Fluorurada
Cidade ITAM Cidade ITAM
Chicago 1,0640 Los ´Angeles 0,8875 Filadelphia 1,4118 Boston 1,7358 Baltimore 2,1115 New Orleans 1,0165 Cleveland 1,9401 Seattle 0,4923 Washington 3,8772 Cincinatti 4,0155 Milwaukee -0,4561 Atlanta -1.1744 San Luis 4,8359 Kansas City 2,8132 San Francisco 1,8875 Columbus 1,7451 Pittsburg 4,4964 Newark -0,5676 Buffalo 1,4045 Portland 2,4471 Tabela 1: ITAM: incremento na taxa anual de mortes
2.49, quarenta empresas que participaram de uma enquete (20 grandes e 20 pe- quenas) indicaram que elas n˜ao precisavam dos serv´ıcios externos de consultor´ıa.
A principal ra¸c˜ao foi que estas sempre obtinham ajuda de consultar´ıa sempre que necess´ario. Entretanto, duas vezes mais empresas grandes (12) que pequenas (6) citaram este motivo . Establecer um intervalo de confian¸ca de 90% para a dife- ren¸ca nas porcentagens das empresas grandes e as pequenas que citam a ajuda das oficinas corporativas.
2 Testes de Hip´ oteses
2.1 Teste para µ
Exerc´ıcio 33. Uma vari´avel aleat´oria tem distribui¸c˜ao normal e desvio padr˜ao igual a 12. Estamos testando se sua m´edia ´e igual ou ´e diferente de 20 e coletamos uma amostra de 100 valores dessa vari´avel, obtendo uma m´edia amostral de 17,4.
(i) Formule as hip´oteses. (ii) Obtenha a regi˜ao cr´ıtica e dˆe a conclus˜ao do teste para os seguintes n´ıveis de significˆancia: 1%, 2%, 4%, 6% e 8%.
Exerc´ıcio 34. Para uma vari´avel aleat´oria com densidade normal e desvio padr˜ao 5, o teste da m´edia µ=10 contra µ=14, teve a regi˜ao cr´ıtica dada por {x ∈ R : x >12}para uma amostra de tamanho 25. Determine as probabilidades dos erros tipo I e II.
Exerc´ıcio 35. Uma m´aquina deve produzir pe¸cas com diˆametro de 2 cm. En- tretanto, varia¸c˜oes acontecem e vamos assumir que o diˆametro dessas pe¸cas siga o modelo Normal com variˆancia igual a 0,09 cm2. Para testar se a m´aquina est´a
bem regulada, uma amostra de 100 pe¸cas ´e coletada. (i) Formule o problema como um teste de hip´oteses. (ii) Qual seria a regi˜ao cr´ıtica seα= 0,02? (iii) se a regi˜ao de aceita¸c˜ao fosse {x∈ R|1,956x62,05}, qual seria o n´ıvel de significˆancia do teste? Nesse caso, determine a probabilidade do erro tipo II se µ=1,95 cm. (iv) Se para essa amostra ¯x= 1,94; qual a decis˜ao em (ii)?, em (iii)?
Exerc´ıcio 36. Um estudo foi desenvolvido para avaliar o sal´ario de empregadas dom´esticas na cidade de S˜ao Paulo. Foram sorteadas e entrevistadas 200 traba- lhadoras. Admita que o desvio padr˜ao dessa vari´avel na cidade ´e de 0,8 sal´arios m´ınimos. (i) Vocˆe conhece a distribui¸c˜ao do estimador ¯X? Se n˜ao, ´e poss´ıvel fazer alguma suposi¸c˜ao?
Exerc´ıcio 37. A vida m´edia de uma amostra de 100 lˆampadas de certa marca ´e 1615 horas. Por similaridade com outros processos de fabrica¸c˜ao, supomos o desvio padr˜ao igual a 120 horas. Utilizando α=5%, desejamos testar se a dura¸c˜ao m´edia de todas as lˆampadas dessa marca ´e igual ou ´e diferente de 1600 horas. Qual ´e a conclus˜ao? Determine tamb´em a probabilidade do erro tipo II, se a m´edia fosse 1620 horas.
Exerc´ıcio 38. Uma amostra com 10 observa¸c˜oes de uma vari´avel aleat´oria normal forneceu m´edia de 5,5 e variˆancia de 4. Deseja-se testar, ao n´ıvel de significˆancia de 5%, se a m´edia na popula¸c˜ao ´e igual ou ´e menor que 6. Qual ´e a conclus˜ao?
Exerc´ıcio 39. Um criador tem constatado uma propor¸c˜ao de 10% do rebanho com verminose. O veterin´ario alterou a dieta dos animais e acredita que a doen¸ca diminuiu de intensidade. Um exame em 100 cabe¸cas do rebanho, escolhidas ao acaso, indicou 8 delas com verminose. Ao n´ıvel de 8%, h´a ind´ıcios de que a propor¸c˜ao diminuiu?
Exerc´ıcio 40. Considere o teste p= 0,6 contrap6= 0,6. Sendo n= 100, indique a probabilidade de erro tipo I para as seguintes regi˜oes cr´ıticas: (i) RC = {x ∈ R|x <0,56 ou x >0,64}, (ii) RC ={x∈R|x <0,54 oux >0,66}.
2.2 Testes t-Student : teste e intervalo para µ com σ
2des- conhecida
Exerc´ıcio 41. Com aux´ılio da tabelat-Student calcule (se necess´ario, aproxime):
(i) P(−3,365 6 t5 6 3,365). (ii) P(|t8| < 1,4). (iii) P(−1,1 6 t14 < 2,15).
(iv) a : P(t9 > a) = 0,02. (v) b : P(t16 6 b) = 0,05. (vi) c: P(|t11| 6 c) = 0,1.
(vii)d:P(|t21|> d) = 0,05.
Exerc´ıcio 42. Uma amostra de 20 observa¸c˜oes de uma vari´avel com distribui¸c˜ao normal foi colhida, obtendo-se desvio padr˜ao 1,1. No teste µ=5 contra µ >5, foi estabelecida a regi˜ao critica{t∈R|t >2,033}. Determine a probabilidade do erro tipo I.
Exerc´ıcio 43. A porcentagem anual m´edia da receita municipal empregada em saneamento b´asico em pequenos munic´ıpios de um estado tem sido 8% (admita que esse ´ındice se comporte segundo um modelo normal). O governo pretende melhorar esse ´ındice e, para isso, ofereceu alguns incentivos. Para verificar a efic´acia dessa atitude, sorteu 10 cidades e observou as porcentagens 8, 12, 16, 9, 11 e 12. Os dados trazem evidˆencia de melhoria, ao n´ıvel de 2%? Caso altere a m´edia, dˆe um intervalo de confian¸ca para anova m´edia.
2.3 N´ıvel Descritivo
Exerc´ıcio 44. Um pesquisador est´a realizando um teste para a m´edia e obteve n´ıvel descritivo igual a 0,035. Ele aceitar´a a hip´otese nula para n´ıveis de signi- ficˆancia superiores ou inferiores `a 0,035?
2.4 Teste χ
2: Testes e intervalos para a Variˆ ancia
Exerc´ıcio 45. Para cada uma das seguintes combina¸c˜oes de a e gl (graus de libertade), calcular o valor deχ2aque uma ´areaano extremo direito da distribui¸c˜ao χ2, i.e., P(X 6) = a.
(i). a= 0,05, gl = 7 (ii). a= 0,1, gl = 16 (iii).a= 0,01, gl = 10 (iv). a= 0,025, gl = 8 (v). a= 0,005, gl= 5.
Exerc´ıcio 46. O tempo de certo evento observado em 18 provas forneceu as quan- tidades: ¯x= 334,8 (ns), S = 6,3 (ns). (i) Obtenha um intervalo de confian¸ca de 95% para o verdadeiro devio padr˜ao dos tempos.
2.5 Teste F (Fisher-Snedecor): σ
21/σ
22Exerc´ıcio 47. Supondo X ∼F(a, b), encontre xc tal que: (i) P(X >xc) = 0,05 com a=18, b=3. (ii) P(X > xc) = 0,05 com a=3, b=18. (iii) P(X > xc) = 0,05 coma=180,b=192. (iv)P(X >xc) = 0,95 coma=5,b=12. (v)P(X >xc) = 0,95 com a=30, b=40.
Exerc´ıcio 48. Uma panificadora produz determinado tipo de p˜ao, cujo peso m´edio
´e de 190 gramas, com desvio padr˜ao de 18 gramas. Devido a mudan¸cas na pol´ıtica cambial, que ocasionou aumento no pre¸co do trigo, alguns ingredientes da receita foram substitu´ıdos. Uma equipe do governo resolveu verificar se a variabilidade no peso do produto aumentou e escolheu, aleatoriamente, 16 unidades, medindo o peso de cada uma. O peso m´edio obtido da amostra foi de 102 gramas e o desvio padr˜ao foi de 24,5 gramas. Qual ´e a conclus˜ao paraα = 10%.
Exerc´ıcio 49. Uma linha de montagem produz pe¸cas cujos pesos, em gramas, obedecem ao modelo normal com variˆancia 30 g2. Os equipamentos foram mo- dernizados e, para verificar se o processo continua sob controle, foi tomada uma
amostra de 23 pre¸cas, que forneceu s2 = 40 g2. Existem evidˆencias indicando que a variˆancia mudou, considerando α=10%.
Exerc´ıcio 50. Queremos comparar trˆes hospitais, a trav´es da satisfa¸c˜ao demons- trada por pacientes quanto ao atendimento, durante o per´ıodo de interna¸c˜ao. Para tanto, foram selecionados, aleatoriamente, pacientes com grau de enfermidade se- melhante. Cada paciente preencheu um question´ario e as respostas geraram ´ındices variando de 0 a 100, indicando o grau de satisfa¸c˜ao. Os resultados foram
Hospital
A B C
n 10 15 13
¯
x 80,7 59,0 72,3
s2(x) 113,3 101,4 106,5
(i) Baseando-se nos dados apresentados, teste a igualdade das variˆancias para os hospitais A e B. Useα= 0,10. (ii) Teste se as m´edias populacionais s˜ao iguais.
Qual sua conclus˜ao? Useα= 0,05.
3 Extras
Exerc´ıcio 51. Sejam ¯X1 e S12 a m´edia e a variˆancia amostrais de n1 observa¸c˜oes de uma popula¸c˜ao com m´edia µ1 e variˆancia σ12. Da forma an´aloga consideramos X¯2, S22,n2,µ2 eσ22. Estabelecer um intervalo de confian¸ca paraµ1+µ2. Sugest˜ao:
partir do estat´ıstico
Z = ( ¯X1+ ¯X2) + (µ1+µ2) rσ12
n1 + σ22 n2
.
Demonstrar que se n1 → ∞ e n2 → ∞, ent˜ao Z ∼Φ(z; 0,1). [Sugest˜ao: Obtenha E[ ¯X1+ ¯X2] eV ar[ ¯X1+ ¯X2], e lembrar o TCL para a soma de v.as padronizadas]
Exerc´ıcio 52. Sea X1, X2, . . . , Xn uma amostra de uma popula¸c˜ao Poisson(λ).
Se utiliza ¯X como um estimador para λ. Obtenha um intervalo de confian¸ca de (1−α)% para λ. [Sugest˜ao, considerar o estimador,
Z = X¯ −λ pλ/n e demostre queZ ∼Φ(z; 0,1) se n→ ∞.]
4 Complementos
Esta se¸c˜ao apresenta diversos resultados sobre a origem de varias distribui¸c˜oes amostrais utilizadas em aula. O seu estudo ´e opcional e so devera ser considerado numa segunda leitura.
4.1 Distribui¸ c˜ oes Gamma e χ
2Apresentamos dois distribui¸c˜oes essenciais no estudo das distribui¸c˜oes amostrais de ¯X e S2.
SeX´e normal padr˜ao, qual ser´a a distribui¸c˜ao deX2? Encontraremos primeiro a fun¸c˜ao de distribui¸c˜ao de Y = X2, FY. Obviamente FY(y) = 0 se y < 0. Se y≥0, ent˜ao
FY(y) =P(Y ≤y) = P(X2 ≤y) =P(−√
y≤X ≤√ y)
= Z +√
y
−√ y
√1
2πe−x2/2dx= 2 Z √y
0
√1
2πe−x2/2dx.
Consideramos a seguir a seguinte troca de vari´avel, x=√
t, ent˜ao FY(y) =
Z y 0
√1
2πt−12e−t/2dt.
A densidade deY, fY, ´e a derivada de FY com respeito a y, fY(y) =
( 1
√
2πy12e−y/2, sey >0, 0, caso contr´ario.
Esta densidade ´e um membro da “familia de distribui¸c˜oes gamma”. Antes de definirmos esta fam´ılia lembramos a defini¸c˜ao da fun¸c˜ao gamma, muito utilizada em analise. A fun¸c˜ao Γ : (0,+∞)→[0,+∞) dada por
Γ(x) = Z +∞
0
tx−1e−tdt, x >0,
´e conhecida como a fun¸c˜ao gamma. Utilizando integra¸c˜ao por partes ´e poss´ıvel mostrar que Γ(x+ 1) = xΓ(x) para qualquer x > 0, e portanto como um caso particular obtemos que Γ(n+ 1) =n! para n ∈N.
Exerc´ıcio 53. Mostre que Γ(1/2) = √ π.
Defini¸c˜ao 1. A vari´avel aleat´oria X tem distribui¸c˜ao gamma com parˆametros α eβ >0 se a sua densidade ´e dada por
fX(x) =
1
βαΓ(α)xα−1e−x/β, sex≥0,
0, caso contr´ario.
Segue imediatamente deste defini¸c˜ao, do exerc´ıcio 53´e do exposto nesta se¸c˜ao que se X ´e normal padr˜ao, ent˜ao X2 tem distribui¸c˜ao gamma com parˆametros α= 1/2 e β= 2 (justifique isto!).
Exerc´ıcio 54. (i) Mostre que a fun¸c˜ao geradora de momentos de uma vari´avel aleat´oria gamma ´e dada por
M(t) = 1 (1−βt)α,
sendo queM(t) esta definida no dom´ınio (−∞,β1). [Dica: considerex=βu e logo a troca de vari´avel u= v/(1−βt)]. (ii) Utilizando M(t) mostre que EX = αβ e Var(X) =αβ2.
Proposi¸c˜ao 1. SejamX1, . . . , Xn vari´aveis aleat´orias independentes gamma com parˆametrosαi,β respectivamente. A vari´avel aleat´oriaX1+. . . Xntem distribui¸c˜ao gamma com parˆametros α1+. . .+αn e β.
Demonstra¸c˜ao. Lembramos que seX1 eX2 s˜ao vari´aveis aleat´orias independentes ent˜ao a fun¸c˜ao geradora deZ =X1+X2 ´e simplesmenteMZ(t) =MX1(t)MX2(t).
Temos ent˜ao que
MX1+...+Xn(t) = MX1(t)· · ·MXn(t) = 1
(1−βt)α1 · · · 1 (1−βt)αn
= 1
(1−βt)α1+...+αn,
a qual ´e a fun¸c˜ao geradora de uma vari´avel aleat´oria gamma com parˆametros α1+. . .+αn e β.
Suponhamos agora que X1, . . . , Xn ´e uma amostra i.i.d. de uma popula¸c˜ao normal padr˜ao. Neste caso diante ao exposto temos que X12, . . . , Xn2 s˜ao indepen- dentes e com distribui¸c˜ao gamma com α = 1/2 e β = 2. Da proposi¸c˜ao acima temos que
X12+. . . Xn2 ∼gamman 2,2
. (1)
Exerc´ıcio 55. (i) Suponha que X e Y s˜ao independentes e com distribui¸c˜ao χ2 comn graus de liberdade e χ2 com mgraus de liberdade respectivamente. Mostre queX+Y tem distribui¸c˜ao χ2 com n+m graus de liberdade. (ii) Suponha agora que X e eX+Y s˜ao χ2 com m e n, m < n, graus de liberdade. Mostre que Y ´e χ2 com n−m graus de liberdade.
Defini¸c˜ao 2. Uma vari´avel aleat´oria tem distribui¸c˜aoχ2comngraus de liberdade se esta tem distribui¸c˜ao gamma com parˆametros α=n/2 e β = 2.
Esta terminologia introduzida pelo estat´ıstico Britˆanico K. Pearson (1857-1936) ainda ´e utilizada hoje em dia. A figura4.1 mostra a densidade χ2 para diferentes graus de liberdade.
O interesse inicial na distribui¸c˜aoχ2 `e que esta esta relacionada a distribui¸c˜ao amostral de S2. Com o prop´osito de mostrarmos esta rela¸c˜ao utilizaremos o se- guinte resultado.
0 10 20 30 40 50 60 70
0.000.020.040.060.080.10
Figura 1: densidade χ2 para 10 (linha continua), 30 e 50 graus de liberdade.
Teorema 1. Seja X1, . . . , Xn uma amostra i.i.d. de uma popula¸c˜ao normal. Os estimadores X¯ e S2 s˜ao independentes.
Este Teorema permite obter a distribui¸c˜ao amostral deS2 no caso quando s˜ao consideradas amostras i.i.d. de uma popula¸c˜ao normal.
Teorema 2. SejaX1, . . . , Xn,n≥2, uma amostra i.i.d. de uma popula¸c˜ao normal com m´edia µe variˆancia σ2. A vari´avel aleat´oria
V = (n−1)S2 σ2
apresenta distribui¸c˜ao χ2 com n−1 graus de liberdade.
Demonstra¸c˜ao. Observamos que cada uma das vari´aveis aleat´orias (Xi−µ)/σs˜ao independentes e normais padr˜ao. Neste caso, diretamente de (1) temos que
n
X
i=1
Xi−µ σ
2
tem distribui¸c˜ao χ2 com n graus de liberdade.
SeX1, . . . , Xn´e uma amostrai.i.d. de uma popula¸c˜aoN(µ, σ2), segue das pro- priedades da distribui¸c˜ao normal que a vari´avel aleat´oria √
n( ¯X−µ)/σ ´e N(0,1). T.I.6.6 Portanton( ¯X−µ)2/σ2 tem distribui¸c˜aoχ2 com 1 grau de liberdade.
Observamos agora que
n
X
i=1
Xi−µ σ
2
=
n
X
i=1
(Xi−X)¯ 2 σ2 +n
X¯ −µ σ
2
= (n−1)S2
σ2 +nX¯ −µ σ
2
.
Segue ent˜ao do Teorema 1 e do exerc´ıcio55(ii) que (n−1)S2/σ2 tem distribui¸c˜ao χ2 com n−1 graus de liberdade.
4.2 Distribui¸ c˜ ao t (t-Student)
Estudamos a continua¸c˜ao a distribui¸c˜ao da vari´avel aleat´oria T =√
nX¯−µ S
,
obtida ao considerar uma amostra i.i.d. de uma popula¸c˜ao normal. Observamos primeiro a seguinte representa¸c˜ao paraT,
X¯ −µ S/√
n =
X¯ −µ σ/√
n · σ S =
X¯ −µ σ/√
n .
rS2 σ2. SeZ = X¯ −µ
σ/√
n e V = (n−1)S2
σ2 , ent˜ao X¯ −µ
S/√
n = Z
pV /(n−1).
Observamos queZ tem distribui¸c˜aoN(0,1) eV tem distribui¸c˜aoχ2comn−1 graus de liberdade, e tamb´em que o par de vari´aveis aleat´orias Z,V s˜ao independentes.
O seguinte resultado determina a distribui¸c˜ao do quociente Z/p V /n.
Proposi¸c˜ao 2. Seja Z com distribui¸c˜ao N(0,1) e V com distribui¸c˜ao χ2 com n graus de liberdade. Se Z e V s˜ao independentes, ent˜ao a vari´avel aleat´oria
T = Z
pV /n
tem densidade de probabilidade f dada por
f(x) = Γ(n+12 )
√πnΓ(n2)
1 + x2 n
−n+12
para todo x∈R. (2)
Demonstra¸c˜ao. Calculamos primeiro a densidade deU =√
V. Temos que a fun¸c˜ao de distribui¸c˜ao de U ´e dada por
FU(a) =P(U ≤a) = P(Y ≤a2) = Z a2
0
1
2n/2Γ(n/2)xn2−1e−x/2dx sea >0.
Tomandox=u2 obtemos FU(a) =
Z a 0
2
2n/2Γ(n/2)un−1e−u2/2du se a >0.
Se derivamos respeito de a obtemos a densidade de U, fU(u) =
2
2n/2Γ(n/2)un−1e−u2/2, seu >0,
0, seu≤0.
Calculamos agora a distribui¸c˜ao de probabilidade de Z/U. A tal fim observa- mos que
P Z
U ≤a
=P(Z ≤aU) =P (Z, U)∈Ga ,
onde Ga = {(x, u) ∈ R2 : u > 0 e x ≤ au}. Devido a independˆencia de Z e U, temos que a densidade conjunta de (Z, U) ´e
fZ,U(x, u) =
fZ(x)fU(u) = 1
√2πe−x2/2 2
2n/2Γ(n2)un−1e−u2/2, se u >0,
0, se u≤0.
Conseq¨uentemente, P
Z U ≤a
= Z Z
Ga
fZ(x)fU(u)dxdu,
e trocando a ordem das integrais, paraa 6= 0, P
Z U ≤a
= Z +∞
0
Z au
−∞
fZ(x)fU(u)dx
du
= Z +∞
0
fU(u) Z au
−∞
√1
2πe−x2/2dx
du.
Mantendo u fixo e trocandox=ut na integral mais interna resulta em P
Z U ≤a
= Z +∞
0
fU(u) Z a
−∞
√1
2πe−(ut)2/2u dt
du
= Z a
−∞
Z +∞
0
fU(u) 1
√2πe−(ut)2/2u du
dt,
sendo que a ultima igualdade resulta ao trocar novamente a ordem de integra¸c˜ao.
Temos ent˜ao, da ´ultima igualdade, que a densidade de Z/U pode ser escrita como fZ/U(a) =
Z +∞
0
fU(u) 1
√2πe−(au)2/2u du
= Z +∞
0
2 2n/2√
2πΓ(n2)une−(1+a2)u2/2du.
Se agora consideramos a trocau=v/√
1 +a2 na ultima integral obtemos fZ/U(a) = (1 +a2)−(n+1)/2 2
2n/2√
2πΓ(n2) Z +∞
0
vne−v2/2dv.
Substituindo v = √
2s, a integral a direita pode ser expressada em termos da fun¸c˜ao gamma como
Z +∞
0
vne−v2/2dv = 2n/2√ 2 2
Z +∞
0
sn2−12e−sds
= 2n/2√ 2
2 Γn+ 1 2
,
e assim,
fZ/U(a) = Γ
n+1 2
√πΓ(n2)(1 +a2)−(n+1)/2. Por ultimo derivamos agora a densidade de Z/p
V /n. Observamos que,
Z
pV /n =√ n Z
√V =√ nZ
U, e ent˜ao finalmente a distribui¸c˜ao de √
nZ/U ´e
f(a) = Γ
n+1 2
√πnΓ(n2)
1 + a2 n
−(n+1)/2
.
Defini¸c˜ao 3. Uma vari´avel aleat´oria tem distribui¸c˜ao tcom n graus de liberdade se a sua densidade ´e dada pela lei em (2).
A distribui¸c˜ao t foi descrita inicialmente por William S. Gosset (1876-1937).
Gosset trabalhava numa cervejaria a qual proibia que os seus empleados publi- cassem o seu trabalho cient´ıfico. Devido a isto Gosset publico os seus trabalhos utilizando o pseudˆonimo “Student”. Em honra ao seu descobridor hoje em dia a distribui¸c˜aot tamb´em ´e conhecida como a “distribui¸c˜ao Student” (ou t-Student).
Esta distribui¸c˜ao ´e apresentada na figura 4.2.
−4 −2 0 2 4
0.00.10.20.30.4
−4 −2 0 2 4
−6−5−4−3−2−1
Figura 2: esquerda: densidade t de Student para 5 (linha continua), 10, 20 e 30 graus de liberdade, e direita: mesmas densidades com ordenas algor´ıtmicas para enfatizar a diferen¸ca nas caudas. A fim de estabelecer uma compara¸c˜ao, a densidade normal padr˜ao tamb´em se encontra graficada, sendo que esta ´e a densidade com a menor probabilidade nas caudas.
4.3 Distribui¸ c˜ ao F
Sejam X e Y duas popula¸c˜oes e SX2, XY2 os estimadores das variˆancias σX2 e σY2. Desejamos estudar o quociente σ2X/σY2 e a tal fim determinamos a distribui¸c˜ao de
SX2σX2 SY2σY2 . Esta vari´avel aleat´oria tem “distribui¸c˜ao F”.
Defini¸c˜ao 4. A vari´avel aleat´oria X apresenta distribui¸c˜ao F com m graus de liberdade no numerados engraus de liberdade no denominador se a sua densidade
´e dada por
f(x) =
Γ(m+n2 ) Γ(m2)Γ(n2)
m n
m/2
xm2−1
1 + m nx
−m+n
2 , sex >0,
0, sex≤0.
A distribui¸c˜aoF ´e tamb´em conhecida como a distribui¸c˜ao de Fisher em honra a Sir Ronald A. Fisher (1890–1962).
Teorema 3. Sejam U e V duas vari´aveis aleat´orias com distribui¸c˜ao χ2 de m e n graus de liberdade respectivamente. Se U e V s˜ao independentes, ent˜ao
U/m V /n
0 1 2 3 4
0.00.51.01.5
Figura 3: densidadesF(m, n) para v´arios valores demen(linha continua (50,50), ponteada (30,30) e linha interrompida (10,1000)).
tem distribui¸c˜ao F com m graus de liberdade no numerador en graus de liberdade no denominador.
Demonstra¸c˜ao. Encontramos primeiro a distribui¸c˜ao deU/V. Devido a queU >0 eV >0, temos que
P U
V ≤a
= 0, se a≤0.
No caso a >0 temos P
U V ≤a
=P(U ≤aV) = P (U, V)∈A ,
onde A = {(u, v) : u ≤ av eu, v ≥ 0} ⊂ R2. Seguindo o mesmo argumento utilizado para derivar a distribui¸c˜ao de Z/U na Proposi¸c˜ao2, temos
P U
V ≤a
= Z Z
A
1
2m+n2 Γ(m2)Γ(n2)um2−1vn2−1e−u/2e−v/2du dv.
SejaC−1 = 2m+n2 Γ(m2)Γ(n2). Se trocamos a ordem de integra¸c˜ao na ultima integral obtemos
P U
V ≤a
=C Z +∞
0
Z av 0
um2−1vn2−1e−u/2e−v/2du
dv.
Se deixamosv fixo e consideramos a trocau=vt na integral mais interna obtemos
que o lado direito da ultima igualdade ´e C
Z +∞
0
Z a 0
vm2−1vn2−1tm2−1e−vt/2e−v/2v dt
dv
=C Z a
0
Z +∞
0
vm+n2 −1tm2−1e−(1+t)v/2dv
dt.
Parat fixo consideramos agora a troca v = 2s/(1 +t), C
Z a 0
Z +∞
0
2 1 +t
m+n2
tm2−1sm+n2 −1e−sds
dt
=C Z a
0
2 1 +t
m+n2
tm2−1dt
Z +∞
0
sm+n2 −1e−sds
=C Z a
0
2m+n2
(1 +t)m+n2 tm2−1dt
Γm+n 2
.
Desta forma, P
U V ≤a
= Γ(m+n2 ) Γ(m2)Γ(n2)
Z a 0
tm2−1(1 +t)−m+n2 dt.
Se derivamos agora respeito deaobtemos a densidade de probabilidade ˜f deU/V, f˜(a) =
( Γ(m+n
2 )
Γ(m2)Γ(n2)am2−1(1 +a)−m+n2 , se a≥0,
0, caso contr´ario.
Num segundo passo, calculamos a distribui¸c˜ao de U/mV /n, isto ´e, U/m
V /n = n m
U V .
Lembramos que se X ´e uma vari´avel aleat´oria com densidade fX, ent˜aoY =bX, b6= 0, tem densidade
fY(y) = 1
|p|fX(y/p)
Ent˜ao a densidade f de U/mV /n segue da densidade de U/V,
f(a) =
Γ(m+n2 ) Γ(m2)Γ(n2)
m n
m2
am2−1
1 + mna−m+n2
, se a≥0,
0, caso contr´ario.
Esta express˜ao corresponde a densidadeF commgraus de liberdade no numerador en no denominador.
Exerc´ıcio 56. Mostre o seguinte resultado.
Proposi¸c˜ao 3. Seja X uma vari´avel aleat´oria com distribui¸c˜ao F com m graus de liberdade no numerador e n graus de liberdade no denominador. A vari´avel aleat´oria 1/X tem distribui¸c˜ao F com n graus de liberdade no numerador e m graus de liberdade no denominador.