Departamento de Matem´
atica
Sec¸c˜
ao de Estat´ıstica e Aplica¸c˜
oes - IST
Probabilidades e Estat´ıstica – 2005/06
Resolu¸c˜ao do 1o Exame/2oTeste 10/01/2006 – 9h00
Grupo I - 5.0 val.
1. Um novo m´etodo de detec¸c˜ao de contaminantes na ´agua est´a a ser testado. Este m´etodo pode ser utilizado para detectar poluentes orgˆanicos. A empresa que o desenvolveu afirma que com este m´etodo ´e poss´ıvel detectar os poluentes orgˆanicos com 99.5% de efic´acia. Por outro lado, caso n˜ao haja poluentes o m´etodo comporta-se com 98% de efic´acia (i.e, nesta situa¸c˜ao n˜ao detecta poluentes orgˆanicos).
Para calibrar o m´etodo foram recolhidas v´arias amostras de ´agua pura; destas amostras 80% foram contaminadas,de forma independente, com poluentes orgˆanicos.
a) Qual ´e a probabilidade do m´etodo detectar poluentes orgˆanicos numa amostra recolhida ao
acaso? (0.5)
b) Qual ´e a probabilidade do m´etodo dar um resultado verdadeiro? (0.5)
c) Supondo que o m´etodo foi aplicado duas vezes consecutivas `a mesma amostra e que das duas vezes acusou polui¸c˜ao por poluentes orgˆanicos, calcule a probabilidade da amostra estar efec-tivamente contaminada se se admitir que os resultados de aplica¸c˜ao (em qualquer situa¸c˜ao) do
m´etodo em sucessivas aplica¸c˜oes s˜ao independentes; (2.0)
Resolu¸c˜ao: seja D o acontecimento que indica se o teste acusa detec¸c˜ao de poluentes orgˆanicos e O o acontecimento correspondente `a ocorrˆencia de polui¸c˜ao da ´agua por poluentes orgˆanicos. Decorre do enunciado que
P (D|O) = 0.995; P ( ¯D| ¯O) = 0.98; P (O) = 0.80. a)
P (D) = P (D|O)P (O) + P (D| ¯O)P ( ¯O) (lei das probabilidades totais) = 0.995 × 0.80 + (1 − 0.98) × 0.20
= 0.80.
b) Seja V o acontecimento que indica que o teste acusa resultado verdadeiro. Note-se que V = (D ∩ O) ∪ ( ¯D ∩ ¯O)
pelo que
P (V ) = P (D ∩ O) ∪ ( ¯D ∩ ¯O) = P (D|O)P (O) + P ( ¯D| ¯O)P ( ¯O) = 0.995 × 0.80 + 0.98 × 0.20 = 0.992.
c) Seja Di o acontecimento que indica que o m´etodo acusou polui¸c˜ao por poluentes orgˆanicos na
i-´esima aplica¸c˜ao.
P (O|D1∩ D2) =
P (D1∩ D2|O)P (O)
P (D1∩ D2|O)P (O) + P (D1∩ D2| ¯O)P ( ¯O)
= P
2(D|O)P (O)
P2(D|O)P (O) + P2(D| ¯O)P ( ¯O)
= 0.995
2× 0.8
0.9952× 0.8 + (1 − 0.98)2× 0.20
2. O m´etodo atr´as descrito vai ser aplicado num rio. Nesse rio existem duas f´abricas que s˜ao respons´aveis pela polui¸c˜ao do rio por poluentes orgˆanicos; uma situa-se na margem direita do rio e outra na margem esquerda do rio. Suponha que o n´umero de descargas de poluentes orgˆanicos para o rio da f´abrica que se situa na margem direita ´e modelado por um Processo de Poisson de taxa 2.5 por dia, enquanto que o n´umero de descargas de poluentes orgˆanicos para o rio da f´abrica que se situa na margem esquerda ´e modelado por um Processo de Poisson de taxa 1.0 por dia, independentemente do que acontece na f´abrica da margem direita.
i. Seja Nt a v.a. que contabiliza o n´umero de descargas de materiais poluentes no rio pelo
conjunto das duas f´abricas em t dias. Indique a distribui¸c˜ao da v.a. Nt. (1.0)
ii. Qual a probabilidade de em meio dia n˜ao haver nenhuma descarga efectuada por essas
duas f´abricas? (1.0)
Resolu¸c˜ao
a) Seja Xto n´umero de descargas em t dias de compostos clor´ıdricos para o rio da f´abrica que se
situa na margem direita e Yto n´umero de descargas em t dias de compostos clor´ıdricos para o
rio da f´abrica que se situa na margem esquerda, com Xt∼ P oi(2.5t) e Yt∼ P oi(t). Dado que
Xte Yts˜ao independentes (tal como afirmado no enunciado), ent˜ao Nt= Xt+Yt∼ P ois(3.5t).
b) Pretende-se determinar P (N0.5= 0). Como N0.5∼ P ois(3.5 × 0.5) = P ois(1.75) ent˜ao
P (N0.5= 0) = e−1.75.
Grupo II - 5.0 val.
1. A percentagem de indiv´ıduos que, quando expostos a uma dada bact´eria, contraiem a doen¸ca ´e 20%. Admita que 1000 indiv´ıduos (independentes entre si) desta popula¸c˜ao s˜ao expostos `a bat´eria.
a) Determine um valor aproximado para a probabilidade de que mais de 225 destes indiv´ıduos
adoen¸cam. (1.0)
b) Suponha que se neste conjunto de ind´ıviduos mais de 225 adoecerem, ent˜ao ´e lan¸cada uma campanha de vacina¸c˜ao `a popula¸c˜ao, que custar´a 1 milh˜ao de euros; se o n´umero de indiv´ıduos que contraiem a doen¸ca for inferior ou igual a 225 mas superior a 50, ent˜ao s´o os familiares destes indiv´ıduos ser˜ao vacinados. Nesse caso o custo da campanha de vacina¸c˜ao ser´a de 5000 euros. Finalmente, se no m´aximo 50 indiv´ıduos ficarem infectados, ent˜ao n˜ao ´e lan¸cada nenhuma campanha de vacina¸c˜ao.
b.i) Encontre a fun¸c˜ao de probabilidade (aproximada) do custo da campanha de vacina¸c˜ao.
(1.0)
b.ii) Qual o custo esperado associado a esta campanha de vacina¸c˜ao? (0.5)
Resolu¸c˜ao: Seja X a v.a. que contabiliza o n´umero de indiv´ıduos, de entre 1000, que contraiem a doen¸ca quando expostos `a bat´eria. Como os indiv´ıduos s˜ao independentes entre si, ent˜ao
X ∼ Bin(1000, 0.2) com E[X] = 200 e V ar[X] = 200 × 0.8 = 160.
a) P (X > 225) = 1 − P (X ≤ 225) = 1 − P (X − 200 12.65 ≤ 225.5 − 200 12.65 ) ≈ 1 − Φ(2.02) = 1 − 0.9783 = 0.0217
b.i) Seja Y a v.a. que designa o custo da campanha de vacina¸c˜ao. Ent˜ao temos P (Y = y) = P (X > 225) y = 105 P (50 < X ≤ 225) y = 500 P (X ≤ 50) y = 0 0 c.c. ≈ 0.0217 y = 105 Φ(2.02) − Φ(−11.819) = 0.9783 y = 500 0 c.c. b.ii) E[Y ] =X y yP (Y = y) = 500P (Y = 500) + 105P (Y = 105) = 22189.15
2. Seja (X, Y ) um par de v.a. discretas, para o qual a fun¸c˜ao de probabilidade conjunta ´e dada por:
P (X = x, Y = y) = c(x + y), x = 1, 2, 3; y = 1, 2
a) Determine o valor de c para o qual a fun¸c˜ao anterior define realmente uma fun¸c˜ao de
probabilidade conjunta de X e de Y . (0.5)
b) Calcule E[X], E[X|Y = 1] e V ar[X|Y = 1]. (1.0)
c) Ser´a que X e Y s˜ao v.a. independentes? Justifique. (1.0)
Resolu¸c˜ao:
a) ComoP3x=1P2y=1P (X = x, Y = y) = 1 ent˜ao vem:
3 X x=1 2 X y=1 P (X = x, Y = y) = c((1 + 1) + (1 + 2) + (2 + 1) + (2 + 2) + (3 + 1) + (3 + 2)) = 21c donde c = 1/21.
b) Calcule-se a fun¸c˜ao de probabilidade (marginal) de X, assim como a condicionada (de X em Y = 1): P (X = x) = 2 X y=1 P (X = x, Y = y) = 5 21 x = 1 7 21 x = 2 9 21 x = 3 0 c.c. P (X = x|Y = 1) =P (X = x, Y = 1) P (Y = 1) = 2 9 x = 1 3 9 x = 2 4 9 x = 3 0 c.c.
Consequentemente: E[X] = 3 X x=1 xP (X = x) = 1 × 5 + 2 × 7 + 3 × 9 21 = 2.19 E[X|Y = 1] = 3 X x=1 xP (X = x|Y = 1) = 1 × 2 + 2 × 3 + 3 × 4 9 = 2.22 E[X2|Y = 1] = 3 X x=1 x2P (X = x|Y = 1) =1 2× 2 + 22× 3 + 32× 4 9 = 5.55
V ar[X|Y = 1] = E[X2|Y = 1] − E2[X|Y = 1] = 0.617.
c) As v.a. na˜o s˜ao independentes pois, por exemplo, E[X] 6= E[X|Y = 1].
Grupo III - 4.0 val.
Os capacetes usados pelos pilotos e co-pilotos participantes no rally Lisboa-Dakar foram previamente testados, de forma a indagar sobre a sua seguran¸ca. Para tal foram seleccionaos ao acaso 50 capacetes, os quais foram sujeitos a testes de impacto. Em consequˆencia destes testes de impacto, 18 capacetes ficaram com algum dano.
a) Construa um intervalo de confian¸ca a 95% para a verdadeira propor¸c˜ao de capacetes com
algum dano fruto do teste de impacto. (2.0)
b) Para um n´ıvel de significˆancia de 5%, ser´a que ´e de admitir que a verdadeira propor¸c˜ao de capacetes com algum defeito fruto do teste de impacto ´e igual a 32%? (2.0)
Resolu¸c˜ao: Seja Xi uma v.a. que toma o valor 1 (0) se o i-´esimo capacete sofrer (n˜ao sofrer)
algum dano fruto do teste de impacto, com Xi∼ Ber(p), com p desconhecido. Adicionalmente, se
se admitir que os 50 capacetes tˆem um comportamento independente mas que obedecem `a mesma lei probabil´ıstica, ent˜ao segue-se que {X1, X2, . . . , X50} ∼ X ∼ Ber(p). Para a amostra particular,
P50
i=1xi= 18 donde ¯x = 1850 = 0.36.
a) Nesta al´ınea pretende-se construir um I.C.0.95(p). Decorre do TLC que uma vari´avel fulcral
para este problema ´e:
¯ X − p q¯ X(1− ¯X) n ∼aN (0, 1)
Dado que Φ−1(0.975) = 1.96, vem que
P (−1.96 <qX − p¯¯ X(1− ¯X) n < 1.96) ≈ 0.95 P ( ¯X − 1.96 × r ¯ X(1 − ¯X) n <p < ¯X + 1.96 × r ¯ X(1 − ¯X) n ) ≈ 0.95 donde I.C.A.0.95(p) ≈] ¯X − 1.96 × r ¯ X(1 − ¯X) n ; ¯X + 1.96 × r ¯ X(1 − ¯X) n [. Concretizando: I.C.0.95(p) ≈]0.36 − 1.96 × r 0.36(1 − 0.36) 50 ; 0.36 − 1.96 × r 0.36(1 + 0.36) 50 [ =]0.227; 0.493[.
b) Pretende-se testar H0 : p = 0.32 vs H1 : p 6= 0.32. Uma vez que o teste ´e bilateral, e que se
pretende o mesmo n´ıvel de confian¸ca da al´ınea anterior, ent˜ao podemos utilizar o resultado da al´ınea anterior (note-se por´em que a estat´ıstica de teste adequada para esta situa¸c˜ao n˜ao coincide necessariamente com a vari´avel fulcral indicada na al´ınea anterior com p = 0.32. Por´em como o valor observado da estimativa de m´axima verosimilhan¸ca, ¯x = 0.36 ´e pr´oximo do valor em teste, p = 0.32, utilizaremos o resultado anterior, com evidente economia de trabalho!).
Como o valor proposto para p, p = 0.32 sob H0, est´a contido na aproxima¸c˜ao do I.C.0.95(p),
ent˜ao a hip´otese H0 n˜ao deve ser rejeitada para α = 5% (na verdade esta hip´otese n˜ao ´e
rejeitada para α ≤ 5%).
Grupo IV - 6.0 val.
1. Uma f´abrica produtora de circuito el´ectricos tem um departamento de controlo de qualidade, onde os circuitos produzidos s˜ao submetidos a um rigoroso controlo de qualidade. Fruto de resultados anteriores, ´e convic¸c˜ao do respons´avel por este departamento que o n´umero de defeitos em cada circuito el´ectrico (X) tem uma distribui¸c˜ao de Poisson. Para verificar essa hip´otese, foi recolhida uma amostra de 60 circuitos independentes, tendo-se observado os seguintes valores:
N´umero de defeitos 0 1 2 3 Frequˆencia observada 32 15 9 4
a) Se se admitir que efectivamente X tem uma distribui¸c˜ao de Poisson, prove que a estimativa de m´axima verosimilhan¸ca do valor esperado de X ´e igual a 0.75. Qual ´e a estimativa de m´axima verosimilhan¸ca da probabilidade de um circuito el´ectrico n˜ao ter defeitos? (1.5)
b) Acha que os dados evidenciam que X tem distribui¸c˜ao Poisson? (2.0)
Resolu¸c˜ao a) L(λ; x1, . . . , xn) = P (X1= x1, . . . , Xn= xn; λ) =iid n Y i=1 P (X = xi; λ) = n Y i=1 e−λλxi xi! = e−nλλ Pn i=1xi Qn i=1xi! , λ > 0 LnL(λ; x1, . . . , xn) = −nλ + n X i=1 xiLnλ − Ln( n Y i=1 xi!) [LnL(λ; x1, . . . , xn)]′ = −n + Pn i=1xi λ [LnL(λ; x1, . . . , xn)]′′= − Pn i=1xi λ2 < 0, ∀λ
Logo a estimativa de m´axima verosimilhan¸ca de λ, ˆλ, ´e tal que −n +
Pn i=1xi
ˆ
λ = 0 ⇔ ˆλ = ¯x. Nesta situa¸c˜ao, como
¯ x = 3 X i=0 iNi n = 0 × 32 + 1 × 15 + 2 × 9 + 3 × 4 60 = 0.75
ent˜ao vem que efectivamente
ˆ
Por outro lado, como
P (X = 0) = e−λ
decorre da propriedade da invariˆancia dos estimadores de m´axima verosimilhan¸ca que d
P (X = 0) = e−ˆλ
= e−0.75= 0.472.
b) Pretende-se testar H0: X ∼ P oi(λ). Para este teste a estat´ıstica de teste ´e:
Q = k X i=0 (Oi− ˆEi)2 ˆ Ei ∼(a,H0)χ (2) (k−2)
onde Oi designa a frequˆencia observada da classe i e ˆEi designa a frequˆencia estimada da
classe i. Se H0 for verdadeira, X toma valores em IN0, pelo que a ´ultima classe (para a
qual X = 3) tem de ser aumentada para X ≥ 3. Desta forma temos a seguinte tabela:
N´umero de defeitos oi eˆi 0 32 60 × e−ˆλ= 28.43 1 15 60 ×e−λˆλˆ1 1! = 21.26 2 9 60 × e−λˆλˆ2 2! = 7.97 ≥ 3 4 60 − 28.43 − 21.26 − 7.97 = 2.43 Ent˜ao o valor observado da estat´ıstica de teste ´e:
qobs= (32 − 28.43)2 28.43 + (15 − 21.26)2 21.26 + (9 − 7.97)2 7.97 + (4 − 2.43)2 2.43 = 3.46. Como Fχ(2)
2 (3.46) ∈]0.80; 0.85[, ent˜ao p ∈]0.20; 0.25[. Desta feita se conclui que H0 ´e
rejeitada para n´ıveis de significˆancia α ≥ 25%, enquanto que n˜ao ´e rejeitada para α ≤ 20%. Assim se conclui que para os n´ıveis usuais de significˆancia a hip´otese de que X segue uma distribui¸c˜ao de Poisson n˜ao ´e rejeitada.
2. Um investigador acha que a quantidade de vapores t´oxicos produzidos mensalmente por uma f´abrica de qu´ımicos est´a relacionada com a temperatura m´edia mensal (oC). Para indagar essa
possibilidade recolheu uma amostra, tendo obtido os seguintes resultados:
xi 12.5 14 14.5 17 20 26.4 28.3 29.2 27.3 20.5
yi 185.79 214.47 288.03 424.84 454.58 539.03 621.55 675.06 562.03 452.93
pelo que P10i=1xi = 209.7, P 10 i=1yi = 4418.31, P 10 i=1x2i = 4767.53, P10 i=1y2i = 2204216 e P10
i=1xiyi = 101975.8. Com base nestes valores foi ajustado um modelo de regress˜ao linear
simples, tendo-se obtido ˆβ0= −86.43 e ˆβ1= 25.19.
a) Com base na recta estimada de regress˜ao dos m´ınimos quadrados, calcule uma estimativa da diferen¸ca esperada da quantidade de vapores t´oxicos de dois meses cuja temperatura m´edia mensal difere de 3oC. Como interpreta este valor?
(1.0)
b) Ser´a que se pode concluir, para um n´ıvel de significˆancia de 5%, que a quantidade esper-ada de vapores t´oxicos emitidos pela f´abrica aumente com a temperatura m´edia mensal? Indique todas as hip´oteses sobre o modelo que achar convenientes. (1.5)
Resolu¸c˜ao
a) A equa¸c˜ao da recta estimada ´e: ˆ
y = −86.43 + 25.19x, x ∈ [12.5; 29.2]
Se se considerar dois meses cuja temperatura m´edia mensal difere de 3oC (e desde que
ambas as temperaturas destes dois meses estejam no intervalo considerado [12.5; 29.2]), ent˜ao uma estimativa da diferen¸ca esperada da quantidade de vapores t´oxicos destes dois meses ´e 3 × 25.19 = 75.57. Este valor n˜ao significa obrigatoriamente que a diferen¸ca seja exactamente este valor: ´e apenas uma estimativa do que se espera encontrar!
b) Assumindo que ǫi ∼ N (0, σ2) (onde ǫi designa o erro aleat´orio associado `a i-´esima
tem-peratura), para o teste:
H0: β1= 0 vs H1: β1> 0
a estat´ıstica de teste indicada ´e:
T =q βˆ1 ˆ σ2 Px2 i−n¯x2 ∼ tn−2 Como ˆ σ2= 1 n − 2 " n X i=1 y2i − n¯y 2− ˆβ2 1 n X i=1 x2i − n¯x 2 !# = 2151.82 ent˜ao o valor observado da estat´ıstica de teste ´e:
tobs= 25.19 q 2151.82 4767.53−10(20.97)2 = 10.447 Dado que F−1
t8 (0.95) = 1.86 e como tobs > 1.86, ent˜ao para = 5% h´a evidˆencias para
rejeitar H0, i.e., aceitamos que a quantidades esperada de vapores t´oxicos emitidos pela