• Nenhum resultado encontrado

Testes de hip´ oteses para a variˆ ancia σ 2 de uma popula¸c˜ ao Normal com m´edia desconhecida

No documento Probabilidades e Estatística (páginas 157-172)

Suponhamos que observamos uma amostra aleat´oria (X1, . . . , Xn) de uma popula¸c˜ao X ∼ N(µ, σ2),

em que µ ´e desconhecido. Vamos nesta sec¸c˜ao considerar 3 hip´oteses diferentes respeitantes ao parˆametro variˆancia populacional, σ2.

Teste bilateral

X Testamos aqui a hip´otese de que o parˆametro variˆancia populacional σ2, da popula¸c˜ao acima

definida, vale σ2 0:

H0 : σ2= σ02 vs H1: σ2 6= σ02

X Vamos escolher a estat´ıstica de teste com base no estimador de σ2, S2, variˆancia amostral:

X2 = (n − 1)S

2

σ02

sob H0

∼ χ2(n−1)

X Definamos a regi˜ao de rejei¸c˜ao do teste, para um n´ıvel de significˆancia α, pr´e-especificado. Vamos

escolhˆe-la para valores muito grandes e muito pequenos da estat´ıstica de teste, indicadores de uma despropor¸c˜ao entre as variˆancias amostrais e populacionais, n˜ao condizente com a hip´otese nula - ver figura seguinte.

c1 c2

α/2 α/2

Assim defino a regi˜ao de rejei¸c˜ao, denotando-a por Rα, como:

Rα≡ (0; c1) ∪ (c2; +∞), c1: P (X2 < c1) = α 2 ⇔ c1= Fχ−12 (n−1) α 2  = χα 2 c2: P (X2 < c2) = 1 − α 2 ⇔ c2= F −1 χ2 (n−1)  1 −α2= χ1−α 2 Ent˜ao Rα≡ (0; χα 2) ∪ (χ1−α2; +∞)

X Regra de decis˜ao do teste:

Rejeitar H0 ao n´ıvel de significˆancia α se x2obs = (n − 1)s 2

σ2

0 ∈ R α.

Exemplo 10.8 Consideremos novamente o exemplo da popula¸c˜ao dos pesos das formigas Solenop-

sis, i.e. a popula¸c˜ao X ∼ N(µ, σ2). Vamos testar a hip´otese de que a variˆancia populacional σ2 efectivamente vale 22, com base na amostra aleat´oria dos 4 pesos recolhida, (8, 13, 9, 8.5).

• H0 : σ2 = 22 vs H1: σ2 6= 22 • Estat´ıstica de teste: X2 = (4 − 1)S 2 22 = 3S2 4 sobH0 ∼ χ2(4−1) ≡ χ2(3)

• Regi˜ao de rejei¸c˜ao para α = 0.05: R0.05≡ (0; c1) ∪ (c2; +∞), c1 : P (X2 < c1) = 0.05 2 = 0.025 ⇔ c1 = F −1 χ2 (3) (0.025) = 0.216 c2: P (X2 < c2) = 1 − 0.05 2 = 0.975 ⇔ c2 = F −1 χ2 (3) (0.975) = 9.348 Ent˜ao Rα ≡ (0; 0.216) ∪ (9.348; +∞)

• Regra de decis˜ao do teste:

Rejeitar H0 ao n´ıvel de significˆancia 5% se x2obs = 3s2/4 ∈ R0.05.

• Decis˜ao: Sendo s2= 1 n − 1 ( n X i=1 x2i − n¯x2 ) = 1 3386.25 − 4 × 9.625 2 = 5.229167, ent˜ao xobs = 3 × 5.229167 4 = 3.921875 /∈ R0.05

Logo, n˜ao rejeitar H0 ao n´ıvel de significˆancia 5%, vindo ent˜ao os dados confirmar a validade

desta hip´otese.

Probabilidades e Estat´ıstica Isabel Nat´ario 157

Teste unilateral direito

X Testamos aqui a hip´otese de que o parˆametro variˆancia populacional σ2, da popula¸c˜ao anteri-

ormente definida, ´e inferior ou igual a σ2 0:

H0 : σ2≤ σ02 vs H1: σ2 > σ02

Nota: Repare que o valor σ2

0 pertence `a hip´otese nula.

X Estat´ıstica de teste: X2 = (n − 1)S 2 σ2 0 sob H0 ∼ χ2(n−1)

X Definamos a regi˜ao de rejei¸c˜ao do teste, para um n´ıvel de significˆancia α, pr´e-especificado. Vai

corresponder aos valores maiores da estat´ıstica de teste - ver figura seguinte.

c α

Assim defino a regi˜ao de rejei¸c˜ao, denotando-a por Rα, como:

Rα≡ (c; +∞),

c : P (X2< c) = 1 − α ⇔ c = F−1

χ2

(n−1)(1 − α) = χ1−α

Ent˜ao Rα≡ (χ1−α; +∞)

X Regra de decis˜ao do teste:

Rejeitar H0 ao n´ıvel de significˆancia α se x2obs = (n − 1)s 2

σ2

0 ∈ R α.

Teste unilateral esquerdo

X Finalmente estamos interessados em testar a hip´otese de que o parˆametro variˆancia populacional

σ2, da popula¸c˜ao anteriormente definida, ´e superior ou igual a σ2 0:

H0 : σ2≥ σ02 vs H1: σ2 < σ02

Nota: Repare que o valor σ2

0 pertence `a hip´otese nula.

X Estat´ıstica de teste: X2 = (n − 1)S 2 σ2 0 sob H0 ∼ χ2(n−1)

X Definamos a regi˜ao de rejei¸c˜ao do teste, para um n´ıvel de significˆancia α, pr´e-especificado. Vai

corresponder aos valores menores da estat´ıstica de teste - ver figura seguinte.

c α

Assim defino a regi˜ao de rejei¸c˜ao, denotando-a por Rα, como:

Rα≡ (0; c), c : P (X2< c) = α ⇔ c = F−1 χ2 (n−1) (α) = χα Ent˜ao Rα≡ (0; χα)

X Regra de decis˜ao do teste:

Rejeitar H0 ao n´ıvel de significˆancia α se x2obs = (n − 1)s 2

σ2

0 ∈ R α.

Probabilidades e Estat´ıstica Isabel Nat´ario 159

10.6

Testes de hip´oteses para o pressuposto da normalidade de uma

popula¸c˜ao

Temos usado em diversas situa¸c˜oes o pressuposto de que a popula¸c˜ao X, de onde retiramos a nossa amostra aleat´oria (X1, . . . , Xn), ´e Normalmente distribu´ıda. Nesta sec¸c˜ao usamos a amostra

para testar esse pressuposto da Normalidade populacional:

X Hip´oteses:

H0 : X ∼ N(·, ·) vs H0 : X  N (·, ·)

Observamos que o teste desta hip´otese pode necessitar a estima¸c˜ao dos parˆametros que identifi- cam a Normal, µ e σ2, caso n˜ao se tenha ideia `a partida de quanto estes devem valer.

Este teste faz parte da classe mais vasta dos testes de ajustamento do Qui-quadrado.

Os dados observados (a amostra) s˜ao divididos em k classes, como aprendemos na fazer no cap´ıtulo da estat´ıstica descritiva. Em cada classe i consideramos o n´umero de observa¸c˜oes que lhe correspondem (a frequˆencia absoluta de cada classe), denotando esse n´umero aqui por Oi.

Consideramos ainda o n´umero de observa¸c˜oes que esperar´ıamos observar em cada uma das classes se a hip´otese nula fosse verdadeira, denotando-o por Ei. Este n´umero ´e determinado como n×pi,

em que pi ´e a probabilidade de uma observa¸c˜ao pertencer `a classe i, caso a hip´otese nula seja

verdadeira:

pi= P (X ∈ classe i|H0 verdadeira)

Assim, estat´ıstica de teste avalia se o que eu observei na classe i, Oi, se encontra pr´oximo do

que eu esperaria observar nessa classe se a hip´otese nula fosse verdadeira, Ei:

X Estat´ıstica de teste: X2 = k X i=1 (Oi − Ei)2 Ei sob H0 ∼ χ2(k−p−1)

O n´umero de graus de liberdade da distribui¸c˜ao por amostragem da estat´ıstica anterior ´e dado pelo n´umero de classes em que os dados foram divididos, k, menos o n´umero de parˆametros que foi necess´ario estimar, p (num m´aximo de 2, caso seja necess´ario estimar dos dados tanto µ como σ2), menos 1.

Regra 10.1 Depois de determinados os Ei, se os houver inferiores a 5, tipicamente correspon-

dendo `as classes dos extremos, essas classes devem ser agrupadas at´e o correspondente novo n´umero esperado Ei (dado pelas somas dos correspondentes antigos Ei0s) ultrapassar 5. Os cor-

respondentes Oi’s devem nesse caso ser tamb´em somados, diminuindo naturalmente o valor do

X Definamos a regi˜ao de rejei¸c˜ao do teste, para um n´ıvel de significˆancia α, pr´e-especificado. Esta

vai corresponder a valores grandes da estat´ıstica de teste, indicando que o que eu observei se encontra longe daquilo que eu esperaria observar, caso a hip´otese nula fosse verdadeira.

Assim defino a regi˜ao de rejei¸c˜ao, denotando-a por Rα, como:

Rα≡ (c, +∞),

c : P (X2< c) = 1 − α ⇔ c = Fχ−12

(k−p−1)(1 − α) = χ1−α

Ent˜ao Rα≡ (χ1−α; +∞)

X Regra de decis˜ao do teste:

Rejeitar H0 ao n´ıvel de significˆancia α se x2obs ∈ Rα.

Exemplo 10.9 Os artigos produzidos em determinada f´abrica s˜ao sujeitos a um controle de qualidade,

resultando num ´ındice de qualidade, X. De forma a avaliar essa qualidade recolheu-se uma amostra aleat´oria de 46 artigos da produ¸c˜ao, tendo-se medido os valores seguintes do referido ´ındice:

(100,110,122,132,99,96,88,75,45,154,153,161,142,99,111,105,133,142,150,153,121,126,117,97, 105,117,125,105,94,90,80,50,55,102,122,136,75,104,109,108,134,135,111,78,89,154)

Use estes dados para testar, ao n´ıvel de significˆancia 5%, a hip´otese de que este ´ındice tem dis- tribui¸c˜ao Normal.

• H0 : X ∼ N(·, ·) vs H1 : X  N (·, ·)

Como n˜ao sabemos os valores populacionais de µ e σ2, vamos estim´a-los dos dados:

ˆ µ = ¯x = 1 46 46 X i=1 xi= 111.0652; ˆ σ2 = s2 = 1 46 − 1 46 X i=1 x2i − 46 × ¯x2 ! = 785.3068

O pr´oximo passo ´e a divis˜ao dos dados em classes e a determina¸c˜ao dos correspondentes Oi e

Ei. Pela regra de Sturges o n´umero de classes a considerar ´e dado por:

k ≈ 1 + log(n)log(2) = 1 +log(46)

log(2) ≈ 6.523562

Consideramos ent˜ao k = 7 classes. Seguidamente definimos os extremos das classes. A ampli- tude dos dados ´e dada por:

Probabilidades e Estat´ıstica Isabel Nat´ario 161

Ent˜ao a amplitude de cada classe deve ser dada por:

l = L k =

116

7 ≈ 16.57

Vamos aproximar este valor a 20, um n´umero mais redondo, e considerar as classes:

] − ∞; 60] ]60; 80] ]80; 100] ]100; 120] ]120; 140] ]140; 160] ]160; +∞[

Devemos contar quantas observa¸c˜oes caiem em cada um dos intervalos anteriores, para obter os valores de Oi, e devemos determinar os valores de Ei= n × pi= 46 × pi:

p1 = P (X ∈ classe 1|H0 verdadeiro) = P (X ≤ 60|H0 verdadeiro) =

= P X − 111.0652 785.3068 ≤ 60 − 111.0652 √ 785.3068  = P (Z ≤ −1.82) = P (Z ≥ 1.82) = = 1 − Φ(1.82) = 1 − 0.9656 = 0.0344 E1 = 46 × 0.0344 = 1.5824

p2 = P (X ∈ classe 2|H0 verdadeiro) = P (60 < X ≤ 80|H0 verdadeiro) =

= P 60 − 111.0652 785.3068 < Z ≤ 80 − 111.0652 √ 785.3068  = P (Z ≤ −1.11) − P (Z < −1.82) = = (1 − Φ(1.11)) − (1 − Φ(1.82)) = 0.9656 − 0.8665 = 0.0991 ⇒ E2= 46 × 0.0991 = 4.5586

p3 = P (X ∈ classe 3|H0 verdadeiro) = P (80 < X ≤ 100|H0 verdadeiro) =

= P 80 − 111.0652 785.3068 < Z ≤ 100 − 111.0652 √ 785.3068  = P (Z ≤ −0.39) − P (Z < −1.11) = = (1 − Φ(0.39)) − (1 − Φ(1.11)) = 0.8665 − 0.6517 = 0.2148 ⇒ E3= 46 × 0.2148 = 9.8808

p4 = P (X ∈ classe 4|H0 verdadeiro) = P (100 < X ≤ 120|H0 verdadeiro) =

= P 100 − 111.0652 785.3068 < Z ≤ 120 − 111.0652 √ 785.3068  = P (Z ≤ 0.32) − P (Z < −0.39) = = Φ(0.32) − (1 − Φ(0.39)) = 0.6255 − (1 − 0.6517) = 0.2772 ⇒ E4= 46 × 0.2772 = 12.7512

p5 = P (X ∈ classe 5|H0 verdadeiro) = P (120 < X ≤ 140|H0 verdadeiro) = = P 120 − 111.0652√ 785.3068 < Z ≤ 140 − 111.0652 785.3068  = P (Z ≤ 1.03) − P (Z < 0.32) = = Φ(1.03) − Φ(0.32) = 0.8485 − 0.6255 = 0.223 ⇒ E5= 46 × 0.223 = 10.258

p6 = P (X ∈ classe 6|H0 verdadeiro) = P (140 < X ≤ 160|H0 verdadeiro) =

= P 140 − 111.0652√ 785.3068 < Z ≤ 160 − 111.0652 785.3068  = P (Z ≤ 1.75) − P (Z < 1.03) = = Φ(1.75) − Φ(1.03) = 0.9599 − 0.8485 = 0.1114 ⇒ E6= 46 × 0.1114 = 5.1244 p7 = 1 − p1− p2− p3− p4− p5− p6 = = 1 − 0.0344 − 0.0991 − 0.2148 − 0.2772 − 0.223 − 0.1114 = 0.0401 ⇒ E7= 46 × 0.0401 = 1.8446 i Classe Oi pi Ei 1 ] − ∞; 60] 3 0.0344 1.5824 2 ]60; 80] 4 0.0991 4.5586 3 ]80; 100] 9 0.2148 9.8808 4 ]100; 120] 12 0.2772 12.7512 5 ]120; 140] 10 0.223 10.258 6 ]140; 160] 7 0.1114 5.1244 7 ]160; +∞[ 1 0.0401 1.8446

Como vemos as classes dos extremos tˆem Ei’s inferiores a 5. Como tal vamos aglutinar a classe

1 com a classe 2 e a classe 7 com a classe 6, somando os correspondentes valores de Ei0s e Oi’s:

i Classe Oi pi Ei 1 ] − ∞; 80] 7 0.1335 6.141 2 ]80; 100] 9 0.2148 9.8808 3 ]100; 120] 12 0.2772 12.7512 4 ]120; 140] 10 0.223 10.258 5 ]140; +∞[ 8 0.1515 6.969

Passo ent˜ao a ter k = 5 classes. N˜ao nos esque¸camos que tivemos de estimar p = 2 parˆametros, µ e σ2. Ent˜ao:

Probabilidades e Estat´ıstica Isabel Nat´ario 163 X2 = k X i=1 (Oi − Ei)2 Ei sobH0 ∼ χ2(k−p−1)≡ χ2(5−2−1) ≡ χ2(2)

• Definamos a regi˜ao de rejei¸c˜ao do teste, para o n´ıvel de significˆancia 5%, R0.05, como:

R0.05≡ (c, +∞),

c : P (X2 < c) = 1 − 0.05 = 0.95 ⇔ c = Fχ−12 (2)

(0.95) = χ0.95= 5.991

Ent˜ao R0.05≡ (5.991, +∞)

• Regra de decis˜ao do teste:

Rejeitar H0 ao n´ıvel de significˆancia 5% se x2obs ∈ Rα.

• Decis˜ao: x2 = 5 X k=1 (Oi− Ei)2 Ei = (7 − 6.141) 2 6.141 + (9 − 9.8808)2 9.8808 + + (12 − 12.7512) 2 12.7512 + (10 − 10.258)2 10.258 + (8 − 6.969)2 6.969 = 0.4019 /∈ R0.05

Logo, ao n´ıvel de significˆancia 5% n˜ao rejeitamos a hip´otese nula de que a distribui¸c˜ao da popula¸c˜ao ´e Normal.

2

10.7

Exerc´ıcios Propostos

10.1 Uma f´abrica de gelados afirma que a procura do gelado de chocolate no ver˜ao, por dia e em euros, ´e uma v.a. Normalmente distribu´ıda com valor m´edio 200e e desvio padr˜ao 40e.

Numa amostra aleat´oria constitu´ıda por 10 dias seleccionados ao acaso do per´ıodo de ver˜ao verificou-se que ¯x = 216e.

(a) Teste, ao n´ıvel de significˆancia 5%, se de facto o consumo m´edio de gelado de chocolate no ver˜ao ´e de 200epor dia.

(b) Teste, ao ao n´ıvel de significˆancia 5%, se de facto o consumo m´edio de gelado de chocolate no ver˜ao ´e menor do que 200epor dia.

10.2 Um produtor de azeite afirma que a acidez m´edia do seu azeite ´e de 0.9o. De forma a confirmar tal facto recolheu-se uma amostra aleat´oria da sua produ¸c˜ao de azeite, tendo-se medido os seguintes valores de acidez:

0.9 0.8 0.7 1.1 0.9 0.9 1.0 0.7 1.5 1.1 Admitindo a Normalidade da acidez do azeite:

(a) Teste, ao n´ıvel de significˆancia 1%, se o produtor tem raz˜ao.

(b) Teste, ao ao n´ıvel de significˆancia 1%, se a acidez m´edia ´e superior a 0.9o.

10.3 Um bi´ologo pretende demonstrar que o peso m´edio de uma determinada esp´ecie de coelhos - coelhos an˜oes - ´e superior a 250g. Para tal seleccionou aleatoriamente 40 coelhos, tendo obtido uma m´edia dos pesos de 255.3g e um desvio padr˜ao de 30g. Teste se o bi´ologo est´a certo, assumindo a Normalidade dos pesos dos coelhos (use o p-value do teste).

10.4 A Inˆes recebe, para al´em do seu sal´ario, vencimento correspondente a 2 horas extra que devia fazer todos os dias. Contudo ela est´a desconfiada que tem andado a trabalhar, em m´edia, mais do que 2 horas extra. Como a empresa onde trabalha regista sempre a hora de entrada e de sa´ıda dos seus funcion´arios, ela seleccionou aleatoriamente 12 dias de trabalho passados e registou os seguintes valores relativos ao hor´ario extra: ¯x = 2.3h e s = 0.5h. Admitindo a Normalidade do tempo extra de trabalho, teste se as suas suspeitas se confirmam.

10.5 Uma companhia de seguros tem previsto no seu or¸camento um total de 5000e/dia para pagar os pr´emios dos seus segurados. De forma a confirmar se o valor m´edio dos pr´emios pagos por dia est´a bem previsto seleccionaram-se, de anos anteriores, 100 dias, tendo-se verificado ¯x = 5625ee P(xi− ¯x)2 = 6187500e2. Teste, ao n´ıvel de significˆancia 5%, se a previs˜ao se adequa.

10.6 Numa f´abrica de massas embalam-se pacotes de esparguete que deveriam ter peso m´edio de 500g. O peso dos pacotes ´e uma v.a. Normal com variˆancia σ2= 225g2. De forma a confirmar o peso

m´edio destes pacotes, seleccionaram-se ao acaso 40 embalagens que tinham um peso m´edio de 495g. Teste se o peso m´edio das embalagens ´e menor do que as 500g indicadas.

10.7 Seja X uma v.a. com distribui¸c˜ao Normal de valor m´edio µ e desvio padr˜ao σ. A partir de uma amostra de dimens˜ao 30, retirada da popula¸c˜ao, obtiveram-se os seguintes resultados:

30 X i=1 xi = 64.0 30 X i=1 (xi− ¯x)2 = 84.4

(a) Teste, ao n´ıvel de significˆancia 1%, as hip´oteses H0 : µ = 2 vs H1 : µ > 2.

(b) Suponha que est´a a testar a hip´otese H0 : µ = 2 contra a hip´otese H1 : µ = 2.5 e que

rejeita a hip´otese nula se ¯X30> 2.3. Calcule as probabilidades dos erros de 1a e 2a esp´ecie

do teste, se σ = 1.

10.8 De forma a poder comparar o desempenho de 2 corredores de Formula 1, seleccionaram-se ao acaso 15 corridas onde ambos participaram, tendo-se registado as seguintes diferen¸cas de pontua¸c˜ao entre os dois corredores (corredor 1 - corredor 2):

Probabilidades e Estat´ıstica Isabel Nat´ario 165

−1 − 2 0 − 3 − 1 1 2 − 3 − 3 − 1 − 4 − 4 1 − 6 − 8

Teste se o corredor 2 ´e em m´edia melhor do que o corredor 1. Assuma a Normalidade das diferen¸cas de pontua¸c˜ao (recorra ao p-value do teste).

10.9 De forma a comparar a longevidade dos homens com a das mulheres, seleccionaram-se ao acaso 50 pares de irm˜aos, um de cada sexo, j´a falecidos, tendo-se registado uma m´edia de longevidade feminina de 85 anos e uma m´edia de longevidade masculina de 84 anos. Assuma que tanto a longevidade masculina, X1, como a longevidade feminina, X2, seguem distribui¸c˜oes Normais

com desvios padr˜ao de 4 anos e 2 anos, respectivamente.

Teste, ao n´ıvel de significˆancia 1%, se h´a diferen¸cas de longevidades m´edias.

10.10 Uma amostra de 10 peixes foi apanhada de um lago A e as concentra¸c˜oes de chumbo nos peixes foi medida (em partes por milh˜ao):

11.5, 10.8, 11.6, 9.4, 12.4, 11.4, 12.2, 11.0, 10.6, 10.8

Apanharam-se tamb´em 8 peixes num outro lago B e mediram-se as correspondentes concen- tra¸c˜oes de chumbo:

11.8, 12.6, 12.2, 12.5, 11.7, 12.1, 10.4, 12.6

Assumindo que as concentra¸c˜oes de chumbo nos peixes, em ambos os lagos, seguem distribui¸c˜oes Normais com variˆancias 0.09 e 0.16 para os lagos A e B, respectivamente, pode afirmar que os lagos est˜ao igualmente contaminados com o elemento chumbo?

10.11 Numa opera¸c˜ao stop da brigada de trˆansito, de 120 cami˜oes TIR que foram parados, 42 iam com excesso de peso. Com base nesta amostra aleat´oria, teste a hip´otese de que a propor¸c˜ao deste tipo de cami˜oes, que circulam nas nossas estradas em situa¸c˜ao ilegal, ultrapassa os 30%. Use um n´ıvel de significˆancia de 10%.

10.12 Determinada desordem gen´etica no sangue pode ser prevista com base num teste de sangue muito simples. De forma a ter uma no¸c˜ao da propor¸c˜ao de pessoas que na popula¸c˜ao possam vir a ter esta desordem, testaram-se 100 pessoas, seleccionadas ao acaso, para as quais 14 testes deram positivo. Efectue um teste de hip´oteses, usando o p-value do teste para concluir, sobre se percentagem de pessoas com tal desordem ´e inferior a 10%.

10.13 No fabrico de parafusos admite-se, relativamente aos seus comprimentos, uma variabilidade m´axima de 0.5mm2. Recolheu-se uma amostra aleat´oria de 20 parafusos que se verificou terem s2 = 0.3. Admitindo a Normalidade do comprimento dos parafusos, teste, ao n´ıvel de sig- nificˆancia de 5% se a especifica¸c˜ao sobre a variabilidade do comprimento dos parafusos est´a a ser respeitada.

10.14 Com base na amostra aleat´oria seguinte, teste H0 : σ = 1.3 vs H1 : σ 6= 1.3, a um n´ıvel de

significˆancia de 1%:

10.15 A resistˆencia de um determinado metal ´e dito ter uma variabilidade inferior a 0.01 ohm2. Teste esta hip´otese, a um n´ıvel de significˆancia 10%, usando a seguinte amostra aleat´oria de resistˆencias medidas para este metal:

0.14, 0.138, 0.143, 0.142, 0.144, 0.137

10.16 Teste a um n´ıvel de significˆancia 5% que a seguinte amostra aleat´oria provˆem de uma distribui¸c˜ao Normal(3, 22):

1.14, 3.11, 3.55, 2.81, 6.28, 1.61, 4.36, 0.90, 0.81, −0.18, 2.08, 2.68, 2.12, −0.33, 2.57, 3.55, 1.81, 2.56, 5.56, 2.46, 4.20, 1.63, 4.21, 4.85, 4.24, 3.98, 1.40, 3.00, 2.01, 3.31

10.17 Pensa-se que a altura a que os eucaliptos chegam aos 20 anos ´e uma v.a. Normal de m´edia 2m. Para o confirmar seleccionou-se uma amostra aleat´oria de 30 eucaliptos, tendo observado as seguintes alturas:

0.2, 0.8, 3.6, 1.0, 0.2, 4.3, 3.1, 0.4, 3.3, 3.1, 3.2, 5.3, 1.7, 0.2, 2.8, 0.4, 0.5, 3.0, 1.2, 4.2, 4.8, 3.4, 2.1, 2.5, 2.4, 2.1, 0.8, 3.5, 1.7, 1.3

Teste, ao n´ıvel de significˆancia 1%, a conjectura referida.

10.18 Pensa-se que a press˜ao arterial nos homens segue uma distribui¸c˜ao Normal de valor m´edio 14 e variˆancia 1. De forma a confirmar se assim ´e recolheu-se uma amostra aleat´oria de 28 valores de tens˜ao arterial, que se agruparam em classes no quadro abaixo. O que pode concluir a um n´ıvel de confian¸ca de 10%?

i Classe Frequˆencia observada

1 ] − ∞; 13.5] 4

2 ]13.5; 14] 7

3 ]14; 14.5] 8

4 ]14.5; 15] 5

5 ]15; +∞[ 4

10.19 A quantidade de lixo (toneladas) produzida no concelho do Xeisal, por dia, ´e uma vari´avel aleat´oria com distribui¸c˜ao normal. De forma a avaliar o que se passa no concelho em rela¸c˜ao a esta vari´avel seleccionaram-se 15 dias ao acaso para os quais se registaram as correspondentes quantidades de lixo produzidas, resultando numa m´edia de ¯x = 100100 toneladas e num desvio padr˜ao amostral s = 1117 toneladas.

(a) Teste, ao n´ıvel de significˆancia de 1%, se a variˆancia desta quantidade de lixo ´e inferior a 1000000 toneladas2. Justifique o procedimento empregue.

(b) Assumindo agora que σ = 1000 teste a hip´otese de que a quantidade m´edia de lixo por dia ´e inferior a 100000 toneladas. Use um n´ıvel de significˆancia de 5%. Justifique.

(Exerc´ıcio de exame) 10.20 Determinado produtor de vinho afirma que a gradua¸c˜ao m´edia do seu vinho ´e de 13o - assuma

que a gradua¸c˜ao segue uma distribui¸c˜ao normal. Seleccionaram-se aleatoriamente 5 garrafas da produ¸c˜ao tendo-se medido as correspondentes gradua¸c˜oes (em o): 13.4 13.5 13.6 13.6 13.4.

Probabilidades e Estat´ıstica Isabel Nat´ario 167

(a) Teste a hip´otese de a gradua¸c˜ao m´edia deste vinho ser de facto 13o, ao n´ıvel de significˆancia 5%. Justifique todos os passos empregues.

(b) Diga o que entende por n´ıvel de significˆancia de um teste de hip´oteses.

(c) O pressuposto da normalidade atr´as considerado foi questionado por algu´em. Assim recolheu- se nova amostra aleat´oria de 33 garrafas de vinho, tendo-se medido as correspondentes gradua¸c˜oes, agrupadas em classes na tabela abaixo. Use estes dados para testar a hip´otese de a gradua¸c˜ao de vinho seguir uma distribui¸c˜ao normal de m´edia µ = 13.5o e desvio padr˜ao σ = 1o, a um n´ıvel de significˆancia de 10%. Justifique e comente.

i Classe Frequˆencia observada

1 ] − ∞; 11.5] 5 2 ]11.5;12.5] 8 3 ]12.5;13.5] 9 4 ]13.5;14.5] 6 5 ]14.5; +∞[ 5 (Exerc´ıcio de exame) 10.21 Diga, justificando, se as seguintes afirma¸c˜oes s˜ao verdadeiras ou falsas:

(a) Se, com base numa determinada amostra, certa hip´otese H0 for rejeitada a um n´ıvel de

significˆancia 5% ent˜ao tamb´em o ser´a a um n´ıvel de significˆancia 10%.

(b) Suponha que para determinada m´edia populacional µ conduzimos um teste de hip´oteses para H0 : µ = 0.5 vs H1 : µ 6= 0.5 e que rejeit´amos esta hip´otese nula com um n´ıvel de

significˆancia de 5%. Ent˜ao ´e imposs´ıvel que a verdadeira m´edia µ seja 0.5.

(c) O Teorema Limite Central ´e ´util quando se pretende fazer um teste de hip´oteses sobre propor¸c˜oes.

(d) O n´ıvel de significˆancia de um teste ´e a probabilidade de a hip´otese nula ser falsa.

(e) Pretendemos testar a hip´otese nula de que determinado conjunto de dados prov´em de uma popula¸c˜ao com distribui¸c˜ao Normal. Assim, depois de dividirmos os dados em classes, contamos quantos dos elementos da amostra caem em cada uma dessas classes. A ideia do teste que vamos efectuar ´e ent˜ao comparar os valores observados com os que esperar´ıamos observar, caso a hip´otese nula fosse verdade. O n´umero esperado de casos para cada classe ´e calculado pesando a dimens˜ao da amostra pela correspondente propor¸c˜ao de elementos que na referida popula¸c˜ao Normal se encontram nessa classe.

(f) Se o n´umero de observa¸c˜oes numa amostra for aumentado de n para 2n ent˜ao o n´ıvel de significˆancia α de um teste de hip´oteses para a m´edia populacional, conduzido com base nessa amostra, diminui.

(Exerc´ıcio de exame) 10.22 Pensa-se que a idade (em anos) dos indiv´ıduos de determinada cidade segue uma distribui¸c˜ao

Normal(45, 202). Para se confirmar esta suposi¸c˜ao seleccionou-se uma amostra aleat´oria de 30 indiv´ıduos dessa cidade, tendo-se registado as respectivas idades e agrupado os elementos da amostra na seguinte tabela de frequˆencias:

Classes ≤15 ]15,30] ]30,45] ]45,60] >60

Teste, ao n´ıvel de significˆancia de 5%, a conjectura referida.

Cap´ıtulo 11

Regress˜ao Linear Simples

Em muitos problemas pr´aticos temos interesse em estabelecer rela¸c˜oes entre certas vari´aveis. Pense-se, por exemplo, que os resultados de muitas reac¸c˜oes qu´ımicas dependem da temperatura a que se d˜ao as referidas reac¸c˜oes ou que a qualidade de um cimento depende da quantidade e qualidade da areia usada na sua confec¸c˜ao. O conhecimento das rela¸c˜oes entre as v´arias vari´aveis permite-nos predizer o valor de umas vari´aveis em fun¸c˜ao das outras.

11.1

Regress˜ao Linear Simples

Vamos estar aqui apenas interessados no caso em que temos uma ´unica vari´avel dita resposta ou dependente, Y , que queremos ver explicada ou modelada por uma outra vari´avel dita explicativa ou independente, x, atrav´es de uma rela¸c˜ao linear:

Y = β0+ β1 x

Sendo as vari´aveis Y e x relacionadas pela equa¸c˜ao anterior, conhecidos os valores de β0 e β1,

podemos prever o valor de Y para qualquer valor de x. Contudo, na pr´atica, a equa¸c˜ao anterior ´e v´alida a menos de algumas flutua¸c˜oes aleat´orias:

Y = β0+ β1 x + ε, ε ∼ N(0, σ2)

Ao termo ε chamamos erro aleat´orio e assumimos que tem distribui¸c˜ao normal com m´edia nula. Aos parˆametros β0 e β1 chamamos parˆametros da regress˜ao. A este modelo designamos por

modelo de regress˜ao linear simples. Os parˆametros de regress˜ao, bem como a variˆancia do erro σ2, s˜ao usualmente estimados dos dados. Note-se que, assumindo independˆencia entre os erros ε e a

vari´avel explicativa x:

• E [Y |x] = E [β0+ β1 x + ε|x] = β0+ β1 x + E [ε] = β0+ β1 x + 0 = β0+ β1 x

• V[Y |x] = V[β0+ β1 x + ε|x] = V[ε] = σ2

• Y |x ∼ N(β0+ β1 x, σ2)

Observamos que o modelo de regress˜ao linear simples pode tornar-se mais complexo, se houver necessidade de incluir mais vari´aveis independentes no modelo. Por exemplo, o resultado de uma

reac¸c˜ao qu´ımica pode n˜ao depender apenas da temperatura mas tamb´em da press˜ao. Um modelo de regress˜ao linear que inclui mais de uma vari´avel independente designa-se por modelo de regress˜ao linear m´ultipla.

No documento Probabilidades e Estatística (páginas 157-172)