Inferência Estat´ıstica para Duas Amostras: Análise da Média

(1)

An´ alise da M´ edia

Anna Regina Corbo

CEFET/RJ - UnED NI

Aula Te´ orica 2

(2)

Comparar duas condi¸c˜ oes (tratamentos) diferentes para determinar

se cada condi¸ c˜ ao produz um efeito significante na resposta.

(3)

Considere duas popula¸c˜ oes independentes:

popula¸ c˜ ao 1: m´ edia µ

1

e variˆ ancia σ

²₁

. popula¸ c˜ ao 2 : m´ edia µ

2

e variˆ ancia σ

₂²

.

Vamos basear nossa inferˆ encia em duas amostras aleat´ orias de

tamanho n

1

e n

2

das popula¸c˜ oes 1 e 2, respectivamente.

(4)

An´ alise da diferen¸ ca das m´ edias µ

₁−

µ

₂

:

1

Com variˆ ancias σ

₁²

e σ

₂²

conhecidas.

2

Com variˆ ancias σ

₁²

e σ

₂²

desconhecidas:

Supondo queσ₁²=σ₂² Supondo queσ₁²6=σ₂²

(5)

conhecidas

Suponha que:

1

X

11

, X

12

, . . ., X

1n1

´ e uma amostra aleat´ oria proveniente da popula¸ c˜ ao 1;

2

X

₂₁

, X

₂₂

, . . ., X

_2n₂

´ e uma amostra aleat´ oria proveniente da popula¸ c˜ ao 2;

3

As duas popula¸ c˜ oes representadas por X

₁

e X

₂

s˜ ao independentes;

4

Ambas as popula¸ c˜ oes s˜ ao normais ou tais que o teorema

central do limite se aplica.

(6)

conhecidas

Estimadores e Estat´ıstica

Estimador para a diferen¸ ca de m´ edias:

E [X

1−

X

2

] = µ

1−

µ

2

Estimador para a variˆ ancia da diferen¸ ca de m´ edias:

Var [X

₁−

X

₂

] = σ

₁²

n

1

+ σ

₂²

n

2

(7)

conhecidas

Estimadores e Estat´ıstica

No caso de uma amostra, tinhamos como distribui¸ c˜ ao de probabilidade da estat´ıstica, a distribui¸ c˜ ao normal padr˜ ao, onde:

Z = X

−

µ

r

σ

²

n

, onde

Z

∼

N(0, 1).

De modo an´ alogo, neste caso, teremos:

Z = X

₁−

X

₂−

(µ

₁−

µ

₂

)

s

σ

₁²

n

₁

+ σ

₂²

n

₂

, onde

Z

∼

N(0, 1).

(8)

conhecidas

Teste de hip´oteses

Teste de hip´ oteses para a diferen¸ ca nas m´ edias µ

₁−

µ

₂

de duas popula¸ c˜ oes:

H

0

: µ

1−

µ

2

= ∆

0

H

₁

: µ

₁−

µ

₂ 6= ∆₀

Desejamos testar se esta diferen¸ ca ´ e igual ou n˜ ao a um valor

especificado ∆

0

. Se quisermos testar a igualdade das duas m´ edias

basta definir ∆

₀

= 0.

(9)

conhecidas

Hip´ otese Nula:

H

₀

: µ

₁−

µ

₂

= ∆

₀

Estat´ıstica do Teste:

Z

_calc

= X

1−

X

2−

∆

0

s

σ

²₁

n

1

+ σ

₂²

n

2

(10)

conhecidas

Hip´ oteses Alternativas H

₁

: µ

₁−

µ

₂6= ∆₀

H

1

: µ

1−

µ

2

> ∆

0

H

1

: µ

1−

µ

2

< ∆

0

Crit´ erios de Rejei¸ c˜ ao

z

_calc

> z

_α/2

ou z

_calc

<

−z_α/2

z

_calc

> z

α

z

_calc

<

−z_α

(11)

conhecidas

Teste de hip´oteses - Exemplo 1

Um idealizador de produtos est´ a interessado em reduzir o tempo de secagem de uma tinta. Duas formula¸ c˜ oes de tinta s˜ ao testadas:

a formula¸c˜ ao 1 tem uma qu´ımica padr˜ ao e a formula¸ c˜ ao 2 tem um

novo ingrediente, que deve reduzir o tempo de secagem. Da

experiˆ encia, sabe-se que o desvio-padr˜ ao do tempo de secagem ´ e

de 8 minutos e que este dado n˜ ao deve ser alterado pela adi¸ c˜ ao do

novo ingrediente. Dez esp´ ecimes s˜ ao pintados com a formula¸ c˜ ao 1

e outros dez esp´ ecimes s˜ ao pintados com a formula¸ c˜ ao 2. Os

tempos m´ edios de secagem das duas amostras s˜ ao x

₁

= 121

minutos e x

2

= 112 minutos, respectivamente. Quais as

conclus˜ oes que o idealizador de produtos pode tirar sobre a

eficiˆ encia do novo ingrediente, usando α = 0, 05?

(12)

conhecidas

Intervalo de confian¸ca

Vimos que se as duas popula¸ c˜ oes forem normais ent˜ ao a vari´ avel

Z = X

1−

X

2−

(µ

1−

µ

2

)

s

σ

²₁

n

₁

+ σ

₂²

n

₂

ter´ a uma distribui¸ c˜ ao normal padr˜ ao. Isso implica que:

P (−z

_α/2 6

Z

6

z

_α/2

) = 1

−

α

(13)

conhecidas

P 0

@X1−X2−zα/2

s σ²₁ n1

+σ₂²

n2 6µ1−µ26X1−X2+zα/2

s σ₁² n1

+σ²₂ n2

1 A= 1−α

Ou seja, este ´ e o intervalo de confian¸ca 1

−

α para a diferen¸ ca de

m´ edias se X

₁

e X

₂

forem as m´ edias de duas amostras aleat´ orias

independentes de tamanhos n

1

e n

2

, provenientes de popula¸ c˜ oes

com variˆ ancias conhecidas σ

₁²

e σ

₂²

, respectivamente.

(14)

conhecidas

Intervalo de confian¸ca - Exemplo 2

Testes de resistˆ encia ` a tens˜ ao foram feitos em duas estruturas contendo dois teores distintos de alum´ınio. Essas estruturas foram usadas na fabrica¸ c˜ ao das asas de um avi˜ ao. Os dados obtidos s˜ ao mostrados na tabela abaixo. Se µ

₁

e µ

₂

denotam as resistˆ encias m´ edias para os dois tipos de teores da estrutura, encontre um intervalo de confian¸ ca de 90% para a diferen¸ ca real destas resistˆ encias.

Tipo da Tamanho Resistˆ encia m´ edia Desvio-padr˜ ao Estrutura da amostra da amostra (kg /mm

²

) (kg /mm

²

)

1 10 87,6 1,0

(15)

desconhecidas

Quando o tamanho da amostra ´ e consideravelmente pequeno ou

quando desconhecemos o valor da variˆ ancia populacional σ

²

, ao

supor que a popula¸ c˜ ao ´ e normalmente distribu´ıda devemos basear

nossas an´ alises de inferˆ encia na distribui¸c˜ ao t-Student.

(16)

desconhecidas

Teste de Hip´oteses

No caso de variˆ ancias desconhecidas, devemos estudar duas

situa¸c˜ oes diferentes: primeiro, se as variˆ ancias em quest˜ ao s˜ ao

iguais, e segundo, caso elas sejam diferentes.

(17)

desconhecidas

CASO 1 - Variˆ ancias Iguais: σ

²₁

= σ

₂²

= σ

²

Suponha que tenhamos duas popula¸ c˜ oes normais independentes, com m´ edias desconhecidas µ

₁

e µ

₂

e variˆ ancias desconhecidas, por´ em iguais, σ

₁²

= σ

₂²

= σ

²

. Desejamos testar

H

₀

: µ

₁−

µ

₂

= ∆

₀

H

1

: µ

1−

µ

2 6= ∆₀

(18)

desconhecidas

Estimadores do CASO 1 - Variˆancias Iguais

M´ edia: E [X

1−

X

2

] = µ

1−

µ

2

Variˆ ancia: Var [X

₁−

X

₂

] = σ

₁²

n

1

+ σ

₂²

n

2

= σ

²

n

1

+ σ

²

n

2

= σ

²

1 n

1

+ 1 n

2

Estimador Combinado S

_p²

:

S

_p²

= (n

₁−

1)S

₁²

+ (n

₂−

1)S

₂²

n

1

+ n

2−

2 Dizemos que este estimador combinado possui n

₁

+ n

₂−

2 graus

(19)

desconhecidas

Estat´ıstica de Teste CASO 1 - Variˆancias Iguais

Como

Z = X

1−

X

2−

(µ

1−

µ

2

) σ

r

1 n

₁

+ 1

n

₂

tem uma distribui¸c˜ao

N

∼

(0, 1)

ent˜ ao, trocando σ por S

_p

temos o seguinte:

T = X

1−

X

2−

(µ

1−

µ

2

) S

p

r

1 n

₁

+ 1

n

₂

tem uma distribui¸ c˜ ao t, com n

₁

+ n

₂−

2 graus de liberdade.

(20)

desconhecidas

Teste de Hip´oteses CASO 1 - Variˆancias Iguais

Teste t Combinado para Duas Amostras Hip´ otese Nula:

H

0

: µ

1−

µ

2

= ∆

0

Estat´ıstica do Teste:

T

_calc

= X

1−

X

2−

∆

0

S

_p r

1 n

₁

+ 1

n

₂

(21)

desconhecidas

Teste de Hip´oteses CASO 1 - Variˆancias Iguais

Teste t Combinado para Duas Amostras Hip´ oteses Alternativas

H

₁

: µ

₁−

µ

₂6= ∆₀

H

₁

: µ

₁−

µ

₂

> ∆

₀

H

1

: µ

1−

µ

2

< ∆

0

Crit´ erios de Rejei¸ c˜ ao

t

_calc

> t

_α/2,n₁_+n₂₋₂

ou t

_calc

<

−t_α/2,n₁_+n₂₋₂

t

calc

> t

α,n1+n2−2

t

_calc

<

−t_α,n₁_+n₂₋₂

(22)

desconhecidas

Teste de Hip´oteses CASO 1 - Variˆancias Iguais - Exemplo 3

Vocˆ e ´ e um analista financeiro de uma corretora de a¸ c˜ oes. De acordo com os dados coletados abaixo, h´ a diferen¸ ca de dividendos entre as a¸ c˜ oes negociadas na Bolsa de T´ okio e de NY? Assuma variˆ ancias iguais e α = 5%.

NY T´ oquio N´ umero de A¸ c˜ oes 21 1 25

M´ edia amostral 3,27 2,53

Desvio-padr˜ ao amostral 1,30 1,16

(23)

desconhecidas

CASO 2 - Variˆ ancias diferentes: σ

²₁ 6=

σ

²₂

Em algumas situa¸ c˜ oes n˜ ao ´ e razo´ avel considerar que as vari´ aveis

desconhecidas σ

²₁

e σ

₂²

sejam iguais.

(24)

desconhecidas

Estat´ıstica de teste do CASO 2 - Variˆancias diferentes

Neste caso, se H

₀

: µ

₁−

µ

₂

= ∆

₀

for verdadeira, ent˜ ao a estat´ıstica

T

_calc^∗

= X

1−

X

2−

∆

0

s

S

₁²

n

₁

+ S

₂²

n

₂

´ e distribu´ıda normalmente com t, com graus de liberdade dados aproximadamente por

υ =

S

₁²

n

1

+ S

₂²

n

2

2 2 2 2 −

2

(25)

desconhecidas

Estat´ıstica de teste do CASO 2 - Variˆancias diferentes - Observa¸c˜oes

Realiza¸c˜ ao do teste igual ao anterior, exceto por:

troque T

_calc

por T

_calc^∗

na estat´ıstica do teste;

n

₁

+ n

₂−

2 ´ e trocado por υ na determina¸ c˜ ao do grau de

liberdade do teste

(26)

desconhecidas

Teste de Hip´oteses do CASO 2 - Variˆancias diferentes - Exemplo 4

Um fabricante de unidades de v´ıdeos est´ a testando dois projetos de microcircuitos para determinar se eles produzem correntes m´ edias equivalentes. A engenharia de desenvolvimento obteve os seguintes dados:

Projeto 1 n

1

= 15 x

1

= 24, 2 s

₁²

= 10 Projeto 2 n

2

= 10 x

2

= 23, 9 s

₂²

= 20

Usando α = 10%, desejamos determinar se h´ a qualquer diferen¸ ca

na corrente m´ edia entre os dois projetos, supondo que ambas as

popula¸ c˜ oes sejam normais, embora n˜ ao estejamos dispostos a

(27)

desconhecidas

CASO 1 - Variˆ ancias Iguais: σ

²₁

= σ

₂²

= σ

²

A estat´ıstica T , definida por:

T = X

₁−

X

₂−

(µ

₁−

µ

₂

) S

p

r

1 n

1

+ 1 n

2

tem distribui¸ c˜ ao t-Student, com n

₁

+ n

₂−

2 graus de liberdade.

Sendo assim temos, em termos de probabilidade, a express˜ ao:

P (−t

_α/2,n₁_+n₂₋₂6

T

6

t

_α/2,n₁_+n₂₋₂

) = 1

−

α

(28)

desconhecidas

Intervalo de confian¸ca: CASO 1 - Variˆancias Iguais

Substituindo T pela defini¸c˜ ao da estat´ıstica e tomando g = n

₁

+ n

₂−

2 graus de liberdade, temos:

P 0 B B B B

@

−t_α/2,g6X1−X2−(µ1−µ2) Sp

s 1 n1

+ 1 n2

6t_α/2,g 1 C C C C A

= 1−α

P X1−X2−t_α/2,g·Sp

s 1 n1

+ 1 n2

6µ1−µ26X1−X2+t_α/2,g·Sp

s 1 n1

+ 1 n2

!

= 1−α

Isto ´ e, este ´ e o intervalo de confian¸ ca 1

−

α para a diferen¸ ca de

m´ edias se X

1

e X

2

forem as m´ edias de duas amostras aleat´ orias

(29)

desconhecidas

Intervalo de confian¸ca: CASO 2 - Variˆancias diferentes

A estat´ıstica

T

^∗

= X

₁−

X

₂−

(µ

₁−

µ

₂

)

s

S

₁²

n

₁

+ S

₂²

n

₂

´ e distribu´ıda aproximadamente como a distribui¸ c˜ ao t-Student , com υ graus de liberdade. Em termos de probabilidade, obteremos o intervalo de confian¸ ca

P (−t

_α/2,υ 6

T

^∗ 6

t

_α/2,υ

) = 1

−

α

(30)

desconhecidas

Intervalo de confian¸ca: CASO 2 - Variˆancias diferentes

P 0

@X1−X2−tα/2,υ

s S₁² n1

+S₂²

n2 6µ1−µ26X1−X2+tα/2,υ

s S₁² n1

+S₂² n2

1 A= 1−α

onde υ ´ e dado aproximadamente por:

υ =

S

₁²

n

1

+ S

₂²

n

2

(S

₁²

/n

₁

)

²

n

1

+ 1 + (S

₂²

/n

₂

)

²

n

2

+ 1

−

2

(31)

desconhecidas

Intervalo de confian¸ca: CASO 2 - Variˆancias diferentes - Exemplo 5

Deseja-se estudar a quantidade de c´ alcio em um cimento padr˜ ao e de em um cimento que cont´ em chumbo. Quanto menor a

quantidade de chumbo, maior a chance de infiltra¸c˜ ao. Dez

amostras de cimento padr˜ ao tiveram um teor m´ edio percentual de c´ alcio de x

₁

= 90, 0, com um desvio-padr˜ ao da amostra de

s

₁

= 5, 0, enquanto 15 amostras do cimento com chumbo tiveram um teor m´ edio percentual de c´ alcio de x

1

= 87, 0, com um desvio-padr˜ ao da amostra de s

₂

= 4, 0. Supondo que o teor percentual de c´ alcio seja normalmente distribu´ıdo, encontre um intervalo de 95% de confian¸ ca para a diferen¸ ca nas m´ edias µ

1−

µ

2