Comparação entre duas

(1)

Comparação entre duas

populações

(2)

AMOSTRAS INDEPENDENTES

(3)

Comparação entre

duas médias

(4)

•Na comparação de duas populações, dispomos de duas amostras, em que são possíveis as seguintes situações:

Em aplicações práticas é comum que o interesse seja

comparar as médias de duas diferentes populações (ambas as médias são desconhecidas).

 variâncias pop. conhecidas

variâncias pop.

desconhecidas

 _

^{ iguais}

 diferentes 2 amostras

dependentes independentes



Discutiremos apenas os testes conhecidos como paramétricos, que assumem que as variáveis se comportam segundo um

modelo Normal.

Introdução

(5)

•Exemplo 1: Um pesquisador deseja comparar o salário de profissionais da saúde, de ambos os sexos. Para isso, selecionou uma amostra aleatória de 50 profissionais, sendo 22 do sexo feminino e 28 do sexo masculino. Sabe-se, de estudos anteriores, que o salário de profissionais da saúde segue uma distribuição normal.

•

Masculino Feminino

4708 4412 4010 3768

4603 3868 4122 3939

4017 4252 4344 4459

4534 4265 4446 3827

4402 4377 3938 4197

4526 4000 4514 4306

4584 3441 3400 3935

4594 4172 4264 3748

4236 4203 3850 3838

4817 4001 3676 4016

4008 4464 3604 4274

4083 4706 3788 4681

(6)

•Exemplo 1

As duas populações, de onde as amostras são provenientes, são independentes e normalmente distribuídas;

- a população dos salários de profissionais da saúde do sexo feminino tem média _X e variância _X²

 X ~ N(_X, _X²)

- a população dos salários de profissionais da saúde do sexo masculino tem média _Y e variância _Y²

 Y ~ N(_Y, _Y²)

 Interesse: Comparar as médias das duas populações.

(7)

• Hipóteses estatísticas:

 da pop. normal com média _X e desvio padrão _X  extrai-se uma a.a. de tamanho n 

H₀: _X= _Y H₁: _X _Y ou _X> _Y ou _X< _Y

H₀: _X- _Y= 0 H₁: _X- _Y 0 ou _X- _Y> 0 ou _X- _Y< 0 ou, equivalentemente,

usando diferenças 

X X

sX

x

de amostra da

padrão desvio

de amostra da

média :

:

 da pop. normal com média _Y e desvio padrão _Y extrai-se uma a.a. de tamanho m 

Y s

Y y

Y

:

de amostra da

padrão desvio

:

de amostra da

média

Obs.: note que os tamanhos das 2 amostras, n e m, não precisam ser iguais.

(8)

grupo 1 grupo 2

população média



_X



_Y

desvio padrão



_X



_Y

m tamanho n

s_Y s_X

desvio padrão média

amostra

x y

Situações possíveis com respeito às variâncias _X² e _Y²: 1. conhecidas: teste Z

2. desconhecidas:

- iguais: teste-t de duas amostras - diferentes: teste-t modificado

Obs.: O teste de comparação de variâncias pode ser utilizado como um procedimento preliminar em teste de comparação de médias, auxiliando a escolha da técnica adequada.

(9)

CASO 1: variâncias conhecidas

(1) Hipóteses estatísticas:

H₀: _X= _Y H₁: _X< _Y

H₀: _X- _Y= 0 H₁: _X- _Y< 0 ou, equivalentemente,

usando diferenças  (2) Estatística de teste

Considere o Exemplo 1, dos salários de profissionais da saúde.

Queremos verificar se o salário das mulheres é menor do que o dos homens.

Como X e Y são

independentes com distribuição normal, com médias _Xe _Y e desvio padrão _X² e _Y², respectivamente, então

• Estimador de _X- _Y: _X _- _Y

• Distribuição amostral do estimador:

,



 



  

 m

σ n

μ σ μ

N Y

X _X _Y ^X ^Y

2 2

,

~

(10)

Se as variâncias são conhecidas, a estatística de teste é dada por

m σ n

σ

Y Z X

Y X

2 2

) (



 

(2) Estatística de teste

 Sob H₀, Z ~ N(0,1)

(3) Nível de significância:  = 5%

(4) Calcular medidas necessárias:

Tamanho da amostra Média

Masculino (Y) 28 4302,87

Feminino (X) 22 4021,68

Informação dada:

_X= 280 e _Y= 300

(11)

(5A) Região crítica (teste unilateral inferior)

(6A) Decidir e Concluir

A região crítica deve ter a forma: RC = { Z ≤ z_tab }  z_tab = ? Da tabela da N(0,1), com  = 5%, z_tab= -1,64

 RC = { Z ≤ -1,64}

415 ,

33 3 , 82

19 , 281

28 300 22

280

87 , 4302 68

,

4021    



 

2 2

) (

zobs

z_obs= -3,415  RC  rejeita-se H₀ (5B) Nível descritivo P

P = P(Z ≤ -3,415) = 0,0003.

(6B) Decidir e Concluir

P <   rejeita-se H

(12)

 A média dos salários das mulheres é menor do que a dos homens. Quanto menor?

• Intervalo de confiança para a diferença



_X-



_Y:

 











         

























 











m z n

Y m X

z n Y

X P

z m

n Y z X

P z

Z z

P

Y X

tab Y

X Y

X tab

tab Y

X

Y X

tab tab

tab

2 2

) (



 

 





 

No exemplo:

IC(_X-_Y;10%) = (-281,19-1,6482,33; -281,19+1,6482,33;) = (-416,21;-146,17)

(13)

CASO 2: variâncias desconhecidas, iguais

H₀:



_X=



_Y

H₁:



_X<



_Y ^H⁰^:



_X-



_Y= 0

H₁:



_X-



_Y< 0 ou, equivalentemente,

usando diferenças  (2) Estatística de teste

Exemplo 1: salário de profissionais da saúde. Queremos verificar se o salário das mulheres é menor do que o dos homens.

Suponha agora: NÃO CONHECEMOS AS VARIÂNCIAS. Temos apenas a informação de que SÃO IGUAIS (_x= _Y= ), mas não sabemos o valor.

Temos que:

1 , 1





 



 



 

 





 



  



m σ n

μ μ

N

m σ n

μ σ μ

N Y

X

Y X

2

2 2

,

~

,

~

(14)

Assim,

) (0,1 1

1

) (

2

N m

σ n

μ μ

Y

Z X ^X ^Y ~



 

 



 

2 . 1) (

1)

( ² ²

2









 

m n

s m

s

s_p n ^X ^Y

Não conhecemos , precisamos estimar por:

- A estimativa s_p² combina informação de ambas amostras para se produzir uma estimativa mais confiável de ²;

- Na verdade, s_p² é média ponderada das duas variâncias amostrais s_X² e s_Y², onde cada variância é ponderada pelos seus graus de liberdade associados;

- Se n é igual a m, s_p² é a média aritmética simples; caso contrário, maior peso é dado à variância da maior amostra.

(15)

m) S n

Y T X

p

1 (1

) (

2 

 

(3) Nível de significância:  = 5%

Tamanho da amostra Média Desvio padrão

Masculino 28 4302,87 335,74

Feminino 22 4021,68 301,08

s²_p= [(22-1)301,08²+(28-1)335,74²] / (22+28-2) = 103.065 s_p = 321,037

 Sob H₀, T ~ t (n+m-2).

(16)

, 3,074 -

28) 1 22

( 1 321,037

4302,87) 021,68

( 



 

 4

T_obs

(5A) Região crítica

(6A) Decidir e Concluir

A região crítica deve ter a forma: RC = { T ≤ t_tab }  t_tab = ? Da tabela da t(48 g.l.), com  = 5%, t_tab= -1,68

 RC = {T ≤ -1,68}

T_obs = -3,074  RC  rejeita-se H₀ (5B) Nível descritivo P

P= P(T₄₈ ≤ -3,074) = 0,0017 (6B) Decidir e Concluir

P <   rejeita-se H₀

(17)

• Intervalo de confiança para a diferença 

_X

- 

_Y

:

No exemplo:

IC(_X-_Y; 10%) =

= (-281,19-1,68321,0370,285; -281,19+1,68321,0370,285)

= (-434,85;-127,53).

em que t_tab é obtido da tabela t com (n+m-2) graus de liberdade.

(18)

CASO 3: variâncias desconhecidas, diferentes

H₀: _X= _Y H₁: _X< _Y

H₀: _X- _Y= 0 H₁: _X- _Y< 0 ou, equivalentemente,

usando diferenças 

Exemplo 1: salário de profissionais da saúde. Queremos verificar se o salário das mulheres é menor do que o dos homens.

Suponha agora: NÃO CONHECEMOS AS VARIÂNCIAS E SABEMOS QUE SÃO DIFERENTES (_x  _Y ).

Temos que: 



 



  

 m

σ n

μ σ μ

N

~ Y

X _X _Y ^X ^Y

2 2

,

(19)

Assim,

) (

2

2 ( ) 0,1

)

( N

m σ n

σ

μ μ

Y Z X

Y X

Y

X ~



 



 



 

Não conhecemos _X² e _Y² estimamos por s_x² e s_Y². Finalmente, a estatística de teste, sob H₀, é

. ) (

) (

2 2

m S n

S

Y T X

Y X 

 

.

/( 1) ( ) ( 1)]

) [(

)]

( ) [(

2 2

2







 

m m

s n

n s

m s

n s

Y X

/ /

/

/ /

2

 2

Sob H₀, T ~ t(), em que  é o número de graus de liberdade dado por

(20)

(3) Nível de significância:  = 5%

 

, - ,

,

t_obs , 312

28 74 335 22

08 301

87 4302 68

4021

2 2













 

 

. 1 1)] 47

/(28 /28)

(335,74 1)

/(22 /22)

[(301,08

/28)]

(335,74 /22)

[(301,08

2 2

2

 ,







 



Assim, usamos   47.

Tamanho da amostra Média Desvio padrão

Masculino 28 4302,87 335,74

Feminino 22 4021,68 301,08

(21)

(5A) Região crítica

(6A) Decidir e Concluir

A região crítica deve ter a forma: RC = {T ≤ t_tab}  t_tab = ? Da tabela da t(47 g.l.), com



= 5%, t_tab= -1,68

 RC = { T ≤ -1,68}

t_obs = -3,12  RC  rejeita-se

H

₀

(5B) Nível descritivo P

P = P(T₄₇ ≤ -3,12) = 0,0015

(6B) Decidir e Concluir

P <



 rejeita-se

H

₀

(22)

• Intervalo de confiança para a diferença 

_X

- 

_Y

:

No exemplo:

IC(_X-_Y;10%) = (-281,19-1,6890,26; -281,19+1,6890,26) = (-432,82; -129,56).

em que t_tab é obtido da tabela t com  graus de liberdade.

(23)

Comparação entre

duas variâncias

(24)

Um teste de hipóteses importante consiste em verificar se duas populações têm a mesma variância.

Considere uma amostra X₁, ...,X_n de uma população com distribuição N(_X, _X²) e uma amostra Y₁, ...,Y_m de uma população com distribuição N(_Y, _Y²). Suponha que as duas amostras sejam independentes.

Se S_X² e S_Y² são as variâncias amostrais respectivas, então a estatística do teste é

2 2 X

S F  S

H₀: ²_X= ²_Y

H₁: _X²  _Y²ou _X²> _Y²ou _X²< _Y²

 Qual é a distribuição de probabilidade de F ?

(25)

Se a hipótese nula H₀ é verdadeira (_X²= _Y²), a estatística F possui distribuição de probabilidade F de Snedecor com n-1 graus de liberdade no numerador e m-1 graus de

liberdade no denominador.

 

2

) 1

~ ( _

  _n

X X

σ S

U n ¹₂ ²



Resultado:

Sejam X ~ N(_X, _X²) e Y ~ N(_Y, _Y²), independentes. Para amostras aleatórias X₁, X₂, ..., X_n, de X e Y₁, Y₂, ..., Y_m, de Y, temos

 

2

) 1

~ ( _

  _m

Y Y

σ

S

V m ¹₂ ²



 



^^¹¹



^~ ⁽ ^¹^; ^¹⁾



 F n m

m V

n U

S F S

Y X

2 2

Se _X² = _Y², então

(26)

Obtenção dos valores críticos: Teste bilateral

• Para  fixado, encontre na tabela F(n-1; m-1) um valor f₂ tal que P(F (n-1; m-1) > f₂) = /2 e

• Para  fixado, encontre na tabela F(m-1; n-1) (observe que os g.l. foram trocados) um valor g₁ tal que P(F (m-1;

n-1) > g₁) = /2 e calculamos f₁=1/g₁. (3) Nível de significância: 

Obter S_X² e S_Y², as variâncias amostrais, e calcular F.

Se H₁: _X² > _Y² ,

Se H₁: _X² < _Y² ,

Se H₁: _X²  _Y² ,

RC = {F: F < f }

RC = {F: F < f₁ ou F > f₂} RC = {F: F > f }

tabela

(27)

(5B) Nível Descritivo

P = P(F(n-1; m-1) < F_obs)

P = 2  P(F(n-1; m-1) > F_obs) ou P = 2  P(F(n-1; m-1) < F_obs)

P = P(F(n-1; m-1) > F_obs)

(6) Decidir e concluir

(A) Se F_obs  RC, rejeita-se H₀ Se F_obs RC, não se rejeita H₀ (B) Se P    rejeita-se H₀

Se P >   não se rejeita H₀ Se H₁: _X²  _Y² ,

Se H₁: _X²> _Y² ,

Se H₁: _X² < _Y² ,

(28)

Intervalo de confiança para o quociente 

_Y²

/ 

_X²

com coeficiente de confiança 

  _ ^ ^ _



 



  

 



 



  



 



 



 



 











2 2 2 2

2 2

2 1 2 2

2

2 2

1

2 1

1 ) 1

1

; 1 (

X Y X

Y X

Y Y

Y

X X

S f S S

f S P S f

f S P

m f V

n f U

P f

m n

F f

P





(29)

Considere o Exemplo 1, dos salários de profissionais da saúde.

Queremos verificar se a variabilidade do salário das mulheres é igual à dos homens.

(1) Hipóteses estatísticas: H₀: _M²  _F² H₁: _M²  _F² (2) Estatística de teste

Se S_M² e S_F² são as variâncias amostrais respectivas, então a estatística do teste é

27)

; 21 (

2 ~

2

S F F S

M

 F

(3) Nível de significância  = 5%.

(4) Calcular as medidas necessárias

S_M = 335,74 e S_F = 301,08 0,804 74

, 335

08 , 301

2 2



 F_obs

(30)

RC = {F : F < f₁ ou F > f₂}, sendo f₁ e f₂ obtidos por

f₂: encontre na tabela F(21; 27) o valor f₂ tal que P(F(21;27) > f₂) = 0,025  f₂ = 2,25 (aprox.) e f₁: encontre na tabela F(27; 21) um valor g₁ tal que

P(F (27; 21) > g₁) = 0,025 e calculamos f₁=1/g₁=1/2,34 = 0,427

RC = {F : F < 0,427 ou F > 2,25 }, (6) Decidir e concluir

F_obs = 0,804  RC  não se rejeita H₀ (5B) Nível descritivo

P = 2  P(F(21; 27) < 0,804) = 2  (1- 0,69) = 0,62 > 

 não se rejeita H₀

30

(31)

Intervalo de confiança de 95% para o quociente



_Y²/



_X² :

 O valor “1”  IC, como esperado.

(32)

Comparação entre duas

proporções

(33)

•Como vimos para a média, muito frequentemente, podemos estar interessados na comparação de duas proporções de duas populações independentes.

(1) Hipóteses estatísticas:

_H

0

: p

₁

= p

₂

H₁

: p

₁

 p

₂ou

p

₁

> p

₂ou

p

₁

< p

₂

 extraímos uma uma a.a. de tamanho n₁ de uma população com proporção p₁; se observamos x₁sucessos na amostra,

então ˆ ₁).

1 1

1 (estimador pontual de p n

p  X

 Analogamente, selecionamos uma amostra de tamanho n₂ da população com proporção p₂ e se observamos x₂ sucessos, então

ˆ ₂ ).

2 2

2 (estimador pontual de p n

p  X

(34)

2 1

2 2 1 1

n n

p n p

p n



 ˆ  ˆ ˆ

A quantidade é uma média ponderada das duas proporções das amostras, e .

pˆ

2

1

p

p ˆ ˆ

.

2 1

n n

X X



 

2 1

- ˆ

ˆ p

p _

2 2 1

1 2 1

1

2 1

) ) )

ˆ ˆ

ˆ ) ˆ

n p p

n p p p

p Var

p p

E

 

 







(1 ( (1

(

2



Se a hipótese nula é verdadeira, temos que p₁ = p₂ = p, os dados de ambas as amostras podem ser combinados para estimar esse parâmetro comum p, por

(35)

1 ) )( 1

- (1

2 1 n p n

pˆ ˆ 

Sob a hipótese nula H₀, o estimador do erro padrão da diferença é dado por:

p ˆ

₁

- p ˆ

₂

• Estatística do teste:

1 ) )( 1

(1

) (

2 1

n p n

p

p Z p





 

ˆ ˆ

 Se n₁ e n₂ são suficientemente grandes, essa estatística, sob H₀, tem uma distribuição normal com média 0 e desvio padrão 1.

(36)

(3) Nível de significância: 

(4) Calcular medidas necessárias (5A) Região crítica

(5B) Nível Descritivo (6) Decidir e concluir

(A) Se Z_obs  RC, rejeita-se H₀

Se Z_obs  RC, não se rejeita H₀ (B) Se P    rejeita-se H₀

Se P >   não se rejeita H₀

(37)

Exemplo 2 : Para investigar a lealdade de consumidores a um determinado produto, sorteou-se uma amostra de 200 homens e 200 mulheres. Foram classificados como tendo alto grau de fidelidade 100 homens e 120 mulheres. Os dados trazem evidências de diferença de grau de fidelidade entre os gêneros? Em caso afirmativo, construa um intervalo de confiança para a diferença.

Sejam: p_H: proporção de homens com alto grau de fidelidade p_M: proporção de mulheres com alto grau de fidelidade

(38)

H₀: p_H = p_M H₁: p_H  p_M,

(2) Estatística do teste

(3) Fixar o nível de significância do teste :  = 5%

1 ) )( 1

(1

) (

M H

n p n

p

p Z p





 

ˆ ˆ

ˆ

sendo

M H

M M

H H

n n

p n

p p n



 ˆ  ˆ

ˆ

(39)

n_H = 200  100 com alto grau de fidelidade

 0,5

 200 ˆ_H 100

p

 0,6

 200 ˆ_M 120

p

n_M= 200  120 com alto grau de fidelidade (4) Calcular as medidas necessárias

• Valor da estatística do teste:

01 , 2 200

55 200 ,

0 55

, 0

6 , 0 5

0  



 



 



 

1 ) 1

(1

) ( ,

z_obs

 0,55







 

200 200

6 , 0 200 5

, 0 ˆ 200

p

(40)

P = 2 P(Z  -2,01) = 0,044 (5A) Região crítica (teste bilateral)

(5B) Nível Descritivo

 = 5%  RC = {Z : Z < -1,96 ou Z > 1,96 }

(6) Decidir e concluir

(A) z_obs= -2,01  RC, rejeita-se H₀

(B) Se P    rejeita-se H₀

(41)

M H

p

p ˆ - ˆ

 fornece uma estimativa por ponto para a verdadeira diferença p_H – p_M das proporções populacionais.

ˆ ˆ

ˆ ˆ ˆ

ˆ 









    

M

M M

H

H H

M

H n

p p

n p p p

p (1 ) (1 )

1,96 -

Um intervalo de confiança de 95% para a diferença p_H - p_M, usando a aproximação normal, é

Note que o erro padrão da diferença das proporções amostrais não é o mesmo que aquele usado no teste;

no teste de hipóteses, o erro padrão empregado foi baseado na suposição de que a hipótese nula era verdadeira (p_H=p_M=p);

essa suposição não é necessária no cálculo de um intervalo de confiança.

(42)

 0,5 pˆH

No exemplo, como e , um intervalo de confiança aproximado de 95% para p_H – p_M é

 0,6 pˆM

) 03 , 0 ; 197 , 0 (

) 097 ,

0 1 , 0 ; 097 ,

0 1 , 0 (

200

) 6 , 0 1 ( 6 , 0 200

) 5 , 0 1 ( 5 , 96 0

, 1 ) 6 , 0 5 , 0 (

















 

 





Note que, como esperado, o intervalo não contém o valor zero.

(43)

AMOSTRAS DEPENDENTES

(teste t-pareado)

(44)

• característica das amostras dependentes (pareadas):

•para cada unidade amostral realizamos duas medições.

 As medidas são tomadas em um único “indivíduo” em dois pontos distintos no tempo.

 Em geral, observações pareadas correspondem a medidas tomadas antes e depois de uma dada intervenção -- cada indivíduo é examinado antes que um certo tratamento seja aplicado e novamente depois que o tratamento foi completado.

 Outro tipo de emparelhamento: o pesquisador “casa” os indivíduos de um grupo com aqueles de um segundo grupo, de modo que os membros de um par sejam parecidos (em relação a características, tais como, a idade e o gênero).

(45)

 Planejamento empregado na tentativa de se controlar fontes de variação que poderiam influenciar os resultados da comparação.

 Se as medidas são feitas no mesmo sujeito uma certa variabilidade biológica é eliminada -- não temos que nos preocupar com o fato de um sujeito ser mais velho do que outro ou se um é homem e o outro é mulher.

 A intenção do emparelhamento é, portanto, fazer uma comparação mais precisa.

(46)

Exemplo 3: Uma empresa deseja estudar o efeito de uma pausa de dez minutos para um cafezinho sobre a produtividade de seus trabalhadores. Para isso, sorteou seis operários, e contou o número de peças produzidas durante uma semana sem intervalo e uma semana com intervalo. Os resultados sugerem se há ou não melhora na produtividade? Caso haja melhora, qual deve ser o acréscimo médio de produção para todos os trabalhadores da fábrica?

X_i: número de peças produzidas pelo operário i na semana sem

intervalo

Operário 1 2 3 4 5 6

Sem intervalo 23 35 29 33 43 32

Com intervalo 28 38 29 37 42 30

Y_i: número de peças produzidas pelo operário i na semana com intervalo

(47)

Efeito do emparelhamento:

eliminar quaisquer distorções que poderiam ser introduzidas ao se comparar indivíduos que diferem com relação a outras variáveis, como idade, sexo, peso, etc.

Suponha que os dois grupos de observações possam ser dispostos como a seguir:

Variável de interesse: D = Y – X ,

e uma amostra de D é d₁, d₂, ...d_n(as diferenças amostrais).

Amostra 1 Amostra 2

x₁ y₁

x₂ y₂

... ...

x_n y_n

d_i = y_i - x_i d₁ = y₁- x₁ d₂ = y₂- x₂

...

d_n = y_n- x_n

(48)

H₀: _D= 0

H₁: _D 0 ou _D< 0 ou _D> 0

O efeito produzido para o i-ésimo indivíduo pode ser

representado pela variável diferença D_i = Y_i- X_i(“com”–“sem”) Supondo D_i  N(_D, _D²), para i = 1, ..., n,

numa situação geral, queremos testar as hipóteses:

 a pausa para o café não produz efeito



A pausa aumenta a produtividade média

 a pausa para o café produz algum efeito

(49)

O parâmetro _Dé estimado pela média amostral das diferenças:

Como não temos informação sobre a variância das diferenças, estimamos seu valor por S_D², dado por:





 ⁿ

i

Di

D n

1

2 1

2 ( )

1

1 D D

S n _i

n i

D 

 





Estatística do teste:

n S

T D

D



Sob

H

₀, a estaística T tem distribuição t-Student com n-1 graus de liberdade.

(50)

• A média da amostra fornece uma estimativa por ponto para a verdadeira diferença das médias das populações _D _Y - _X.

• Em geral supomos que X e Y têm distribuição normal e, consequentemente, podemos considerar que a distribuição das diferenças tem distribuição normal.

Obs.: no caso geral, é necessário uma verificação da suposição de normalidade da diferença Y-X pela análise gráfica e/ou testes de hipóteses. Se a normalidade não é válida, esse teste t não se aplica e técnicas não paramétricas de análise são necessárias.

Comentários

(51)

Voltando ao exemplo,

gostaríamos de saber se há alguma evidência estatística de que a pausa para o café aumenta a produtividade.

(1) Hipóteses:

H₀: _D = 0 H₁: _D> 0

(“com”-”sem”)

que equivale a H₀: _X= _Y H₁: _Y > _X

(2) Estatística de teste: _~ _t₍ ₁₎_, _H₀_. n

S

T D _n

D

 sob



(3) Nível de significância:  = 5%.

(52)

Amostra de pares  d_i= y_i - x_i: 5, 3, 0, 4, -1, -2

(média amostral das diferenças)

(desvio padrão das diferenças)

5 6 1

9 6

6

1 ,

d d ⁱ

i  







88 , 2 )

(

6

1

2











1 - 6

i

i D

d d

s

(4) Calcular

medidas

necessárias

276 6 1

88 2

5

1 ,

,

t_obs  , 



Sob a hipótese nula H₀,

T tem distribuição t-Student com 6 -1 = 5 graus de liberdade.

(5A) Região Crítica

 = 5%  RC = {T : T₅  2,015 }

(53)

(5B) Nível descritivo:

P(T  1,276)  0,15 (valor exato: 0,129)

 não há evidência experimental para concluirmos que a pausa para um cafezinho melhora a produtividade média._. (6) Decidir e concluir

(A) t_obs = 1,276  RC  não se rejeita H₀ (B) P >   não se rejeita H₀

(54)

Se a hipótese nula H₀ é rejeitada:

Interesse: Encontrar um intervalo de confiança para



_D

esperado.

como ,

zero"

"

o contem

caso, neste

que,

), 3,87 0,87;

- (

) 2,37 1,5

; 2,37 1,5

(

6 ) 2,015 2,88

1,5 6 ;

2,015 2,88 1,5

( 90%) ;

(

















D  μ IC

) (

%)

( n

t s n d

t s μ d

IC

_D

;   

_n_-₁ ^D

; 

_n_-₁ ^D

(55)

(56)

(57)

Tabela da distribuição t-Student

Comparação entre duas

Comparação entre duas

populações

AMOSTRAS INDEPENDENTES

Comparação entre

duas médias

 



Introdução

 Interesse: Comparar as médias das duas populações.

• Hipóteses estatísticas:









CASO 1: variâncias conhecidas

m σ n

σ

Y Z X

) (



 





 

CASO 2: variâncias desconhecidas, iguais

















• Intervalo de confiança para a diferença 

- 

:

CASO 3: variâncias desconhecidas, diferentes

 

(5A) Região crítica

(6A) Decidir e Concluir



H

(5B) Nível descritivo P

(6B) Decidir e Concluir



H

• Intervalo de confiança para a diferença 

- 

:

Comparação entre

duas variâncias

S F  S

 



 



 





Intervalo de confiança para o quociente 

/ 

com coeficiente de confiança 

     





Comparação entre duas

proporções

(1) Hipóteses estatísticas:

: p

= p

: p

 p

p

> p

p

< p

p

p ˆ ˆ

- ˆ

 _

  _ ^ ^ _

p _