Teste Exacto de Fisher
O teste ideal para aplicar com tabelas de contingência
de dados pequenos esparsos e não balanceados.
Embora seja aplicável noutras situações, vamos sempre
usar em tabelas 2 x 2 .
É um teste exacto, portanto um p-value exacto.
A ideia geral é considerando a tabela de observações,
“gerar” as tabelas com as mesmas margens, que são mais extremas que a observada, na mesma direcção da nossa observação e.g. que a proporção TB do tipo SR nas mulheres é menor que proporção TB tipo SR nos homens.
Teste Exacto de Fisher (cont.)
Considerando a tabela de contingência 2 x 2 geral, temos:
A probabilidade de obter (de forma aleatória) as observações desta tabela
é:
O p-value = ∑ p das tabelas tão ou mais extremas do que a observada.
(tipicamente ∑ p: p < pobservada)
Para tabelas 2x2, usar quando n inferior a 20, ou quando n inferior a 40 e c + d d c X2 n= a+b+c+d b + d a + c Total a + b b a X1 Total Y2 Y1 X\Y ! ! ! ! ! )! ( )! ( )! ( )! ( d c b a n d b c a d c b a p= + + + +
TESTE DO QUI-QUADRADO - Teste de Homogeneidade
(de Populações independentes)
Consideremos L (≥2) populações independentes,
com f.d.’s
Dispomos de L amostras, uma de cada população
Com base nas amostras anteriores, pretende-se testar
•
H0: as L populações são homogéneas.1 2 1 11 12 1 2 21 22 2 1 2
(
,
,
,
)
(
,
,
,
)
(
,
,
,
)
L n n L L L LnX
X
X
X
X
X
X
X
X
X
X
X
=
=
=
⋯
ɶ
⋯
ɶ
⋯
⋯
ɶ
1,
2,
,
LX X
⋯
X
F F
1,
2,
⋯
,
F
LTESTE DO QUI-QUADRADO - Teste de Homogeneidade
(de Populações independentes)
Consideremos uma Partição da recta
real em C ≥ 2 classes disjuntas e exaustivas A1, A2, … , AC .
Faça-se a contagem dos elementos de
cada amostra que pertencem a cada classe: Seja vs. { } # , 1, , , 1, , ; 1, , . ij ik j i N = X ∈A k = ⋯ n i = ⋯ L j = ⋯ C n N.C N. j N. 2 N.1 nL NLC … NL2 … NL2 NL1 XL … ni NiC … Nij … Ni2 Ni1 Xi … n2 N2C … N22 … N22 N21 X2 n1 N1C … N1j … N12 N11 X1 AC … Aj … A2 A1 Xi, i=1,…,L Margem fixa formada pelas dimensões das amostras | : [ ] j i i j p = P X ∈ A 0 : j|1 j|2 j L| j , 1, , H p = p = ⋯ = p = p j = ⋯ C
Com as frequências esperadas eij desconhecidas, utiliza-se Estatística de Teste (ET):
Regra de Decisão:
Ao nível αααα , Rejeitar a hipótese nula de Homogeneidade se o valor da
•
ET ≥• Alternativamente, calcula-se o
e rejeita-se H0 para todos os níveis superiores ao p-value.
2
2
0 ( 1)
1 1
( )
, tem uma distribuição assintótica de um .
L C ij ij L C i j ij N e sob H e χ − = = −
∑ ∑
| : [ ] j i i j p = P X ∈ A eij = n pi j i| . | ˆij i ˆ j i i ˆ j i N j , 1, , , 1, , e n p n p n j C i L n = = = = ⋯ = ⋯ 2 2 2 0 ( 1)( 1) 1 1 ˆ ( ), tem uma distribuição assintótica de um . ˆ L C ij ij L C i j ij N e X sob H e χ − − = = − = ∑ ∑ 1 2 (L 1)(C 1) α χ − − − ( 1)( 1) 2 2 [ ] L C p value P χ x − − = > −
TESTE DO QUI-QUADRADO - Teste de Homogeneidade
TESTE DO QUI-QUADRADO - Teste de Homogeneidade
(de Populações independentes)
Exemplo 7 O Senhor Afonso, director da Academia de
Manequins Continental, tem muito orgulho na sua escola e argumenta que os seus manequins são melhores profissionais do que os da sua concorrente, a Senhora D. Barbara, dos
Modelos Jovens. Numa avaliação destas duas escolas de
manequins, as classificações obtidas pelos manequins foram:
Com base nas classificações, haverá evidência para duvidar de que as duas escolas fornecem profissionais do mesmo nível?
11 35 4 Esc D.Bárbara 5 45 10 Esc SrAfonso Mediocre Suficiente Muito Bom X1 , X2
TESTE DO QUI-QUADRADO - Teste de Homogeneidade
(de Populações independentes)
H0: P(MB|Afonso)= P(MB|Barbara); P(Suf|Afonso)= P(Suf|Barbara); P(Med|Afonso)= P(Med |Barbara)
H1: Alguma das igualdades anteriores não se verifica
Sob H0, o valor observado da estatística de teste:
p-value:
• Decisão: Rejeitar a hipótese de que os manequins das duas escolas tem o mesmo nível de qualidade, para valores de significância α ≥ 7.43%.
n=n1+n2=110 n.3=16 n.2=80 n.1=14 n2=50 n23=11 n22=35 n21=4 X2:Esc D.Bárbara n1=60 n13=5 n12=45 n11=10 X1:Esc Sr.Afonso Mediocre Suficiente Muito Bom X1 , X2 2 2 2 (L 1)(C 1) (2 1)(3 1) (2) χ − − = χ − − = χ 2 (2) [ 5.20] 0.074274 P χ > = 2 x