TESTES PARA A PROPORC ¸ ˜ AO E O TESTE DO QUI-QUADRADO
Departamento de Matem´atica 2021
Teste do Qui-quadrado: associa¸ c˜ ao ou de independˆ encia
Considere duas vari´aveis aleat´oriasX eY categ´oricas provenientes de uma popula¸c˜ao bivariada, pretende-se testar:
H0: X eY s˜ao independentes;
H1: X eY n˜ao s˜ao independentes.
Em alternativa, as hip´oteses podem ser formuladas da seguinte forma:
H0: N˜ao existe associa¸c˜ao entreX eY; H1: Existe associa¸c˜ao entreX eY.
Teste do Qui-quadrado
A metodologia a seguir ´e :
. Agrupar os dados da vari´avel X em I categorias mutuamente exclusivas;
. Agrupar os dados da vari´avel Y em J categorias mutuamente exclusivas;
. Calcular as frequˆencias observadas,nij, para a categoria i de X e j de Y;
. SupondoH0verdadeira, calcular as frequˆencias esperadas,eij= ni.×nn .j comni.=PJ
j=1nij,n.j=PI
i=1nij en=PI
i=1
PJ j=1nij; . SupondoH0verdadeira, calcular
ET=
I
X
i=1 J
X
j=1
(nij−eij)2 eij
∼χ2((I−1)(J−1));
Teste do Qui-quadrado
Requisitos exigidos:
. N˜ao existirem mais de 20% de categorias com frequˆencias esperadas inferiores a 5;
. Todas as categorias devem ter frequˆencias esperadas superiores ou iguais a 1.
Teste do Qui-quadrado
Inconvenientes:
. Para amostras pequenas, o p-valor poder´a conter um erro apreci´avel. No caso de tabelas 2×2 e sempre quen<20 deve-se recorrer ao teste de Fisher;
. Devido `a natureza discreta da contagem das frequˆencias, o valor da estat´ıstica do qui-quadrado vem acrescida de um erro. No caso de tabelas 2×2 deve-se utilizar uma correc¸c˜ao da continuidade (fornecida pelo SPSS e R).
Exemplo (birthwt):
Pretende-se testar, ao n´ıvel de significˆancia de 5%, a associa¸c˜ao entre as vari´aveisSMOKE eLOW:
H0: O estatuto fumador da m˜ae (SMOKE) e o estatuto de baixo peso ao nascer (LOW) s˜ao independentes;
ou
H0: N˜ao existe associa¸c˜ao entre o estatuto fumador da m˜ae e o nascimento de crian¸cas com baixo peso ;
H1: O estatuto fumador da m˜ae (SMOKE) e o estatuto de baixo peso ao nascer (LOW) n˜ao s˜ao independentes.
ET= 4.236 df = 1
p−valor=P(ET>4.236) = 0.040
Rejeita-se a hip´otese nula ao n´ıvel de significˆancia de 5%.
Teste Qui-Quadrado de homogeneidade
O teste Qui-Quadrado de homogeneidade pode ser utilizado para testar a afirma¸c˜ao de que diferentes popula¸c˜oes tˆem a mesma propor¸c˜ao de indiv´ıduos com alguma caracter´ıstica.
B1 ... Bs
A1 O11 ... O1s O1.
A2 O21 ... O2s O2.
... ... ... ... ...
Ar Or1 ... Ors Or.
O.1 ... O.s O..
A hip´otese de homogeneidade ´e: H0:pj|1=pj|2=...=pj|r,j= 1, ...,s. A ET segue uma distribui¸c˜ao qui-quadrado com (r−1)(s−1) graus de liberdade.
Exemplo (birthwt):
O teste Qui-Quadrado de homogeneidade pode ser utilizado para averiguar:
Baixo Peso
ra¸ca N˜ao Sim
White 73 23
Black 15 11
Other 42 25
A hip´otese de homogeneidade ´e neste caso: H0:P(Baixo peso|Raca¸ =0 White0) =P(Baixo peso|Raca¸ =0Black0) =P(Baixo peso|Raca¸ =0Other0).
Amostras emparelhadas: o teste de McNemar
O teste de McNemar ´e um teste estat´ıstico utilizado em dados nominais emparelhados. ´E utilizado em tabelas de contingˆencia 2×2, ou seja para duas vari´aveis bin´arias.
Neste caso, conv´em registar pares de observa¸c˜oes, que correspondem a contagens que referem pares de respostas correlacionadas (do mesmo indiv´ıduo).
O teste ´e aplicado a uma tabela de contingˆencia que apresenta os resultados como segue:
Depois: presente Depois: ausente
Antes: presente a b a+b
Antes: ausente c d c+d
a+c b+d n=a+b+c+d
Amostras emparelhadas: o teste de McNemar
O teste de Mcnenar centra a aten¸c˜ao apenas nas altera¸c˜oes (pares discordantes): ausente−→presente; presente−→ausente.
H0:P(ausente−→presente) =P(presente−→ausente) H1:P(ausente−→presente)6=P(presente−→ausente) O teste estat´ıstico de McNemar ´e:
χ2=(b−c)2 b+c
Sob a hip´otese nula, com um n´umero suficientemente grande de discordantes (c´elulas b e c),χ2tem uma distribui¸c˜ao qui-quadrado com 1 grau de liberdade.
Amostras emparelhadas: o teste de McNemar
Exemplo: Um investigador pretende determinar se um medicamento tem um efeito sobre uma determinada doen¸ca. As contagens de indiv´ıduos
encontram-se na tabela, com o diagn´ostico (doen¸ca: presente ou ausente), antes do tratamento dado nas linhas, e o diagn´ostico ap´os o tratamento nas colunas. O teste requer os mesmos indiv´ıduos a serem testados nas medi¸c˜oes, antes e depois.
Depois: presente Depois: ausente Total da linha
Antes: presente 101 121 222
Antes: ausente 59 33 92
Total da coluna 160 154 314
Amostras emparelhadas: o teste de McNemar
Um investigador pretende estudar o impacto de um tratamento sobre a dor nas articula¸c˜oes. Neste estudo, foram recrutados 1455 participantes. Os resultados reportados pelos indiv´ıduos antes e depois de um tratamento est˜ao referidos na tabela em baixo.
Depois: presente Depois: ausente Total
Antes: presente 380 785 1165
Antes: ausente 75 215 290
Total 455 1000 1455
Teste correla¸ c˜ ao ordinal de Spearman
Considere duas vari´aveis aleat´oriasX eY provenientes de uma popula¸c˜ao bivariada, pretende-se testar:
H0: As vari´aveisX eY s˜ao independentes;
H1: As vari´aveisX eY n˜ao s˜ao independentes;
A metodologia a seguir ´e :
. Atribuir um n´umero de ordem a cada observa¸c˜ao para cada uma das vari´aveis. Quando existem valores repetidos atribui-se a cada um dos valores repetidos a ordem m´edia das ordens correspondentes a esses valores;
. Calcular, para cada observa¸c˜ao, a diferen¸ca,di, dos n´umeros de ordem;
. Calcular a estat´ıstica de teste:
rs= 1−6Pn i=1di2
n(n2−1) onden−n´umero total de observa¸c˜oes;
. Para amostras de pequena dimens˜ao recorre-se `a distribui¸c˜ao exacta ders
que se encontra tabelada;
. SupondoH0verdadeira, quandon>30, ET= rs
p(1−rs2)/(n−2) ∼t(n−2).
Exemplo (birthwt):
Pretende-se testar, ao n´ıvel de significˆancia de 5%, a associa¸c˜ao entre o peso das m˜aes (vari´avelLWT) e o peso das crian¸cas no nascimento (vari´avelBWT):
H0: O peso da m˜ae na ´ultima menstrua¸c˜ao (LWT) e o peso das crian¸cas ao nascer (BWT) s˜ao independentes;
ou
H0: N˜ao existe associa¸c˜ao entre o peso da m˜ae na ´ultima menstrua¸c˜ao e o peso das crian¸cas ao nascer;
H1: O peso da m˜ae na ´ultima menstrua¸c˜ao (LWT) e o peso das crian¸cas ao nascer (BWT) n˜ao s˜ao independentes.
rs= 0.249 p−valor= 0.001
Rejeita-se a hip´otese nula ao n´ıvel de significˆancia de 5%.
Exemplos de bases de dados a trabalhar
. Bases de dados trabalhadas em ANOVA (bronch-react, deemice, smoking-moms).
. anorexia . BMI . evans . framimgham . titanic