dismenorreia moderada 1.71 0.950 3.12 6.86e-02 dismenorreia intensa 1.54 0.980 2.42 5.11e-02 dismenorreia incapacitante 2.10 1.042 4.25 2.69e-02
M-H combined 1.91 1.496 2.45 1.36e-07
M-H Chi2(1) = 27.77 , P value = 0
Homogeneity test, chi-squared 4 d.f. = 6.9 , P value = 0.141 O resultado obtido por meio da raz˜ao de chances combinada pelom´etodo de Mantel-Haenszel sugerem que a chance de endometriose para pacien-tes com sintomas de esterilidade ´e 1,91 (IC95%: 1,5 - 2,45) vezes a chance de endometriose para pacientes sem esses sintomas, independentemente da intensidade da dismenorreia. Detalhes sobre a t´ecnica de Mantel-Haenszel s˜ao apresentados na Nota de Cap´ıtulo 4.
O desvio padr˜ao amostral daj-´esima componente ´esj = (sjj)1/2, j= 1, . . . , p. Denotando por D a matriz diagonal de ordem p×p com o j-´esimo elemento da diagonal igual a sj, a matriz de correla¸c˜oes ´e definida por
R=D−1SD−1= [ruv]. (5.6) em que rvv=rv = 1, v= 1, . . . , perv ≥ruv para todou6=v.
O coeficiente de correla¸c˜ao amostral entre as vari´aveisXueXv ´e dado por
ruv= suv
√susv, (5.7)
com −1≤ruv≤1 eruv =rvu para todo u, v.
Em muitas situa¸c˜oes tamb´em s˜ao de interesse as somas de quadrados de desvios, nomeadamente
Wvv= Xn i=1
(xiv−xv)2, v = 1, . . . , p (5.8) e as somas dos produtos de desvios, a saber,
Wuv = Xn
i=1
(xiu−xu)(xiv−xv), u, v= 1, . . . , p. (5.9)
Exemplo 5.9. Os dados dispostos na Tabela 5.4 correspondem a cinco agentes de seguros para os quais foram observados os valores das vari´aveisX1 = n´umero de anos de servi¸co eX2 = n´umero de clientes.
Tabela 5.4: N´umero de anos de servi¸co e n´umero de clientes para cinco agentes de seguros
Agente X1 X2
A 2 48
B 4 56
C 5 64
D 6 60
E 8 72
Para os dados da Tabela 5.4, a matriz de dados ´e X> =
2 4 5 6 8 48 56 64 60 72
,
de modo que
x1= 1 5
X5 i=1
xi1 = 1
5(2 + 4 + 5 + 6 + 8) = 5,
x2 = 1 5
X5 i=1
xi2 = 1
5(48 + 56 + 64 + 60 + 72) = 60 e o vetor de m´edias ´e
x= x1
x2
= 5
60
.
A matriz de desvios em rela¸c˜ao `as m´edias ´e
Y =
2 48 4 56 5 64 6 60 8 72
−
1 1 1 1 1
[5 60] =
2-5 48-60 4-5 56-60 5-5 64-60 6-5 60-60 8-5 72-60
=
-3 -12 -1 -4
0 4
1 0
3 12
e as correspondentes matrizes de covariˆancias e correla¸c˜oes s˜ao, res-pectivamente,
S= 1
5−1Y>Y=
5 19 19 80
e R=
1 0,95 0,95 1
.
As variˆancias e covariˆancias amostrais s˜ao respectivamente, s11= 1
4 X5 i=1
(xi1−x1)2= 5, s22= 1 4
X5 i=1
(xi2−x2)2 = 80,
s12==s21= 1 4
X5 i=1
(xi1−x1)(xi2−x2) = 19 ao passo que as correla¸c˜oes amostrais s˜ao dadas por
r11=r22= 1 e r12=r21= s12
√s11s22 = 19
√5×80 = 0,95.
2) Lowess
Muitas vezes, gr´aficos de dispers˜ao (simb´olicos ou n˜ao) s˜ao utilizados para a identifica¸c˜ao de curvas que possam representar a rela¸c˜ao en-tre as vari´aveis sob avalia¸c˜ao. Por exemplo, pode haver interesse em saber se uma vari´avel ´e uma fun¸c˜ao linear ou quadr´atica da outra.
O ajuste de uma curva suave aos dados pode ser realizado or meio da t´ecnica conhecida como lowess (locally weighted regression scat-terplot smoothing). Essa t´ecnica de suaviza¸c˜ao´e realizada por meio de sucessivos ajustes de retas por m´ınimos quadrados ponderados (ver Cap´ıtulo 6) a subconjuntos dos dados.
Consideremos, as coordenadas (xj, yj), j = 1, . . . , n de um conjunto de dados, por exemplo, correspondentes aos pontos associados aos ve´ıculos drv=4 na Figura 5.5. O ajuste de uma curva suave a es-ses pontos por meio da t´ecnica lowess ´e baseado na substitui¸c˜ao da coordenada yj por um valor suavizado byj obtido segundo os seguintes passos:
i) Escolha uma faixa vertical centrada em (xj, yj) contendoqpontos conforme ilustrado na Figura 5.12 (em que q = 9). Em geral, escolhemos q = [n×p] em que 0 < p < 1, tendo em conta que quanto maior forp, maior ser´a o grau de suaviza¸c˜ao.
xj
yj
dj
xj (xj,byj)
Figura 5.12: Faixa centrada em (xj, yj) para suaviza¸c˜ao por lowess.
ii) Use uma fun¸c˜ao sim´etrica em torno dexj para atribuir pesos aos pontos na vizinhan¸ca de (xj, yj). Essa fun¸c˜ao ´e escolhida de forma que o maior peso seja atribu´ıdo a (xj, yj) e que os demais pesos diminuam `a medida quex se afasta de xj. Com essa finalidade, utiliza-se a fun¸c˜ao tric´ubica
h(u) =
(1− |u|3)3, se|u|<1
0, em caso contr´ario.
O peso atribu´ıdo a (xk, yk) ´e h[(xj − xk)/dj] em que dj ´e a distˆancia entre xj e seu vizinho mais afastado dentro da faixa selecionada em i) conforme ilustrado na Figura 5.13.
xj
yj
dj
dj
Figura 5.13: Atribui¸c˜ao de pesos para suaviza¸c˜ao por lowess.
iii) Ajuste uma reta y =α+βx+eaos q pontos da faixa centrada em xj, por meio da minimiza¸c˜ao de
Xq k=1
hj(xk)(yk−α−βxk)2,
obtendo os estimadores αb e β. O valor suavizado deb yk ´e byk = b
α+βxb k,k= 1, . . . , q.
iv) Calcule os res´ıduos bek =yk−ybk,k = 1, . . . , q e por meio de um gr´afico de dispers˜ao, por exemplo, identifique poss´ıveis pontos dis-crepantes (outliers). Quando existirem, refa¸ca os c´alculos, atri-buindo pesos menores aos maiores res´ıduos, por meio da fun¸c˜ao biquadr´atica
g(u) =
(1− |u|2)2, se|u|<1
0, em caso contr´ario.
O peso atribu´ıdo ao ponto (xk, yk) ´eg(xk) =g(bek/6m) em quem
´e a mediana dos valores absolutos dos res´ıduos (|bek|). Se o res´ıduo b
ekfor muito menor do que 6m, o peso a ele atribu´ıdo ser´a pr´oximo de 1; em caso contr´ario, ser´a pr´oximo de zero. A raz˜ao pela qual utilizamos o denominador 6m ´e que se os res´ıduos tiverem uma distribui¸c˜ao Normal com variˆanciaσ2, ent˜aom≈2/3 e 6m≈4σ.
Isso implica que para res´ıduos Normais, raramente teremos pesos pequenos.
v) Finalmente, ajuste uma nova reta aos pontos (xk, yk) com pesos h(xk)g(xk). Se (xk, yk) corresponder a um ponto discrepante, o res´ıduo bek ser´a grande, mas o peso atribu´ıdo a ele ser´a pequeno.
vi) Repita o procedimento duas ou mais vezes, observando que a pre-sen¸ca de pontos discrepantes exige um maior n´umero de itera¸c˜oes.
Gr´aficos das fun¸c˜oes tric´ubica [h(u)] e biquadr´atica [g(u)] est˜ao exibi-dos na Figura 5.14.
−1.0 −0.5 0.0 0.5 1.0
0.00.20.40.60.81.0
u
h(u)
−1.0 −0.5 0.0 0.5 1.0
0.00.20.40.60.81.0
u
g(u)
Figura 5.14: Gr´aficos das fun¸c˜oes tric´ubica [h(u)] e biquadr´atica [g(u)].
Para mais detalhes sobre o m´etodo lowess bem como sobre outros m´etodos de suaviza¸c˜ao o leitor poder´a consultar Morettin e Tol´oi (2018), por exemplo.
O gr´afico da Figura 5.15 cont´em curvas lowess (com dois n´ıveis de suaviza¸c˜ao) ajustadas aos pontos do conjunto de dados rotarod ob-tidos de um estudo cujo objetivo era propor um modelo para avaliar a evolu¸c˜ao de uma vari´avel ao longo do tempo. O gr´afico sugere um modelo de regress˜ao segmentada,i.e. em que a resposta m´edia as-sume um valor constante at´e um ponto de mudan¸ca, a partir do qual a uma curva quadr´atica pode representar a sua varia¸c˜ao temporal. Os comandos utilizados para a constru¸c˜ao da figura s˜ao
> par(mar=c(5.1,5.1,4.1,2.1))
> plot(rotarod$tempo, rotarod$rotarod, type=’p’, xlab = "Tempo", ylab ="Rotarod",
cex.axis = 1.3, cex.lab = 1.6)
> lines(lowess(rotarod$rotarod ~ rotarod$tempo, f=0.1), col=1, lty=2, lwd =2)
> lines(lowess(rotarod$rotarod ~ rotarod$tempo, f=0.4), col=2, lty=1, lwd =2)
8 10 12 14 16 18 20
050100150
Tempo
Rotarod
Figura 5.15: Curvas lowess com diferentes parˆametros de suaviza¸c˜ao ajus-tadas a um conjunto de dados.
3) Parametriza¸c˜ao de desvios m´edios
Com a finalidade de explicitar efeitos principais e intera¸c˜ao no modelo,
´e comum considerar-se a reparametriza¸c˜ao µij =µ+αi +βj+αβij,
que implica o modelo
yijk=µ+αi+βj +αβij+eijk, (5.10) i = 1, . . . , a, j = 1, . . . , b, k = 1, . . . , m. Muitos autores, como Nel-der et al. (1988), interpretam erroneamente os parˆametros µ, αi, βj, αβij, respectivamente, como “m´edia geral”, “efeito principal do n´ıvel i do fator A”, “efeito principal do n´ıvel j do fator B” e “intera¸c˜ao entre os n´ıveis i do fatorA e j do fator B”. Esse modelo tamb´em ´e inidentific´avel1 e seus parˆametros s˜ao n˜ao estim´aveis e as restri¸c˜oes de identificabilidade mais frequentemente utilizadas e corresponden-tes `as parametriza¸c˜oes de desvios de m´edias e cela de referˆencia s˜ao, respectivamente,
Xa i=1
αi= Xb j=1
βj = Xa i=1
αβij = Xb j=1
αβij = 0 (5.11) e
α1=β1 =αβ11=. . .=αβ1b =αβ21=. . .=αβa1 = 0 (5.12) Sob as restri¸c˜oes (5.11), pode-se mostrar que
µ= (ab)−1 Xa i=1
Xb j=1
µij, αi=b−1 Xb j=1
µij−µ, βj =a−1 Xa i=1
µij −µ
e que
αβij =µij−b−1 Xb j=1
µij −a−1 Xa i=1
µij.
Sob as restri¸c˜oes (5.12), temos
µ=µ11, αi =µij−µ1j, i= 2, . . . , a, βj =µij −µi1, j = 2, . . . , b, e que
αβij =µij−(µ11+αi+βj), i= 2, . . . , a, j= 2, . . . , b,
de forma que os parˆametros αi, i= 2, . . . , a podem ser interpretados como efeitos diferenciais entre as respostas esperadas das unidades amostrais submetidas ao n´ıvel ido fator A relativamente `aquelas ob-tidas por unidades amostrais submeob-tidas ao tratamento associado ao
1Um modelo F(θ), dependendo do parˆametro θ ⊂ Θ, ´e identific´avel se para todo θ1, θ2 ⊂Θ, θ1 6=θ2 temos F(θ1)6=F(θ2). Em caso contr´ario, o modelo ´e dito inidenti-fic´avel. Por exemplo, consideremos o modeloyi∼N(µ+αi, σ2),i= 1,2 em quey1 ey2
s˜ao independentes. Tomandoθ= (µ, α1, α2)>como parˆametro, o modelo ´e inidentific´avel, pois tanto paraθ1 = (5,1,0)>quanto para θ2= (4,2,1)>6=θ1, a distribui¸c˜ao conjunta de (y1, y2) ´e N2[(6,6)>, σ2I2]. O leitor poder´a consultar Bickel e Doksum (2001), entre outros, para detalhes.
n´ıvel 1 do fator A, mantido fixo o n´ıvel correspondente ao fator B.
Analogamente, os parˆametros βj, j = 2, . . . , b podem ser interpreta-dos como efeitos diferenciais entre as respostas esperadas das unidades amostrais submetidas ao n´ıvel j do fatorB relativamente `aquelas ob-tidas por unidades amostrais submeob-tidas ao tratamento associado ao n´ıvel 1 do fator B, mantido fixo o n´ıvel correspondente do fator A.
Os parˆametrosαβij, i= 2, . . . , a, j= 2, . . . bpodem ser interpretados como diferen¸cas entre as respostas esperadas das unidades amostrais submetidas ao tratamento correspondente `a cela (i, j) e aquela espe-rada sob um modelo sem intera¸c˜ao.
4) A estat´ıstica de Mantel-Haenszel
A estat´ıstica de Mantel-Haenszel ´e utilizada para avaliar a associa¸c˜ao em conjuntos de tabelas 2 ×2 obtidas de forma estratificada segundo o paradigma indicado na Tabela 5.5, com apenas dois estratos, para simplifica¸c˜ao.
Tabela 5.5: Frequˆencia de pacientes Fator Status do paciente
Estrato de risco doente s˜ao Total 1 presente n111 n112 n11+
ausente n121 n122 n12+
Total n1+1 n1+2 n1++
2 presente n211 n212 n21+
ausente n221 n222 n22+
Total n2+1 n2+2 n2++
Uma estimativa da raz˜ao de chances para o estrato h ´e rch= nh11nh22
nh12nh21.
A estimativa da raz˜ao de chances comum proposta por Mantel e Ha-enszel (1959) ´e uma m´edia ponderada das raz˜oes de chances de cada um dos H estratos com pesos
wh = nh12nh21 nh++ /
XH h=1
nh12nh21 nh++ , ou seja
rcM H = XH h=1
whrch = XH h=1
nh12nh21
nh++ ×nh11nh22 nh12nh21/
XH h=1
nh12nh21 nh++
= XH h=1
nh11nh22 nh++ /
XH h=1
nh12nh21 nh++
Consideremos, por exemplo, os dados dispostos na Tabela 5.6 prove-nientes de um estudo cujo objetivo ´e avaliar a associa¸c˜ao entre um fator de risco e a ocorrˆencia de uma determinada mol´estia com dados obtidos em trˆes cl´ınicas diferentes.
Tabela 5.6: Frequˆencias de pacientes em um estudo com trˆes estratos
Fator Doen¸ca Raz˜ao
Cl´ınica de risco sim n˜ao Total de chances
A presente 5 7 12 2,86
ausente 2 8 10
B presente 3 9 12 2,00
ausente 1 6 7
C presente 3 4 7 2,63
ausente 2 7 9
A estimativa da raz˜ao de chances proposta por Mantel-Haenszel ´e rcM H = (5×8)/22 + (3×6)/19 + (3×7)/16
(7×2)/22 + (9×1)/19 + (4×2)/16 = 2,53.
Uma das vantagens da raz˜ao de chances de Mantel-Haenszel ´e que ela permite calcular a raz˜ao de chances comum mesmo quando h´a frequˆencias nulas. Vamos admitir que uma das frequˆencias da Tabela 5.6, fosse nula, como indicado na Tabela 5.7
Tabela 5.7: Tabela com frequˆencia nula
Fator Doen¸ca Raz˜ao
Cl´ınica de risco sim n˜ao Total de chances
A presente 5 7 12 ∞
ausente 0 10 10
B presente 3 9 12 2,00
ausente 1 6 7
C presente 3 4 7 2,63
ausente 2 7 9
Embora a raz˜ao de chances para o estrato A seja “infinita”, a raz˜ao de chances de Mantel-Haenszel pode ser calculada,
rcM H = (5×10)/22 + (3×6)/19 + (3×8)/16
(7×0)/22 + (9×1)/19 + (4×2)/16 = 6,56.
Outra vantagem da estat´ıstica de Mantel-Haenszel ´e que ela n˜ao ´e afetada peloParadoxo de Simpson, que ilustramos por meio de um exemplo em que a opini˜ao sobre um determinado projeto foi avaliada com moradores de duas regi˜oes, obtendo-se os dados apresentados na Tabela 5.8.
Tabela 5.8: Tabela com frequˆencias relacionadas com a prefrˆencia por dois projetos
Opini˜ao Raz˜ao
Regi˜ao Projeto favor´avel desfavor´avel Total de chances
1 A 50 950 1000 0,47
B 1000 9000 10000
Total 1050 9950 10000
2 A 5000 5000 1000 0,05
B 95 5 100
Total 5095 5005 10100
Segundo a Tabela 5.8, em ambas as regi˜oes, h´a uma preferˆencia pelo Projeto B ou seja, a chance de preferˆencia pelo projeto B ´e pelo menos o dobro daquela de preferˆencia pelo Projeto A. Se agruparmos os dados somando os resultados de ambas as regi˜oes, obteremos as frequˆencias dispostas na Tabela 5.9.
Tabela 5.9: Frequˆencias agrupadas correspondentes `a Tabela 5.8
Opini˜ao Raz˜ao
Projeto favor´avel desfavor´avel Total de chances
A 5050 5950 11000 6,98
B 1095 9005 10100
Total 6145 9950 21100
A raz˜ao de chances obtida com os dados agrupados indicam que a chance de preferˆencia pelo Projeto A ´e cerca de 7 vezes aquela de pre-ferˆencia pelo Projeto B. Essa aparente incongruˆencia ´e conhecida como o Paradoxo de Simpson e pode ser explicado por uma forte associa¸c˜ao (com rc= 0,001) entre a vari´avel Regi˜ao e Projeto como indicado na Tabela 5.10.
Tabela 5.10: Frequˆencias de pacientes favor´aveis a cada projeto
Regi˜ao Raz˜ao
Projeto 1 2 Total de chances
A 1000 10000 11000 0,001
B 10000 100 10100
Total 11000 10100 21100
A estat´ıstica de Mantel-Haenszel correspondente ´e rcM H = (50×9000)/11000 + (5000×5)/10100
(950×1000)/11000 + (5000×95)/10100 = 0,33 preservando a associa¸c˜ao entre as duas vari´aveis de interesse. Detalhes sobre o Paradoxo de Simpson podem ser encontrados em Paulino e Singer (2006).