UNIVERSIDADE ESTADUAL DE CAMPINAS
(UNICAMP)
INSTITUTO DE MATEMÁTICA, ESTATÍSTICA E CIÊNCIA DA COMPUTAÇAO
{IMECC)
"Teste Assintótico da Razão de Verossimilhança para a
Homogenei-dade entre Riscos Relativos sob um Novo Delineamento."
CARLOS ALEXANDRE DADOORIAN
Orientador: Professor Dr. SEBASTIÃO DE AMO RIM
CAMPINAS - SAO PAULO -BRASIL
DEZEMBRO DE 1992
TESTE ASSINTÓTICO DA RAZÃO DE VEROSSIMILHANÇA PARA A HOMOGENEIDADE ENTRE RISCOS RELATIVOS SOB UM NOVO
DELINEAMENTO
Este exemplar corresponde à redação fmal da dissertação devidamente corrigida e definida por Carlos Alexandre Dadoorian e aprovada pela comissão julgadora.
Campinas, 16 de dezembro de 1992.
stião de Amorim · ntador
Dissertação apresentada ao Instituto de Matemática, Estatística e Computação Científica, UNICAMP, como requisito parcial para obtenção do Título de
"Brilhar para sempre Brilhar como um farol Brilhar como brilho eterno Gente é pra brilhar
Que tudo mais vá pro inferno Este é meu slogan
E o do Sol."
Agradecimentos
Primeiro a quem dedico este trabalho, sem dúvida alguma foram minhas mawres fontes de força em momentos de crise.
Ao Professor Sebastião de Amorim, ou simplesmente Mestre, por razões diversas e marcantes: meu orientador, chefe e amigo. Muito da estatística que hoje utilizo é fruto de inúmeras conversas formais e informais que travamos, chegando às vezes em discussões quase sem fim; e este tema tão interessante que ele me permitiu desenvolver.
Aos Professores do Departamento de Estatística do IMECC, pelos conhecimentos e oportunidades do dia-a-dia. Em especial aos amigos Eliana, Mauro e Hotta.
Ao Professor Djalma C.G. Pessoa, membro de minha banca e da escola onde descobri, aos 14 anos, a palavra estatística; aproveito o momento e mando um beijo bem forte a todos da ENCE - amigos, professores, funcionários e aos que passaram por lá e cruzamos nossas vidas. Aqui em especial cito o Professor Alcides Malaquias.
Aos meus amigos de turma que sem dúvida alguma souberam levar a sério esta palavra. Formamos uma equipe nota dez. Espero que passemos adiante tudo que juntos aprendemos, como por exemplo, fazer café, molho branco, quibe, feijão tropeiro, festas, etc ... Um abraço do tamanho do Corcovado!
Aos meus amigos de Mestrado, principalmente os que me deram a chance de monitorá-los e ouviram as opiniões deste chato aqui.
Aos meus amigos da SOMA Estatística, ala Campinas e ala Catanduva. Excelentes momentos vivi junto a vocês. Tudo bem, alguns foram chatos, mas destes "estou fora"! Um obrigado também pela utilização de seus equipamentos.
Às minhas meninas Mariângela e Ignês Amêndola, por tudo que me proporcionaram. Um grande beijo!
Aos amigos Carlos Henrique e Ana Paula pelo uso do computador, casa, telefone e etc... Adoro vocês!
A todos os meus parentes. Não vou citar um a um senão vira lista telefônica! Obrigado por tudo que vocês me dão!
Aos funcionários do IMECC, principalmente Cidinha e Bel, e às tias do café. Grande cafezinho!
À Instituição CNPq pela bolsa de Mestrado e à UNICAMP pela bolsa de Monitoria . ... e finalmente a quem se sentir esquecido.
Aos meus pais,
Carlos e Elba, vó Lia, Tidy e Beinny,
pela força e amorj
À memória de minha avó Noêmia, pela coragem de ter feito
ÍNDICE
Capítulo I- Conceitos Básicos e Revisão Bibliográfica da Associação de Duas Variáveis 1
1.1. Uma Breve Revisão ... .- ... 3
1.2. Um Novo Delineamento ... 4
1.3. A Extensão do Delineamento U para k Pares de Populações ... 6
Capítulo II - Testando a Homogeneidade entre os lliscos Relativos ... 7
2.1. Generalização do Delineamento U para k Pares de Populações ... 8
2.2. O Caso k = 2 ... 10
2.2.1. Os Estimadores de Máxima Verossimilhança ... 11
2.2.2. Os Estimadores de Máxima Verossimilhança Restritos a H o ... 12
2.2.3. O Estudo sobre </> • . . . • • • . . . . . . • • • • . . . . . . • . • . . . . . . . . . . . . . . . . . . . . 15
2.3. A Extensão para Outros Valores de k ... 17
Capítulo IH - Algoritmos e Aplicação do Teste de Homogeneidade sob o Delineamento U para Dois Pares de Populações ... 20
3.1. Os Algoritmos ... 22
3.1.1. A Simulação da Realização do Experimento ... 22
3.1.2. A Busca de </> e o Cálculo de
POi ...
243.1.3. Algoritmo para o Cálculo dos Máximos ... 27
3.1.3.1. Máximo Global ... 28
3.2. O Programa Principal ... 31 3.3. Resultados e Comentários ... 34 3.4. Gráficos e Tabelas Apêndice 1 ... 48 Referências Bibliográficas ... 51 Bibliografia ... 51
'
CAPITULO I
CONCEITOS BÁSICOS E REVISAO
BIBLIOGRÁFICA DA ASSOCIAÇÃO
DE DUAS VARIÁVEIS
A associação entre duas variáveis categóricas binárias é um tema de grande interesse em praticamente todas as áreas onde a estatística é empregada. O estudo destas variáveis tem um papel central nestas diversas áreas devido à sua generalidade natural, somado ao fato que diversos modelos mais complexos podem ser simplificados para uma abordagem preliminar binária.
Considerando a situação em que se tem uma variável binária e duas populações
dis-tintas (Po e P1 ) é frequentemente de interesse estimarmos a razão entre as proporções p0
e Pl· Formalmente temos cP =~,onde Po e P1 são as proporções em questão.
PO
Exemplo 1.1
-Em decorrência do uso frequente destes conceitos na área médica, onde a variável binária pode se referir, por exemplo, à ocorrência ou não de uma determinada doença, é comum se designar rjJ como o risco relativo, a razão entre as taxas de risco, em duas subpopulações distintas. Por exemplo, considerando o hábito de fumar como critério de partição de uma população em duas subpopulações, pode se definir:
Po, como a taxa de risco {de contração da doença) entre não fumantes
PI, como taxa de risco entre fumantes; e
rjJ = Pl, como o risco relativo. Po
O delineamento clássico para a estimativa de <P extrai de P0 e P1 amostras aleatórias
com reposição (AAS-CR) de tamanhos
no
e n1, respectivamente. O número de sucessos em cada caso,X
o e X1, são então variáveis aleatórias independentes, ondeX
o,...b(no,Po)
e X1 ~ b(n1,p,).
Definindo
Po
= Kfl no e p1 = Kl, os estimadores de ntPo
e p1, um estimador natural para4>
parece então ser dado porOs graves problemas com esta opção- por exemplo, seu valor pode ser indeterminado e, dado que é determinado, sua esperança é oo -induziram um grande esforço no sentido de buscar alternativas que contornassem tais problemas. Frequentemente interessa ao pesquisador testar a hipótese nula H o:
4>
=4>o
versus a alternativa H1 : 4>=f
t/>o,
e um caso particular muito comum ocorre quando4>o
= LNeste capítulo apresentaremos sumariamente uma revisão bibliográfica desta liter-atura, mostrando a evolução em relação à maneira de se abordar este problema. Em particular, destacam nesta área os trabalhos de John J. Gart.
Mais recentemente Boché
[1
J apresentou uma abordagem nova que, adotando um delineamento sequencial que conjuga uma binomial com uma binomial negativa, permitiu um estimador Uniforme de Máxima Verossimilhança Não Viciado (UMVNV) para4>,
com expressão fechada para a variância.Neste trabalho apresentamos a extensão deste novo delineamento para o problema do teste de homogeneidade para dois ou mais pares de subpopulações (Pai, Pli, i= 1, 2, 3, ... , k), com ênfase para k = 2.
A estratificação natural da população em estudo em k estratos, cada um com duas sub-populações, é definida por uma terceira variável, denominada de confundimento. Seguindo o exemplo do início deste capítulo, podemos supor que a relação entre o fumo e a incidência da doença seja diferente entre homens e mulheres. Porém, a ocorrência de diversos pareS de populações não é sempre produto de estratificação. É comum termos uma série de dados pareados segundo dois tratamentos, por exemplo. Em epidemiologia temos casos específicos como o estudo do caso-controle (ou retrospectivo) e o estudo de caso-coorte.
Em qualquer uma destas situações teremos, para cada par, uma medida de associação. Portanto, devemos estar atentos a duas situações práticas: o caso de termos poucos pares de populações e grande número de observações ou o caso de muitos pares de populações e poucas observações.
Estas características devem ser levadas em consideração, pois a qualidade dos esti-madores e testes para o risco relativo comum estão diretamente ligadas a elas e podem perturbar propriedades, como consistência, por exemplo.
Um teste de hipótese para diversos pares de populações é o da homogeneidade, ou seja, testamos se todos os riscos são iguais ((h=
t/J2
= · · · = t/Jk = ,P). Um caso particular de homogeneidade é tP = 1, que testa também a independência entre as variáveis, em todos os estratos.1.1.
Uma Breve Revisão
A revisão que agora apresentamos tem como in tensão indicar a evolução da abordagem dada ao risco relativo, assim as expressões para os estimadores do risco relativo comum e estatísticas de testes foram suprimidas tendo total indicação em "referências bibliográficas". Em 1971, Gari [2] fez uma revisão bastante minuciosa para o ODDS-RATIO (<p),
estudando o caso de uma tabela 2 x 2, para a combinação de diversas tabelas 2 x 2 e ainda para a combinação de diversas tabelas 2 x t.
Neste artigo Gart supõe que as variáveis sejam independentes e distribuídas pela binomial e, utilizando uma reparametrização pela logística, deriva os estimadores pontuais, o teste de hipótese e intervalos de confiança, para o parâmetro de reparametrização do ODDS-RATIO.
Nota: <P=--; PI@
PoQl
assim quando qo e q1 são próximos de 1 (um), r.p serve como estimativa do risco relativo. Após este trabalho, mais alguns foram apresentados por diversos pesquisadores e Koopmam em [3] apresenta um estimador para o risco relativo comum que Gart em [4] não considera muito eficiente, mas utiliza-o como início para o cálculo das equações de verossimilhança que ele propõe em 1985.
Neste trabalho, Gart [4] considerando k pares de binomiais mutuamente independentes e assumindo a hipótese de homogeneidade entre os riscos relativos (
r/J1
= (jJ2 = . . . = <!Jk = <P), utiliza escores estatísticos baseados na verossimilhança e deriva um intervalo de confiança aproximado para <P como também testes para ifJ = 1.Ainda baseado na teoria dos escores estatísticos, mas supondo que as caudas da dis-tribuição de <P sejam muito assimétricas, Gart (4] introduz um fator de correção visando
melhorar a aproximação para normal.
1.2. Um Novo Delineamento
es-tudo de pequenas amostras foram a mola propulsora para o desenvolvimento de um novo delineamento- delineamento U- apresentado recentemente por Boché [1].
O delineamento U consiste em retirarmos, através de uma amostra aleatória com reposição, itens de P0 até a obtenção do m0-ésimo sucesso - mo fixado a priori. Definindo
No ccmo o número total de itens amostrados, temos que:
[No"' binomial negativa (m0,po).j Faça No= no.
Em seguida, sorteamos de P1 , por AAS-CR, N1 =no elementos.
Seja M1 o número de sucessos obtidos, assim:
/ (M!/ No =no)
~
B(no,Ptl·/• Mt
Definindo
r/Ju
= - , temos que: mo 1.2.1) E(~.)= <P ' <P 1.2.2) V ar(</>.)= - [ 1 - Pl+
</>(1- Po)] mo 1.2.3)~.
- </J _!2_, N(O 1).jva:r(
~.) mo-~ ' 1.2.4) P(Mt = mt) =f
(:o~ ~)Po'(1-
Po)no-mo ( :0)p;"'(1- p,)no-m',
nt=max(1Tl{),ml) O 1
m1 = 0,1,2, ...
Ainda neste trabalho, Boché [1] exploram a aproximação a distribuição normal e testes de hipóteses para pequenas amostras no caso em que rP = 1.
1.3. A Extensão do Delineamento U para k Pares de Populações
A motivação do presente trabalho é de estratificarmos a população em tantos estratos quantos necessários e, após a utilização do delineamento U, verificarmos como testar a hipótese de homogeneidade entre os riscos relativos (</>i; i= 1, 2, ... , k).
Sejam (FOi, Pli); i = 1, 2, 3, ... , k, os diversos pares de sub-populações a serem estu-dados.
Para cada par aplicamos o delineamento U obtendo assim (mru, NOi, M1i), onde o
primeiro índice está relacionado à etapa do delineamento (0, 1) e o segundo ao i-ésimo estrato, de forma que:
1
1 _Mli.
I
'/-'Ui - 1 i= 1, 2,,,, l k,
mOi .
No Capítulo II apresentamos o teste aproximado para testarmos a hipótese de homo-geneidade entre os riscos relativos, em particular para dois estratos (H o : rjJ1 = </>2 = r/J).
Foi utilizado o teste da razão de verossimilhança e explorada a sensibilidade do teste sob o delineamento U, isto é, a partir de que tamanhos de mOi a aproximação é adequada.
Apresentamos as tabelas com valores de (moi, Noi, m1i; i = 1, 2) e o nível de significân-cia estimado.
Ilustrações comparativas com a distribuição acumulada da
xi
também são apresen-tadas.CAPÍTULO 11
TESTANDO A HOMOGENEIDADE ENTRE
OS RISCOS RELATIVOS
Aproveitando o exemplo do Capítulo I, seja rP = Pl, onde Po e Pl são as taxas de
PD
risco entre não fumantes e fumantes, respectivamente.
Suponha agora que tal associação possa ter diferentes valores entre homens e mulheres. Assim, dividimos a população em duas sub-populações, homens e mulheres, com seus riscos relativos dados por:
<f>, = Pn PDl
e cfo2 = Pl2, onde: PD2
p01 : a taxa de risco entre não fumantes do sexo feminino; Pu : a taxa de risco entre fumantes do sexo feminino;
PD2 : a taxa de risco entre não fumantes do sexo masculino;
p11 : a taxa de risco entre fumantes do sexo masculino.
No Exemplo 1.1 consideramos, como motivação, o problema de se comparar, através do risco relativo r/J, a taxa de incidência de uma determinada doença entre não fumantes e fumantes (po, Pl).
Neste capítulo introduzimos uma terceira variável e consideramos o problema de se testar a homogeneidade de r/J nas sub-populações definidas pelos distintos valores desta
Uma situação extrema e curiosa ocorre quando o efeito do fumo é oposto entre sexo masculino e feminino, fazendo que seu efeito global desapareça. Assim, é frequentemente de interesse, antes de se estudar cP para toda população, verificar a legitimidade de se agrupar no mesmo estudo, indistintamente, os dois sexos.
A abordagem estatística para esta aferição é o teste da homogeneidade
I
(H o : ljJ1 =1/!
2 = 1/J vs H1 :q,,
i'
q,,)
I
entre os riscos relativos.
Neste capítulo generalizamos o delineamento U, para k pares de populações, e ex-ploramos os limites de aplicabilidade dos resultados assintóticos associados ao teste da R. V.
2.1. Generalização do Delineamento
U
para
k
Pares de
Popu-lações
Sejam P1, ... , Pk os k estratos em que a população original foi dividida segundo critério baseado na terceira variável, dita de confundimento. Cada estrato é dividido em duas populações, Pai e Pli, segundo a variável classificatória binária. Aplicando o delineamento U, independentemente, em cada estrato, definimos:
mru: número de sucessos fixado na sub-população Po do i-ésimo estrato;
N0i: número de itens amostrados de P0 do i-ésimo estrato, até a obtenção do moi-ésimo sucesso;
M1i: número de sucessos observados na sub-população P1 do i-ésimo estrato.
assim, NOi"' bin.neg.(mru,pru) e, dado NOi, Mli"' b(NOi,Pli)· O esquema a seguir facilita a visualização.
Figura 2.1: Esquema do delineamento U realizado em k pares de populações.
Definindo Ci como a função de verossimilhança associada ao i-ésimo estrato, temos:
(n""-
"''1)
fflOi no.:-moi(no;)
mt; noi-fflli ·1 POi QOi Plí qli , para z = 1, 2, 3, ... , k,
moi- m1i
onde:
QOi = 1 - POii Qli = 1 - Plii
0 < POi $ 1, 0
<
Pli<
1;Seja C a verossimilhança conjunta, isto é, a combinação das k funções de verossimil-hança. Assim:
O teste da R. V. para a hipótese fjJ1 = l/J2 = · · · = 1/Jk = fjJ se baseia então na estatística:
definida por
sup L À = r/J1 =r/J2= .. ·=r/J
supL
Portanto, devemos nos preocupar agora em encontrar o máximo em todo o espaço paramétrica e o máximo restrito ao subespaço definido por fjJ1 = l/J2 = · · · = 1/Jk· Tra-balharemos com log(.\), por conveniência algébrica e pelas propriedades assintóticas desta estatística, já que, sob condições bem gerais,
Embora a função L envolva 2k parâmetros, ela é o produto de k funções Li, cada uma dependendo apenas de seu par exclusivo de parâmetros POi e Pli· Esta propriedade simplifica os trabalhos, na medida em que o máximo de .C é o produto dos máximos dos fatores Ci.
2.2. O Caso
k=
2
Neste trabalho nos concentramos principalmente no caso em que a variável de con-fundimento é também binária, portanto, k = 2.
A utilização do delineamento U para a estimação do risco relativo nos fornece a conjugação de duas variáveis aleatórias, binomial negativa e binomial, para cada par de populações, gerando então suas funções de verossimilhança,
cl
ec2,
de forma que:(nol-1)
m01 not-mo1(n01)
mu not-mn.1 P01 qOl Pn Qn ,
mm- mu
L,
=L' =
(n02-
1)
1 P0202 m"qno2-mo2 (no2)pm"qno2-mi2. 1 2 1 2 'mo2- m12
e a verossimilhança total pela expressão:
Ao utilizarmos o teste da razão de verossimilhança, devemos encontrar, com os re-sultados do experimento, o máximo no espaço paramétrica total e o máximo restrito à hipótese nula (H o: </J1
=
</J2=
</J), de sorte que-2log.\ = -2log <~>~<h~···~<l = -2log 0'~<1,~···~<1 ,
(
sup
L)
(
sup L1 xL,)
sup .C sup !1 x .C2
é a estatística de teste.
O máximo das funções de verossimilhança encontram-se nos estimadores de máxima verossimilhança, que apresentamos a seguir.
2.2.1. Os Estimadores de Máxima Verossimilhança Irrestritos
Vamos encontrar os estimadores de máxima verossimilhança irrestritos de Poi e Pli maximizando
!ogL = logL1 x logL2 em POi e Pli·
Assim, (.Pru,PH) são os EMV de (Poi,Pli), respectivamente, tais que:
sup log
ci
moi x log(fio,) +(No,-mo,) x log(qru)+
m11 x ]og(ji,,)Maximizando cada parte separadamente e aplicando resultado de Boché (pag. 71), temos:
POi i= 1, 2,
Pli i= 1, 2,
os EMV de Pai e Pli, respectivamente, i= 1, 2, ...
2.2.2. Os EMV Restritos a H0
Desejamos testar a homogeneidade entre os riscos relativos (~I e ~2), isto é,
H
oq,,
=q,,
=q,
vsH,
q,,
oi
q,,.
Assim,q,,
Pl! - ::::} Pn=
~P01 POlq,,
- Pl2 - ::::} P12=
~P02· P02Consequentemente, substituindo na função de verossimilhança, obtemos a função de verossimilhança restrita, cujo logaritmo é dado por:
logL; = mo; x log(ftOi) +(No;- mo;) x log(qo;)
+
M,,
x log(1>Po;) +(No;- Mli) x log(1- 1>po;) +C;, para i.= 1,2,que atinge o máximo nos EMV's restritos a Ho(ftoi) e ~ -o valor de ~ que maximiza L:1 e L2 conjuntamente, sujeitos às restrições fiii
=
tPPoi, i=
1, 2.Sob condições gerais e restrito a H0 , temos que:
-2 X <P X NOi
-Pli <PfiOi, i=l,2.
•
Alguns casos particulares exigem um tratamento especial, gerando diferentes esti-madores de ÍJOi.
Temos que:
Para efeito de simplificação, a constante Ci não foi colocada em todos os casos, visto que ela se cancelará em .\. Para o espaço restrito, a notação da verossimilhança será [,ri.
Lembramos que
H
o :r/J1
=r/J2
=
,P, ou seja,Pu
=
r/JPm
e ÍJ12 =<PPo2,
e queA mOi A m1i A M li
POi = N , Pli = N , </Ji = - - , para i = 1, 2,
Oi oi moi
e consideramos os seguintes casos especiais:
Caso 1) mu =O, m12 =O.
.
.
-<jJ1 = O, <1>2 = O
=>
<P = O, a.ssimr -mo2 ( 1 - ) no2 -1n02
Assim, Po1 Po2 mm A - - =Po1 NO! moz A Noz = Po2,
ou seja, os EMV restritos coincidem com os EMV totais.
Os casos a seguir apresentam os resultados levando-se em consideração que em apenas um estrato ocorreu uma situação particular. É claro que nos dois estratos podem ocorrer tais situações, mas a independência entre eles permite que sejam estudados separadamente. Caso 2) Situação: (mn =O, m12
i'
O) ou (m11i'
O, m12 = 0).2.1) Se NOi =mOi,
r -m"(1 ;;;- )No e max J...r, = Poi - 'f'POi ',
onde 2.2) Se Noi
i-
mOi, onde:Oi=
2t
{ - 1 Poi = 1; - 1 paratP
>2'
- 1 para tjJ :::;2
.
fio;= No;+ J(mOi +No;- V(NOt
+~(mo;+
NOi))'- 8 x JNOt x mo;)_ 4 X </J X NOiCaso 3) Situação: (m11
i'
O, m12i'
O).Caso 3.1) mli = Noi e NOi =F mOi,
onde
i= 1,2.
" =<>>(Z- )m"
max J....,n = POi '1-'POi ' i= 1, 2,
onde POi
-2.2.3. O Estudo sobre <P ondeiiDi
= 1. moi +mli 2</JNo; - 1 # <P2:
2'
i= 1, 2,Desejamos encontrar rf> que maximize conjuntamente .C 1 e .C2 de acordo com os valores encontrados após a realização do experimento, isto é, sujeito a rf>1 = rf>2 =
r/>,
encontrar ospontos (iiot.iiu) e CPo2.ii12) que dão a melhor explicação de H0 .
O estimador de MV restrito a Ho é uma função de ('i,moi>NOi,Mti) e
cP,
por sua vez, é uma função de (POi. moi, Noi, M1i) de álgebra complicada para uma explicitação deMas encontrar fjJ é uma questão numericamente trivial, pois estamos trabalhando com funções de verossimilhança que possuem a característica de serem unimodais. Portanto, é fácil observar que
:P
E [~[!], ~121], onde<71[21 - max(~,, ~,).
•
I
<Pr•J
Figura 2.2. Função de Verossimilhança
A independência de .C1 e .C2 permite a fatoração de Àmax, por Àmax = Àlrnax
+
À2rnax' ondefornecendo
4J
emonde
(
mOi::-M1; _ NOi- :"Oi_ (NOi-
~o;)</J)
POi 1-pOi 1-pOi
(
Wu+~~--+~)
)
x [(Mli
+No;+
,P(mOi+
</J(mo;+
</J(mo;+No;)+ 4</JNoáioM
+
(M1; _(No;-
M!i)Po;)
i~
1 2.<P 1 - </JiiOi ' '
a
A derivação da expressão
Bcf
Àimax encontra-se no Apêndice 1.Temos agora um conjunto de etapas e ferramentas que permitem o teste de homo-geneidade sob o delineamento U, para grandes amostras.
O estudo para pequenas amostras não é tema do presente trabalho, mas algumas considerações devem ser abordadas, como por exemplo a própria expressão da verossimil-hança quando ocorrem casos particulares após a realização do experimento, que muda e nos fornece diferentes estimadores de
POi
e tornam o teste da razão de verossimilhança muito agressivo. Estes casos são apresentados e possibilitam ao pesquisador a decisão adequada.2.3. A Extensão para Outros Valores de
kO teste da homogeneidade gera uma grande malha de variações decorrentes dos taman-hos mOi's fixados e a magnitude das proporções (Pot, Pli) envolvidas, e a utilização da teoria assintótica está diretamente associada a este fato.
Mas a independência entre os estratos, mesmo quando muitos, facilita a abordagem que demos ao problema, que no caso genérico é o de maximizar .C restrito a Ho, como segue:
I
Àm=-À1~
+
À2m=+ · · · +
Àkm=·lAssim, a teoria apresentada para o caso k = 2 é perfeitamente expandida para o caso geral, sem perda das propriedades e resultados desenvolvidos até agora.
É claro que perdemos a agilidade de encontrarmos o máximo restrito utilizando as derivadas de ,\1max e À2max através da busca binária (ver Capítulo III), mas a idéia do
intervalo de valor tP que maximiza .C1,.C2, ... ,.Ck(i) permanece, ou seja,
i
E [J[l],J[k]], onde.P[J] - min{~,, ~2, ... , ~k) e
A Figura 2.3 ilustra a situação das verossimilhanças para o caso de outros estratos independentes. O ponto
J
é alguma combinação linear deJ1, J2,
J3
eJ4.
Aqui apenas o tempo computacional aumenta, pois devemos varrer do menor valor de tP (t/J[IJ) ao maior (J[kj), o que envolve maior número de iterações para encontrarmos
;j
restrito a H o : f/J1 = c/>2 = · · · = 4>k =r/l.
No Capítulo III exploramos diversas situações, alterando os tamanhos de moi e (POi,Pli) na simulação da realização do experimento com todo o material desenvolvido neste capítulo. A idéia é a de atingirmos o limite inferior da utilização da teoria assintótica e fornecermos material suficiente para tomada de decisão.
Figura 2.3. Ilustração das funções de verossimilhança para k = 41 onde rp[l] ::; rp[2] :::; rp[3] S rp[4]·
de significância (&) de 5% e 10% (&0.051 &0.10 ). Os gráficos da distribuição empírica de
U = -2log
>.
juntamente com a distribuição de probabilidade acumulada dexi
ilustram estas situações e apresentam1 para resultados do experimento específico, qual o ponto decorte para a rejeição de H o : cp1 = <P2 = t/J.
Os resultados obtidos para o estudo com grandes amostras mostraram-se de boa qual-idade para detectarmos a existência ou não de homogenequal-idade.
CAPÍTULO III
ALGORITMOS E APLICAÇAO DO TESTE DE
HOMOGENEIDADE SOB O DELINEAMENTO
U
PARA DOIS PARES DE POPULAÇOES
Vimos no capítulo anterior o desenvolvimento teórico para a aplicação do teste de homogeneidade assintótico da razão de verossimilhança sob o delineamento U, isto é, testar se existe evidência estatística de igualdade entre os riscos relativos entre dois grupos de uma população (Ho : 4J1 = f/Jz = cP vs H
1 :
1>1-:f
cP2).
Os testes se baseiam no critério darazão de verossimilhança, com U = -2log-X, onde
sup C
). = r/>l=r/>2=··-=r/>
supL
A construção do teste e algoritmos estão divididos em três partes: a realização do experimento, o cálculo de <P e
P-
estimadores derp
e p0, respectivamente, que maximizam o log.C no espaço restrito- e o cálculo deU= -2logÀ. Neste capítulo apresentamos a operacionalização deste fluxo (ver Figura 3.1) e a utilização de simulações de Monte Carlo para construção da distribuição empírica de U e comparamos com a distribuição dexi
verificando a partir de que valores de moi e (Poi1Pli) os resultados dados pela teoriaassintótica já fornecem a aproximação adequada.
A distribuição exata de U pode, em princípio, ser determinada exatamente a partir da distribuição de (N011 Mu), em termos dos parâmetros p01, pu, poz e p12 • Para pequenas
amostras, contudo, a dependência nestes parâmetros é muito acentuada, o que reduz a sua utilidade para testes sobre
ifJI
e ifJ2 pela dificuldade em se estabelecer valores críticos comuns. Para amostras maiores, contudo, os resultados assintóticos para U já podem ser aplicados. Aqui nós exploramos os limites desta validade, determinando, a partir de simulações, a distribuição exata de U e comparando-a com axi.
Nas simulações seguimos o roteiro a seguir:
I
InícioI
!
I
Leitura de Poi, Pli• mOiI
!
I
Simulaçao do experimentoI
Determinação de tP e
iioi
!
I
Cálculo dos Máximos Restrito e GlobalI
!
/ Determinação do valor de U
I
!
Comparação do valor de U
com valor de corte
xi
(o= 5% e 10%)!
I
Acumulação de Número de RejeiçõesI
!
I
Saída: Valores de U, &o.os e &o.w \!
I
FimI
Figura 3.1. Fluxo do Programa Principal para o Teste Assintótico da Razão de Verossimilhança sob o delineamento deU.
A seguir apresentamos os algoritmos e os resultados da exploração de casos em que
<P < 1, <P = 1 e <P > 1, com valores pequenos e grandes de (PoúPli)· As tabelas são apresentadas e acompanhadas de gráficos que mostram a aproximação à
xi.
O programa, desenvolvido em Thrbo Pascal, mostra as etapas para a construção do teste. Estas etapas foram desenvolvida em procedimentos, conseqüência natural da vantagem de independência entre os grupos e pela própria estruturação desta linguagem.
Como normalização, adotamos o seguinte critério para a apresentação dos procedi-mentos: letras maiúsculas para o nome do procedimento, as variáveis de entrada estão denominadas por letras minúsculas em negrito e as variáveis de saída por letras minúscu-las, como segue:
, ... r-1
REALIZA_EXP
(p
0 , p1 , phi, mo, no, ml)3.1. Os Algoritmos
~1 Nome do Procedimento~T
Variáveis de Saída3.1.1. A Simulação da Realização do Experimento
Este procedimento faz a simulação de realizações do experimento, sob o delineamento
U para cada grupo da população. São necessárias para seu processamento a entrada do número de sucessos desejados (mo) e as propriedades de ocorrência destes sucessos para
cada sub-população (Po, pJ).
O procedimento termina com a obtenção de no e m1 , para o cálculo de ifJ e os
estimadores de máxima verossimilhança no espaço restrito e espaço totaL
Início
("'simulação da 1~ etapa do experimento*) no= O;
cont =mo;
enquanto cont
>
O faça UOl = random; no= no+ 1; se u.Ol < Poentão cont = cont -1 Fim {enquanto);
(* Simulação da 2!!:. etapa do experimento *)
m1 =O
para I = 1 até no faça U02 = random; se U02 < p1 então m1 = m1
+
1 Fim (para); phi = mi/mo; Fim (procedimento);3.1.2. A Busca de 1> e o Cálculo de
P01.
Este procedimento (CALC_DERIV) tem como objetivo encontrar o ponto 1> e POi
que maximizam C1 e
C2
restritos aH
o : 1>1 =1>2
= c/>.Como visto em 2.2.2 e 2.2.3, os estimadores de máxima verossimilhança restritos
(ftOi,ftli)
são funções de 1>, assim como os valores das derivadas de Àlrnax e À2ma.x' Assim,inicia-se o processo com o cálculo de
POi
e Àimax' com o valor médio de 1>1 e1>2,
atravésda busca binária que estará mais detalhada no corpo do programa principal.
As variáveis de eiJ.trada são (mo, no, m1) obtidas do procedimento REALIZA__EXP e o procedimento é encerrado com a obtenção de
Po.
1> e Ài, respectivamente o estimador de máxima verossimilhança restrito a H o, estimador de 1> que maximiza C1 e .C2 conjunta-mente e o valor da derivada de cada par.CALC_DERIV (no, mo, m,,po,
J, .\;)
Início (* Cálculo de p0 restrito a -p0 ) se m1 =O então se no -::J. mo; então a = 2*
1> *no;b
=no+</>*
(no+ mo);c= mo;
descl=b2 -4*a*c' ,
desc = sqrt(descl);
PO!
= (b- desc)/2 *a;senão se
q,
> 0.5 então POl = 1.0/(2*h
senão Pm = 1; Fim (se); Fim (se); senãoentão Pm =(mo+
ml)/2
*no;senão Pm = LO; Fim (se); senão seno=mo então se
J;
> 0.5 e m1 ~ INT(m0*
(2*
J;-
1)então POl =(mo+ ml)/(2 •
J; •
mo;senão
.P
01 = 1.0;Fim (se);
senão
-a = 2
*
rjJ*
no;b = (m, +no+
J;
*(mo+ no)); c=(m!+mo);desci = b2 - 4
*
a*
c;desc = sqrt(descl);
POl = (b- DESC)/2 *a;
Fim (se); Fim (se); Fim (se);
(' Cálculo da Derivada ') se i'o < 0.0001 ou
p
2:
0.999; então .\ = O senao p,=,P•i'o se p1 < 0.0001 oup
2:
0.999 então>.
= O senão ij = 1-Po; ii1=l-P1; a= 2*
<P *no;b = m, +no+ ;i"* (mo+ no); S1 =(mo+ m,)fPo;
S2 =((no- m,) *
;i")/ih;
S3 =(no* ;i"; ih)- (m1 • ;i";iÍI);
PARC1 = S1 - S2- S3;
NUM= ((m, * Po +no* Po)- (mo+ m.,)); DEN = (b- (h (a* i'o)) *;i";
PARC2 = NUM/DEN;
PARC3 = (md;i")- (((no* Po)/iÍI)- ((m, * i'o)/<1,)));
.\ = (PARC1
*
PARC2)+
PARC3;Fim (se) Fim (se)
Fim (Procedimento).
4>[1] min{~,,~z},
-Na Tabela 3.1 apresentamos alguns resultados da simulação e a localização de (jJ.
Observe que
;f
de um modo geral está bem próximo da média ((~,+
~z)/2) pesando um pouco mais para o par que obteve menor tamanho de amostra. Isto quando os resultados estão muito desbalanceados.POi Pli mOi NOi M1i li> i 4>
i - 1 0.10 0.20 10 59 13 1.30 i= 2 0.20 0.40 15 72 32 2.13 2.01 i = 1 0.10 0.20 10 142 22 2.2 i=2 0.20 0.40 15 77 36 2.44 2.33 i - 1 0.02 0.02 15 697 15 1.0 i= 2 0.01 0.01 20 2021 28 1.4 1.23 i - 1 0.02 0.02 3 105 2 0.67 i=2 0.01 0.01 3 62
o
0.00 0.33 i - 1 0.04 0.02 3 42 1 0.33 i=2 0.02 0.01 3 151 1 0.33 0.33Tabela 3.1. Localização de f/J. Alguns resultados baseados em 1.000 sim-ulações de Monte-Carlo.
3.1.3. Algoritmo para o Cálculo dos Máximos
Os procedimentos CALC_MAX e MAX-RESTR calculam os valores de log [,i no es-paço paramétrica total e no eses-paço restrito, respectivamente. Estes procedimentos foram desenvolvidos separadamente.
3.1.3.1. Máximo Global
Este procedimento recebe como variáveis de entrada (mo,
no,
mi), as variáveis de saída do procedimento REALIZA_EXP, calcula os estimadores de máxima verossimilhança para cada par e fornece como variável de saída o máximo do log .Ci a ser utilizado no cálculo de U=-2log.\.CALC_MAX((mo,
no,
m,, max) InícioPm =mo/no;
cim
= 1-fim;
ftn
=mo/no;4n
= 1 -Pu; se m1 =Oentão
seno=mo
então max =O
senão max = mo
*
log(ftoi)+
(no - mo)*
log( 4oi)Fim (se) senão se m1 =no então então no= mo então max =O
senão max =mo* log(fio;) +(no- mo)* log(qo;) Fim (se)
senão
se no= mo
então max = m1 * log(fin
+(no-
m1) * log(qn) senão max =mo* log(po; +(no- mo)* log(<]o;)++mr
*
log(pn+(no-
m,)*
log(qu) Fim (se); Fim (se); Fim (se); Fim (Procedimento). 3.1.3.2. Máximo RestritoEste procedimento recebe as variáveis de REALIZA_EXP (mo,
no,
mr) e CALC_j)ERIV-
~~POi -
para o cálculo dos outros estimadores de máxima verossimilhança restritos(ijOi,pli, q"u). Como visto no Capítulo II, a verossimilhança no espaço restrito tem difer-entes formas, proporcionando diversos estimadores de
Poi
e consequentemente expressões diferentes para o cálculo do máximo restrito. Estas condições estão aqui implementadas e este procedimento termina com a obtenção do máximo restrito que combinado aos valores dos máximos globais, calculam o valor deU= -2logÀ.MAXJtESTR(mo, no, m,,p0,,
J,,
max) Inícioiin
=cPPm
iiin
= 1 -Pn;
Pu=
1-Pm
se m1 =O então se nof=
moentão max =mo • !og(po; +(no- mo)* !og(q"a;) +no* ]og(qu) senão
se;;< 0.5 então max = m0
*
log(l- r/>)então max =mo* log{0.5) senão
max =mo • (log(íJDl) + log(qli)) Fim (se) Fim (se) senão se m1 =no então se no =j:. O
então max =mo • log(íJDi +(no- mo) • log{qDi) + m1 • log(íJI;) então max = m 1
*
log(~)
+(no- m1) * log{l-~);
Fim (se); senão;
max =mo • log(íJDi +(no- mo) • log(qo;)+ +m1
*
log(fin +(no-m1) * log(ifn) Fim (se);Fim (se)j
Fim (Procedimento).
Na Tabela 3.2 apresentamos algumas estimativas dos valores de Poi e Pli no espaço total e restrito, bem como os valores do máximo global e restrito.
POi i - 1 0.10 i=2 0.20 i - 1 0.10 i=2 0.20 i - 1 0.02 i=2 0.01 i - 1 0.02 i=2 0.01 i - 1 0.04 i=2 0.02
-Pli ffiQi NOi Mli PDi Pli POi Pli ~ Máximo
Restrito 0.20 10 59 13 0.16949 0.22034 0.156696 0.31523 0.40 15 72 32 0.20883 0.44444 0.21786 0.43768 2.009 -149.52253 0.20 10 142 22 0.07042 0.15493 0.06758 0.15753 0.40 15 77 36 0.19481 0.46753 0.19931 0.46451 2.332 -188.59593 0.02 15 697 15 0.02152 0.02152 0.01932 0.02372 0.01 20 2015 28 0.00993 0.01390 0.01062 0.01304 1.228 -404.79093 0.02 3 105 2 0.02857 0.01905 0.03559 0.01185 0.01 3 62
o
0.048309 0.00000 0.03652 0.01216 0.333 -36.68533 0.02 3 42 1 0.07143 0.02381 0.07143 0.02367 0.01 3 151 1 0.01987 0;00662 0.01987 0.00662 0.333 -36.27302 Tabela 3.2. Estimativas de PGi e Pli no espaço total restrito e ,P, baseadosem 1.000 simulações de Monte Carla.
3.2. O Programa Principal
Máximo Global -149.44775 -188.5705 -404.52747 -35.53702 -36.27302O programa principal é composto pelos procedimentos 3.1.1, 3.1.2, 3.1.3, tendo um processo de busca binária de
;J,
após a realização do experimento, para o cálculo de!...._
>..1a"'
m=a
e 8rj> >..2max' tal que
a
a
a<P
À1m=+
aq,
Àzm= ~ O.Não é necessário que a soma das derivadas seja exatamente igual a O (zero), portanto, foi escolhido um PONTO que forneça o valor de
;j
tal que a soma das derivadas seja próxima de O (zero). Mesmo porque, o significado estatístico de;j
= 1.645239 é o mesmo-que if> ~ 1.65.
O início do processo de busca pelo ponto médio de ~
1
e ~2 se dá ao fato de que ~ estará na vizinhança do mesmol acelerando assim este processo.Após 1.000 simulações para cada caso estudado, temos a distribuição empírica da razão de verossimilhança e estimativas do nível de significância de
5%
e 10% para axi.
Início
Leia P111 P111 P121 P121 mo1, m12
Leia NMC (* número de simulações de Monte Carla *)
PONTO = 0.0001; NREJ05 =O; NREJ10 =O;
Para I = 1 até NMC faça
REALIZA-.EXP(p01,p11 , ~~, m 01, Nm, Mn)i
REALIZA_EXP(p02,p12 ,
J;,,
mo,, No,, M12); seJ,
<J,
então menor = <h; maior = 4>2 senão menor =Jz;
maior = 4>1; Fim (se)médio = (menor
+
maior)/2 </J = médio se<P;"O então CALC_DERIV(mor, N m, M n,Por,
J;,
À r); CALC_DERIV(mo,, N 02, M "' iio2,J;,
À,); DIF =À r+ À2;(ABS(DIF) > Ponto)) faça seDIF>O
médio= (maior+ menor)/2;
4> =médio senão maior = médio
médio= (maior+ menor)/2;
<P =médio
CALC_DERIV(mm, N 01, M u,Pol, ~.À,);
CALC_DERIV{mo,, N o2, M ,, Po2, ,P, À,); DIF = À1 +À,;
Fim (se);
MAX_RESTR(mm, Nm, Mu,;íio,,
J,,
restl); MAX_RESTR{mo,, N o2, M 12,Po2,J,,
rest2); CALC_MAX(mo,No,,Mu, maxtotl); CALC_MAX{mo,, N 02, M ,, maxtot2); MAX_REST = restl+
rest2;MAXTOT = maxtot1
+
maxtot2; U[i] = -2' {MAX-REST- MAXTOT); Fim (enquanto)senão U[i] =0; se U[i] > 3.841
então NREJ05 = NREJ05
+
1 NREJ!O = NREJ!O+
1; senãose U[i] > 2. 706
então NREJ!O = NREJ10
+
1 Fim {se)Fim {para);
ALFACH05 = NREJ05/NMC; ALFACH!O = NREJlO/NMC;
Para I= 1 até NMC faça Escreva
(U[i]);
Fim (Programa Principal).
3.3. Resultados e Comentários
A seguir apresentamos os resultados das simulações e apontamos, para cada caso, a partir de quando a utilização da teoria assintótica é adequada para o teste de f/11 = r:/J2 = cjJ
sob o delineamento U.
Para cada situação foram feitas 3 rodadas de 1.000 simulações e apresentados os valores estimados do nível de significância (a) de 5% a 10% (&o.os, &o.w).
Desejamos oferecer ao pesquisador uma confiança de 95% para a utilização do teste assintótico, tendo como valores de corte (C) da
xi
iguais a 3.841 (para a= 0.05) e 2.761 (para a= 0.10). Definindo X como o número de vezes que o valor (U = 2*
log). >C), temos que P(37:ô
X:ô
63) = 0.95, P(82:S
X:S
118) = 0.95, para para X ~ B(lOOO, 0.05) X~ B(lOOO,O.lO). eConsideraremos, portanto, que o nível de signi:ficância real não é significativamente diferente do valor nominal adotado (5 ou 10%) quando o número de rejeições (ocorrência do erro tipo I) estiver dentro do intervalo correspondente acima. Com base em 1.000 repetições, a probabilidade de detecção de uma diferença de 1 ou 2 pontos percentuais no nível de significância não será facilmente detectada.
As simulações foram feitas para <P
<
1.0, <P = 1.0 e cjJ > 1.0 com diferentes magnitudes de (Poi,Pii)1 i= 112. Os gráficos ilustram os pontos de utilização, isto é, a partir de quandopodemos usar e quando não usar a teoria assintótica. Para cada caso apresentamos a tabela com resultados das simulações.
Caso <fi
<
1)Po1- 0.04 Poz- 0.02
p11 = 0.02 P12 = 0.01
ll'Q.05 &o.1o
mo1 mo2 I 11 III I 11 III
3 3 0.0470 0.0660 0.0550 0.1170 0.1160 0.1140 5 5 0.0730 0.0660 0.0740 0.1310 0.1360 0.1320 10 10 0.0600 0.0590 0.0440 0.1140 0.1100 0.0960 15 15 0.0690 0.0450 0.0600 0.1180 0.1070 0.1250 20 20 0.0420 0.0480 0.0590 0.0920 0.1020 0.0960 25 25 0.0540 0.0600 0.0510 0.0960 0.1100 0.1030 Tabela 3.3
Experimento O 1 POl - 0.04 P02 - 0.02 Pn = 0.02 P12 = 0.01
!.O
/:r
/.-0.8
.-/<
r/
o
<
0.6
..lI
::::> ~0.4
::::>u
<
0.2 I
0.0
I I _1o
2
46
810
12
Gráfico 3.1 - m01 = 03 e mo2 = 03 1.00.8
<
o
<
0.6
..l .J ::::> I' ~ )0.4
I
::::> ju
i/
<
i
i
I
'0.2
,.
,,-1
I r I ' !0.0
o
2
46
8
10
12
Caso </J
<
1) P01- 0.3 Po2- 0.15 Pn = 0.1 P12 = 0.05 ao.os ao.10 m01 mo2 I [[ [[[ I [[ [[[ 5 5 0.0640 0.0580 0.0670 0.1240 0.1120 0.1360 10 10 0.0760 0.0710 0.0890 0.1050 0.1010 0.1220 15 15 0.0670 0.0540 0.0470 0.1110 0.0930 0.0880 20 20 0.0510 0.0640 0.0510 0.1140 0.1210 0.0950 25 25 0.0480 0.0520 0.0540 0.1090 0.1050 0.1120 30 30 0.0430 0.0410 0.0510 0.0890 0.0940 0.1050 Tabela 3.41.0 0.8
<
o
<
0.6 ..l::J
"
0.4 J::J
u
~
<
0.2 ,, ' 0.0o
1.0 0.8 :-!<
ro
<
L
0.6 i4
I
..l::J
: f
I ..::8
::J
u
<
! ' ' i 0.4 -; '.
,i
I Experimento 02 PDl- 0.3 P02- 0.15 Pll = 0.1 P12 = 0.05----7
-2
4 6 8lO
12
Gráfico 3.3 - m0, = 05 e mo2 = 05 021 0.0 ,__ _ _ _ j _ _ _ _L_ _ _ _ j _ _ _ _ L _ _ _ _ j _ _ _ _Jo
2 4 68
lO
12
Caso ~ = 1)
POl- 0.02 P02- 0.01 Pn = 0.02 P12 = 0.01
o:o.os 0:0.10
mo! mo2 I 11 Ili I 11 Ili
2 2 0.0590 0.0500 0.0610 0.1690 0.1600 0.1600 3 3 0.0740 0.0950 0.0990 0.1150 0.1490 0.1510 5 5 0.0650 0.0650 0.0640 0.1120 0.1200 0.1200 10 10 0.0470 0.0420 0.0680 0.0970 0.0770 0.1310 15 15 0.0530 0.0580 0.0760 0.1100 0.1330 0.1240 20 20 0.0520 0.0510 0.0520 0.1050 0.1090 0.0990 30 30 0.0510 0.0570 0.0570 0.1010 0.1100 0.1040 Tabela 3.5
Experimento 03 POl - 0.02 P02 - 0.01 Pn = 0.02 P12 = 0.01
1.0
0.0
o
24
68
!O
12 Gráfico 3.5 - m 01 = 02 e mo2 = 02 I.O
I0.8
~
I
<
'
L
o
<
0.6
-l::>
:E
0.4
::>
ü<
0.2
·' ~0.0
I
o
2
4
6
8
1012
Caso </> = 1)
POt- 0.15 P02- 0.20 Pn = 0.15 P12 = 0.20
&o.os ao. lo
mo1 mo2 I I! III I I! IIl
5 5 0.0550 0.0530 0.0730 0.1160 0.1130 0.1210 10 10 0.0580 0.0360 0.0550 0.1170 0.0900 0.1140 15 15 0.0510 0.0460 0.0530 0.0900 0.1100 0.1090 20 20 0.0600 0.0630 0.0540 0.0990 0.1140 0.1080 30 30 0.0490 0.0440 0.0520 0.1000 0.0950 0.1030 Tabela 3.6
Experimento 04 P01- 0.15 Poz- 0.20 Pn = 0.15 P12 = 0.20
1.0
0.8 0.20.0
o
2
4
6
8
10
12
Gráfico 3. 7 - m01 = 05 e moz = 05I.
O
0.8<
L
Q<
0.6 ' ...l !I
::::>'
:E
'
'
0.4'
::::> e-fu
'/
<
~
0.2'
0.0I
o
2
46
8
10
12
Caso </J > 1)
Pai- 0.2 Po2 - 0.1
P11 ~ 0.4 P12 ~ 0.2
O:Q.05 âo.w
mo1 mo2 I 11 IIJ I 11 III
5 3 0.0590 0.0650 0.0830 0.1180 0.1280 0.1340 5 5 0.0590 0.0610 0.0540 0.1180 0.1080 0.1010 5 10 0.0610 0.0530 0.0570 0.1060 0.1150 0.1070 10 5 0.0480 0.0560 0.0610 0.0890 0.1170 0.1150 10 10 0.0480 0.0370 0.0490 0.1040 0.0850 0.1050 20 20 0.0620 0.0570 0.0490 0.1060 0.1020 0.0930 30 30 0.0420 0.0490 0.0640 0.0960 0.0890 0.1220 Tabela 3.7
1.0
0.8
/<
I
o
<
0.6
' ...J ~;:g
0.4
~I
u
<
0.2
0.0
o
2
1.0
/
~
. I
<
0.6
r;·
0.8
r • ...J I . ~ I;:g
! ~ 0.4u
<
I
I
' I0.2 "
'
0.0
o
2
Experimento 05 POl ~ 0.2 P02 ~ 0.1 Pn ~ 0.4 P12 ~ 0.24
6
8
10
12
Gráfico 3.9 - m01 ~ 03 e mo2=
03 46
8
10
12
Caso <P > 1) P01- 0.02 P02 - 0.01 Pn ~ 0.04 P12 ~ 0.02 ao.os &o.w mm m02 I 11 III I 11 III 3 3 0.0710 0.0580 0.0870 0.1180 0.1100 0.1390 5 5 0.0630 0.0490 0.0630 0.1130 0.0930 0.1140 10 10 0.0690 0.0570 0.0520 0.1170 0.1190 0.1010 15 15 0.0470 0.0560 0.0510 0.0840 0.1040 0.1020 20 20 0.0510 0.0430 0.0460 0.0960 0.0880 0.1010 30 30 0.0580 0.0590 0.0590 0.1080 0.1120 0.1260 Tabela 3.8
Experimento 06 Po1 - 0.02 Pü2 0.01 Pu = 0.04 P12 = 0.02
1.0
0.8<
Cl<
0.6 ...J ::::> ::11 0.4í/
::>
u
<
i'
0.2~
li
'
0.0I
o
2
4 6 8lO
12
Gráfico 3.11 - m01 = 05 e m02 = 031.0
0.8 r f '/
!<
/ ' ClI
<
0.6 '-' ...J ' ::::>i
I
::;;:
' '' i
i ::::> 0.4r·
Iu
!I
'<
:!.
• 0.2i
J
0.0
o
2
46
8
lO
12
onde
APÊNDICE 1
-
-A EXPRESS-AO D-A DERIV-AD-A N-A R-AZ-AO
DE VEROSSIMILHANÇA
Podemos fatorar
>.
porÀ1m- - >.,(pÚ,POl) =
>.,(íJoM),íJli(</>))
>.,m_ -
>.,(íJodh2)
= >.,(po,(<P),P12(<P)) Desejamos encontrar o ponto onde{) {)
->.,
&c/>-
-->.,max -
84>
mwc'isto é, o ponto de ifJ que maximiza >.(i).
Mas
Como
mOi & (- ) (nOi- mo;) & (- )
-:o-{)~ Poi
-1 - {)~ Poi POi '~-' - POi '+'
mli {) - (nOi- mli) {)
-+-:o-&~
(Pli) -
1 - &~ (P,,).Pti 'f' - Pli 'f'
Pli ~ _ r â _ _ ~ â (- )
Assim Mas POi Assim, Mas Portanto:
(- -moi Poi (noi- moi)) 1 - Poi -po· 8fjJ
a (- )
~-
-
+ - -
.rjJ - PO(
moi (no,- moi mli (no;- mli) )
a (- )
Poi 1 - Poi POi 1 - cPPoi 8f/J l
+
(m
1, _ (n0, - :''')
r/J I - rfJPOi
(
mo,+ m,, _ (no,- mo,) _ (noi- m,,)q,)
!..._(- ·)
- I - I ~- a~ Po,
POi - POi - 'f'POi '+'
+
(mli __
(no;-":li)).
rP 1-r/Jpo,
(mli + noi +</>(moi+ no,))- [(mli + noi + rjJ(moi + no,))2 - 8r/lno,(mo; +
m,,)]'i'
41/>noi
m1i
+
noi moi +nOi _ ((mli+
nOi+
f/J(moi+
noi)?- Scftnoi(m,Oi+
mli))112--':'c--"'
+
2 2 .4f/Jnoi 4noi 16rjJ nOi
D
(mli
+
nod2 8nÕ,rjJ3(mli
+
noi) 4n0icft2(mli
+
noi)(moi+
noi)- 4noi(m0i+
m1i)Portanto:
(mli- no;) 2 (mli + nOi)(mOi + noi)- 4n0i(m0i + mli)
1 8nÕi4>3 8n2i<P2
2 ((mli + nOi +</!(mo;+ n0i))2 - 8</!nOi(mo; + mli))112
4cf>noi
- -
(m1, + nOi)+
[(mli + n0,)+
-'-"--'----'=_:::----:-='-;----=----"---"'-2 (mli + no;)(mo; +no;)- 4n0i(mo; + m1;)]
4no;</!2 4no;,P2 4no;</!
-I
X~----~---~~~~~---~
((m!i + nOi +</!(mo;+ no;))2 + 8</!no;(mOi + m1,))
_ (mli +no;) + [(m1; + n0;)2 + <P(mli + no;)(mo; + nOi)- 4no;(mo; + m!i)l
4n0i4>2 4noi4>2
I
X ((m!i +no;+ ,P(mo; + no;))2 - 8</!no;(mo; + m1;))
_ (m!i +no;) + (mli + n0i)2 + (m!i + no;)(mo; +no;)- 4no;(mo; + mli)<P 4no;,P2 4no;</!2[(mli +no;+ f( mo;+ no;)- 4</!noâ1o;]
4(mu + no;)no;)pDi</!- 4no;(mo; + mli)<P 4[(mi; +no;+ f( mo;+ nOi) - 4</!no;po.]no;</!2
[(m!i +no;+ <P(mo; +no;)- 4</!noâ>o;J<P ·
Revisão Bibliográfica
[1] Boché, Silvia Leonor (1990) - "Estimação Não Tendenciosa do Risco Relativo", Tese de Mestrado, IMECC/UNICAMP.
[2j Gart, John J. (1971) - "The Comparison of Proportions: A Review of Significance Tests, Confidence Intervals and Adjustments for Stratification", Review of Interna-tional Statístical Institute, Volume 39:2, 148-166.
[3j Koopmam, P.A.R. (1984) - "Confidence Intervals for the Ratio of Two Binomial Proportions", Biometrics 40, 513-517- June 1984.
[4] Gart, John J. and Nam, Jun-mo (1980) - "Approximate Interval Estimation of the Ratio of Binomial Parameters: A Review and Corrections for Skewness, Biometrics 44, 323-338 · June 1988.
Bibliografia
• Bailey, B.J.R. (1987)- "Confidence Limits to the Risk Ratio", Biometrics 43, 201-205, March 1987.
• Noether, Gottfried E. (1957) - "Two Con:fidence Intervals for the Ratio of Two Probabilities and some Measures of Effectiveness", American Statistical Association Journal, March 1957.
• Bedrick, Edward J. {1987)- "A Family of Confidence Intervals for t.he Rat.io of Two Binomial Proportions", Biometrics 43, 993-998, December 1987.
• Thoma.s, Donald G. e Gart, John J. (1977) - "A Table of Exact Confidence Limits fo Differences and Ratio of Two Proportions and their Odds Ratios", Journal of the American Statistical Association, March 1977, vol. 72, number 357, Applications Section.