"Teste assintotico da razão de verossimilhança para a homogeneidade entre riscos relativos sob um novo delineamento"

(1)

UNIVERSIDADE ESTADUAL DE CAMPINAS

(UNICAMP)

INSTITUTO DE MATEMÁTICA, ESTATÍSTICA E CIÊNCIA DA COMPUTAÇAO

{IMECC)

"Teste Assintótico da Razão de Verossimilhança para a

Homogenei-dade entre Riscos Relativos sob um Novo Delineamento."

CARLOS ALEXANDRE DADOORIAN

Orientador: Professor Dr. SEBASTIÃO DE AMO RIM

CAMPINAS - SAO PAULO -BRASIL

DEZEMBRO DE 1992

(2)

TESTE ASSINTÓTICO DA RAZÃO DE VEROSSIMILHANÇA PARA A HOMOGENEIDADE ENTRE RISCOS RELATIVOS SOB UM NOVO

DELINEAMENTO

Este exemplar corresponde à redação fmal da dissertação devidamente corrigida e definida por Carlos Alexandre Dadoorian e aprovada pela comissão julgadora.

Campinas, 16 de dezembro de 1992.

stião de Amorim · ntador

Dissertação apresentada ao Instituto de Matemática, Estatística e Computação Científica, UNICAMP, como requisito parcial para obtenção do Título de

(3)

"Brilhar para sempre Brilhar como um farol Brilhar como brilho eterno Gente é pra brilhar

Que tudo mais vá pro inferno Este é meu slogan

E o do Sol."

(4)

Agradecimentos

Primeiro a quem dedico este trabalho, sem dúvida alguma foram minhas mawres fontes de força em momentos de crise.

Ao Professor Sebastião de Amorim, ou simplesmente Mestre, por razões diversas e marcantes: meu orientador, chefe e amigo. Muito da estatística que hoje utilizo é fruto de inúmeras conversas formais e informais que travamos, chegando às vezes em discussões quase sem fim; e este tema tão interessante que ele me permitiu desenvolver.

Aos Professores do Departamento de Estatística do IMECC, pelos conhecimentos e oportunidades do dia-a-dia. Em especial aos amigos Eliana, Mauro e Hotta.

Ao Professor Djalma C.G. Pessoa, membro de minha banca e da escola onde descobri, aos 14 anos, a palavra estatística; aproveito o momento e mando um beijo bem forte a todos da ENCE - amigos, professores, funcionários e aos que passaram por lá e cruzamos nossas vidas. Aqui em especial cito o Professor Alcides Malaquias.

Aos meus amigos de turma que sem dúvida alguma souberam levar a sério esta palavra. Formamos uma equipe nota dez. Espero que passemos adiante tudo que juntos aprendemos, como por exemplo, fazer café, molho branco, quibe, feijão tropeiro, festas, etc ... Um abraço do tamanho do Corcovado!

Aos meus amigos de Mestrado, principalmente os que me deram a chance de monitorá-los e ouviram as opiniões deste chato aqui.

Aos meus amigos da SOMA Estatística, ala Campinas e ala Catanduva. Excelentes momentos vivi junto a vocês. Tudo bem, alguns foram chatos, mas destes "estou fora"! Um obrigado também pela utilização de seus equipamentos.

(5)

Às minhas meninas Mariângela e Ignês Amêndola, por tudo que me proporcionaram. Um grande beijo!

Aos amigos Carlos Henrique e Ana Paula pelo uso do computador, casa, telefone e etc... Adoro vocês!

A todos os meus parentes. Não vou citar um a um senão vira lista telefônica! Obrigado por tudo que vocês me dão!

Aos funcionários do IMECC, principalmente Cidinha e Bel, e às tias do café. Grande cafezinho!

À Instituição CNPq pela bolsa de Mestrado e à UNICAMP pela bolsa de Monitoria . ... e finalmente a quem se sentir esquecido.

(6)

Aos meus pais,

Carlos e Elba, vó Lia, Tidy e Beinny,

pela força e amorj

À memória de minha avó Noêmia, pela coragem de ter feito

(7)

ÍNDICE

Capítulo I- Conceitos Básicos e Revisão Bibliográfica da Associação de Duas Variáveis 1

1.1. Uma Breve Revisão ... .- ... 3

1.2. Um Novo Delineamento ... 4

1.3. A Extensão do Delineamento U para k Pares de Populações ... 6

Capítulo II - Testando a Homogeneidade entre os lliscos Relativos ... 7

2.1. Generalização do Delineamento U para k Pares de Populações ... 8

2.2. O Caso k = 2 ... 10

2.2.1. Os Estimadores de Máxima Verossimilhança ... 11

2.2.2. Os Estimadores de Máxima Verossimilhança Restritos a H o ... 12

2.2.3. O Estudo sobre </> • . . . • • • . . . . . . • • • • . . . . . . • . • . . . . . . . . . . . . . . . . . . . . 15

2.3. A Extensão para Outros Valores de k ... 17

Capítulo IH - Algoritmos e Aplicação do Teste de Homogeneidade sob o Delineamento U para Dois Pares de Populações ... 20

3.1. Os Algoritmos ... 22

3.1.1. A Simulação da Realização do Experimento ... 22

3.1.2. A Busca de </> e o Cálculo de

POi ...

24

3.1.3. Algoritmo para o Cálculo dos Máximos ... 27

3.1.3.1. Máximo Global ... 28

(8)

3.2. O Programa Principal ... 31 3.3. Resultados e Comentários ... 34 3.4. Gráficos e Tabelas Apêndice 1 ... 48 Referências Bibliográficas ... 51 Bibliografia ... 51

(9)

'

CAPITULO I

CONCEITOS BÁSICOS E REVISAO

BIBLIOGRÁFICA DA ASSOCIAÇÃO

DE DUAS VARIÁVEIS

A associação entre duas variáveis categóricas binárias é um tema de grande interesse em praticamente todas as áreas onde a estatística é empregada. O estudo destas variáveis tem um papel central nestas diversas áreas devido à sua generalidade natural, somado ao fato que diversos modelos mais complexos podem ser simplificados para uma abordagem preliminar binária.

Considerando a situação em que se tem uma variável binária e duas populações

dis-tintas (Po e P_{1 )} é frequentemente de interesse estimarmos a razão entre as proporções p₀

e Pl· Formalmente temos cP =~,onde Po e P1 são as proporções em questão.

PO

Exemplo 1.1

-Em decorrência do uso frequente destes conceitos na área médica, onde a variável binária pode se referir, por exemplo, à ocorrência ou não de uma determinada doença, é comum se designar rjJ como o risco relativo, a razão entre as taxas de risco, em duas subpopulações distintas. Por exemplo, considerando o hábito de fumar como critério de partição de uma população em duas subpopulações, pode se definir:

Po, como a taxa de risco {de contração da doença) entre não fumantes

PI, como taxa de risco entre fumantes; e

rjJ = Pl, como o risco relativo. Po

(10)

O delineamento clássico para a estimativa de <P extrai de P0 e P1 amostras aleatórias

com reposição (AAS-CR) de tamanhos

no

e n_1,respectivamente. O número de sucessos em cada caso,

X

o e X_1,são então variáveis aleatórias independentes, onde

X

o,...

b(no,Po)

e X₁~ b(n1,p,).

Definindo

Po

= Kfl _no e p₁= Kl, os estimadores de _nt

Po

e p1, um estimador natural para

4>

parece então ser dado por

Os graves problemas com esta opção- por exemplo, seu valor pode ser indeterminado e, dado que é determinado, sua esperança é oo -induziram um grande esforço no sentido de buscar alternativas que contornassem tais problemas. Frequentemente interessa ao pesquisador testar a hipótese nula H o:

4>

=

4>o

versus a alternativa H1 : 4>

=f

t/>o,

e um caso particular muito comum ocorre quando

4>o

= L

Neste capítulo apresentaremos sumariamente uma revisão bibliográfica desta liter-atura, mostrando a evolução em relação à maneira de se abordar este problema. Em particular, destacam nesta área os trabalhos de John J. Gart.

Mais recentemente Boché

[1

J apresentou uma abordagem nova que, adotando um delineamento sequencial que conjuga uma binomial com uma binomial negativa, permitiu um estimador Uniforme de Máxima Verossimilhança Não Viciado (UMVNV) para

4>,

com expressão fechada para a variância.

Neste trabalho apresentamos a extensão deste novo delineamento para o problema do teste de homogeneidade para dois ou mais pares de subpopulações (Pai, Pli, i= 1, 2, 3, ... , k), com ênfase para k = 2.

(11)

A estratificação natural da população em estudo em k estratos, cada um com duas sub-populações, é definida por uma terceira variável, denominada de confundimento. Seguindo o exemplo do início deste capítulo, podemos supor que a relação entre o fumo e a incidência da doença seja diferente entre homens e mulheres. Porém, a ocorrência de diversos pareS de populações não é sempre produto de estratificação. É comum termos uma série de dados pareados segundo dois tratamentos, por exemplo. Em epidemiologia temos casos específicos como o estudo do caso-controle (ou retrospectivo) e o estudo de caso-coorte.

Em qualquer uma destas situações teremos, para cada par, uma medida de associação. Portanto, devemos estar atentos a duas situações práticas: o caso de termos poucos pares de populações e grande número de observações ou o caso de muitos pares de populações e poucas observações.

Estas características devem ser levadas em consideração, pois a qualidade dos esti-madores e testes para o risco relativo comum estão diretamente ligadas a elas e podem perturbar propriedades, como consistência, por exemplo.

Um teste de hipótese para diversos pares de populações é o da homogeneidade, ou seja, testamos se todos os riscos são iguais ((h=

t/J2

= · · · = t/Jk = ,P). Um caso particular de homogeneidade é tP = 1, que testa também a independência entre as variáveis, em todos os estratos.

1.1. Uma Breve Revisão

A revisão que agora apresentamos tem como in tensão indicar a evolução da abordagem dada ao risco relativo, assim as expressões para os estimadores do risco relativo comum e estatísticas de testes foram suprimidas tendo total indicação em "referências bibliográficas". Em 1971, Gari [2] fez uma revisão bastante minuciosa para o ODDS-RATIO (<p),

(12)

estudando o caso de uma tabela 2 x 2, para a combinação de diversas tabelas 2 x 2 e ainda para a combinação de diversas tabelas 2 x t.

Neste artigo Gart supõe que as variáveis sejam independentes e distribuídas pela binomial e, utilizando uma reparametrização pela logística, deriva os estimadores pontuais, o teste de hipótese e intervalos de confiança, para o parâmetro de reparametrização do ODDS-RATIO.

Nota: <P=--; PI@

PoQl

assim quando qo e q₁são próximos de 1 (um), r.p serve como estimativa do risco relativo. Após este trabalho, mais alguns foram apresentados por diversos pesquisadores e Koopmam em [3] apresenta um estimador para o risco relativo comum que Gart em [4] não considera muito eficiente, mas utiliza-o como início para o cálculo das equações de verossimilhança que ele propõe em 1985.

Neste trabalho, Gart [4] considerando k pares de binomiais mutuamente independentes e assumindo a hipótese de homogeneidade entre os riscos relativos (

r/J1

= (jJ₂ = . . . = <!Jk = <P), utiliza escores estatísticos baseados na verossimilhança e deriva um intervalo de confiança aproximado para <P como também testes para ifJ = 1.

Ainda baseado na teoria dos escores estatísticos, mas supondo que as caudas da dis-tribuição de <P sejam muito assimétricas, Gart (4] introduz um fator de correção visando

melhorar a aproximação para normal.

1.2. Um Novo Delineamento

(13)

es-tudo de pequenas amostras foram a mola propulsora para o desenvolvimento de um novo delineamento- delineamento U- apresentado recentemente por Boché [1].

O delineamento U consiste em retirarmos, através de uma amostra aleatória com reposição, itens de P₀até a obtenção do m₀-ésimo sucesso - mo fixado a priori. Definindo

No ccmo o número total de itens amostrados, temos que:

[No"' binomial negativa (m₀,po).j Faça No= no.

Em seguida, sorteamos de P1 , por AAS-CR, N1 =no elementos.

Seja M1 o número de sucessos obtidos, assim:

/ (M!/ No =no)

~

B(no,Ptl·/

• Mt

Definindo

r/Ju

= - , temos que: mo 1.2.1) E(~.)= <P ' <P 1.2.2) V ar(</>.)= - [ 1 - Pl

+

</>(1- Po)] mo 1.2.3)

~.

- </J _!2_, N(O 1)

.jva:r(

~.) mo-~ ' 1.2.4) P(Mt = mt) =

f

(:o~ ~)Po'(1-

Po)no-mo ( :0

)p;"'(1- p,)no-m',

nt=max(1Tl{),ml) O 1

m1 = 0,1,2, ...

(14)

Ainda neste trabalho, Boché [1] exploram a aproximação a distribuição normal e testes de hipóteses para pequenas amostras no caso em que rP = 1.

1.3. A Extensão do Delineamento U para k Pares de Populações

A motivação do presente trabalho é de estratificarmos a população em tantos estratos quantos necessários e, após a utilização do delineamento U, verificarmos como testar a hipótese de homogeneidade entre os riscos relativos (</>i; i= 1, 2, ... , k).

Sejam (FOi, Pli); i = 1, 2, 3, ... , k, os diversos pares de sub-populações a serem estu-dados.

Para cada par aplicamos o delineamento U obtendo assim (mru, NOi, M1i), onde o

primeiro índice está relacionado à etapa do delineamento (0, 1) e o segundo ao i-ésimo estrato, de forma que:

1

1 _Mli.

I

'/-'Ui - 1 i= 1, 2,,,, l k,

mOi .

No Capítulo II apresentamos o teste aproximado para testarmos a hipótese de homo-geneidade entre os riscos relativos, em particular para dois estratos (H o : rjJ1 = </>2 = r/J).

Foi utilizado o teste da razão de verossimilhança e explorada a sensibilidade do teste sob o delineamento U, isto é, a partir de que tamanhos de mOi a aproximação é adequada.

Apresentamos as tabelas com valores de (moi, Noi, m₁i; i = 1, 2) e o nível de significân-cia estimado.

Ilustrações comparativas com a distribuição acumulada da

xi

também são apresen-tadas.

(15)

CAPÍTULO 11

TESTANDO A HOMOGENEIDADE ENTRE

OS RISCOS RELATIVOS

Aproveitando o exemplo do Capítulo I, seja rP = Pl, onde Po e Pl são as taxas de

PD

risco entre não fumantes e fumantes, respectivamente.

Suponha agora que tal associação possa ter diferentes valores entre homens e mulheres. Assim, dividimos a população em duas sub-populações, homens e mulheres, com seus riscos relativos dados por:

<f>, = Pn PDl

e cfo2 = Pl2, onde: PD2

p_{01 :} a taxa de risco entre não fumantes do sexo feminino; Pu : a taxa de risco entre fumantes do sexo feminino;

PD2 : a taxa de risco entre não fumantes do sexo masculino;

p11 : a taxa de risco entre fumantes do sexo masculino.

No Exemplo 1.1 consideramos, como motivação, o problema de se comparar, através do risco relativo r/J, a taxa de incidência de uma determinada doença entre não fumantes e fumantes (po, Pl).

Neste capítulo introduzimos uma terceira variável e consideramos o problema de se testar a homogeneidade de r/J nas sub-populações definidas pelos distintos valores desta

(16)

Uma situação extrema e curiosa ocorre quando o efeito do fumo é oposto entre sexo masculino e feminino, fazendo que seu efeito global desapareça. Assim, é frequentemente de interesse, antes de se estudar cP para toda população, verificar a legitimidade de se agrupar no mesmo estudo, indistintamente, os dois sexos.

A abordagem estatística para esta aferição é o teste da homogeneidade

I

(H o : ljJ1 =

1/!

2 = 1/J vs H1 :

q,,

i'

q,,)

I

entre os riscos relativos.

Neste capítulo generalizamos o delineamento U, para k pares de populações, e ex-ploramos os limites de aplicabilidade dos resultados assintóticos associados ao teste da R. V.

2.1. Generalização do Delineamento

U

para

k

Pares de

Popu-lações

Sejam P1, ... , Pk os k estratos em que a população original foi dividida segundo critério baseado na terceira variável, dita de confundimento. Cada estrato é dividido em duas populações, Pai e Pli, segundo a variável classificatória binária. Aplicando o delineamento U, independentemente, em cada estrato, definimos:

mru: número de sucessos fixado na sub-população Po do i-ésimo estrato;

N0i: número de itens amostrados de P0 do i-ésimo estrato, até a obtenção do moi-ésimo sucesso;

M1i: número de sucessos observados na sub-população P₁do i-ésimo estrato.

assim, NOi"' bin.neg.(mru,pru) e, dado NOi, Mli"' b(NOi,Pli)· O esquema a seguir facilita a visualização.

(17)

Figura 2.1: Esquema do delineamento U realizado em k pares de populações.

Definindo Ci como a função de verossimilhança associada ao i-ésimo estrato, temos:

(n""-

"''

1)

fflOi no.:-moi

(no;)

mt; noi-fflli ·

1 POi QOi Plí qli , para z = 1, 2, 3, ... , k,

moi- m1i

onde:

QOi = 1 - POii Qli = 1 - Plii

0 < POi $ 1, 0

<

Pli

<

1;

Seja C a verossimilhança conjunta, isto é, a combinação das k funções de verossimil-hança. Assim:

(18)

O teste da R. V. para a hipótese fjJ₁= l/J2 = · · · = 1/Jk = fjJ se baseia então na estatística:

definida por

sup L À = r/J1 =r/J2= .. ·=r/J

supL

Portanto, devemos nos preocupar agora em encontrar o máximo em todo o espaço paramétrica e o máximo restrito ao subespaço definido por fjJ₁= l/J2 = · · · = 1/Jk· Tra-balharemos com log(.\), por conveniência algébrica e pelas propriedades assintóticas desta estatística, já que, sob condições bem gerais,

Embora a função L envolva 2k parâmetros, ela é o produto de k funções Li, cada uma dependendo apenas de seu par exclusivo de parâmetros POi e Pli· Esta propriedade simplifica os trabalhos, na medida em que o máximo de .C é o produto dos máximos dos fatores Ci.

2.2. O Caso

k

=

2

Neste trabalho nos concentramos principalmente no caso em que a variável de con-fundimento é também binária, portanto, k = 2.

A utilização do delineamento U para a estimação do risco relativo nos fornece a conjugação de duas variáveis aleatórias, binomial negativa e binomial, para cada par de populações, gerando então suas funções de verossimilhança,

cl

e

c2,

de forma que:

(nol-1)

m01 not-mo1

(n01)

mu not-mn.

1 P01 qOl Pn Qn ,

mm- mu

L,

=

(19)

L' =

(n02-

1)

₁ P0202 m"qno2-mo2 (no2)pm"qno2-mi2. 1 2 1 2 '

mo2- m12

e a verossimilhança total pela expressão:

Ao utilizarmos o teste da razão de verossimilhança, devemos encontrar, com os re-sultados do experimento, o máximo no espaço paramétrica total e o máximo restrito à hipótese nula (H o: </J1

=

</J2

=

</J), de sorte que

-2log.\ = -2log <~>~<h~···~<l = -2log 0'~<1,~···~<1 ,

(

sup

L)

(

sup L1 _x

L,)

sup .C sup !1 x .C2

é a estatística de teste.

O máximo das funções de verossimilhança encontram-se nos estimadores de máxima verossimilhança, que apresentamos a seguir.

2.2.1. Os Estimadores de Máxima Verossimilhança Irrestritos

Vamos encontrar os estimadores de máxima verossimilhança irrestritos de Poi e Pli maximizando

!ogL = logL₁x logL₂ em POi e Pli·

Assim, (.Pru,PH) são os EMV de (Poi,Pli), respectivamente, tais que:

sup log

ci

moi x log(fio,) +(No,-mo,) x log(qru)

+

m11 x ]og(ji,,)

(20)

Maximizando cada parte separadamente e aplicando resultado de Boché (pag. 71), temos:

POi i= 1, 2,

Pli i= 1, 2,

os EMV de Pai e Pli, respectivamente, i= 1, 2, ...

2.2.2. Os EMV Restritos a H₀

Desejamos testar a homogeneidade entre os riscos relativos (~I e ~2), isto é,

H

o

q,,

=

q,,

=

q,

vs

H,

q,,

oi

q,,.

Assim,

q,,

Pl! - ::::} Pn

=

~P01 POl

q,,

- Pl2 - ::::} P12

=

~P02· P02

Consequentemente, substituindo na função de verossimilhança, obtemos a função de verossimilhança restrita, cujo logaritmo é dado por:

logL; = mo; x log(ftOi) +(No;- mo;) x log(qo;)

+

M,,

x log(1>Po;) +(No;- Mli) x log(1- 1>po;) +C;, para i.= 1,2,

que atinge o máximo nos EMV's restritos a Ho(ftoi) e ~ -o valor de ~ que maximiza L:₁ e L2 conjuntamente, sujeitos às restrições fiii

=

tPPoi, i

=

1, 2.

(21)

Sob condições gerais e restrito a H_{0 ,}temos que:

-2 X <P X NOi

-Pli <PfiOi, i=l,2.

•

Alguns casos particulares exigem um tratamento especial, gerando diferentes esti-madores de ÍJOi.

Temos que:

Para efeito de simplificação, a constante Ci não foi colocada em todos os casos, visto que ela se cancelará em .\. Para o espaço restrito, a notação da verossimilhança será [,ri.

Lembramos que

H

o :

r/J1

=

r/J2

=

,P, ou seja,

Pu

=

r/JPm

e ÍJ12 =

<PPo2,

e que

A mOi A m1i A M li

POi = N , Pli = N , </Ji = - - , para i = 1, 2,

Oi oi moi

e consideramos os seguintes casos especiais:

Caso 1) mu =O, m12 =O.

.

-<jJ1 = O, <1>2 = O

=>

<P = O, a.ssim

r -mo2 ( 1 - ) no2 -1n02

(22)

Assim, Po1 Po2 mm A - - =Po1 NO! moz A Noz = Po2,

ou seja, os EMV restritos coincidem com os EMV totais.

Os casos a seguir apresentam os resultados levando-se em consideração que em apenas um estrato ocorreu uma situação particular. É claro que nos dois estratos podem ocorrer tais situações, mas a independência entre eles permite que sejam estudados separadamente. Caso 2) Situação: (mn =O, m₁₂

i'

O) ou (m₁₁

i'

O, m₁₂= 0).

2.1) Se NOi =mOi,

r -m"(1 ;;;- )No e max J...r, = Poi - 'f'POi ',

onde 2.2) Se Noi

i-

mOi, onde

:Oi=

2t

{ - 1 Poi = 1; - 1 para

tP

>

2'

- 1 para tjJ :::;

2 .

fio;= No;+ J(mOi +No;- V(NOt

+~(mo;+

NOi))'- 8 x JNOt x mo;)_ 4 X </J X NOi

Caso 3) Situação: (m11

i'

O, m12

i'

O).

(23)

Caso 3.1) mli = Noi e NOi =F mOi,

onde

i= 1,2.

" =<>>(Z- )m"

max J....,n = POi '1-'POi ' i= 1, 2,

onde POi

-2.2.3. O Estudo sobre <P onde

iiDi

= 1. moi +mli 2</JNo; - 1 # <P

2:

2'

i= 1, 2,

Desejamos encontrar rf> _{que maximize conjuntamente .C 1 e .C2 de acordo com os valores} encontrados após a realização do experimento, isto é, sujeito a rf>₁= rf>2 =

r/>,

encontrar os

pontos (iiot.iiu) e CPo2.ii12) que dão a melhor explicação de H0 .

O estimador de MV restrito a Ho é uma função de ('i,moi>NOi,Mti) e

cP,

por sua vez, é uma função de (POi. moi, Noi, M1i) de álgebra complicada para uma explicitação de

(24)

Mas encontrar fjJ é uma questão numericamente trivial, pois estamos trabalhando com funções de verossimilhança que possuem a característica de serem unimodais. Portanto, é fácil observar que

:P

E [~[!], ~121], onde

<71[21 - max(~,, ~,).

•

I

<Pr•J

Figura 2.2. Função de Verossimilhança

A independência de .C1 e .C2 permite a fatoração de Àmax, por Àmax = Àlrnax

+

À2rnax' onde

(25)

fornecendo

4J

em

onde

(

mOi::-M1; _ NOi- :"Oi_ (NOi-

~o;)</J)

POi 1-pOi 1-pOi

(

Wu+~~--+~)

)

x [(Mli

+No;+

,P(mOi

+

</J(mo;

+

</J(mo;

+No;)+ 4</JNoáioM

+

(M1; _

(No;-

M!i)Po;)

i

~

₁_2.

<P 1 - </JiiOi ' '

a

A derivação da expressão

Bcf

Àimax encontra-se no Apêndice 1.

Temos agora um conjunto de etapas e ferramentas que permitem o teste de homo-geneidade sob o delineamento U, para grandes amostras.

O estudo para pequenas amostras não é tema do presente trabalho, mas algumas considerações devem ser abordadas, como por exemplo a própria expressão da verossimil-hança quando ocorrem casos particulares após a realização do experimento, que muda e nos fornece diferentes estimadores de

POi

e tornam o teste da razão de verossimilhança muito agressivo. Estes casos são apresentados e possibilitam ao pesquisador a decisão adequada.

2.3. A Extensão para Outros Valores de

k

O teste da homogeneidade gera uma grande malha de variações decorrentes dos taman-hos mOi's fixados e a magnitude das proporções (Pot, Pli) envolvidas, e a utilização da teoria assintótica está diretamente associada a este fato.

(26)

Mas a independência entre os estratos, mesmo quando muitos, facilita a abordagem que demos ao problema, que no caso genérico é o de maximizar .C restrito a Ho, como segue:

I

Àm=-

À1~

+

À2m=

+ · · · +

Àkm=·l

Assim, a teoria apresentada para o caso k = 2 é perfeitamente expandida para o caso geral, sem perda das propriedades e resultados desenvolvidos até agora.

É claro que perdemos a agilidade de encontrarmos o máximo restrito utilizando as derivadas de ,\1max e À2max através da busca binária (ver Capítulo III), mas a idéia do

intervalo de valor tP que maximiza _{.C1,.C2, ... ,.Ck(i)}permanece, ou seja,

i

E [J[l],J[k]], onde

.P[J] - min{~,, ~2, ... , ~k) e

A Figura 2.3 ilustra a situação das verossimilhanças para o caso de outros estratos independentes. O ponto

J

é alguma combinação linear de

J1, J2,

J3

e

J4.

Aqui apenas o tempo computacional aumenta, pois devemos varrer do menor valor de tP (t/J[IJ) ao maior (J[kj), o que envolve maior número de iterações para encontrarmos

;j

restrito a H o : f/J1 = c/>2 = · · · = 4>k =

r/l.

No Capítulo III exploramos diversas situações, alterando os tamanhos de moi e (POi,Pli) na simulação da realização do experimento com todo o material desenvolvido neste capítulo. A idéia é a de atingirmos o limite inferior da utilização da teoria assintótica e fornecermos material suficiente para tomada de decisão.

(27)

Figura 2.3. Ilustração das funções de verossimilhança para k = 41 onde rp[l] ::; rp[2] :::; rp[3] S rp[4]·

de significância (&) de 5% e 10% (&0.051 &0.10 ). Os gráficos da distribuição empírica de

U = -2log

>.

juntamente com a distribuição de probabilidade acumulada de

xi

ilustram estas situações e apresentam1 para resultados do experimento específico, qual o ponto de

corte para a rejeição de H o : cp1 = <P2 = t/J.

Os resultados obtidos para o estudo com grandes amostras mostraram-se de boa qual-idade para detectarmos a existência ou não de homogenequal-idade.

(28)

CAPÍTULO III

ALGORITMOS E APLICAÇAO DO TESTE DE

HOMOGENEIDADE SOB O DELINEAMENTO

U

PARA DOIS PARES DE POPULAÇOES

Vimos no capítulo anterior o desenvolvimento teórico para a aplicação do teste de homogeneidade assintótico da razão de verossimilhança sob o delineamento U, isto é, testar se existe evidência estatística de igualdade entre os riscos relativos entre dois grupos de uma população (Ho : 4J1 = f/Jz = cP vs H

1 :

1>1

-:f

cP2).

Os testes se baseiam no critério da

razão de verossimilhança, com U = -2log-X, onde

sup C

). = r/>l=r/>2=··-=r/>

supL

A construção do teste e algoritmos estão divididos em três partes: a realização do experimento, o cálculo de <P e

P-

estimadores de

rp

e p_0,respectivamente, que maximizam o log.C no espaço restrito- e o cálculo deU= -2logÀ. Neste capítulo apresentamos a operacionalização deste fluxo (ver Figura 3.1) e a utilização de simulações de Monte Carlo para construção da distribuição empírica de U e comparamos com a distribuição de

xi

verificando a partir de que valores de moi e (Poi1Pli) os resultados dados pela teoria

assintótica já fornecem a aproximação adequada.

A distribuição exata de U pode, em princípio, ser determinada exatamente a partir da distribuição de (N011 Mu), em termos dos parâmetros p01, pu, poz e p_{12 •}Para pequenas

(29)

amostras, contudo, a dependência nestes parâmetros é muito acentuada, o que reduz a sua utilidade para testes sobre

ifJI

e ifJ2 pela dificuldade em se estabelecer valores críticos comuns. Para amostras maiores, contudo, os resultados assintóticos para U já podem ser aplicados. Aqui nós exploramos os limites desta validade, determinando, a partir de simulações, a distribuição exata de U e comparando-a com a

xi.

Nas simulações seguimos o roteiro a seguir:

I

Início

I

!

I

Leitura de Poi, Pli• mOi

I

!

I

Simulaçao do experimento

I

Determinação de tP e

iioi

!

I

Cálculo dos Máximos Restrito e Global

I

!

/ Determinação do valor de U

I

!

Comparação do valor de U

com valor de corte

xi

(o= 5% e 10%)

!

I

Acumulação de Número de Rejeições

I

!

I

Saída: Valores de U, &o.os e &o.w \

!

I

Fim

I

Figura 3.1. Fluxo do Programa Principal para o Teste Assintótico da Razão de Verossimilhança sob o delineamento deU.

(30)

A seguir apresentamos os algoritmos e os resultados da exploração de casos em que

<P < 1, <P = 1 e <P > 1, com valores pequenos e grandes de (PoúPli)· As tabelas são apresentadas e acompanhadas de gráficos que mostram a aproximação à

xi.

O programa, desenvolvido em Thrbo Pascal, mostra as etapas para a construção do teste. Estas etapas foram desenvolvida em procedimentos, conseqüência natural da vantagem de independência entre os grupos e pela própria estruturação desta linguagem.

Como normalização, adotamos o seguinte critério para a apresentação dos procedi-mentos: letras maiúsculas para o nome do procedimento, as variáveis de entrada estão denominadas por letras minúsculas em negrito e as variáveis de saída por letras minúscu-las, como segue:

, ... r-1

REALIZA_EXP

(p

_{0 ,}p_{1 ,}phi, mo, no, ml)

3.1. Os Algoritmos

~1 Nome do Procedimento

~T

Variáveis de Saída

3.1.1. A Simulação da Realização do Experimento

Este procedimento faz a simulação de realizações do experimento, sob o delineamento

U para cada grupo da população. São necessárias para seu processamento a entrada do número de sucessos desejados (mo) e as propriedades de ocorrência destes sucessos para

(31)

cada sub-população (Po, pJ).

O procedimento termina com a obtenção de no e m1 , para o cálculo de ifJ e os

estimadores de máxima verossimilhança no espaço restrito e espaço totaL

Início

("'simulação da 1~ etapa do experimento*) no= O;

cont =mo;

enquanto cont

>

O faça UOl = random; no= no+ 1; se u.Ol < Po

então cont = cont -1 Fim {enquanto);

(* Simulação da 2!!:. etapa do experimento *)

m1 =O

para I = 1 até no faça U02 = random; se U02 < p1 então m1 = m1

+

1 Fim (para); phi = mi/mo; Fim (procedimento);

(32)

3.1.2. A Busca de 1> e o Cálculo de

P01.

Este procedimento (CALC_DERIV) tem como objetivo encontrar o ponto 1> e POi

que maximizam C1 e

C2

restritos a

H

o : 1>1 =

1>2

= c/>.

Como visto em 2.2.2 e 2.2.3, os estimadores de máxima verossimilhança restritos

(ftOi,ftli)

são funções de 1>, assim como os valores das derivadas de Àlrnax e À2ma.x' Assim,

inicia-se o processo com o cálculo de

POi

e Àimax' com o valor médio de 1>1 e

1>2,

através

da busca binária que estará mais detalhada no corpo do programa principal.

As variáveis de eiJ.trada são (mo, no, m1) obtidas do procedimento REALIZA__EXP e o procedimento é encerrado com a obtenção de

Po.

1> e Ài, respectivamente o estimador de máxima verossimilhança restrito a H o, estimador de 1> que maximiza C1 e .C2 conjunta-mente e o valor da derivada de cada par.

CALC_DERIV (no, mo, m,,po,

J, .\;)

Início (* Cálculo de p₀restrito a -p_{0 )} se m1 =O então se no -::J. mo; então a = 2

*

1> *no;

b

=no+</>*

(no+ mo);

c= mo;

descl=b2 -4*a*c' ,

desc = sqrt(descl);

PO!

= (b- desc)/2 *a;

(33)

senão se

q,

> 0.5 então POl = 1.0/(2

*h

senão Pm = 1; Fim (se); Fim (se); senão

então Pm =(mo+

ml)/2

*no;

senão Pm = LO; Fim (se); senão seno=mo então se

J;

> 0.5 e m1 ~ INT(m0

*

(2

*

J;-

1)

então POl =(mo+ ml)/(2 •

J; •

mo;

senão

.P

01 = 1.0;

Fim (se);

senão

-a = 2

*

rjJ

*

no;

b = (m, +no+

J;

*(mo+ no)); c=(m!+mo);

desci = b2 - 4

*

a

*

c;

desc = sqrt(descl);

POl = (b- DESC)/2 *a;

Fim (se); Fim (se); Fim (se);

(34)

(' Cálculo da Derivada ') se i'o < 0.0001 ou

p

2:

0.999; então .\ = O senao p,=,P•i'o se p₁< 0.0001 ou

p

2:

0.999 então

>.

= O senão ij = 1-Po; ii1=l-P1; a= 2

*

<P *no;

b = m, +no+ ;i"* (mo+ no); S1 =(mo+ m,)fPo;

S2 =((no- m,) *

;i")/ih;

S3 =(no* ;i"; ih)- (m1 • ;i";iÍI);

PARC1 = S1 - S2- S3;

NUM= ((m, * Po +no* Po)- (mo+ m.,)); DEN = (b- (h (a* i'o)) *;i";

PARC2 = NUM/DEN;

PARC3 = (md;i")- (((no* Po)/iÍI)- ((m, * i'o)/<1,)));

.\ = (PARC1

*

PARC2)

+

PARC3;

Fim (se) Fim (se)

Fim (Procedimento).

(35)

4>[1] min{~,,~z},

-Na Tabela 3.1 apresentamos alguns resultados da simulação e a localização de (jJ.

Observe que

;f

de um modo geral está bem próximo da média ((~,

+

~z)/2) pesando um pouco mais para o par que obteve menor tamanho de amostra. Isto quando os resultados estão muito desbalanceados.

POi Pli mOi NOi M1i li> i 4>

i - 1 0.10 0.20 10 59 13 1.30 i= 2 0.20 0.40 15 72 32 2.13 2.01 i = 1 0.10 0.20 10 142 22 2.2 i=2 0.20 0.40 15 77 36 2.44 2.33 i - 1 0.02 0.02 15 697 15 1.0 i= 2 0.01 0.01 20 2021 28 1.4 1.23 i - 1 0.02 0.02 3 105 2 0.67 i=2 0.01 0.01 3 62

o

0.00 0.33 i - 1 0.04 0.02 3 42 1 0.33 i=2 0.02 0.01 3 151 1 0.33 0.33

Tabela 3.1. Localização de f/J. Alguns resultados baseados em 1.000 sim-ulações de Monte-Carlo.

3.1.3. Algoritmo para o Cálculo dos Máximos

Os procedimentos CALC_MAX e MAX-RESTR calculam os valores de log [,i no es-paço paramétrica total e no eses-paço restrito, respectivamente. Estes procedimentos foram desenvolvidos separadamente.

(36)

3.1.3.1. Máximo Global

Este procedimento recebe como variáveis de entrada (mo,

no,

mi), as variáveis de saída do procedimento REALIZA_EXP, calcula os estimadores de máxima verossimilhança para cada par e fornece como variável de saída o máximo do log .Ci a ser utilizado no cálculo de U=-2log.\.

CALC_MAX((mo,

no,

m,, max) Início

Pm =mo/no;

cim

= 1-

fim;

ftn

=mo/no;

4n

= 1 -Pu; se m₁=O

então

seno=mo

então max =O

senão max = mo

*

log(ftoi)

+

(no - mo)

*

log( 4oi)

Fim (se) senão se m1 =no então então no= mo então max =O

senão max =mo* log(fio;) +(no- mo)* log(qo;) Fim (se)

senão

se no= mo

então max = m1 * log(fin

+(no-

m1) * log(qn) senão max =mo* log(po; +(no- mo)* log(<]o;)+

(37)

+mr

*

log(pn

+(no-

m,)

*

log(qu) Fim (se); Fim (se); Fim (se); Fim (Procedimento). 3.1.3.2. Máximo Restrito

Este procedimento recebe as variáveis de REALIZA_EXP (mo,

no,

mr) e CALC_j)ERIV

-

~~

POi -

para o cálculo dos outros estimadores de máxima verossimilhança restritos

(ijOi,pli, q"u). Como visto no Capítulo II, a verossimilhança no espaço restrito tem difer-entes formas, proporcionando diversos estimadores de

Poi

e consequentemente expressões diferentes para o cálculo do máximo restrito. Estas condições estão aqui implementadas e este procedimento termina com a obtenção do máximo restrito que combinado aos valores dos máximos globais, calculam o valor deU= -2logÀ.

MAXJtESTR(mo, no, m,,p0,,

J,,

max) Início

iin

=

cPPm

i

iin

= 1 -

Pn;

Pu=

1-

Pm

se m1 =O então se no

f=

mo

então max =mo • !og(po; +(no- mo)* !og(q"a;) +no* ]og(qu) senão

se;;< 0.5 então max = m0

*

log(l- r/>)

(38)

então max =mo* log{0.5) senão

max =mo • (log(íJDl) + log(qli)) Fim (se) Fim (se) senão se m1 =no então se no =j:. O

então max =mo • log(íJDi +(no- mo) • log{qDi) + m1 • log(íJI;) então max = m 1

*

log(~)

+(no- m1) * log{l-

~);

Fim (se); senão;

max =mo • log(íJDi +(no- mo) • log(qo;)+ +m1

*

log(fin +(no-m1) * log(ifn) Fim (se);

Fim (se)j

Fim (Procedimento).

Na Tabela 3.2 apresentamos algumas estimativas dos valores de Poi e Pli no espaço total e restrito, bem como os valores do máximo global e restrito.

(39)

POi i - 1 0.10 i=2 0.20 i - 1 0.10 i=2 0.20 i - 1 0.02 i=2 0.01 i - 1 0.02 i=2 0.01 i - 1 0.04 i=2 0.02

-Pli ffiQi NOi Mli PDi Pli POi Pli ~ Máximo

Restrito 0.20 10 59 13 0.16949 0.22034 0.156696 0.31523 0.40 15 72 32 0.20883 0.44444 0.21786 0.43768 2.009 -149.52253 0.20 10 142 22 0.07042 0.15493 0.06758 0.15753 0.40 15 77 36 0.19481 0.46753 0.19931 0.46451 2.332 -188.59593 0.02 15 697 15 0.02152 0.02152 0.01932 0.02372 0.01 20 2015 28 0.00993 0.01390 0.01062 0.01304 1.228 -404.79093 0.02 3 105 2 0.02857 0.01905 0.03559 0.01185 0.01 3 62

o

0.048309 0.00000 0.03652 0.01216 0.333 -36.68533 0.02 3 42 1 0.07143 0.02381 0.07143 0.02367 0.01 3 151 1 0.01987 0;00662 0.01987 0.00662 0.333 -36.27302 Tabela 3.2. Estimativas de PGi e Pli no espaço total restrito e ,P, baseados

em 1.000 simulações de Monte Carla.

3.2. O Programa Principal

Máximo Global -149.44775 -188.5705 -404.52747 -35.53702 -36.27302

O programa principal é composto pelos procedimentos 3.1.1, 3.1.2, 3.1.3, tendo um processo de busca binária de

;J,

após a realização do experimento, para o cálculo de

!...._

>..₁

a"'

m=

a

e 8rj> >..2max' tal que

a

a<P

À1m=

+

aq,

Àzm= ~ O.

Não é necessário que a soma das derivadas seja exatamente igual a O (zero), portanto, foi escolhido um PONTO que forneça o valor de

;j

tal que a soma das derivadas seja próxima de O (zero). Mesmo porque, o significado estatístico de

;j

= 1.645239 é o mesmo

-que if> ~ 1.65.

O início do processo de busca pelo ponto médio de ~

1

e ~2 se dá ao fato de que ~ estará na vizinhança do mesmol acelerando assim este processo.

(40)

Após 1.000 simulações para cada caso estudado, temos a distribuição empírica da razão de verossimilhança e estimativas do nível de significância de

5%

e 10% para a

xi.

Início

Leia P111 P111 P121 P121 mo1, m12

Leia NMC (* número de simulações de Monte Carla *)

PONTO = 0.0001; NREJ05 =O; NREJ10 =O;

Para I = 1 até NMC faça

REALIZA-.EXP(p₀₁,p_{11 ,}~~, m 01, Nm, Mn)i

REALIZA_EXP(p₀₂,p_{12 ,}

J;,,

mo,, No,, M12); se

J,

<

J,

então menor = <h; maior = 4>₂ senão menor =

Jz;

maior = 4>1; Fim (se)

médio = (menor

+

maior)/2 </J = médio se<P;"O então CALC_DERIV(mor, N m, M n,

Por,

J;,

À r); CALC_DERIV(mo,, N 02, M "' iio2,

J;,

À,); DIF =À r+ À2;

(ABS(DIF) > Ponto)) faça seDIF>O

(41)

médio= (maior+ menor)/2;

4> =médio senão maior = médio

médio= (maior+ menor)/2;

<P =médio

CALC_DERIV(mm, N 01, M u,Pol, ~.À,);

CALC_DERIV{mo,, N o2, M ,, Po2, ,P, À,); DIF = À1 +À,;

Fim (se);

MAX_RESTR(mm, Nm, Mu,;íio,,

J,,

restl); MAX_RESTR{mo,, N o2, M 12,Po2,

J,,

rest2); CALC_MAX(mo,No,,Mu, maxtotl); CALC_MAX{mo,, N 02, M ,, maxtot2); MAX_REST = restl

+

rest2;

MAXTOT = maxtot1

+

maxtot2; U[i] = -2' {MAX-REST- MAXTOT); Fim (enquanto)

senão U[i] =0; se U[i] > 3.841

então NREJ05 = NREJ05

+

1 NREJ!O = NREJ!O

+

1; senão

se U[i] > 2. 706

então NREJ!O = NREJ10

+

1 Fim {se)

Fim {para);

ALFACH05 = NREJ05/NMC; ALFACH!O = NREJlO/NMC;

(42)

Para I= 1 até NMC faça Escreva

(U[i]);

Fim (Programa Principal).

3.3. Resultados e Comentários

A seguir apresentamos os resultados das simulações e apontamos, para cada caso, a partir de quando a utilização da teoria assintótica é adequada para o teste de f/11 = r:/J2 = cjJ

sob o delineamento U.

Para cada situação foram feitas 3 rodadas de 1.000 simulações e apresentados os valores estimados do nível de significância (a) de 5% a 10% (&o.os, &o.w).

Desejamos oferecer ao pesquisador uma confiança de 95% para a utilização do teste assintótico, tendo como valores de corte (C) da

xi

iguais a 3.841 (para a= 0.05) e 2.761 (para a= 0.10). Definindo X como o número de vezes que o valor (U = 2

*

log). >C), temos que P(37

:ô

X

:ô

63) = 0.95, P(82

:S

X

:S

118) = 0.95, para para X ~ B(lOOO, 0.05) X~ B(lOOO,O.lO). e

Consideraremos, portanto, que o nível de signi:ficância real não é significativamente diferente do valor nominal adotado (5 ou 10%) quando o número de rejeições (ocorrência do erro tipo I) estiver dentro do intervalo correspondente acima. Com base em 1.000 repetições, a probabilidade de detecção de uma diferença de 1 ou 2 pontos percentuais no nível de significância não será facilmente detectada.

As simulações foram feitas para <P

<

1.0, <P = 1.0 e cjJ > 1.0 com diferentes magnitudes de (Poi,Pii)1 i= 112. Os gráficos ilustram os pontos de utilização, isto é, a partir de quando

podemos usar e quando não usar a teoria assintótica. Para cada caso apresentamos a tabela com resultados das simulações.

(43)

(44)

Caso <fi

<

1)

Po1- 0.04 Poz- 0.02

p₁₁= 0.02 P12 = 0.01

ll'Q.05 &o.1o

mo1 mo2 I 11 III I 11 III

3 3 0.0470 0.0660 0.0550 0.1170 0.1160 0.1140 5 5 0.0730 0.0660 0.0740 0.1310 0.1360 0.1320 10 10 0.0600 0.0590 0.0440 0.1140 0.1100 0.0960 15 15 0.0690 0.0450 0.0600 0.1180 0.1070 0.1250 20 20 0.0420 0.0480 0.0590 0.0920 0.1020 0.0960 25 25 0.0540 0.0600 0.0510 0.0960 0.1100 0.1030 Tabela 3.3

(45)

Experimento O 1 POl - 0.04 P02 - 0.02 Pn = 0.02 P12 = 0.01

!.O

/:r

/.-0.8

.-/

<

r/

o

<

0.6

..l

I

::::> ~

0.4

::::>

u

<

0.2 I

0.0

I I _1

o

2

4

6

8

10

12

Gráfico 3.1 - m01 = 03 e mo2 = 03 1.0

0.8 <

o

<

0.6

..l .J ::::> I' ~ )

0.4 I

::::> j

u

_i/

<

i

I

'

0.2 ,.

_,,

-1

I r _I' !

0.0 o

2

4

6

8

10

12

(46)

Caso </J

<

1) P01- 0.3 Po2- 0.15 Pn = 0.1 P12 = 0.05 ao.os ao.10 m01 mo2 I [[ [[[ I [[ [[[ 5 5 0.0640 0.0580 0.0670 0.1240 0.1120 0.1360 10 10 0.0760 0.0710 0.0890 0.1050 0.1010 0.1220 15 15 0.0670 0.0540 0.0470 0.1110 0.0930 0.0880 20 20 0.0510 0.0640 0.0510 0.1140 0.1210 0.0950 25 25 0.0480 0.0520 0.0540 0.1090 0.1050 0.1120 30 30 0.0430 0.0410 0.0510 0.0890 0.0940 0.1050 Tabela 3.4

(47)

1.0 0.8

<

o

<

0.6 ..l

::J

"

_0.4 J

::J

u

~

<

0.2 ,, ' 0.0

o

1.0 0.8 :-!

<

r

o

_<

L

0.6 _i

4

I

..l

::J

_{: f}

I ..

::8

::J

u

<

! ' ' i 0.4 -; '

.

,i

_I Experimento 02 PDl- 0.3 P02- 0.15 Pll = 0.1 P12 = 0.05

----7

-2

4 6 8

lO

12

Gráfico 3.3 - m_0, = 05 e mo2 = 05 021 0.0 ,__ _ _ _ j _ _ _ _L_ _ _ _ j _ _ _ _ L _ _ _ _ j _ _ _ _J

o

2 4 6

8 lO

12

(48)

Caso ~ = 1)

POl- 0.02 P02- 0.01 Pn = 0.02 P12 = 0.01

o:o.os 0:0.10

mo! mo2 I 11 Ili I 11 Ili

2 2 0.0590 0.0500 0.0610 0.1690 0.1600 0.1600 3 3 0.0740 0.0950 0.0990 0.1150 0.1490 0.1510 5 5 0.0650 0.0650 0.0640 0.1120 0.1200 0.1200 10 10 0.0470 0.0420 0.0680 0.0970 0.0770 0.1310 15 15 0.0530 0.0580 0.0760 0.1100 0.1330 0.1240 20 20 0.0520 0.0510 0.0520 0.1050 0.1090 0.0990 30 30 0.0510 0.0570 0.0570 0.1010 0.1100 0.1040 Tabela 3.5

(49)

Experimento 03 POl - 0.02 P02 - 0.01 Pn = 0.02 P12 = 0.01

1.0

0.0 o

2

4

6

8 !O

12 Gráfico 3.5 - _{m 01}= 02 e _mo2= 02 I.

O

I

0.8 ~

I

<

'

L

o

<

0.6

-l

::>

:E

0.4 ::>

ü

<

0.2

_·' ~

0.0 I

o

2

4

6

8

10

12

(50)

Caso </> = 1)

POt- 0.15 P02- 0.20 Pn = 0.15 P12 = 0.20

&o.os ao. lo

mo1 mo2 I I! III I I! IIl

5 5 0.0550 0.0530 0.0730 0.1160 0.1130 0.1210 10 10 0.0580 0.0360 0.0550 0.1170 0.0900 0.1140 15 15 0.0510 0.0460 0.0530 0.0900 0.1100 0.1090 20 20 0.0600 0.0630 0.0540 0.0990 0.1140 0.1080 30 30 0.0490 0.0440 0.0520 0.1000 0.0950 0.1030 Tabela 3.6

(51)

Experimento 04 P01- 0.15 Poz- 0.20 Pn = 0.15 P12 = 0.20

1.0

0.8 0.2

0.0 o

2

4

6

8

10

12

Gráfico 3. 7 - m01 = 05 e moz = 05

I. O

0.8

<

L

Q

<

0.6 _' ...l !

I

::::>

'

:E

_'

0.4

'

::::> e-f

u

_'/

<

~

0.2

'

0.0

I

o

2

4

6

8

10

12

(52)

Caso </J > 1)

Pai- 0.2 Po2 - 0.1

P11 ~ 0.4 P12 ~ 0.2

O:Q.05 âo.w

mo1 mo2 I 11 IIJ I 11 III

5 3 0.0590 0.0650 0.0830 0.1180 0.1280 0.1340 5 5 0.0590 0.0610 0.0540 0.1180 0.1080 0.1010 5 10 0.0610 0.0530 0.0570 0.1060 0.1150 0.1070 10 5 0.0480 0.0560 0.0610 0.0890 0.1170 0.1150 10 10 0.0480 0.0370 0.0490 0.1040 0.0850 0.1050 20 20 0.0620 0.0570 0.0490 0.1060 0.1020 0.0930 30 30 0.0420 0.0490 0.0640 0.0960 0.0890 0.1220 Tabela 3.7

(53)

1.0

0.8

/

<

I

o

<

0.6

' ...J ~

;:g

0.4

~

I

u

<

0.2

0.0 o

2

1.0 /

~

. I

<

0.6 r;·

0.8

r • ...J I . ~ I

;:g

! ~ 0.4

u

<

I

' I

0.2 "

'

0.0 o

2

Experimento 05 POl ~ 0.2 P02 ~ 0.1 Pn ~ 0.4 P12 ~ 0.2

4

6

8

10

12

Gráfico 3.9 - m_{01 ~}03 e mo2

=

03 4

6

8

10

12

(54)

Caso <P > 1) P01- 0.02 P02 - 0.01 Pn ~ 0.04 P12 ~ 0.02 ao.os &o.w mm m02 I 11 III I 11 III 3 3 0.0710 0.0580 0.0870 0.1180 0.1100 0.1390 5 5 0.0630 0.0490 0.0630 0.1130 0.0930 0.1140 10 10 0.0690 0.0570 0.0520 0.1170 0.1190 0.1010 15 15 0.0470 0.0560 0.0510 0.0840 0.1040 0.1020 20 20 0.0510 0.0430 0.0460 0.0960 0.0880 0.1010 30 30 0.0580 0.0590 0.0590 0.1080 0.1120 0.1260 Tabela 3.8

(55)

Experimento 06 Po1 - 0.02 Pü2 0.01 Pu = 0.04 P12 = 0.02

1.0

0.8

<

Cl

<

0.6 ...J ::::> ::11 0.4

í/

::>

u

<

i'

0.2

~

li

'

0.0

I

o

2

4 6 8

lO

12

Gráfico 3.11 - m01 = 05 e m02 = 03

1.0

0.8 r f '

/

!

<

/ ' Cl

I

<

0.6 '-' ...J ' ::::>

i

I

::;;:

' _'

' i

i ::::> 0.4

r·

_I

u

!

I

'

<

:!

.

• 0.2

i

J

0.0 o

2

4

6

8 lO

12

(56)

onde

APÊNDICE 1

-

-A EXPRESS-AO D-A DERIV-AD-A N-A R-AZ-AO

DE VEROSSIMILHANÇA

Podemos fatorar

>.

por

À1m- - >.,(pÚ,POl) =

>.,(íJoM),íJli(</>))

>.,m_ -

>.,(íJodh2)

= >.,(po,(<P),P12(<P)) Desejamos encontrar o ponto onde

{) {)

->.,

_&c/>

-

-->.,

max -

84>

mwc'

isto é, o ponto de ifJ que maximiza >.(i).

Mas

Como

mOi & (- ) (nOi- mo;) & (- )

-:o-{)~ Poi

-1 - {)~ Poi POi '~-' - POi '+'

mli {) - (nOi- mli) {)

-+-:o-&~

(Pli) -

₁ - &~ (P,,).

Pti 'f' - Pli 'f'

Pli ~ _ r â _ _ ~ â (- )

(57)

Assim Mas POi Assim, Mas Portanto:

(- -moi _Poi (noi- moi)) _{1 -} _Poi -po· _8fjJ

a (- )

_~

-

+ - -

.rjJ - PO

(

moi (no,- moi mli (no;- mli) )

a (- )

Poi 1 - Poi POi 1 - cPPoi 8f/J l

+

(m

1

, _ (n0, - :''')

r/J I - rfJPOi

(

mo,+ m,, _ (no,- mo,) _ (noi- m,,)q,)

!..._(- ·)

- I - I ~- a~ Po,

POi - POi - 'f'POi '+'

+

(mli __

(no;-

":li)).

rP 1-r/Jpo,

(mli + noi +</>(moi+ no,))- [(mli + noi + rjJ(moi + no,))2 - 8r/lno,(mo; +

m,,)]'i'

41/>noi

m1i

+

noi moi +nOi _ ((mli

+

nOi

+

f/J(moi

+

noi)?- Scftnoi(m,Oi

+

mli))112

--':'c--"'

+

2 2 .

4f/Jnoi 4noi 16rjJ nOi

D

(mli

+

nod2 8nÕ,rjJ3

(mli

+

noi) 4n0icft2

(mli

+

noi)(moi

+

noi)- 4noi(m0i

+

m1i)

(58)

Portanto:

(mli- no;) 2 (mli + nOi)(mOi + noi)- 4n0i(m0i + mli)

1 8nÕi4>3 8n2i<P2

2 ((mli + nOi +</!(mo;+ n0i))2 - 8</!nOi(mo; + mli))112

4cf>noi

- -

(m1, + nOi)

+

[(mli + n0,)

+

-'-"--'----'=_:::----:-='-;----=----"---"'-2 _{(mli + no;)(mo; +no;)- 4n0i(mo; + m1;)]}

4no;</!2 4no;,P2 _4no;</!

-I

X~----~---~~~~~---~

((m!i + nOi +</!(mo;+ no;))2 _{+ 8</!no;(mOi + m1,))}

_ (mli +no;) + [(m1; + n0;)2 + <P(mli + no;)(mo; + nOi)- 4no;(mo; + m!i)l

4n0i4>2 4noi4>2

I

X ((m!i +no;+ ,P(mo; + no;))2 - 8</!no;(mo; + m1;))

_ (m!i +no;) + (mli + n0i)2 + (m!i + no;)(mo; +no;)- 4no;(mo; + mli)<P 4no;,P2 _4no;</!2_{[(mli +no;+}_f(_{mo;+ no;)- 4</!noâ1o;]}

4(mu + no;)no;)pDi</!- 4no;(mo; + mli)<P 4[(mi; +no;+ f( mo;+ nOi) - 4</!no;po.]no;</!2

[(m!i +no;+ <P(mo; +no;)- 4</!noâ>o;J<P ·

(59)

Revisão Bibliográfica

[1] Boché, Silvia Leonor (1990) - "Estimação Não Tendenciosa do Risco Relativo", Tese de Mestrado, IMECC/UNICAMP.

[2j Gart, John J. (1971) - "The Comparison of Proportions: A Review of Significance Tests, Confidence Intervals and Adjustments for Stratification", Review of Interna-tional Statístical Institute, Volume 39:2, 148-166.

[3j Koopmam, P.A.R. (1984) - "Confidence Intervals for the Ratio of Two Binomial Proportions", Biometrics 40, 513-517- June 1984.

[4] Gart, John J. and Nam, Jun-mo (1980) - "Approximate Interval Estimation of the Ratio of Binomial Parameters: A Review and Corrections for Skewness, Biometrics 44, 323-338 · June 1988.

Bibliografia

• Bailey, B.J.R. (1987)- "Confidence Limits to the Risk Ratio", Biometrics 43, 201-205, March 1987.

• Noether, Gottfried E. (1957) - "Two Con:fidence Intervals for the Ratio of Two Probabilities and some Measures of Effectiveness", American Statistical Association Journal, March 1957.

• Bedrick, Edward J. {1987)- "A Family of Confidence Intervals for t.he Rat.io of Two Binomial Proportions", Biometrics 43, 993-998, December 1987.

• Thoma.s, Donald G. e Gart, John J. (1977) - "A Table of Exact Confidence Limits fo Differences and Ratio of Two Proportions and their Odds Ratios", Journal of the American Statistical Association, March 1977, vol. 72, number 357, Applications Section.