• Nenhum resultado encontrado

Uma extensão da técnica AID em modelos lineares generalizados

N/A
N/A
Protected

Academic year: 2021

Share "Uma extensão da técnica AID em modelos lineares generalizados"

Copied!
213
0
0

Texto

(1)UMA EXTENSÃO DA !tCNICA AID EM MODELOS LINEARES GENERALIZADOS. MARIA CECILIA MENDES BARRETO Estatistico. Orientadora: Profa. Ora. CLARICE GARCIA BORGES DEMÉTRIO. Tese. apresentada à Escola. Superior. de Agricultura "Luiz de Queiroz", da Universidade de São Paulo. para. ob-. tenção do titulo de Doutor em. Agro-. nomia. Área. Esta-. de Concentração:,. tistica e Experimentação Agl'onómica.. P I RACI CABA Est.ado de São Paulo - Brasil maio de 1993.

(2) Barr-eto, Maria Cecilia Mendes B273e. Uma extensão da técni ca AI D em modelos 1 i near es generalizados.. Piracicaba. 1993.. 200p.. Tese_- ESALQ Bibliografia. 1.. 3.. Estatística matemática 2.. Técnica AID L. Luiz de. Queil~oz,. Escola. Modelo matemático. Superiol~. de. Agl~icultura. Piracicaba.. CDD. 518.8 519.5.

(3) UMA EXTENSÃO DA TÉCNICA AIO EM MODELOS LINEARES GENERALIZADOS. MARIA CECILIA MENDES BARRETO. Aprovada em: 18.08.1993 Comissão julgadora: Profa. Ora. Clarice Garcia Borges Demétrio. ESALQ/USP. Prof. Dr. Carlos Roberto Padovarü. IB/UNESP. ProL Dr. Eucl ides. F'CA/UNESP. Prof. Pl~of. Dl~. Bl~aga. Malheiros. . Décio Barbin. ESALQ/USP. . Dr. Hilton Thadeu Zal-ete do Couto. Clt, i entador a. ESALQ/USP.

(4) Aos. quel~. i dos. Flávio Cesar. Guilherme. Heitor. Herminio e Apparecida..

(5) Agradeço: Ã. Profa.. Demélrio. Dra.. pela. Clarice. orienlação.. Garcia. Borges. dedicação. e. eslimulo; • e a lodos aqueles que de alguma forma colaboraram. para. pudesse ser concluído.. que. esle. lrabalho.

(6) iii. SUMÁRIO Página RESUMO. . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . .. vii. SUMMARY ........................................... ix. 1. I NTRODUÇÃ:O . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 1. 1 . 1. Moti vação. 1. 1.2. Objeti vos. 2. 1.3. A organização deste trabalho.............. 3. 2. ALGUNS ALGORITMOS DE DIVISÃO DICOTôMICA HI ERÁRQUI CA ... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 5. 2.1. Introdução ................................ 5. 2.2. Partição dicotômica ................... .... 6. 2.3. Critérios de partição e regras de parada.. 11. 2.4. O método de. agl~upamento. di visi vo hierárquico 18. 2.5. Critérios para a escolha do próximo grupo. 22. 2.5.1. Agrupamento para homogeneidade máxima. . . . . . . . . . . . . . . . . . . . . . . . . . . .. 22. 2.5.2. Técnica AIO. 23. 2.5.3. Agrupamento de casos e variáveis... 24. 2.5.4. Teste de máxima verossimilhança .. ,. 26. 3. UMA INTRODUÇÃO AOS MODELOS LINEARES GENERALIZADOS 31 3.1. O ajuste de um modelo .................... 31. 3.2. Os componentes de um modelo I i neal~ gener aI i zado ..... . . . . . . . . . . . . . . . . . . . . . . . .. 35. 3.3. Inferências sobre o modelo linear gener aI i zado ......... ~. 4. • • • • • • •. 4. ". •. ". ••. 4. • • •. ". ". 37.

(7) iv. 3.4. O algortimo de estimação.................. 43. 4. UMA MEDIDA MAIS GERAL DE HOMOGENEIDADE DE GRUPOS E ALGUMAS CONSEQUtNCIAS ........... ............ 45. 4.1.. Introdução ................................ 45. 4.2.. Uma extensão natural para a medida de homogeneidade de grupos...... ............. 45. 4.3. O caso normal. 50. 4.4. O caso Poisson ............................ 52. 4.5. O caso binomial........................... 54. 4.6.. 63. A escolha da divisão mais promissora.. .... 5. UMA DEFINIÇÃO MAIS GERAL DAS ESTATíSTICAS E UMA ADAPTAÇÃO AO ALGORITMO DE AGRUPAMENTO DIVISIVO HIERÁRQUICO........................... 70. 5.1. Introdução.............. .... .............. 70. 2. 5.2. A estati sti ca R general i zada. c. ;-.. •. •. •. •. •. •. •. •. •. •. 70. 5.2.1. O caso normal ...................... 74. 5.2.2. O caso Poisson ..................... 76. 5.2.3. O caso binomial.................... 78. 5.3. O algoritmo de agrupamento hierárquico di visi vo ................................. 5.4.. 83. Uma generalização do teste de SCOTT & KNOTT (1974) .............................. 85. 6. ALGUNS RESULTADOS SOBRE ADISTRIBUIÇAO 00 MÁXIMO ~. DA ESTATíSTICA 6.1.. ~(~. ) NO CASO NORMAL. . . . . . . . . . .. 89. Introdução................................ 89. ~d. 6.2. O critério B sob a regra de divisão monotónica e mesmo número de. observaç~es. por casela. 89. 6.2.1. Uma transformação conveniente ...... 90. 6.2.2. A distribuição de B. 95. K. ............. .. 6.2.3. Aproximação por uma distribuição qui -quadro ado ..................... .. 97.

(8) v. 6.3. O crilério B sob a regra de divisão monolônica e número diferente de observações. 9a. por casela. 6.3.1. A dislribuição de B. ............... K. 100. 6.3.2. Limiles inferiores para a dislribuição de B. 1<. 102. usando desigualdades ......... 6.3.3. Limiles para a dislribuição de B. 1<. 6.3.4.. usando a distribuição qUi-quadrado. 105. Algumas conclusões................. 107. 6.4. O crilério B sob a regra de divisão livre e. 10a. mesmo número de observações por casela ... 6.4.1.. A distribuição de B. ............... 6.4.2.. Desigualdades que limilam a. K. distribuição de B. K. 109. ................. 111. 6.4.3. A dislribuição de qUi-quadrado como uma aproximação da dislribuição de B. 1<. 112. 6.5. O critério B sob a regra de divisão livre e número diferente de observações por casela. 6.5.1. A função dislribuição acumulada de B. 114 1<. 116. 6.5.2.- Dislribuições que limilam a dislribuição de B. ................. 117. 6.6. Resumo das aproximações................... 118. K. 7.. .. lJM ESTUDO SOBRE O CONPORTAMENTO DADISTRI BUI çÃO A. DO MÁXIMO DA ESTATíSTICA. NO CASO BINOMIAL. 120. 7.1. I nlrodução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 120. 7.2. Descrição do programa de simulação........ 121. ~(rr. ~d. ). A. 7.3. A dislr-ibuição simulada de. ~(rr. ) ......... 122. 7.3.1. O caso de 10 lralamenlos ........... 124. 8.3.2. O caso de 6 lralamenlos ............ 126. ~d. o.

(9) vi. 8.3.3. O caso de 3 tratamentos............ 127. 7.4. Conclusões. 129. 8. O algoritmo AID. 136. 8. 1. Descrição do ai gor i tmo AI D. 136. 8.2. Algumas alternati vas sobre cri tél'ios de 140. seleção e regras de parada 8.3. Um procedimento para valores pequenos de B. 142. 8.4. Procedimentos para valores grandes do critério B .... . . . . . . . . . . . . . . . . . . . . . . . . . . .. 145. 8.5. Uma boa aproximação para a distribuição de B. K. 147 8.6. Uma modificação do algorit.mo AIO para dados da familia exponencial .................. .. 148. 9. A UTILIZAÇÃO DO ALGORITMO AIO EM DADOS BINOMIAIS 151 9.1. Uma análise de um experimento com fungicidas 152 9.2. Resultados da aplicação do algoritmo AIO.. 154. 10. CONCLUSõES .................................. .. 159. REFERÊNCIAS BIBLIOGRÁFICAS ...................... .. 161. APÊNDICE 1: O PROGRAMA DE SIMULAÇÃO ............. .. 166. APÊNOICE 2: RESULTADO DE UMA DAS SIMULAÇõES ..... .. 171. APÊNDICE 3: LISTAGENS DO PROGRAMA E DA EXECUÇÃO DO PROGRAMA DE ANÁLISE DE AGRUPAMENTOS EM LINGUAGEM GLIM ................... .. 182.

(10) vii UMA EXTENSÃO DA TÉCNICA AID EM MODELOS LINEARES GENERALIZADOS. Autora: MARIA CECILIA MENDES BARRETO Orientado!~a:. PROFA. DRA.. CLARICE GARCIA BORGES DEMÉTRIO. RESUMO. Como as técnicas de agrupamentos de médias podem. ser. inadequadas. na. diferente. da. distribuição • Automati c. Inter acti on. apl i cação. em o. gaussiana.. Detecti on'. dados. (AI D). é. com. algori tmo . estendi do. adotando-se como medi da de homogenei dade de grupos uma estatística baseada na função desvio. Esta. úl ti ma. pode. ser. uti I i zada. em. uma. grande classe de modelos, conhecida como modelos lineares gener aI i zados ,. que. abr ange. modelos. do. ti po. r egr essão.. análise de variância. modelos logito e probito.. modelos. log-lineares. entre outros. Considerahdo acaso com K tratamentos e n máximo. da. medida. de. um k. ensaio. completamente. ao. r"epetições por tratamento, o. homogeneidade. de. grupos. e. uma. extensão do coef i ci ente de deter mi nação são obti dos em uma. fOl~. ma. ger aI. supondo. que. os. dados. tenham. uma. distribuição que pertença à família exponencial. e também no caso. particular. de. distribuição· normal.. binomial. e. Poi sson. Supondo que· os dados tenham·· distr i bui ção binomial. a distribuição assintótica do máximo da medida.

(11) vi i i de. homogeneidade. de. grupos. é. obtida. como. sendo. proporcional a uma distribuição qui-quadrado. Esses resultados são, também, uma extensão do procedimento de SCOTT de médias.. & KNOTT (1974), para agrupamento.

(12) ix AN EXTENSION OF THE AID TECHNIQUE IN GENERALIZED LINEAR MODELS. Author: Adviser: PROFA. ORA.. MARIA CECILIA MENDES BARRETO. CLARICE GARCIA BORGES. OEM~TRIO. SUMMARY. Since Clustering techniques for means can be inadequate for proportions with non-Gaussian data. the AID (. Automatic. InteractionDetection. ). algorithm. is. exlended considering as measure of homogeneity of groups a stalislics based on lhe deviance function. Thi s. can. be. used. in. models known as generalized linear have,. as. regl~ession. parti cul ar and. case,. analysis. of. a. 1 arge. models.. among. of. These models. other s ,. val~iance. cl ass. models,. standard logit. and. probit models, log-linear modeIs for contingency tables, etc. Considering a complely random design with. K lrealments and n. k. replicates per treatment. the maximum. of the groups homogeneily meeasur€ isobtained. is. oblained. coefficienl. li. an in a. exlension genel~al. of. ti. the. Also, il. delerminalion. form, supposing a distribulion. for lhe dala in lhe exponential family; in particular lhe normal, binomial and Poisson cases are considered. Supposing a binomial dislribution for da la. lhe asymplotic di slr i buli on gl~oup. fOl~. lhe. lhemaximumof lhe. homogenei ly measure is oblained,. il. is shown thal.

(13) il is proporlional. lo a. chi-square disltibulion.. These. resulls are also, an exlension of lhe procedutes proposed by SCOTT. & KNOTT. (1974) for cluslering means..

(14) 1.. 1. I NTROOUÇÃO.. 1. 1. Moti vação. Uma encontradas. por. das. pesqui sadores. de. freqüentes. mais. situações. di versas. áreas. do. conhecimento é formar grupos de individuos que sejarn, de alguma maneira. similares. A análise de agrupamentos é um conjunto de técnicas e algori tmos cujo objeti vo é i ndi vi duos em gr upos si mi I. al~ es. encont..r·al~. a par ti r. e separar. do conhec i mento. de p vaI" i á vei s que os def i nem. Entretanto.. algumas vezes, além de se ter. um conjunto de p variáveis preditoras. variável. I~esposta. tem-se também uma. definida para cada indi viduo.. Um dos. procedi mentos exi stentes para a busca -de grupos si mi I nessa situação, Oetecti on "). al~es. é a técnica AIO CtlAutomatic Interaction. que foi. i ni ci aI mente proposta. pOl~. MORGAN &. SONQUI ST C1 9(3) .. . mco t t do de. ( ). agl~upamen. t o de n'e' ,_ dl' a--::::c de C:.C()TT __. & KNOTT (1974) é um caso par·ticular da técnica AIO,. e usa. o método de análise de agrupamento divisivo h.ier·ár'quico dicotômico. para. sepatal~. as. médias. amostrais. de. tratamentos em grupos razoavelmente homogêneos no caso de delineamentos bal anceados ~- quando o r'esul tado de um teste.

(15) 2.. F na análise de variância é significativo. COX. (1982). SPJ0TVOLL. &. usam. como. procedimento o teste das hipóteses de que os dados estão, primeiramente. em dois grupos homogêneos. e caso não haja nenhuma partição satisfatória.. em um segundo passo são. testadas todas as partições em três grupos e assim por diante.. A estatistica. utilizada é. baseada. no. teste. F. tr adi ci onal . CARMER & LIN (1983) fazem um estudo. do. erro do tipo 1 para métodos de agrupamento di visi vo de médias. de. grupos,. que. formam. conjuntos. disjuntos. de. inteiramente. ao. tratamentos. Considerando. um. ensaio. acaso do comportamento de fungicidas sobr'e a porcentagem de ger mi nação de sementes de mi 1 ho. uti 1 i zar em esses para. a. métodos. transformação. não é. adequado se. na anál i se de var i ânci a. arco. seno. da. raiz. usual. quadrada. da. proporção de sementes germinadas. uma vez que o interesse do. pesquisador. está. em. um. agrupamento. na. variável. original. Nessa modelo. pr obi to. ou. si t uação 1 ogi to.. é. i ndi cada. segui da. de. a. anál i se. de. uma. técni ca. de. agrupamento que se adapte à variável resposta binária.. 1. 2. Objetivos.. A medida usada. por exemplo t. pOI~. de. homogeneidade. entre. grupos. SCOTT & KNOTT (1974). cor r- esponde. à soma de quadrados entre dois grupos. em um delineamento. completamente. ao. acaso.. Um. dos. primeiros. autores. a.

(16) 3.. definir. homogeneidade. entre. grupos. foi. FISHER. (1958). propondo a soma de quadrados ponderada. Entretanto. a partir do desenvolvimento de modelos. lineares. WEDDERBURN esta ti sti cos.. generalizados. por. CMGL). (1972). um. grande. tai s. como. modelos. número de. NELDER. de. regressão.. &. métodos modelos. probito e logito. modelo de médias, modelos log-lineares. modelos. de. regressão. de. Cox.. dentre. outros,. pode. ser. escrito de uma maneira unificada. possibilitando. também. que a função desvi o sej a usada como medi da de qual idade de ajuste do modelo em questão. Esses aI gor i tmo. AI D par a. conceitos uma. cl asse. permitem mai s. ampl a. estender. o. de si t uações. onde se faz necessária a aplicação de métodos di visi vos hi er ár qui cos.. 1.3. A organização deste trabalho.. Com. o. objetivo. modificação na técnica AID. pal~a. de. propor. se. uma. que se possa utilizar um. mélodo de di vi são di cotómi ca .. hi er árqui ca em anál i se de agrupamentos. para. um. grande. número. de. modelos. estatisticos. este trabalho estuda. em particular. o caso de resposta binária, onde os modelos logito e. p~obito. são. casos tipicos. bem como o caso de resposta categorizada. onde. os. modelos. log-lineares. são. utilizados. para. a. anál i se.. o. Capitulo. 2. trata. de. algoritmos. de. divisão dicotómica hierárquica. onde se faz referência ao procedimento de SCOTT &: KNOTT (1974) e ao algori tmo AID..

(17) 4.. Uma breve introdução aos modelos lineares generalizados,. pel~mi. que é apresentada no Capí tulo 3,. estender o concei to de homogeneidade entre grupos dados da f amí 1 i a uma. definição. exponenci aI. mais. geral. CCapí t uI o. das. 4).. Desse. estatísticas. te. para modo.. usadas. no. algori tmo AID são estendidas para a família exponencial no Capitulo 5. Um. resumo. dos. resul tados. a. respei to. da. di str i bui ção do máxi mo da medi da de homogenei dade entr e grupos no caso de distribuição normal, está no Capítulo 6 e no caso de distribuição binomial. no Capítulo 7. Uma descrição mais detalhada do algoritmo AID. e. algumas .... modificações --em. seus. passos. estão. no. Capitulo 8. Uma AIO, caso. usando a. das. medida. binomial,. possi vei s. do. aI gor i Uno. de homogeneidade entre grupos. discutida. é. vel'sões. em. um. modelo. logito. no no. Capitulo 9.. o. Capitulo. 10. apresenta. as. conclusões. deste trabalho. Uma. cópi a. do progr ama. uti 1 i zado par a. se. obterem os resul tados da si muI ação está no Apêndi ce 1. urna das si tuações estudadas. para. apli cação. Apêndi ce 3.. do. aI gor itmo. no Apêndice· 2. AID. O pi'ogr'ama. estendido. está. no.

(18) 5.. 2. ALGUNS ALGORITMOS DE DIVISÃO DICOTóMICA HIERÁRQUICA. 2.1. Introdução. Na. comparação de. médias. por exemplo em anál i se de var i ânci a. interesse apresentá-las. agrupadas.. de. tratamentos.. al gumas vezes é de de. tal. modo. que. os. tratamentos do mesmo grupo possam ser considerados como tendo a mesma médi a. Quando o número de ní veis do fator. ou o. número de variáveis predi toras é mui to grande. a escolha de um modelo adequado e sua subseqüente avaliação podem se tornar trabalhosas e na maioria dos casos -de difícil interpretação.. Técnicas al ternati vas baseadas em análise. de agr upamentos. podem ser. conceitualmente. mais. usadas I. intuitivas.. poi s. I. al ém de. em. geral.. ser em. produzem. resultados mais simples de se interpretarem. O Detection"). método. AID. proposto por. (lfAutomatic. Intef'action. MORGAN & SONQUIST (1963). como. uma das técnicas de análise de agrupamentos. consiste em di vi di r. o. conj unto. de. dados. sucessi vamente. em gr upos •. combi nando ou não as cl asses das variávei s predi toras·· ou níveis. dos. fatores.. diferenciem ao. de. máximo. modo em. a. produzir. relação. à. grupos. média. da. que. se. variável. resposta. O processo de subdivisão é aplicado enquanto as.

(19) 6.. di vi sões obti das contr i buem par a expl i cal' a var i ação dos dadoS e ao final ser. tem-se um conjunto de grupos que podem. identificados. por. alguns. níveis. dos. fatores. ou. variáveis predit.oras e suas interações mais importantes.. 2.2. Partição dicotômica. Par a se di vi di r gr upos. homogêneos.. partições. uma sol ução ser i a. possíveis. aquela que é. um conj unto de dados. do. referido. exami nar. conjunto. e. ótima segundo algum cri tério. (1958).. conforme. observou. anterior.. teoria ou conveniência.. PISHER. todas. em as. escolher. Entretanto. conhecimento. por. algumas- partições são. eliminadas como sendo soluções possíveis.. Um caso típico. é. sucessivamente. quando. durante ordem. as. observações. alguns. anos.. cronológica.. número. de. e. Esse. partições. são. tomadas. deseja-se fato. agrupar. em. possíveis.. si. os. elimina. desde. que. dados um. se. em. gl'ande busquem. apenas grupos formados por" elementos consecuti vos. Como em cada probl ema tem-se um conj unto de regras que determinam as part.içõespossíveis. que. uma. r. regra. pode. ser. classificada. como. nenhurna condi ção é i mpost.a às parti ções, caso. restrita.. consideração.. certas. condições. sejam. diz-se. l i vre. se. ou então como levadas. em. Dentre as restritas, se os grupos formados. ti vel'em el ementos consecuti vos com reI ação a aI guma ordem fixada. no. conjunto. {f,2, . . . ,K). de. índices. das. observações. a regra é monotônica. Se, por outro lado. os grupos são formados por regra é complexa.. ou~ro. Indica-se. tipo de restrição. então a. r L uma regra livre e r M uma.

(20) 7,. regra monotónica.. ,. Mostra-se que quando da aplicação de. -:>K-1 1 regr'a Y L' tem-se r...... partições possíveis. regra Y , K-1 partições possi veis,. e quando da. M. No exemplo onde os grupos são formados em ordem. cronológica. tem-se. uma. l'egra. monotónica.. Y. O. algoritmo de HARTIGAN (1972), que apresenta um modelo e uma. técnica. para. agrupar. variáveis, é um exemplo de ( 1976). BUSSAB. simultaneamente. regl~a. apr'esenta. complexa,. em. e. casos. O trabalho de. detalhes. todo. o. desenvolvimento de regras de agrupamentos. em particular. Sem perda da gener'alidade.. considere-se o. conjunto de observações dispostas em K caselas, que serão agrupadas e. o~onjunto. I. de. tal. maneira. que. =. de índices. (2.1). (1,2,., . ,K). quando. se. fizer. uma. partição. das. caselas. escrever-se-á uma partição do conjunto I. Ao se aplicar uma regra Y a um conjunto de índices. última. I. é. tem-se. uma. partição. consti tu! da _de. dois. dicotómica,- se. g1' upos .. Seja. tI'( I. esta ,y). o. conjunto de todas as partições dicot6micas possíveis y do conjunto I.. Qualquer' elernento d de {pCI,r) é formado por. dois subconjuntos J(d) e Led), que são cornplementares ern I, ou seja. J(d) n L(d) = 0. Por tem-se que:. e. exemplo,. Jed) u L(d). para. I. =. 1. =. (2.2).

(21) 8.. Apl i cando a. regra. 1 i vre. rL .. o. conjunt.o. tp(I.r ) L. cont.ém 31 element.os.. • Considerando a regra monot.ónica fixada é a nat.ural, tp(I.r ). onde a ordem. cont.ém 5 element.os. d .•. M. est.ão na Tabela 1.. rM .. que. l. Convém not.ar que se a ordenação não ~I.r. fosse a nat.ural. os element.os do conjunt.o. M. ). seriam. complet.ament.e diferent.es daqueles encont.rados.. Tabela 1 -. Element.os I. =. do. (1. 2 • 9 • 4 .• 5 .61-. onde. conjunt.o. 'lICI·r). e a .. or dem. monotóni ca é a. M. natural. JCd). d d d d d d. •. (1). (2,9,4,5,6). (1,2). (9,4,5,6). (1.2,9). (4,5,6). {1,2,3,4}. (5,6). {1,2,3,4,5}. ( 6). 1. 2 3. 4 5. Se. o. conjunto. classificação dupla. out.ro. LCd). com. 3,. ·ele. I. corresponde. sendo terá. representados através de. um fat.or 6. a. caselas. com 2. elementos. ern. níveis. que. podem. uma e. o. ser.

(22) 9.. \ Falor 2 Fator_l_ 1. 2. 3. 1. f. 2. :I. 2. 4-. 5. 6. Então o conj unto de i ndi ces das casel as tem a segui nte correspondência com o conjunto de indices 1:. = {f,2,3,4-,5,6}. {C 1 .1) • C1 .2) , (1 .3) • (2. 1) • (2.2) • (2.3)}. (2.3). Considerando. que. a. r. regra. permite. partições baseadas em agrupamentos marginais apenas com partições monot6nicas para o-fator 2,- tem-se quetKI .y) contém 3 elementos , d , d • d • que estão na tabela 2. 367. Tabela 2 - Elementos 1=< t,. e. Z, 3,4,5, 6}. agrupamentos. onde. conjunto. do. a. r"egra. marginais. r. com. permite partições. monotónicas para o Fator 2. J(d). d d. d d. S. L(d). (i,Z,S). (4,5,6). (t,4). {Z,S,5,Ó}. {t,Z,4,5}. {S,6}. 6. 7.

(23) 10.. Se d é um el emento de WC 1 • r ) • formado por. doi s. subconj untos. de. I.. JC cL). outro lado. se for considerada a classe um. de. seus. subconjuntos de LCd).. (JCd).JCd').LCd')} conjunto. sucessi vaso. JCd'). é. obtida. I.. formar á. d'. el ementos. LCd·).. e. formado por. por. duas. Define-se então a. e. então d é. LC d).. Por. ~CLCd).r).. cada. novamente. doi s. Assim o conjunto. uma. divis5es. tripartição. do. dicotómicas. tripartição de I. r. formada. deste modo como o resultado de um produto especial. *. JCd). =(. CLCd).r). [JCd).JCd').LCd')]. ) (2.4). ~CLCd).r). d'E. Pode-se. então. construir a classe 0(3) de todas as. possi vei s--tr i par-ti ç5es de I. partiç5es dicotómicas. r. obtidas por. duas. sucessivas. que é dada por:. O(3) =. u d. E. 'IJC!. .r). ([. ~CJCd).r). *. LCd) ] u [ JCd). *. ~CLCd).r). ] }. (2.5). Através_ constr 6i -se. a. cl asse de. tetrapartiç5es dicotómicas. r.. de. _uma_partição. OC 4). - I,. de. obtidas. todas por. de maneira análoga à. as. de. 0(3). possi vei s. tr és - -divisões. obtenção da classe. O(3).. As muI ti par ti ções - subseqüentes. podem ser. obtidas até se atingir a partição onde cada subconjunto tem apenas um. elemento~ou. nCK) = {. [. Ú}.. seja. (z) •. -; .•. (K) }. ). (2.6).

(24) 11.. A cl asse de todas as possi vei s do. conjunto. obtidas. I.. pela. aplicação. paI'ti ções. sucessiva. de. partição dicotómica r é indicada por TCI,r).. = (I). Fazendo nCl). = ~CI.r).. e n(2). tem-se. que K. TCI.r). (2.7). u nCj). = j. Esses. =1 concei tos e. o. modo. hi er ár qui co de. construção da classe TCI,r) permitem uma analogia com um grafo terminal de dois. na teoria dos grafos. uma vez que um grafo consiste de um conjunto de nós e um conjunto de arcos. nós.. No presente caso, i. E. TC I • r) .. par ti ções (nós) conectados) partição. se. i. Quanto e. i'. uma. partições correspondem aos. aos. di z -se. ar cos •. que. duas. de TC I • r) são adj acentes Carcos. pode. di cotómica. as. ser. obtida. da de. simples. outra. por. dos. um. uma seus. subconjuntos.. 2.3. Critérios de partição e regras de parada. Uma. vez. estabelecido. obter em gr upos. homogêneos. imediato sabel'. que partições. o. inter namente,. objetivo é. de. se. de i nter esse. levam ao agrupamento mais. homogêneo. Pode-se dizer que o problema é semelhante à classificação cruzada múltipla em análise de variância,. uma vez que a técnica aglomerativa tenta agrupar caselas.

(25) 12.. que. têm. médias. muito. próximas.. Como. cada. casela. é. determinada de maneira única pelos niveis dos fatores. os grupos. são estabelecidos. através. variável resposta e os fatores. uma. discussão. detalhada. de. das. relações. entre a. Em BUSSAB (1976) existe. um. modelo. apresentado. em. SONQUrsT- que. a seguir. é apresentado resumidamente.. O conjunto de N observações é formado por vetores var i á vel fatores. (y. x • x •...• x) onde. na forma. 1. dependente ou. Y e. cada. x, x •...• x 1. 1. uma. y corresponde. à. a. um conj unto. de. Os. preditores. são. P. 2. P. X.X , ... ,X .. preditores. classificações.. 2. 2. P. das quais. com k. p. cl asses. (ou. niveis), para l:::;p:SP. Considerando. todas. combinações. as. possiveis dos níveis dos preditores em uma classificação total. sejam K delas não vazias,. comn. k. Cadaindice k niveis.. corresponde a. podendo. tratamento.. uma.única. considerado,. ser. elementos, l:Sk:SK. combinação .. dos. então.. como. um. Sendo cada um dos N valores observados de y. um número de uma dessas i ndi cados por y. então el es podem ser. representando o. kj •. k-ési ma caseI a.. caseI as,. com 1 'S.k'S.K e 1 :::;j'S.n . k. j-ésimo elemento da Para simplificar. a. notação, seja Y a média da k-ésima casela ou tratamento, k. então n 1. n. 1. SONQUI ST. J . N.. Har bar.. k. E k. (2.8). j= 1. Hul. ti variate. I nsti tute for. of Michigan. 1970.. Node 1... Saci aI. Bui 1-di ne.. Research.. Ann. Uni versi ty.

(26) 13.. Uma. medi da. de. homogenei dade quando as. N. observações estão em um único grupo é dada por. k=1. onde Y é a média geral. considerada. vez. -,2. = E ,E CYkj. SQTCtotaL). também,. (2.9). y.J. J=1. A quantidade SQTCtota'L) pode ser. como. que. uma medida de dispersão,. uma. de todas as observações em relação à médi a geral y. A expl'essão (2.9) pode. ser. var i abi I i dade. a. decomposta. SQ[Ctotal.). em. duas. SQDCtotal.). e. somas. que. de. quadr ados • denominadas,. são. respectivamente. variação entrecaselas e variação dentro de caseI as.. Assim. SQTCtotal.). = SQECtotal.). K. E n kCy k -. =. -. y). 2. k =1. K. +. E k=1. + SQDCtotal.). n. k. E Cy j=1. kJ. -y. )2.. (2.10). k. A função perda quadl'ática SQTCtotal.) pode ser considerada como a perda de informação que resulta de trata!' ger'al. todos y.. informação caseI a h,. os. IV elementos. a. quantidade. Já PO!'. y . k. tratar Já a. cada. como. tendo. SQDCtota1.) obsel~vação. a é. mesma a. per'da. como a. quantidade SQ[CtotaL) é. média. a. de. média. da. pel~da. de. informação por tratar cada média de casela como a. média. geral ponderada pelo número de elementos em cada casela. Como objetivo de agrupar as K caselas em, por exemplo, G gr' upos, def i nem-se as segui ntes expr essões.

(27) 14.. E. onde. indica a soma dentre os lratamentos alocados ao. kEg. e-ésimo grupo:. • N. =. 9. • Y. E. k. kEg. =. 9. E. n. kEg. número de elemenlos no e-ésimo grupo.. n:. k. y /N k. média do e-ésimo grupo.. 9. n. SQT (t'r'u.po) 9. k. = E. E. kEg. j =1. (y. -. -. y) 9. kj. 2. soma de. quadl' ados. lolal no e-ésimo grupo.. •. SQE. 9'. (erupo) =. En kEg. k. 2 V ) - 9. (y -. k. soma de quadr' ados entr e. caselas no e-ésimo grupo. n SQD (erupo) 9'. =. k. E. E. kEg. j =1. (. ,2. Y -. y). kj. k. de. soma. quadrados. dentro de caselas no e-ésimo grupo. G. • SQRCG). = E g=1. G. SQE (eT"Upo) = 9. E g=1. E n k (v• k -. kEg. -. y). 2. 9. soma de. quadrados residual devida aos G grupos. G. • SQXCG). - 2 y). = E. soma de quadr ados de'v'ida aos. 9=1. G grupos.. De acor'do com WARD (1 f.163). SQT C eTUpo) é a 9'. perda de informação devido ao e-ésimo grupo e à perda de informz:ição do modelo de G grupos é a soma das cada grupo. isto é.. pel~das. de.

(28) 15. G. 1:. SQT (erv-po). 9. g=t. Mostra-se facilmente que. n SQT (e1"'UpO) = 9. 1:. k. 1: (:>\..J. Y. )2. -. Y ). Y. -,. kEg j =1. n. =. k. 1:. 1:. kEg. j=t. n =. [. (V. - kj. + (y - Y ) k g. k. ]2. =. -. )2. k. E. 1:. kEg. j=i.. = SQE. =. 9. (y. kj. -. (erupO). ')2. k. +. 1: kEg. + SQD. 9. n (y - Y k k g. =. (2.11). (B'l"'UPO). 9. e também n. G. 1:. SQD. g=1. (eI"UpO). 9. = 1:. k. E (y k. E. g=i. kEg. j =1. = L"\' L"\' ( -Vlq-. V). J. ,)2 :>\-- =. K 2. =. - k. (2.12). SQD( totaL) ,. k=t Fi.. Em. consequênci a.. tem-se. que. a. modelo de G grupos é composta de. quadl~ados. informação casela k.. residual. por. tratar. y • ou seja k. pOl~. devido aos cada. perda. de. í nformação. duas parcelas: G gr'upos. obsel~vação. a. no. soma. e. a. perda de. como. a. médi a. da.

(29) 16. G. G. E. SQT (erupo) = 9. 9=1. G. E. E. SQE (erupo) + 9. g=1. = SQR(G). SQD (erupo) 9. g=1. + SQD(toLai) .. (2.13). Como para um conjunto de dados SQD(totai) é f i xado • a. per da de i nf or mação no mode lo de G gr upos. depende apenas de SQR(G). isto é, da maneira pela qual as. K caselas. são. partidas. em. G grupos.. Pode-se. mostrar. também que. n. a. SQT(totai). = E. k. E. E. g=1 kEg. j=1. (y. kj. 2 y). -. +. 9. o. 9=1 9. a. = E. SQT (erupo) +. E. 9. g=1. = SQR(G). g=1. EN (y-. N(y 9. -. - 2 y). 9. - 2 y). 9. (2.14). + SQD(totai) + SQX(G). Comparando (2.14) com (2.10) obtém-se. SQE(tota7..). = SQR(G). Assim. ao. (2.15). + SQX(G). se. tentar. minimizar. a. perda. SQR(G). maximiza-se SQX(G) uma vez que SQE(totai) é fixo.. Como não se pode constr ui r mai s. fi na. acei tável. definida. para. grupo,. expressão (2.13). grupos. a. de. SQT(tota7..).. cada. das. caselas. N. casela. dá. observações. correspondendo,. do. ou -tratamento. diz. uma. uma. que. aquel a. formando. que qualquer. perda- entre. par ti ção. um. conjunto de SQD(tota7..). respectivamente. à. e. partição. mais fina com K grupos e amais-f'udimentar- com um único.

(30) 17.. Esta. grupo.. COl~. r esponde. à. "per da. r eduzi da. SQRe" G). ti. variando entre zero e SQEe"totaU. Levando. em. conta. essas. premi ssas.. o. problema de análise da perda de informação considerando todos os el ementas no e-és i mo grupo como tendo o mesmo valor. é. y •. equi valente àquele da. análise da. perda de. 9. informação considerando todas as k médias de caselas no .9 e-ési mo grupo tendo a mesma médi a V . ~g. Considere a expressão SQRCG) como a perda da i nfor mação no modelo com G gr upos. e SQXC G) como a soma de quadrados explicada pelo modelo. Uma medida usada para informação sobl~e o. dar. modelo é. a. 2. estatística R. •. que. expressa a proporção da soma de quadrados explicada pelo modelo em relação à soma de quadrados total.. No presente. caso pode-se colocá-la como. (2.16). Demonstra-se que. (2.17). 2. onde, R e"K) cor responde ao coeficienle de delerminação de um. modelo. com. Uma. tl~atamenlos.. K. forma. reduzida. no. intervalo [0.1J é dada por. 50)(eG). =. (2.18). SQEe" total.) Esta. úl ti ma. soma. de. pode ser. quadro ados. i ntel'prelada. e>-.rpl i cada. na. como a. proporção da. consti tui ção. de. tai s.

(31) 18.. modelos. Entr-etanto a aplicação desse conceito especifico em cada. partição torna-se. tr-abalhosa devido. ao grande. número de elementos de T(].y). Um médias. em. procedimento. gr-upos. homogêneos. melhor pode. para. ser. agrupar. encontr-ar. as uma. partição das caselas tal que :. a partição tenha a menor SQR(G) , para um. • caso 1. número fixado G.. ·caso 2. a partição tenha o menor número de grupos G para um nivel fixado de SQR(G).. técni cas. têm. si do. aplicadas tanto no primeiro caso como no segundo,. sendo. que neste úl ti mo surge a. valor. As. de. agrupamento. questão da. escol ha. do. mi ni mo desejado de per-da de informação.. 2.4. O método de agrupamento divisivo hierárquico. Deseja-se encontrar uma partição ótima de caselas. tal. minimizada partiçC5es encontrar-. que sob. a. função. certas. possiveis uma. Como. caselas. é. cal cul ando a. cada parti ção e então escol hendo condi ções impostas.. quadrática. restriçC5es,. das. parti ção. perda. o. SQR número. finito, função. seja de. pode-se. perda. para. uma que sati sf aça às. Esse pr ocedi mento é f acti vel. par ~ G. fixado desde que os valores de K sejam pequenos. No prudente. caso. restringir. em as. que. G. não. técnicas. é de. conhecido,. é. análise. de.

(32) 19.. agrupamentos que. em. hieral~quicamente.. àquela que atue. cada. estágio. possa. ser. verificado. de modo. se. a. perda. núnima é atingida ou outra regra de parada é alcançada.. o divisivo. é. um. método. agrupamento. de. procedimento. simples. e. hierárquico. fácil,. composto. pelos seguintes passos :. No. i ni ci o. agrupamento.. Por. todas algum. as. caseI as. estão. procedimento. em. ótimo,. um. úr'lÍ co. esse. grupo. pode ser dividido em dois.. • Outro critério de seleção escolhe um (ou os dois) dos grupos resultantes e se faz uma nova divisão.. • O passo -anter i oré repetido-até· que o. númel~o. total. de grupos finais é atingido ou alguma regra de parada é sati sfei ta.. Considerando partição d, pode. ser. com G grupos. colocado. que. se. tenha. atingido. uma. o método di visi vo hierárquico. matematicamente,. e-ésimo grupo em dois novos,. e. 1. como. e e. 2. dividindo. o. Verifica-se então. que. N. = N + N g. 9. e. que. a. 1. e. q -2. perda. 9. de. (2.1 g). N Y. 9. infol~mação. def i rü da por. SQECd) = SQRCG) - SQR(G+l). sofre. uma. redução. SQECd).

(33) = SQE cerv.po). = SQXCG+1). Ceru.pO). SQR 92. 9. - SQXCG) - 2 y) -. -. - 2 y) .. N Cv 9 - 9. (2.20). Donde se obtém -. 2. N y. SQECd). 9 9. No. contexto. de. (2.21). .. anál i se. de. var i ânci a.. a. expressão (2.21) é a soma de quadrados entre tratamentos de dois grupos resultante de uma partição dicotômica do grupo ancestral. bem como o montante de explicação ganho. pela di vi são. A. redução. SQEC d).. chamada apenas por redução SQE.. que. mui tas. vezes. é. tem si do usada como base. para o cri tério do método di visi vo hiel'árquico. Dessa agrupamento. maneira.. di visi vo. dado. que. hierárquico. o. foi. método. de. aplicado,. conseguiu-se uma partição formada por G grupos de ], isto é. G. ]. = U 9=1. (2.22). I 9. Cada partição d de wCI .y) tem associada a 9. redução SQECd) que é obtida, (2.21).. por exemplo, pela expressão. Seja BC] ,y) o máximo entre as somas de quadrados 9. entre grupos. isto é..

(34) 21.. = m.ax. B( 1 • r) 9. { SQE( d). d. ,r) ).. tJ!(1. E. (2.23). 9. A partição d. tal que. o. SQECd ). o. = BCl 9 .r). (2.24). pode ser considerada a melhor divisão dicotômica. Diversos (1958). e. autores,. SCOTT & KNOTT. classificação, classificação. (1974).. HARTIGAN cruzada. entre par a. (1972). e. o. caso. para. &. Sonquist. de. o. úni ca. caso. Morgan. Sonqui st et aI i i 3 ci tados por- BUSSAB (1976). 2. além. de de. par a o caso. pl~opuser'am. de classificação múltipla cruzada. FISHER. eles. diferentes. maneiras de escolher o próximo grupo G que será dividido. bem' como parar o processo de di visão caso o número t.otal de. conjuntos. priori. li.. na. partição. não. De uma maneira geral.. seja. especificado. lia. pode-se dizer que para a. pr óxi ma di vi são é escol hi do o conj unto 1. que conduz ao S. valor. máxi mo. de. e. BC 1 • r ). como. r egr a. de. par ada. do. BCl ,r). é. 9. processo. é. verificado. a. se. estatística. s. significativa a um nível pr·é-fixado.. 2. SONQUIST, J. N. Interaction Resear'ch. &. MORGAN,J. A.. Effects. Center,. The. Monografia. Institute. for. Detection. no.. 35.. Social. of. Survey. Reseal~ch,. Uni vel~si ty of Michigan, 1964.. 3. SONQUIST. J. H. ; BAKER. E. L.; MOF2GAN, J. A. Structure.. Insti tute. for. Univer'sity of Michigan. 1971.. Sear-ching Soci aI. for-. Research..

(35) .::>~,. c...,G.. 2.6. Critérios para a escolha do próximo grupo. A li teratura sobre técnicas di visi vas de agrupamentos é muito extensa. mas poucos artigos tratam o problema. especifico. de. agrupamento. de. médias. em. uma. classificação múltipla como mencionado na seção anterior. Quatro deles são apresentados a seguir.. 2.6.1. Agrupamento para homogeneidade máxima As t.écni cas de. agl~upamento. FISHER (1958) têm por objeti vo formar. para uma única variável.. propost.as por. grupos homogêneos. Seus resultados são importantes. para esta discussão. apesar dele não ter usado o método de partição dicot.ômica hierárquica. Nesse arti go é abordado o agrupamento com e sem restr'ições nas partições.. Como exemplo do primeiro. caso, tem-se a formação de grupos homogêneos em uma série t.emporal Par a o. onde a ordem cronológica deve ser. agl~ upament.o. respei t.ada.. sem r est r i ções ,. tem-se como i 1 ustr ação. a criação de estratos homogêneos em amostragem. Também é colocado que no caso da regra r. L. e o. l r á. G- K-f - 1 conjunto I t.er· K el ementos. a c 1 asse tIJ<.~ 1 • r o e T. ). L. partições. WCI.y ) L. Neste caso par a se encontr ar com. computacional. a. maior. muit.o. grande.. haverá Entretanto,. a par ti ção d um no. o. E. trabalho artigo. em. quest.ão é demonstrado que a solução está no subconjunto tI/C I .y ) onde.r M. M. M. é a regra· monot.ônica e I M é o coniunto ~.

(36) ordenado. pelos. valores. das. médias. das. casei as. ou. tralamenlos.. 2.5.2.. Técnica AID ("Aulomatic Inleraclion Delection"). o. algori lmo. AID. ("Aulomalic. Interaclion. Delecti on ") lem por pr opósi lo agr upal~ as casei as usando partição dicolômica nas médias marginais dos predi tores em problemas de classificação múltipla cruzada na análise 4. de variância e foi. desenvolvida por Sonquist e Mor-gan •. de acordo com BUSSAB (1976). O ganho óli mo B( d. X ) de um pr-edi tor- X p. obli do a tr a vés de suas médi as mar gi nai s regl~a. rp. associada. ele.-O. a-. e uli 1 i zando a. algorilmoescolhe. partição ótima aquela que produz o. é. p. maiol~. valol~. como. de BCd.X ) p. • 1 s.ps.P.. A r egr a de par ada pr i nci pai é baseada no conceito de ganho-proporcional de uma nova divisão que é dado por. SQ[[d(G+1)] SQT(totaL) SQX[dCG+l)]. =. 4. SONQUIST,J. N. I ntel~acli on. &. (2.25). sore totaL). MORGAN. J. A.. The. delecti on. of. Effecls.. Research Cenler, Instilule Universily of Michigan. 1964.. for Social Resear·ch..

(37) 24.. onde SQX[dCG+l)] é a soma de quadrados devida aos grupos da nova partição dCG+1). resultados. empíricos. arbitrário. 0,006,. ci tados por. de. Sua significância é. e,. em. geral.. acordo. BUSSAB (1976).. com. fixa-se. o. &. SONQUIST. i sto é.. baseada em valor MORGAN.. se o ganho reI ati vo. SQECd,X ) / SQTCtotaL) é menor que 0,006 o processo pára. p. Posteriormente. novas versões do algoritmo foram sugeridas. cOI"lsiderando algumas opções e diferentes alternativas de análise, mas a essência do algoritmo é a mesma, segundo BUSSAB (1976).. 2.5.3. Agrupamento de casos e variáveis. o. aI gor i tmo proposto por. HARTI GAN (1972). para agrupar casos e variáveis corresponde na realidade a uma cl assi fi cação dupl a com uma resposta por. caseI a.. A. essência desse algoritmo é a mesma da técnica AIO. Di z -se que. uma. f amí I i a. de. gr upos. árvore se dois grupos quaisquer não se sobrepõem.. é. uma. Esses. dois grupos são também disjuntos ou um inclui o outro.. O. agrupamento. a. de. Hartigan. é. feito. de. tal. modo. que. estrutura de árvore é alcançada não s6 nas caselas bem como. nas. complexa. médias. Tem-se.. então.. uma. regl'a. r. O. elemento. marginais.. de. processo. TCI,r). atJ'avés. se da. resume. em. técnica. encontrar de. um. agrupamento. di vi si vo hi er ár qui co que r eduz a soma de quadr ados a um valor razoável.. Em cada passo tal estatística é calculada. e o processo pára quando seu valor esper-ado é maior que o.

(38) 25. obtido.. Aqui. também o. conhecimento da. distribuição. da. variável B(l.r) é fundamental. apesar de • em geral. ela ser desconhecida. Considerando aleatórias. independentes.. ( 1. 2, . . . • K). um. conjunto. de. e. Y • Y •...• Y 1. 2. K. um conj unto de i ndi ces. bem como. variáveis. rL. =. !. uma regra. livr-e de partições. a expressão (2.23) pode ser reescrita como. B(!.r) = L. Y( 1 ) + ... +y <p). = max p. {. Y<p+1) + ... +y (lO. }. - -. P(K-p). K-p. p. K. (2.26). onde Y{k> é a k-ésima média ordenada. Sob a hipótese nula 2 Yk ' 15.kSK. tem uma distribuição N( J.1. O' ) . FISHER (1958) usou o resultado de que para K grande a partição ótima sempre ocorre ao redor de p. = 0.5 •. isto é.. (2.27). onde. é. o. ponto. onde. ocorre. a. di visão.. Com. essa. informação o autor provou que assintoticamente. (2.28). B(l.r) L. onde,. 2. X. (K/m. significa. uma. variável. aleatória. qui-quadrado com K/rr graus de liberdade. Nesse. artigo. existem. expressões. assintóticas para a média e a variância de B(!,r). L. BUSSAB.

(39) 26.. (1976). obteve,. entretanto resultados diferentes usando o. mesmo método.. 2.5.4.. Teste de máxima verossimilhança. o hi er ár qui co agrupar. método. foi. médias. usado de. agrupamento. de. por. SCOTT. tratamentos. & KNOTT. quando. divisivo. (1974). um. par a. teste. F. na. análise de variância rejeita a hipótese de que elas são iguais. • ou seja.. número igual. para o. caso de uma classificação com. de elementos. por. casela e. com a. regra. y. livre para divisão dicotômica. Uma. ~. estatística. da. razão. verossimilhança é construída para testar todas as médias contra a sel~. di vididas. em dois. amostra esse grupo é que SQ[Cd). o. = BCZ,y). L. a. de. máxima. igualdade de. aI ternati va de que elas podem. gl~UpOS. desconhecidos.. Para. dado pela particão doE 'KI,y. L. cada tal. ). Aplicando a estatística de teste. ~. tem-se a regra de parada do procedimento divisivo. Poslel~iol~menle_. BUSSAB. (1976). deduziu. o. lesle da razão de máxima verossimilhança para o caso de qualquer. lipo. de. regra. y,. e. caselas. com. diferentes. números de elementos. De uma manei r a ger aI •. têm-se as segui nles suposições:. • As K médias de caselas V • V •...• y - 1. aI ea lór i as k=1 ,2, ... ,K.. i ndependenles. com. - 2. V ""NC I1 - k r. são. K. k. •. val~iáveis. c./ /nk ),. par a.

(40) 27.. •. uma. 222. VS /O' ...... X. v. estimativa. independente. de. O'. 2. com. .. • Uma regra y é. fixada para a. obtenção da di visão. dicotômica.. o. resultado do teste estatistico da análise de. variância rejei ta a hipótese de igualdade de médias das caselas. e. existem. evidências. de. que. elas. possam. ser. divididas em dois grupos homogêneos distintos.. Então. I. par a. =. ( 1.2 • . . . • 1<) •. qualquer. partição d E \f.1(I.y) implicará que a média dos tratamentos é dada por. ~k = {mmJ L. se k. E. se k. E. J(d). (2.29). L(d). no espaço de par âmetros (J.1 • J.1 ••••• J.1 ). 1. 2. I<. Assi m o espaço de. parâmetros desse vetor de médias é determinado unicamente por. (2.30). onde, di( é a partição (1. 0) que. corl~esponde. ao caso onde. todas as médias são iguais. Então sob a hipótese nula. H :J.1 ú. k. =m. • k E I (correspondendo a d jf ).. (2.31 ).

(41) 28.. o logaritmo da função de verossimilhança 1. =-. Lern.. a). (K+v). toe. O'. (2.32). -. ...,. c. O'. 2. assume seu valor máximo em. -. LCy,CJ ) o. = cte. --2- {1 K+V]. -. [. + 1o té:. "02}. (2.33). quando. N =. E. Y =. nk. "L. kEI. n y /N. e. k k. kEI. (2.34). Sob a hipótese aI ternati va. H:/.i= 1. k. aI gum. d. E. J(d).. se k. E. LCd).. C L. par a. se k. E. 1Jt( I • r ). (2.35). onde. m. J. e. m. L. são. as. médias. desconhecidas de dois grupos, o valor máximo do logaritmo da função de verossimilhança K+v. -. -. LCy ,y J. L. ,o) 1. é atingido para. =. (2.36). ete 2.

(42) 29,. a. 2 1.. =. (2.37). onde N. J. E. =. J(d. o. n }. NL =. k. E. L (d ). nk •. o. (2.38). E n ky k/NL. L(d ). o. sendo. a soma par a todo ke.J( d ),. E J (d. o. o. ). todo kELed ) o (2.37) .. e d. o. Par a. ). o elemento de K I ,.1') quemi ni miza ...... o. é. a soma· para. E L<d. se obter. a estati sti ca do teste da. razão de verossimilhança de H vs H basta calcular o i diferença entre (2.36) e (2.33). isto é.. a. K+v. (2.39) 2. e. rejei ta-se H para valores grandes dessa expressão. o Mostra-se que esse procedimento é equi val.ente--a·reJeictar.':~::-·­. H para valores grandes de o. 2. -2. Ny. Cf. J. 1.. 1 -. ou então. =. J. -2. -2. +Ny-Ny L. L. (2. 40). ~. ..

(43) 30, 2. BCI,r). O'. 1. 1 -. a. =. 2. 1-'S. o. 2. +. E ti. k Cy k -. (2.41). l~esullado. eslalislica para se lestarem SeOTT & KNOTT (1974). observações por casela.. r. L. y). (2.41). 2. kEI. o por. -. corresponde. à. as mesmas hipóleses, oblida. no caso de mesmo. ou seja. ti.. = N/K,. k. número. Vk E I. e. Usando o resul lado de HARTIGAN (1972). de. r =. da expressão. (2.28), eles moslraram que a variável. BCI,r). rr. A. L. =. x. a. 2Crr-2). é. assinlolicamenle. qui-quadrado simulação.. com foi. (2.42). 2. o a. equivalenle. K/(rr-2) moslrado. graus que. de. variável. uma liberdade.. qui-quadrado. é. apr'oximação para valores pequenos ou moderados mas não. pal~ aval or es. v~oo. uma. boa. de v/K.. gr andes.. No caso em que a variância a ou. Usando. 2. é conhecida. • (2.41) lorna-se. BCI,r) o. (2.43). 2. que é usada lanlo para o lesle com grandes amoslras como quando a variância é conhecida. No próxi mo capi lulo será apresenlada uma breve inlrodução aos modelos lineares generalizados para que. posler i ar menle. al guns. possam ser eslendidos.. r esullados. aqui. apr esenlados.

(44) 31.. 3.. UMA I NTRODUÇÃO AOS MODELOS LI NEARES GENERALI ZAOOS. Um grande tais. como. dentre. modelos. outros,. de. número de métodos estatísticos. regressão,. podem. modelos. log-lineares.. consi derados. ser. como. casos. particulares de uma classe mais ampla de modelos que foi. & WEDDERBURN. introduzida por NELDER como. modelos. clássico. para. (1972) e é conhecida. lineares. generalizados. o. de. estudo. tais. O. CGLM).. modelos,. texto. McCULLAGH. &. NELDER (1989), servi u de base para este capi tulo que faz uma breve introdução aos modelos lineares generalizados para poder ser definida uma medida mais geral de grupos homogêneos.. 3.1. O ajuste de um modelo. Ao se considerar uma _relação linear entre duas variáveis. por exemplo. y e x. o ajuste de uma reta do tipo y=a+bx, pressupôe a escolha de um par especifico (a,b). de. um. pal~âmetros. valores de preditos. valores. Y1'. de. de. mais. todos. o. A fim. objetivo.. distância. os. pares. possi veis. de. que tornam o conjunto de valores. y 2 •... • y n •. observados.. proximidade medida. conjunto. ou. mais de é. pr6xi mo tornar. possí vel. o. importante. discrepância. entre. conceito definir os. dos de uma. valores.

(45) 32. observados e os valores ajustados. Tanto a norma L • dada 1. por. r:. S Cy.y) = 1.. ~. ly.\. -y.1 1.. i.. como a norma L. • dada por. 00. ~. ~. s 00Cy,v) =. l7l.ÇtX. ~. são exemplos. de. 2. L. I y.1. -y.\. I. funções. mínimos quadrados, norma L. (3.1). a. (3.2). de discrepância.. No ajuste de. medida de discrepância. ou a soma de quadr ados dos desvi os.. usada. é. a. que é dada. por A. (3.3). SCy.y)= 2. 1.. Essa consequências.. abordagem de. A primeira. discrepância. refere-se. soma. à. tem. direta. A. desvi os onde,. i ndi vi duai s •. cada. observação,. um. I y.1. -y1. I como em. tanto' em. desses. implicando. desvios que. depende. as. sugel~e. feitas na mesma escala física e. dos. 2 (y."",y) ,. apenas. observações. duas. são. A. 1.. 1.. de. uma todas. que as observaçães. são independentes ou, pelo menos, que elas sejam de algum modo. pennutáveis,. justificando. então. um. manuseio. dos. componentes. A segunda está relacionada com o fato de que o. uso. das. di ferenças. ar i tméti cas. y -y. \.. todos os desvi os têm pesos i guai s y.. Na ter roi nol ogi a estati sti ca,. como. medida. de. discrepância. i mpl i ca. em. que. L. i ndependente do valor. a uti 1 i dade da nor ma L. p. depende. da. estocásti ca bem como da suposi ção de que a. independência var i ânci a de.

(46) 33.. cada obser vação é i ndependent.e do seu valor médi o. suposições.. embora comuns e. fl~equent.es. Tai s. na prát.ica.. não. t.êm sent.ido em aplicações mais gerais. Out.r a. função. que. medida de discrepância t.em por pela. maximização. fCy;8). a. da. função. função. densidade. distribuição de. parâmet.ro 8.. verossimilhança. expresso. ~=E(Y). pode. ser. adot.ada. como. base est.imali vas obt.idas de. de. verossimilhança. probabilidade. Seja. para. uma. O logari lmo da função de. como. uma. função. do. parâmetl~o. é dado por. =. tC~;y). (3.4). tn fCy;8). e no caso de um conj unt.o de n. obser vações i ndependenles Y •...• Y é a soma das contr i bui ções i ndi vi duai s. n. 1. E. = i... onde. tn f.Cy. ;8.) L. =1. L. (3.5). t. ~=C ~ •...• ~ ). ~. ""'1. .Ntl. A. medida. de. discrepância. utilizada. no. ajuste de um modelo linear generalizado é a função desvio ("scaled deviance") que é dada por. (3.6). onde.. lC~;~). é o logaritmo da função de verossimilhança. cal cul ado no ponto onde os valores aj ust.ados são i guai s às observações e. tC~;~). como em (3.5).. Para modelos de regressão linear da teoria em que os er r os. t.êm di str i bui ção nor mal. com var i ânci a.

(47) 34. 2. conhecida o • tem-se, para uma única observação. a função densidade 2. = C2rw ). -1/2. 2. 2.. exp [-Cy-j.1) /(20 .JJ ,. (3.7). e o logaritmo da função de verossimilhança,. 1 (3.8) ..... 2 cO. 2. Par a. J.1=y. obtém-se. o. valor. máxi mo. do. logaritmo da função de verossimilhança resultando 2. l.nC2-rra ) (3.. l.Cy;y) =. g). 2. Obtém-se então a função desvio que é dada por. D*Cy;j.1) = 2 (. l.(y;y) - l.Cj.1;y) ) =. (3.10). a. Esta. expressão. quadr ados dos r esí duos ,. é. 2. idêntica. à. soma. de. a menos da constante conheci da. c.,2. Aqui desvi o mí ni mo é si nôni mo de mí ni mos quadr ados. Os modelos lineares generalizados são uma extensão dos modelos lineares clássicos. e seu ajuste é feito pelo método de máxima verossimilhança..

(48) 35.. 3.2. Os componentes de um modelo linear generalizado. Seja uma amostra aleatória Y=(Y •...• Y )' N. com. J.1=( J.1 •. . . • I.l ). média. 1.. N. distribuição. que. cuj os. t. rt. per tence. el ementos. têm. uma. exponenci aI. familia. à. n. 1.. de. distribuições, ou seja.. f(y;8.~). onde. = exp. E(Y)=J.1=b'(8). y8-b(8) {. Var(Y)=a(ep)V. e. (3. 11). c(Y.~). a(ep). denominada função de variância. média J.1.. } +. V=b"(8)=dJ.1/d8. com. é expressa em termos da. O parâmetro natural. 8=fv-1.dJ.1.. isto. é,. Geralmente parâmetro. 8=q(J.1). e. caracteriza. a(Ij:J)=Ij:J/w. ··sendo de. dispersão.. 4;. a. uma função de distribuição. como-"-~um. interpretado. w como. e. é. peso. lia. priori. familia exponencial pode ser de dois parâmetros se. li.. lj:J. A for. desconheci do. Entre. as. médias. das. observações. e. a. estrutura linear do modelo. existe uma função de ligação 6(.). de. chamado. tal. modo. predi tor. que. 6CJ.1)=rJ=Xf].. linear.. é. uma. onde função. par âmetr os desconheci dos (5=( (5 •...• (5 )' N. conhecida, é diferenciável. 1.. .. k. e. y=Cn t , · · · .YJ n ) ' linear eCo) •. dos. k. suposta. Em geral 6C.)-não é linear e. X é uma matriz do modelo conhecida.. A caracterização de. um modelo linear generalizado é feita. especificação de três componentes.. então. através da. O primeiro refel'e-se. ao componente aleatório. que é determinado pela indicação de E(Y)= J.l e da VarCY). O segundo refere:""se ao componente si stemáti co que produz o predi tor. I i near. !J. O tercei ro. componente é a especi fi cação da função -âe 1 i gação 6(.)..

(49) 36.. que. relaciona. o. componente. aleatório. ao. componente. sistemático. Todas função. q(j.1) ,. as. vezes. em. que 8=yt.. onde 8. é. a. diz-se que a ligação utilizada é a canónica. No modelo I i near cl ássi co a médi a • I;! , e o. n.. preditor linear,. são idênticos.. A função de ligação é. a identidade. que nesse caso coincide com a canónica. Em baseados. na. modelos. log-lineares. independência. de. dados. para de. cruzada a função de ligação utilizada é. contagens. classificação a. logaritmica.. que nesse caso é a canónica. Par a a. 0<.u<1. di str i bui ção bi nom! aI.. tem-se que. e a ligação devem satisfazer a condição de levar o. intervalo CO.1). reta real.. à. As funções mais utilizadas. são :. • Logistica. (3.12). que é a ligação canónica para o modelo de erro binomial.. • Probilo. n=ii:. onde. ii:(.). -1. (/-1). C3.13). é a função de distribuição acumulada normal.. • Complemento log-log. (3.14).

(50) 37.. A família potência de funções de ligação também é muilo utilizada e pode ser especificada de duas maneiras. A primeira através de. n. À. = { (~ -1)/À para À~O. (3.15). l.n 11 quando À=O. e a segunda por. =. 1). {. 11. "-. se. À~O. (3.16) l.n. ~. se À=O. & NELDER. Em McCULLAGH uma tabela. quelesume~"as. distribuições. (1989, p. 30) existe. princicpais-=ccaracteristicas de. uni variadas. da. família. exponencial.. A. função de ligação apresentada é a ligação canónica para a qual existe uma estatística suficiente dada por dimensão igual à dimensão de As propriedades. estatísticas. principalmente existe.. em. em geral,. exija isso.. ligações. amostras.. (j.. X'r.. no preditor linear Y1 = conduzem can6nicas desejáveis pequenas.. uma -razão -lia. Em cada caso a c função de_. X(j a. modelo,. no. Entretanto. prior!" -no. com. modelo. não que. ligação-t=a1nbém~deYe. ser estudada na adequabilidade do modelo.. 3.3 Inferências sobre o modelo 11near generalizado. Ao se ajustar um modelo a um conjunto de dados.. é. de i nler esse saber quão, di scr epantes estão os.

(51) 38. ~t. valores observados. I;!.. em relação aos. valores ajustados.. obtidos a partir de um modelo que,. um número p Seção 3.1 .•. pequeno de a. medida. parâmetros.. de. em geral. envolve Como mencionado na. discrepância. ou. ajuste. de. um. modelo pode ser obtida de acordo com vários critérios. entre eles o de máxima verossimilhança. que corresponde a duas vezes a logaritmo de uma razão de verossimilhanças. a qual foi chamada de função desvia em (3.6). Com di ver sos modelos. relação. ao. podem ser. númerO. aj ustados. de a. parâmetros.. um conj unta de. observações. O mais simples. a modelo nula. tem apenas um parâmetro.. repr-esentando. a. mesma. média. para. todas. as. observações; pode-se dizer que esse model a contém toda a variação dos Y's devido ao componente aleatório. No outro extremo. o. modela. observação.. e. observações.. completa. os. J.1'S. ficando. tem. n. parâmetros.. correspondem. toda. a. a. variação. cada dos. Y's. um. por. uma. das. para. o. componente sistemático. Apesar desses dois modelas serem ou muita simples ou não informativos. eles servem de base para se medir. a. discrepância em um modelo intermediário- com - p. parâmetros. Sejam vel~ossi. l..(I;!.4';~P. mi I hança maxi mi zado sobr e r] par ~ um valor f i xado. 4'. e. do parâmetro de dispersão. função. o logaritmo da função de. de. verossimilhança. completo com n parâmetros.. l(~.4';~). maximizado. o logaritmo da em. um. modelo. A discrepância de um ajuste é. proporcional a duas vezes adi ferença entre o logaritmo da verossimilhan(;a maximizada em um modelo completo com n parâmetros. e. o. I ogar i tmo. da. função. de. vel~ossi. mi I hança. maxi mi zado sobr- e (! par a um vaI ar f i xado do par âmetr o de.

(52) 39. A. no modelo sob pesquisa. Se. ~,. dispersão,. ~. A. e=eC~). e=eC~). e. são as estimati vas dos parâmetros canônicos sob os dois modelos.. a. discrepância.. a C~)=~/w.. assumi ndo. pode. 1... L. ser. escrita por. n. E. = 2. Y. 1... i=i. [. -. ". E 2w.t .. i.. ". y.C8. -. {. t. t. ]/a.C~). b(8). [y.e.- bCe) I. I. i. n. =. 8.L -. ê) i. 1..=1.. ]/a.C~). +. L. [. ~). + cCy . •. 1... L. cCy.,~) 1... ]. -. ]}. ". ~. bCe). bCe). i.. i.. (3.17). onde.. ". De ~; ~) ,. chamado. modelo sob estudo. reforçar.. de. desvi o. C devi ance ti) li. par a. uma função apenas dos--dados-:. é. também. que a. " função desvio D* C~;I;!).. o. Vale. definida. em (3.6) é o desvio dividido pelo parâmetro de dtspersão. ~.. Os graus de liberdade associados ao desvio são definidos por v=n-p, onde n é o número de observações e pé o número de parâmetros linearmente independentes no modelo. Para desvio. coincide. o. com. enquanto que par a. a. caso a. soma. de de. distribuição quadrados. di str i bui ção de. normal, do. Poi sson •. o. residuo. el e. é. a. 2. estatistica G mencionada por BISHOP et alii (1975). Outra i mportantenledida de di screpânci a é.

(53) 40. uma generalização da estatística de Pearson que é. dada. por. (3.18). h. onde.. é. V(/-l.). a. função. de. val'iância. estimada. para. a. \.. distribuição sob estudo. também cai nci de com a. X2. Para a distribuição normal, soma de quadr ados. dos. r esí duos •. enquanto que para as distribuições de Poisson e binomial obtém-se a estatí stl ca X2 de Peal'son or- i gi nal . Tanto 2. Pearson X. o. desvio. como. di str i bui ção. de. nor mal.. desde. que o. caso de. modelo. erros. a. com. assumi do sej a. A vantagem do desvio sobre ~ como medida de. verdadeiro. discrepância. é. que. ele. hierárquicos. é. aditivo as. se. verossi nLÍ 1 hança são usadas. não o é.. estatística. gener-alizada têm distribuição proporcional. uma distribuição de qui-quadrado no. modelos. a. para. conjuntos. estimati vas. enquanto que. Entr-etanto é mais fácil. de 2. X,. de. máxima. em geral,. interpretar Xl do que o. desvi o. Sai ndo da teor i a de modelos 1 i neares com distribuição. normal. para. os. erros,. desvio ainda não foi estabelecida.. a. distribuição. do. Par-a as distribuições. exponencial e normal invel-sa, resultados exatos já forarn obtidos, quando as observações provêm de um delineamento simples. Uma estudo. é. quociente. através. maneira de. uma. de. se. testar. estatística. o. modelo. expressa. sob pelo.

(54) 41. (D 1. R. =. -D. )/(p-l). p. (3.19). D /(n-p) p. onde D é o desvio de um modelo com um parâmetro e D. é 1 P o desvio do modelo de interesse com p parâmetros. Essa estatística pode ser aproximada por com (p-l). e. graus. (n-p). de. uma distribuição F. 1 iberdade.. de. acordo. com. J0RGENSEN (1983).. Tabela 3 -. Quadl~o. de análise do desvio. para. um. modelo. fatorial completo com dois fatores principais. difer. sucessivas modelo. g.l.. termo. desvio desvio. 1. N-l. D. 1. D - D 1. 1 +A. N-a. D. - D (a). N-a-b+l. <a). a-i. A i gnor ando B. b-1. B eliminando A. ( a). D. 1+A+B. g.l.. <b). D (b). D<b) - D( c ) Ca-l)Cb-1) l+A+B+AB N-ab Nola. D. (al=1+A,. AB eliminando A e B. {c }. <bl=1+A+B,. (c)=1+A+B+AB. De uma maneiraaFl.áloga à-feita -em anál-ise. de variância pode-se construir uma labela de análise de desvio.. As diferenças l:!e desvios e. correspondentes graus. de liberdade fornecem a redução no desvio com a adição de cada lermo sucessivo e generaliza a análise de variância.

(55) sequencial. para modelos. modelo fatorial. lineares.. Por. com dois fatores.. do desvi o com 3 ter mos. A.. B e. exemplo.. para. um. uma tabela de análise. a. i nter ação AB está na. Tabela 3. Se os dados provêm de uma distribuição normal. o desvi o cor responde à soma de quadrados dos respecti vos modelos.. As diferenças sucessivas de desvios e. graus de. liberdade fornecem elementos para compor os numeradores de quocientes do tipo da expressão (3.19) que são usadas para testar os respectivos termos. Os modelos. linear-es. residuos. são. generalizados.. também. definidos. obtendo-se,. para. segundo. o. critério de definição geral dos residuos. os de Pearson, os de Anscombe e os componentes do desvio. A verificação da adequabilidade do modelo ("model checking") constitui - uma ár-ea--da estatisticaque uI ti mamente. teve. principalmente. no. mercado.. seu. desenvol vi mento. acel er ado. devi do.. às facilidades computacionais existentes. Um. texto. básico. para. a. verificação. adequabi I i dade do modelo é. o. de ATKI NSON (1985). resenha mais recente desse. assunto pode ser. e. da uma. encontrada. em, por exemplo. ATKINSON et alii (1989). Di versos trabalhos tratam da extensão de t.écni cas de di agn6st.i co pal' a o caso de MLG ou modelos de regressão generalizados. Ent.re eles estão os trabalhos de PI ERCE & SCHAFER (1986). LEE. (1988). e. DAVISON. vH LLI AMS C1987). C1 989a).. Devido. WANG (1987), a. cert.as. peculiaridades da dist.ribuição binomial. os trabalhos de PREGIBON (1981). FOWLKES (1987) e DAVISON (1989b) tratam de técnicas de diagnósticos para dados binários. Par a. a. ver i f i cação da. função de I i gação têm-se.. por. adequabi 1 i dade. exemplo.. os. t.t~ abal. da. hos de.

(56) 43.. PREGIBON (1980) e ATKINSON (1982).. 3.4. O algoritmo de estimação. (1972). WEDDERBURN. propost.o. algorit.mo. O. para. ajuste. generalizados corresponde à máY~ma. verossimilhança. de. por. &. NELDER. modelos. lineares. obtenção de estimati vas. dos. parâmetros. @. no. de. preditor. linear !J por mínimos quadrados ponderados iterativos. Seja linear. n(O>. a est.imati va inicial do predi tor. que corresponde ao valor. ajustado ~(O) obtido (O>. Seja Z. part.i r da função de 1 i gação Y'/=e( J.1).. a. a variável. dependente ajustada definida por. [:: r. (O). Z.. t. (3.20). A. onde a derivada da função de ligação é calculada em I;!. (O). Seja. também. o peso quadrático definido por. z (3.21). onde. é' a. V. <O}. função. de. t. Agora. faz-se. a. regressão. (O). A. variância de. z. calculada. (O). em. J.1.. t. covariáveis. ~. X. •X. 1. •.•••. Z •. •. x. com. P A. (1). estlmat~vas(}. peso. • tO}. w. par a. se. obtel' em. as. novas. dos parâmetros;.·:::dessa forma obtém-se uma. . t 1. va d e nova es t lma. (1) Y1. A. do. 'l 1 1. near. pre d lor. Repe t e-se o.

(57) 44.. processo alé que as mudanças sejam mínimas. A variável. é. z. uma forma linearizada da. função de ligação aplicada aos dados. ou seja.. (3.22). Como ponlo de parlida recomenda-se o valor ~. I;!. (O). =}!.. que.. em ger aI.. faz. com. que. a. convel~ gênci. a. do. algorilmo seja mais rápida.. O algorilmo variante. do. método. de. de. ajuste. Newton-Raphson.. utilizado. é. uma. conhecido. como. método de escore. Devido às suas caracteristicas especiais. um. si stema. de. general i zados Interali ve. ajuste. conhecido. Modelling. Inglaterra pelo grupo. i terati vo. como. modelos. lineal~es. GLI M ("General i sed. System") NAG. de. foi. ("Numel~ical. Li near. desenvolvido Algorithms. na. Gl~OUp. Lld"). A edição aqui utilizada é a 3.77 CPAYNE.1986) ..

(58) 45.. 4.. UMA MEDI DA MAl S GERAL DE HOMOGENEI DADE DE GRUPOS E ALGUMAS CONSEQUÊNCIAS. 4.1. Introdução. Para a classe da família exponencial. uma estatística baseada no desvio é proposta como medida de homogeneidade de grupos. Além do grupos. deduzida. desvio mínimo. para. o. modelo. de 2. uma general i zação de est.at.í sti cas do t.i po R para. agrupament.o. auxiliar di visi vo. na. adaptação_ do. hi er ál'qui co. nos. algoritmo casos. é de. das. dist.ribuições normal. Poisson e binomial. O desenvolvimento de um teste da razão de. verossimilhança para obj eti vo. de. o. caso geral. gener aI i zâção. do. é. apresentado com o. pr ocedi mento· de. SCOTT. &. KNOTT (1974).. 4.2.. Uma extensão natural para a medida de homogeneidade de 9ruPOS. Para a. classe de modelos que pertence. familiaexponencialna. forma. (3.11),. pode-se. como medida de discrepância no seu ajuste. à. utilizar.

(59) 46.. *. D C}!; I:!) =. ~. =. A. n. N. E2. =. t. í.=1.. a. obtida. N. A. t. t. partir. (4.1). i. 1.. 1... de. A. bC8.) + bC$) ]. w. [ '::).C8. -$.). (3.17). a.C~). para. =. corresponde à normal. soma de quadrados. equiponderado.. discrepância. ou. o. que. de residuos no modelo. o. menor. Quanto. residuo.. e. ~/W .• 1.. 1.. mais. bem. a. desvio.. ajustado. está. o. modelo. Na si tuação especifica de comparações de caseI as. pode-se di zer. que _quanto_ -mai or. heterogêneas são as caseI as. uma. medida. desvio. de. Se o. homogeneidade -de. entre dois. grupos. o. desvi o.. objeti vo é grupos. de. caselas. o. modelo. de. mai s. encontrar. caselas.. pode. - então.. o ser. usado. Considere. de. ensaio. um. completa.mente ao acaso de K caselas ou tratamentos com n repetições. por. casela.. O desvio. do. modelo. k. associado.. A. De\); 11 i:. ) , pode ser expr esso por. "'1.+K. " [)(\)'/..I ... ) = i : ' ""1.+K. K. E k=1.. - bC. e) kj. + bC. êk ). ]. =. -. [. ]}. (4.2).

Referências

Documentos relacionados

Na filtragem baseada em conteúdo, mesmo que um usuário tenha um perfil raro, a recomendação de itens relacionados a este perfil não é um problema.. Por exemplo, um

ângulo do hálux Valgus, ângulo inter-metatarsiano entre o primeiro e segundo. raios e ângulo da

pela geração da representação digital. Sendo, portanto, o projetista responsável pela definição das regras que regem o mecanismo, assim como o desenvolvimento do

13) Para tal fim cada Parte deverá comunicar a outra por escrito da existência e o objeto da controvérsia, para a resolução da mesma. 14) Caso isto não aconteça em até 60

De acordo com suas ideias, era muito mais civilizado sentar-se ali e falar de bobagens inócuas com adolescentes bonitos, confundindo a audiência com jogos de palavras,

O curta-metragem é um documentário feito da remontagem de imagens gravadas durante as intervenções artísticas do projeto de arte pública Permanências e Destruições, criado

Two multimode adhesives (Scotchbond Universal, 3M ESPE; All-Bond Universal, Bisco) were tested in both self-etch and etch-and-rinse modes and compared to

Eles empregaram a teologia como “um meio que pudesse fazer uma análise crítica da sociedade latino-americana e assim reestruturar a Igreja Católica a partir de uma práxis