• Nenhum resultado encontrado

4. FUNDAMENTOS METODOLÓGICOS

4.1. Antecedentes históricos

Alguns casos especiais de modelos de efeitos fixos, denominados modelos lineares, utilizam a teoria dos mínimos quadrados desenvolvida simultaneamente por

Legendre e Gauss e publicadas em 1806 e 1809, respectivamente, em textos relacionados à solução de problemas em astronomia. À solução destes problemas estão associadas as origens dos modelos de efeitos fixos (SCHEFFE, 1956).

Não se sabe com certeza se os astrônomos, antes dos estatísticos, também formularam os modelos de componentes de variância. Porém, “o uso explícito de um modelo de componentes de variância para um único fator foi feito por Airy (1861, Part IV), [...]” (SCHEFFE, 1956, p. 255, tradução nossa). Airy fazia observações telescópicas de um mesmo fenômeno durante várias noites. Durante cada uma das noites que estudava o fenômeno, ele fazia diversas observações que eram registradas. Digno de nota é que mesmo neste uso inicial da Análise de Componentes de Variância, o modelo já contemplava o estudo de diferentes números de observações em noites distintas. Embora Airy mesmo não acreditasse que seu trabalho contivesse novidades, atualmente é aceito que ele apresenta a primeira ocorrência de modelos de efeitos aleatórios na literatura (SEARLE; CASELLA; McCULLOCH, 1992)

O segundo uso de modelos com efeitos aleatórios apareceu no trabalho de Chauvenet em 1863 (SCHEFFE, 1956), que apesar de também não haver formalizado explicitamente as equações do modelo, utilizou seus conceitos e derivou seus resultados para argumentar sobre suas conclusões.

Após estes trabalhos iniciais que introduziram os conceitos de análise por componentes de variância, o pesquisador que definitivamente fundamentou o método foi Sir Ronald Aylmer Fisher. Um artigo de Fisher publicado em 1918, sobre a genética das populações, introduz os temos “variância” e “análise de variância” e utiliza o modelo de componentes de variância, calculando a influência das variáveis na variabilidade da variável de interesse. Por exemplo, conclui que “desvios dominantes” explicam 21% da variância total da estatura humana (SEARLE; CASELLA; McCULLOCH, 1992).

Em seguida a este artigo, Fisher publicou em 1925 o livro “Statistical Methods for Research Workers” onde faz significativa contribuição ao desenvolvimento do método de componentes de variância, igualando a soma dos quadrados de uma

análise de variância aos seus valores esperados, para obter um conjunto de equações que são lineares nos componentes de variância a serem estimados. Esta idéia surgiu do uso de analise de variância para estimar a correlação de dados de um desenho completamente aleatório (FISHER, 1928). Apesar de Fisher não usar modelos lineares para explicar a análise de variância de experimentos, seus escritos sobre regressão e correlação estão permeados com os conceitos de modelos lineares.

Foi Tippett (1931), baseado no trabalho de seus antecessores, o primeiro a formalizar o método de análise de variância para a estimativa de componentes de variância de dados balanceados e também quem primeiramente estendeu estes conceitos para o caso de experimentos com dois fatores de classificação cruzada.

Com um método de estimação de componentes de variância formalizado, apesar de limitado a dados balanceados, foi possível se focar no estudo dos melhores métodos de amostragem para experimentos específicos. Nesta linha de desenvolvimentos Neyman, Iwaszkiewicz e Kolodziejczyk (1935) examinaram a eficiência dos desenhos utilizando blocos aleatórios e o método Latin square e ao contrário dos estudos anteriores utilizaram exaustivamente modelos lineares e seus conceitos, inclusive para modelos mistos.

O primeiro a utilizar o termo “componentes de variância” foi Daniels (1939) em seu artigo “The estimation of components of variance”, onde faz distinção clara da utilização do método:

“Utilizando apenas a análise de variância para detectar fontes de variação, nenhuma distinção é necessária ser feita entre os dois tipos de fatores [...] Mas quando desejamos estimar os componentes de variância de determinado fator [...] a distinção entre variação aleatória e sistemática é necessária...” (DANIELS, 1939, pg.187)

Daniels (1939) utilizou o conceito de valor esperado, que embora apareça implícito em Fisher (1928), não havia, até então, sido formalizado utilizando o operador “E”. Outros aspectos importantes deste trabalho foram o desenvolvimento de estimativas de componentes de variância para dados balanceados para modelos aleatórios de classificação cruzada com até três fatores com todas as interações e abriu-se a

possibilidade que a população de efeitos para um fator aleatório pudesse ser de tamanho finito (SEARLE; CASELLA; McCULLOCH, 1992).

Desenvolvimentos posteriores, formalizaram a distinção entre modelos de efeitos fixos e modelos de efeitos aleatórios, sendo eles denominados de modelo I e modelo II respectivamente (EISENHART, 1947), apesar de sua existência ser anterior uma vez que aparece implícita em trabalhos como o de Welch (1936).

Na década de 40 o método de estimativa de componentes de variância, utilizando a soma dos quadrados em modelos mistos e aleatórios, passou a ser conhecido como método ANOVA de estimação. Este método apresentava deficiências quando, dependendo dos dados utilizados, fornecia estimativas negativas dos componentes de variância, que por definição deveriam ser positivos. A sugestão para análise dos resultados, quanto este fenômeno acontecia, era considerar tais valores como zero, o que invalidava a propriedade de não viés que estava implícita no método ANOVA (CRUMP, 1946).

Nas décadas de 50 e 60, houve um vigoroso desenvolvimento dos métodos de estimativa de componentes de variância, surgindo novos métodos baseados nos critérios de máxima verossimilhança (maximun likelihood) e norma mínima (minimum

norm).

Um texto publicado o início deste período e considerado como um marco no desenvolvimento da análise de componentes de variância é o livro de Anderson e Bancroft (1952). Neste livro são sedimentados os conceitos utilizados nos procedimentos de associação da soma dos quadrados, da análise de variância, aos seus valores esperados como forma de estimar os componentes de variância, lidando com dados balanceados e não balanceados, para modelos mistos, modelos aleatórios e para classificações aninhadas (SEARLE; CASELLA; McCULLOCH, 1992).

Henderson (1953) apresentou importante contribuição desenvolvendo três métodos diferentes de utilização de dados não balanceados, em modelos aleatórios e mistos, com qualquer quantidade de elementos aninhados ou com classificação cruzada.

Estas três versões passaram a ser conhecidas como Método I, Método II e Método III de Henderson.

Após os trabalhos de Fisher (1928), que desenvolveu o método de máxima verossimilhança (ML) e sua forma geral para a estimação de componentes de variância, Herbach (1959) foi quem primeiramente derivou, de forma explicita, os estimadores de máxima verossimilhança (ML) para alguns modelos de componentes de variância com dados balanceados, que já haviam sido apresentados implicitamente em trabalhos com dados não balanceados (CRUMP, 1946).

Porém, o trabalho que representa um referencial teórico para o cálculo dos estimadores de ML foi apresentado por Hartley e Rao (1967), onde a metodologia é desenvolvida para uma grande gama de modelos, abrangendo modelos mistos e aleatórios, balanceados ou não.

Thompson (1962) trabalhando sobre os modelos de ML, foi quem introduziu a idéia de maximizar a parte da verossimilhança que não varia com os parâmetros do modelo, ou seja os efeitos fixos. Este método é atualmente conhecido como máxima verossimilhança restrita (REML). Um dos aspectos interessantes do REML é que para dados balanceados sua solução é idêntica à apresentada pelos estimadores de ANOVA.

A tentativa de encontrar o equivalente ao melhor estimador linear não viesado da média de modelos lineares, para componentes de variância, levou ao desenvolvimento das metodologias que culminaram com a sistematização dos estimadores quadráticos não viesados de variância mínima. Os trabalhos de Rao (1970, 1972) sistematizaram o desenvolvimento teórico dos estimadores quadráticos não viesados de norma mínima (MINQUE), que tendo a forma quadrática seja não viesado e minimize a norma euclidiana da matriz núcleo. O método MINQUE não exige suposições sobre a distribuição de probabilidade da variável dependente, porém se a suposição de normalidade é satisfeita, o estimador MINQUE tem a propriedade de ser a forma quadrática não viesada da variância mínima denominado MIVQUE (CAMARINHA, 2003).

As mais recentes contribuições metodológicas ao campo de estudo da análise de componentes de variância vieram do trabalho de Smith e Murray (1984), que formularam os componentes de variância como covariâncias e então usaram o método ANOVA para resolvê-lo.

A maior parte dos desenvolvimentos recentes tem sido na utilização da metodologia em novos tipos de aplicação em diversas áreas do conhecimento (SEARLE; CASELLA; McCULLOCH, 1992).

Documentos relacionados