• Nenhum resultado encontrado

6.2 Estima¸c˜ ao em Pequenas ´ Areas

6.2.4 Coment´ arios Finais

Na Aplica¸c˜ao 1, os modelos multivariados tiveram desempenho inferior em rela¸c˜ao `

a modelagem separada das propor¸c˜oes, com base nos crit´erios de compara¸c˜ao de modelos DIC e verossimilhan¸ca preditiva. O modelo com c´opula Gaussiana apresentou tendˆencia a superestimar as propor¸c˜oes de acertos. No entanto, os altos valores estimados dos parˆametros de correla¸c˜ao indicam que a an´alise conjunta deve ser considerada pelo pesquisador. Este modelo precisa ser investigado, lembrando que apenas a c´opula Gaussiana foi utilizada e esta pode n˜ao ser a mais adequada para estes dados.

Na Aplica¸c˜ao 2, o modelo multivariado hier´arquico foi capaz de estimar bem as m´edias das escolas n˜ao selecionadas e ainda reduziu a variˆancia das estimativas diretas.

Cap´ıtulo 7

Conclus˜oes e Trabalhos Futuros

Os modelos apresentados possuem a vantagem de manter as vari´aveis resposta em sua escala original. Outra vantagem refere-se ao uso de c´opulas que s˜ao marginal-free, ou seja, o grau de associa¸c˜ao das vari´aveis ´e preservado n˜ao importa quais sejam as marginais. Assim, se dois ´ındices s˜ao correlacionados qualquer que seja a marginal adotada, a dependˆencia ser´a a mesma. A combina¸c˜ao das c´opulas com a regress˜ao beta permite estudar as vari´aveis conjuntamente, tirando-se partido de sua estrutura de dependˆencia, mantendo-se as vari´aveis em sua escala original. A aplica¸c˜ao de modelos multivariados com respostas beta constituem-se em alternativas a modelos que exigem a transforma¸c˜ao da vari´aveis originais, al´em de serem aplicados quando a resposta representa uma raz˜ao de vari´aveis cont´ınuas que pertence ao intervalo (0, 1). A escolha entre os modelos propostos e seus concorrentes encontrados na literatura deve ser guiada pelos objetivos do pesquisador, que deve observar a capacidade de predi¸c˜ao e o ajuste dos mesmos. A desvantagem dos modelos que utilizam c´opulas ´e a implementa¸c˜ao dos m´etodos de simula¸c˜ao de amostras da distribui¸c˜ao a posteriori, com tempo de processamento mais lento que os modelos univariados.

O exerc´ıcio de simula¸c˜ao do Cap´ıtulo 4, bem como os exemplos com dados simulados e reais do Cap´ıtulo 6 mostraram que existe vantagem na aplica¸c˜ao da abordagem multivariada sobre a ado¸c˜ao de modelos separados, primeiramente por reduzir os erros nas estimativas dos parˆametros e segundo porque auxilia a previs˜ao de valores ausentes. Mais detalhadamente, os modelos multivariados descritos no Cap´ıtulo 4 apresentaram bons resultados nas simula¸c˜oes, sendo capazes de gerar previs˜oes mais precisas. A compara¸c˜ao entre os v´ıcios e os erros quadr´aticos mostrou que quanto maior a dependˆencia entre as respostas, melhores s˜ao os resultados dos ajustes de modelos multivariados em rela¸c˜ao aos ajustes separados. Al´em disso, quando as respostas foram geradas independentemente, os v´ıcios e erros quadr´aticos m´edios encontrados foram

aproximadamente iguais aos obtidos com o ajuste do modelo bivariado, mesmo este n˜ao sendo o modelo correto. Neste caso, pode-se pensar que o modelo bivariado pode ser utilizado ainda que a dependˆencia seja pr´oxima de zero, pois nas simula¸c˜oes, n˜ao houve aumento de varia¸c˜ao com o ajuste de um modelo complexo em dados que n˜ao comportavam tal estrutura.

No Cap´ıtulo 5, foi proposto um modelo hier´arquico multivariado com dois n´ıveis no qual as vari´aveis s˜ao correlacionadas no primeiro n´ıvel com aux´ılios de c´opulas. Apesar de ser aplic´avel em situa¸c˜oes gerais este modelo foi desenvolvido especialmente para o problema de estima¸c˜ao em pequenas ´areas para permitir a troca de informa¸c˜ao entre as ´

areas ou dom´ınios de interesse, de forma a gerar estimativas mais precisas que aquelas encontradas com estimador direto baseado no desenho amostral. Para tal, considerou- se que os efeitos aleat´orios de uma mesma ´area eram correlacionados e que efeitos de diferentes ´areas possu´ıam matriz de variˆancias-covariˆancias iguais.

O Cap´ıtulo 5 se dedica basicamente a definir procedimentos para inferˆencia dos parˆametros do modelo hier´arquico, mostrando a importˆancia da parametriza¸c˜ao da distribui¸c˜ao a posteriori neste processo. A parametriza¸c˜ao da distribui¸c˜ao a posteriori em fun¸c˜ao dos coeficientes aleat´orios levou `a convergˆencia mais r´apida das cadeias do m´etodo MCMC empregado. Para auxiliar a escolha de distribui¸c˜oes a priori para a matriz de variˆancias-covariˆancias dos efeitos aleat´orios, considerou-se distribui¸c˜oes a priori para os elementos da matriz, mais especificamente para as variˆancias (ou desvio) e as correla¸c˜oes. Essas especifica¸c˜oes levaram a algoritmos mais complexos, mas em alguns casos os resultados compensam a dificuldade de implementa¸c˜ao dos algoritmos. No Cap´ıtulo 6, as aplica¸c˜oes em pequenas ´areas mostraram como obter estimativas para unidades ou ´areas fora da amostra de pesquisas e os estimadores das quantidades de interesse nessas ´areas foram exibidos. Na segunda aplica¸c˜ao, as estimativas fornecidas pelo modelo multivariado se mostraram mais precisas que aquelas encontradas com o estimador direto. Na primeira aplica¸c˜ao, a vers˜ao univariada dos modelos propostos mostrou melhores resultados, mas uma an´alise de res´ıduos mostrou que o modelo mais geral n˜ao foi bem ajustado. No entanto, as estimativas das propor¸c˜oes de acertos em Matem´atica, obtidas por este modelo, apresentaram menor variabilidade, mensurada pelo coeficiente de varia¸c˜ao. Mais an´alises devem ser realizadas para mostrar quanto se pode ganhar em termos de precis˜ao com o modelo bivariado.

Pesquisas domiciliares por amostragem s˜ao uma importante fonte de problemas nos quais os modelos aqui desenvolvidos poderiam ser aplicados. Alguns exemplos de vari´aveis medidas no intervalo (0, 1) s˜ao a taxa de ocupa¸c˜ao e o hiato de pobreza que ´

e uma raz˜ao entre a soma das rendas dos indiv´ıduos abaixo da linha da pobreza e a soma de todas as rendas da popula¸c˜ao. Essas vari´aveis s˜ao importantes medidas de planejamento e conhecimento da realidade populacional, mas raramente est˜ao dispon´ıveis em n´ıveis geogr´aficos pequenos ou subgrupos populacionais, fora do ano censit´ario. Suas previs˜oes podem representar uma aplica¸c˜ao interessante de como modelos multivariados de regress˜ao beta podem ser ´uteis na estima¸c˜ao em pequenas ´

areas. Ambas as vari´aveis poderiam ser extra´ıdas da Pesquisa Nacional por Amostra de Domic´ılios (PNAD) realizada pelo IBGE.

Nos exemplos, n˜ao foram consideradas omiss˜oes nas vari´aveis explicativas, sendo que uma extens˜ao poss´ıvel dos modelos para previs˜ao devem contemplar este caso. Os exemplos e exerc´ıcios de simula¸c˜ao devem ser complementados com a considera¸c˜ao de valores pequenos para φ, onde pode haver dificuldades adicionais na inferˆencia deste parˆametro. Inclusive com a possibilidade de reparametriza¸c˜ao do modelo de regress˜ao beta, fazendo-se, por exemplo, σ2 = 1/(1 + φ), onde σ2 ´e a variˆancia da vari´avel resposta. Em muitas aplica¸c˜oes pode haver necessidade de modelar φ usando covari´aveis. Al´em disso, valores de µ pr´oximos aos extremos do intervalo (0, 1) devem ser testados. Embora, os exerc´ıcios tenham se concentrado em situa¸c˜oes nas quais havia apenas uma ou duas vari´aveis explicativas, os modelos podem ser utilizados com um n´umero maior de covari´aveis, com aumento do tempo computacional, sempre observando-se problemas comuns em modelos de regress˜ao, como multicolinearidade.

´

E importante frisar que este trabalho se concentrou na constru¸c˜ao de modelos multivariados de regress˜ao em que as distribui¸c˜oes marginais s˜ao beta, apontando suas vantagens com rela¸c˜ao aos modelos univariados correspondentes e as dificuldades de estima¸c˜ao de seus parˆametros. No entanto, a teoria de fun¸c˜oes c´opula permite que os modelos multivariados sejam constru´ıdos para quaisquer distribui¸c˜oes marginais conhecidas, possibilitando que as distribui¸c˜oes das vari´aveis resposta envolvidas sejam diferentes, inclusive admitindo que as vari´aveis sejam discretas e cont´ınuas. A passagem da distribui¸c˜ao beta para outras distribui¸c˜oes ´e direta, por´em cada uma tem natureza peculiar e o sentido pr´atico, bem como o processo de estima¸c˜ao devem ser levados sempre em considera¸c˜ao na proposta de uma nova modelagem. No caso espec´ıfico da

distribui¸c˜ao beta, foi adotado em todo trabalho a parametriza¸c˜ao com a m´edia e a precis˜ao, em que este ´ultimo parˆametro controla a variˆancia, possuindo caracter´ısticas espec´ıficas e outras parametriza¸c˜oes poderiam levar a dificuldades adicionais. V´arias estrat´egias podem ser definidas pelo pesquisador, de acordo com a base de dados que estiver dispon´ıvel, dentre as quais destacam-se: primeiro encontrar as marginais e em seguida obter a c´opula mais apropriada; estimar modelos com diferentes c´opulas e marginais, decidindo qual ´e a melhor solu¸c˜ao atrav´es de crit´erios que comparem os modelos resultantes. Os modelos desenvolvidos neste trabalho partiram do pressuposto de que a distribui¸c˜ao beta era uma boa candidata para modelar as vari´aveis envolvidas. Outro ponto que merece ser comentado ´e que em situa¸c˜oes pr´aticas nas quais existem zeros ou uns nas vari´aveis resposta, a distribui¸c˜ao beta n˜ao ser´a adequada para trat´a-las. Uma possibilidade de contornar o problema ´e a utiliza¸c˜ao de misturas de distribui¸c˜oes, de tal maneira que os zeros e uns possam ser contemplados. Ospina e Ferrari (2010) prop˜oem modelos de regress˜ao beta inflacionados para trabalhar dados com tal caracter´ıstica.

Al´em dos crit´erios de compara¸c˜ao utilizados no trabalho, existem outras formas de comparar modelos que podem ser implementadas seguindo o que aparece em Gneiting e Raftery (2004). O crit´erio Desvio Preditivo Esperado (EPD, em inglˆes), definido em Gelfand e Ghosh (1998) se mostrou sens´ıvel `a escala das vari´aveis e merece ser estudado com cuidado para aplica¸c˜ao em modelos multivariados.

Ferramentas de diagn´ostico de ajuste dos modelos multivariados aqui propostos precisam ser definidas. An´alises de res´ıduos e a defini¸c˜ao de uma estat´ıstica semelhante ao R2da regress˜ao linear podem auxiliar a avalia¸c˜ao da qualidade de ajuste. Al´em disso, deve-se estudar t´ecnicas para sele¸c˜ao das vari´aveis regressoras.

Coment´arios sobre alguns t´opicos que surgiram durante a execu¸c˜ao deste trabalho s˜ao apresentados a seguir.

7.1 Alguns aspectos computacionais

No modelo de efeitos aleat´orios do Cap´ıtulo 5, ocorre forte dependˆencia da distribui¸c˜ao a priori adotada para a matriz de covariˆancias dos efeitos. Reparametriza¸c˜oes do modelo devem ser testadas, mas a aplica¸c˜ao do Algoritmo 2 j´a proporcionou a convergˆencia do MCMC no modelo hier´arquico.

Na aplica¸c˜ao do algoritmo de Metropolis-Hastings no modelo hier´arquico, uma forma de obter distribui¸c˜oes propostas que ajudem o algoritmo a procurar candidatos mais

realistas, pode ser feita da seguinte forma: transformar a vari´avel resposta de tal modo a linearizar o modelo; neste modelo linearizado, encontrar as distribui¸c˜oes dos parˆametros que ter˜ao forma conhecida no modelo linear. Candidatos podem ser gerados a partir de tais distribui¸c˜oes.

Os algoritmos foram implementados no pacote OX, vers˜ao 5.0. No entanto, seria poss´ıvel utilizar o pacote Winbugs 1.4.3, nos modelos nos quais n˜ao se faz uso de fun¸c˜oes c´opulas, bastando escrever a fun¸c˜ao de verossimilhan¸ca. O Winbugs 1.4.3 possui um conjunto fechado de densidades de distribui¸c˜oes de probabilidades, englobando as mais conhecidas. Por isso, em modelos que n˜ao contemplem distribui¸c˜oes previamente implementadas no programa, ser´a necess´ario escrever a fun¸c˜ao de verossimilhan¸ca. Nos modelos propostos neste trabalho, que utilizam c´opulas, a fun¸c˜ao de verossimilhan¸ca envolve a programa¸c˜ao das fun¸c˜oes de c´opulas e da fun¸c˜ao de distribui¸c˜ao acumulada da beta, que n˜ao ser´a uma tarefa simples porque n˜ao possui forma anal´ıtica. Quando se utiliza a distribui¸c˜ao Exponencial, por exemplo, a implementa¸c˜ao ´e r´apida, pois sua acumulada tem forma fechada.

Documentos relacionados