• Nenhum resultado encontrado

Regressão Beta Multivariada com Aplicações em Pequenas Áreas

N/A
N/A
Protected

Academic year: 2021

Share "Regressão Beta Multivariada com Aplicações em Pequenas Áreas"

Copied!
188
0
0

Texto

(1)

Universidade Federal do Rio de Janeiro Instituto de Matem´atica

Regress˜

ao Beta Multivariada com

Aplica¸c˜

oes em Pequenas ´

Areas

Debora Ferreira de Souza

Rio de Janeiro

2011

(2)

Regress˜

ao Beta Multivariada com

Aplica¸c˜

oes em Pequenas ´

Areas

Debora Ferreira de Souza

Tese de Doutorado apresentada ao Programa de P´os-Gradua¸c˜ao em Estat´ıstica, Instituto de Matem´atica, da Universidade Federal do Rio de Janeiro, como parte dos requisitos necess´arios `a obten¸c˜ao do t´ıtulo de Doutor em Estat´ıstica.

Orientador: Fernando A. S. Moura

Rio de Janeiro 2011

(3)

Souza, Débora Ferreira de.

Regressão beta multivariada com aplicações em pequenas áreas/Débora Ferreira de Souza .--Rio de Janeiro:

S729 UFRJ/IM, 2011.

xxi, 167f. :il. ; 30 cm.

Dissertação (mestrado) – UFRJ/IM/Programa de Pós- Graduação em Estatística, 2011.

Orientador: Fernando Antônio da Silva Moura. Referências: f. 134-139

1.Regressão(Estatística). 2.Cópulas (Estatística matemática). 3. Modelos hierárquicos (Estatística). I. Moura, Fernando Antônio da Silva. II. Universidade Federal do Rio de Janeiro. Instituto de Matemática. III.Título.

(4)

Regress˜

ao Beta Multivariada com

Aplica¸c˜

oes em Pequenas ´

Areas

Debora Ferreira de Souza Orientador: Fernando A. S. Moura

Tese de Doutorado apresentada ao Programa de P´os-Gradua¸c˜ao em Estat´ıstica, Instituto de Matem´atica, da Universidade Federal do Rio de Janeiro, como parte dos requisitos necess´arios `a obten¸c˜ao do t´ıtulo de Doutor em Estat´ıstica.

Aprovada em:

Prof. Fernando Antonio da Silva Moura, Ph.D., UFRJ

Profa. Flavia Maria Pinto Ferreira Landim, Ph.D., UFRJ

Profa. Marina Silva Paez, Ph.D., UFRJ

Profa. Cibele Queiroz da Silva, Ph.D., UNB

Prof. Marcel de Toledo Vieira, Ph.D., UFJF

Profa. Silvia Lopes de Paula Ferrari, Ph.D., USP

Rio de Janeiro 2011

(5)

Agradecimentos

A Deus que me deu sa´ude e persistˆencia para levar este trabalho adiante.

Ao meu orientador, por ter me aceito como aluna, pela ajuda, dedica¸c˜ao e incentivo nesta pesquisa.

Aos professores do Programa de P´os Gradua¸c˜ao em Estat´ıstica da UFRJ por todo conhecimento transmitido.

Ao Comitˆe de Treinamento do IBGE pela concess˜ao de afastamento integral do trabalho, que permitiu a dedica¸c˜ao exclusiva a esta pesquisa, fato fundamental para sua realiza¸c˜ao.

Aos meus colegas de laborat´orio na UFRJ sempre prestativos e que certamente tornaram minha estada mais alegre.

Aos meus colegas de trabalho no IBGE pelo incentivo e apoio.

Aos meus pais e ao meu irm˜ao por todo carinho, dedica¸c˜ao e paciˆencia, n˜ao s´o durante a elabora¸c˜ao da Tese, como tamb´em durante a vida.

A todos aqueles que contribu´ıram direta, ou indiretamente, para a realiza¸c˜ao deste trabalho.

(6)

RESUMO

Regress˜

ao Beta Multivariada com

Aplica¸c˜

oes em Pequenas ´

Areas

Debora Ferreira de Souza Orientador: Fernando A. S. Moura

Resumo da Tese de Doutorado apresentada ao Programa de P´os-Gradua¸c˜ao em Estat´ıstica, Instituto de Matem´atica, da Universidade Federal do Rio de Janeiro, como parte dos requisitos necess´arios `a obten¸c˜ao do t´ıtulo de Doutor em Estat´ıstica.

Modelos de regress˜ao beta multivariados s˜ao propostos para modelagem conjunta de duas ou mais vari´aveis cujos valores pertencem ao intervalo (0,1), tais como ´ındices, taxas e propor¸c˜oes. A modelagem multivariada pode trazer benef´ıcios ao processo de estima¸c˜ao, aumentando a troca de informa¸c˜oes entre as unidades, de modo a obter estimativas mais precisas, sobretudo para amostras pequenas. Cada vari´avel resposta foi suposta beta distribu´ıda, possibilitando a considera¸c˜ao de dados assim´etricos. Fun¸c˜oes c´opulas foram utilizadas para construir a distribui¸c˜ao conjunta das vari´aveis dependentes. As c´opulas tˆem flexibilidade na representa¸c˜ao de diversos tipos de dependˆencia entre as vari´aveis e no tratamento de rela¸c˜oes n˜ao-lineares. Um modelo de regress˜ao e um modelo hier´arquico de dois n´ıveis foram propostos. O ´ultimo assume efeitos fixos e aleat´orios correlacionados. Ambos os modelos foram utilizados com sucesso para estima¸c˜ao em pequenas ´areas e para imputa¸c˜ao de dados faltantes. Todo o processo de inferˆencia foi realizado sob a abordagem Bayesiana e algumas vantagens em fazer reparametriza¸c˜oes no modelo hier´arquico s˜ao exploradas em detalhes.

Palavras-chave: Regress˜ao beta univariada, c´opulas, modelos hier´arquicos, estima¸c˜ao em pequenas ´areas.

(7)

ABSTRACT

Multivariate Beta Regression with Applications

in Small Area Estimation

Debora Ferreira de Souza Orientador: Fernando A. S. Moura

Abstract da Tese de Doutorado apresentada ao Programa de P´os-Gradua¸c˜ao em Estat´ıstica, Instituto de Matem´atica, da Universidade Federal do Rio de Janeiro, como parte dos requisitos necess´arios `a obten¸c˜ao do t´ıtulo de Doutor em Estat´ıstica.

Multivariate beta regression models for jointly modelling two or more variables whose values belong to the interval (0,1), such as indexes, rates and proportions are proposed. The multivariate model can help the estimation process, borrowing information between units and obtaining more precise estimates, especially for small samples. Each response variable was assumed to be beta distributed, allowing dealing with multivariate asymmetric data. Copula functions are used to construct the joint distribution of the dependent variables. Copulas are flexible for representing various types of dependence between variables and for dealing with non-linear relationships. A regression model and a hierarchical model with two levels have been proposed. The later model assumes fixed and correlated random effects. Both models are successfully used to make small area predictions and to impute missing values. The inference process was conducted under a Bayesian approach and some advantages of applying a reparametrization to the hierarchical model is explored in details.

Keywords: Univariate beta regression, copulas, hierarchical models, small area estimation.

(8)

Sum´

ario

Lista de Figuras xi

Lista de Tabelas xvii

Lista de Abreviaturas xxi

1 Introdu¸c˜ao 1

2 Revis˜ao bibliogr´afica 5

2.1 Modelos hier´arquicos . . . 5

2.2 Estima¸c˜ao em pequenas ´areas . . . 7

2.3 Crit´erios de compara¸c˜ao de modelos . . . 13

2.3.1 Verossimilhan¸ca preditiva . . . 13

2.3.2 Crit´erios de informa¸c˜ao baseados no desvio . . . 14

2.4 Diagn´ostico de convergˆencia . . . 15

2.4.1 Inspe¸c˜ao Visual . . . 15

2.4.2 Crit´erio de Geweke . . . 15

2.4.3 Crit´erio de Gelman e Rubin . . . 16

3 Modelo de regress˜ao beta univariado 17 3.1 Regress˜ao beta univariada . . . 17

3.2 Inferˆencia Bayesiana no modelo de regress˜ao beta univariado . . . 19

3.3 Exemplo com dados simulados . . . 22

4 Modelo de regress˜ao beta multivariado utilizando c´opulas 25 4.1 Distribui¸c˜oes multivariadas com marginais beta . . . 25

4.2 Constru¸c˜ao de distribui¸c˜oes conjuntas via c´opulas . . . 27

4.2.1 Medidas de dependˆencia . . . 30

(9)

4.3 Regress˜ao beta multivariada via aplica¸c˜ao de c´opulas . . . 33

4.3.1 Crit´erios de compara¸c˜ao de modelos envolvendo c´opulas . . . 35

4.4 Inferˆencia no modelo de regress˜ao beta multivariado . . . 37

4.5 Exerc´ıcios com dados simulados . . . 39

4.5.1 Ajuste do modelo bivariado . . . 39

4.5.2 Aplica¸c˜ao de diferentes fun¸c˜oes c´opula . . . 41

4.5.3 Compara¸c˜ao dos ajustes univariado e bivariado . . . 44

5 Modelo hier´arquico multivariado com efeitos aleat´orios correlacionados 51 5.1 Modelo hier´arquico beta . . . 51

5.1.1 Coment´arios sobre estima¸c˜ao em pequenas ´areas . . . 53

5.1.2 Alguns casos particulares do modelo hier´arquico . . . 55

5.1.3 Modelo hier´arquico multivariado de trˆes n´ıveis . . . 56

5.2 Inferˆencia no modelo hier´arquico . . . 56

5.3 Exemplos com dados simulados . . . 63

5.4 Aplica¸c˜ao com dados reais . . . 78

6 Previs˜ao e estima¸c˜ao em pequenas ´areas 84 6.1 Previs˜ao no modelo de regress˜ao multivariado . . . 84

6.1.1 Observa¸c˜oes faltantes em todas as vari´aveis resposta . . . 84

6.1.2 Observa¸c˜oes faltantes em uma vari´avel resposta . . . 87

6.1.3 Aplica¸c˜ao com dados reais . . . 95

6.1.4 Coment´arios finais . . . 99

6.2 Estima¸c˜ao em Pequenas ´Areas . . . 100

6.2.1 Aplica¸c˜ao - Dados da Prova Brasil . . . 101

6.2.2 Aplica¸c˜ao 1 . . . 102

6.2.3 Aplica¸c˜ao 2 . . . 116

6.2.4 Coment´arios Finais . . . 124

7 Conclus˜oes e Trabalhos Futuros 125 7.1 Alguns aspectos computacionais . . . 128

7.2 Modelo dinˆamico hier´arquico multivariado . . . 129

(10)

Referˆencias Bibliogr´aficas 134 A Fun¸c˜oes de distribui¸c˜ao acumuladas e densidades das c´opulas

bivariadas utilizadas neste trabalho. 140

B Algoritmos de simula¸c˜ao de observa¸c˜oes das c´opulas utilizadas neste

trabalho 142

C Diagn´ostico de convergˆencia 144

C.1 Regress˜ao beta univariada . . . 144 C.2 Modelo minimal com resposta beta bivariada . . . 145 C.3 Regress˜ao beta bivariada nas simula¸c˜oes - amostragem separada dos

parˆametros . . . 147 C.4 Regress˜ao beta bivariada nas simula¸c˜oes - amostragem conjunta dos

parˆametros . . . 155 C.5 Modelo hier´arquico multivariado . . . 163 D Sum´ario da distribui¸c˜ao a posteriori das observa¸c˜oes faltantes do

(11)

Lista de Figuras

3.1 Compara¸c˜ao das densidades a posteriori de φ quando φ ∼ Gama(67, 6; 2, 6) (linha cheia) e φ ∼ Gama(0, 001; 0, 001) (linha tracejada) a priori. . . 24 4.1 Histogramas das amostras dos parˆametros do modelo com a c´opula

FGM, misturando-se as duas cadeias geradas. Valores verdadeiros destacados pela linha vertical. . . 40 4.2 Raz˜oes entre as estat´ısticas REQM fornecidas pelos modelos univariado

(denominador) e bivariado(numerador), calculadas para as amostras de tamanho 100 e para cada parˆametro, contra os valores fixos de τ . . . . 50 5.1 Trajet´orias das cadeias dos interceptos, βk, k = 1, 2, fornecidos

pelo Algoritmo 1. Foi utilizada a distribui¸c˜ao a priori Wishart mais informativa para Σ. As linhas tracejadas destacam os valores verdadeiros dos parˆametros. . . 66 5.2 Trajet´orias das cadeias dos interceptos, βk, k = 1, 2, fornecidos

pelo Algoritmo 2. Foi utilizada a distribui¸c˜ao a priori Wishart mais informativa para Σ. As linhas tracejadas destacam os valores verdadeiros dos parˆametros. . . 66 5.3 Histogramas dos parˆametros βk, φk, σk2, k = 1, 2, e σ12. Foram utilizados

o Algoritmo 2 para obten¸c˜ao das amostras a posteriori e a distribui¸c˜ao a priori mais informativa para Σ. As linhas verticais destacam os valores verdadeiros dos parˆametros. . . 67 5.4 Trajet´orias de duas cadeias simuladas pelo algoritmo de

Metropolis-Hastings, com 300000 itera¸c˜oes, para os parˆametros do modelo hier´arquico de regress˜ao beta, com distribui¸c˜oes a priori uniformes para os parˆametros da matriz de variˆancias-covariˆancias. Os valores verdadeiros aparecem destacados pelas linhas tracejadas. . . 71

(12)

5.5 M´edias a posteriori dos parˆametros dos vetores µ1 e µ2 contra as m´edias simuladas de cada resposta. . . 73 5.6 Trajet´orias das amostras dos parˆametros do modelo hier´arquico de

regress˜ao beta com c´opula FGM, uma vari´avel explicativa e interceptos aleat´orios. Amostras geradas pelo Algoritmo 2. Os dados utilizados foram simulados e as linhas tracejadas destacam os valores verdadeiros. 76 5.7 Trajet´orias das amostras dos interceptos no modelo hier´arquico de

regress˜ao beta com c´opula FGM e interceptos aleat´orios. Amostras geradas pelo Algoritmo 1. Os dados utilizados foram simulados e as linhas tracejadas destacam os valores verdadeiros. . . 77 5.8 Propor¸c˜oes m´edias de Biologia e F´ısica observadas nas 99 escolas contra

as m´edias a posteriori das propor¸c˜oes fornecidas pelos trˆes modelos. . . 82 6.1 Distribui¸c˜ao dos v´ıcios relativos absolutos entre os valores verdadeiros e

as m´edias a posteriori fornecidas pelos modelos bivariado e univariado. Quatro situa¸c˜oes s˜ao comparadas: (a) no = 80, nf = 20 e τ = 0, 8; (b)

no = 80, nf = 20 e τ = 0, 5; (c) no = 40, nf = 10 e τ = 0, 8 e (d)

no = 40, nf = 10 e τ = 0, 5. . . 89

6.2 Raz˜ao entre os v´ıcios relativos absolutos fornecidos pelos modelos bivariado e univariado. Quatro situa¸c˜oes s˜ao comparadas: (a) no = 80,

nf = 20 e τ = 0, 8; (b) no = 80, nf = 20 e τ = 0, 5; (c) no = 40, nf = 10

e τ = 0, 8 e (d) no= 40, nf = 10 e τ = 0, 5. . . 90

6.3 Distribui¸c˜ao das amplitudes dos intervalos de credibilidade 95% fornecidos pelos modelos bivariado e univariado. Quatro situa¸c˜oes s˜ao comparadas: (a) no = 80, nf = 20 e τ = 0, 8; (b) no = 80, nf = 20 e

τ = 0, 5; (c) no = 40, nf = 10 e τ = 0, 8 e (d) no = 40, nf = 10 e τ = 0, 5. 91

6.4 Raz˜ao entre as amplitudes dos intervalos de credibilidade 95% fornecidos pelos modelos bivariado e univariado. Quatro situa¸c˜oes s˜ao comparadas: (a) no = 80, nf = 20 e τ = 0, 8; (b) no = 80, nf = 20 e τ = 0, 5; (c)

(13)

6.5 Posi¸c˜oes das observa¸c˜oes no vetor yf 2contra: os limites dos intervalos de

credibilidade 95% dos modelos univariado (unidos pelas linhas tracejadas e delimitados por colchetes) e bivariado (delimitados por parˆenteses); medianas a posteriori dos modelos univariado (c´ırculo) e bivariado (c´ırculo cheio); e valores verdadeiros (X). . . 94 6.6 Distribui¸c˜ao dos erros encontrados para (a) L´ıngua Portuguesa e (b)

Matem´atica com os modelos hier´arquicos multivariados sem c´opula (Mod.1), com c´opula Gaussiana (Mod.2) e os modelos individuais (Mod. Ind.). . . 108 6.7 Distribui¸c˜ao dos erros relativos absolutos obtidos para (a) L´ıngua

Portuguesa e (b) Matem´atica com os modelos hier´arquicos multivariados sem c´opula (Mod.1), com c´opula Gaussiana (Mod.2) e os modelos individuais (Mod. Ind.). . . 108 6.8 Distribui¸c˜ao dos erros quadr´aticos encontrados para (a) L´ıngua

Portuguesa e (b) Matem´atica com os modelos hier´arquicos multivariados sem c´opula (Mod.1), com c´opula Gaussiana (Mod.2) e os modelos individuais (Mod. Ind.). . . 109 6.9 Distribui¸c˜ao dos coeficientes de varia¸c˜ao encontrados para (a) L´ıngua

Portuguesa e (b) Matem´atica com os modelos hier´arquicos multivariados sem c´opula (Mod.1), com c´opula Gaussiana (Mod.2) e os modelos individuais (Mod. Ind.). . . 109 6.10 Res´ıduos (c´ırculos cheios) com intervalos de credibilidade 95%

encontrados pelo ajuste dos modelos separados para as respostas (a) L´ıngua Portuguesa e (b) Matem´atica. . . 113 6.11 Res´ıduos (c´ırculos cheios) com intervalos de credibilidade 95%

encontrados pelo ajuste do modelo hier´arquico multivariado sem c´opula para (a) L´ıngua Portuguesa e (b) Matem´atica. . . 114 6.12 Res´ıduos (c´ırculos cheios) com intervalos de credibilidade 95%

encontrados pelo ajuste do modelo hier´arquico multivariado com c´opula Gaussiana para (a) L´ıngua Portuguesa e (b) Matem´atica. . . 115

(14)

6.13 Propor¸c˜oes de acertos observadas na Prova Brasil contra as m´edias estimadas das escolas selecionadas pelo plano amostral fict´ıcio para: (a) vari´avel L´ıngua Portuguesa; (b) vari´avel Matem´atica. As estimativas s˜ao dadas pelas m´edias a posteriori do parˆametro µijk em cada escola

selecionada. . . 120 6.14 Propor¸c˜oes de acertos observadas na Prova Brasil contra as m´edias

estimadas das escolas n˜ao selecionadas pelo plano amostral fict´ıcio para: (a) vari´avel L´ıngua Portuguesa; (b) vari´avel Matem´atica. As estimativas s˜ao dadas pelas m´edias a posteriori do parˆametro µijk em cada escola

n˜ao selecionada. . . 120 6.15 Propor¸c˜oes de acertos observadas na Prova Brasil contra as estimadas

nas escolas selecionadas pelo plano amostral fict´ıcio: (a) vari´avel L´ıngua Portuguesa; (b) vari´avel Matem´atica. As estimativas s˜ao dadas pelas m´edias a posteriori do parˆametro yijk em cada escola selecionada. . . . 121

6.16 Compara¸c˜ao dos coeficientes de varia¸c˜ao fornecidos pelo estimador direto e pelo modelo nas escolas amostradas para as disciplinas (a) L´ıngua Portuguesa e (b) Matem´atica nas escolas amostradas. . . 122 6.17 Res´ıduos (c´ırculos cheios) com intervalos de credibilidade 95%

encontrados pelo ajuste do modelo hier´arquico multivariado sem c´opula para (a) L´ıngua Portuguesa e (b) Matem´atica. . . 123 C.1 Modelo de regress˜ao beta univariada do Cap´ıtulo 3: trajet´orias,

histogramas e autocorrela¸c˜oes dos parˆametros. Seus valores verdadeiros aparecem destacados. . . 144 C.2 Modelo bivariado utilizando a c´opula FGM do Cap´ıtulo 4: trajet´orias,

histogramas e autocorrela¸c˜oes dos parˆametros. Seus valores verdadeiros aparecem destacados. . . 145 C.3 Modelo bivariado utilizando a c´opula FGM do Cap´ıtulo 4: trajet´orias,

histogramas e autocorrela¸c˜oes dos parˆametros. Seus valores verdadeiros aparecem destacados (continua¸c˜ao). . . 146 C.4 Modelo de regress˜ao beta bivariado com c´opula Clayton do Cap´ıtulo 4:

trajet´orias, histogramas e autocorrela¸c˜oes dos parˆametros. . . 147 C.5 Modelo de regress˜ao beta bivariado com c´opula Clayton do Cap´ıtulo 4:

(15)

C.6 Modelo de regress˜ao beta bivariado com c´opula FGM do Cap´ıtulo 4: trajet´orias, histogramas e autocorrela¸c˜oes dos parˆametros. . . 149 C.7 Modelo de regress˜ao beta bivariado com c´opula FGM do Cap´ıtulo 4:

trajet´orias, histogramas e autocorrela¸c˜oes dos parˆametros (continua¸c˜ao). 150 C.8 Modelo de regress˜ao beta bivariado com c´opula Frank do Cap´ıtulo 4:

trajet´orias, histogramas e autocorrela¸c˜oes dos parˆametros. . . 151 C.9 Modelo de regress˜ao beta bivariado com c´opula Frank do Cap´ıtulo 4:

trajet´orias, histogramas e autocorrela¸c˜oes dos parˆametros (continua¸c˜ao). 152 C.10 Modelo de regress˜ao beta bivariado com c´opula Gaussiana do Cap´ıtulo

4: trajet´orias, histogramas e autocorrela¸c˜oes dos parˆametros. . . 153 C.11 Modelo de regress˜ao beta bivariado com c´opula Gaussiana do Cap´ıtulo 4:

trajet´orias, histogramas e autocorrela¸c˜oes dos parˆametros (continua¸c˜ao). 154 C.12 Modelo de regress˜ao beta bivariado com c´opula Clayton do Cap´ıtulo 4:

trajet´orias, histogramas e autocorrela¸c˜oes dos parˆametros. . . 155 C.13 Modelo de regress˜ao beta bivariado com c´opula Clayton do Cap´ıtulo 4:

trajet´orias, histogramas e autocorrela¸c˜oes dos parˆametros (continua¸c˜ao). 156 C.14 Modelo de regress˜ao beta bivariado com c´opula FGM do Cap´ıtulo 4:

trajet´orias, histogramas e autocorrela¸c˜oes dos parˆametros. . . 157 C.15 Modelo de regress˜ao beta bivariado com c´opula FGM do Cap´ıtulo 4:

trajet´orias, histogramas e autocorrela¸c˜oes dos parˆametros (continua¸c˜ao). 158 C.16 Modelo de regress˜ao beta bivariado com c´opula Frank do Cap´ıtulo 4:

trajet´orias, histogramas e autocorrela¸c˜oes dos parˆametros. . . 159 C.17 Modelo de regress˜ao beta bivariado com c´opula Frank do Cap´ıtulo 4:

trajet´orias, histogramas e autocorrela¸c˜oes dos parˆametros (continua¸c˜ao). 160 C.18 Modelo de regress˜ao beta bivariado com c´opula Gaussiana do Cap´ıtulo

4: trajet´orias, histogramas e autocorrela¸c˜oes dos parˆametros. . . 161 C.19 Modelo de regress˜ao beta bivariado com c´opula Gaussiana do Cap´ıtulo 4:

trajet´orias, histogramas e autocorrela¸c˜oes dos parˆametros (continua¸c˜ao). 162 C.20 Modelo hier´arquico bivariado com σ2

1 = σ22 = 0, 5 e ρ12 = 0, 5 no Cap´ıtulo

5: trajet´orias, histogramas e autocorrela¸c˜oes. . . 163 C.21 Modelo hier´arquico bivariado com σ2

1 = σ22 = 0, 5 e ρ12 = 0, 5 no Cap´ıtulo

(16)

C.22 Modelo hier´arquico bivariado com σ2

1 = σ22 = 0, 5 e ρ12 = 0, 2 no Cap´ıtulo

5: trajet´orias, histogramas e autocorrela¸c˜oes. . . 165 C.23 Modelo hier´arquico bivariado com σ2

1 = σ22 = 0, 5 e ρ12 = 0, 2 no Cap´ıtulo

(17)

Lista de Tabelas

3.1 Sum´arios das distribui¸c˜oes a posteriori, em cada cadeia, quando φ ∼ Gama(67, 62, 6) e φ ∼ Gama(0, 001; 0, 001) a priori. . . 23 4.1 Defini¸c˜ao das c´opulas utilizadas neste trabalho, dom´ınio de varia¸c˜ao do

parˆametro das c´opulas, θ, a medida de associa¸c˜ao τ de Kendall e sua rela¸c˜ao com θ. . . 35 4.2 Sum´ario da distribui¸c˜ao a posteriori dos parˆametros do modelo bivariado

com c´opula Clayton: valores verdadeiros, limites dos intervalos de credibilidade 95%, mediana e m´edia a posteriori e distribui¸c˜oes a priori de cada parˆametro. . . 42 4.3 Sum´ario da distribui¸c˜ao a posteriori dos parˆametros do modelo bivariado

com c´opula FGM: valores verdadeiros, limites dos intervalos de credibilidade 95%, mediana e m´edia a posteriori e distribui¸c˜oes a priori de cada parˆametro. . . 43 4.4 Sum´ario da distribui¸c˜ao a posteriori dos parˆametros do modelo bivariado

com c´opula Frank: valores verdadeiros, limites dos intervalos de credibilidade 95%, mediana e m´edia a posteriori e distribui¸c˜oes a priori de cada parˆametro. . . 43 4.5 Sum´ario da distribui¸c˜ao a posteriori dos parˆametros do modelo bivariado

com c´opula Gaussiana: valores verdadeiros, limites dos intervalos de credibilidade 95%, mediana e m´edia a posteriori e distribui¸c˜oes a priori de cada parˆametro. . . 43 4.6 Percentual das vezes em que o intervalo de credibilidade 95% cont´em o

valor verdadeiro do parˆametro e amplitude dos intervalos. Amostras do modelo bivariado com τ = 0, 10. . . 45 4.7 V´ıcio e erro quadr´atico m´edio obtido para as amostras do modelo

(18)

4.8 Percentual das vezes em que o intervalo de credibilidade 95% cont´em o valor verdadeiro do parˆametro e amplitude dos intervalos. Amostras do modelo bivariado com τ = 0, 50. . . 46 4.9 V´ıcio e erro quadr´atico m´edio obtido para as amostras do modelo

bivariado com τ = 0, 50. . . 46 4.10 Percentual das vezes em que o intervalo de credibilidade 95% cont´em o

valor verdadeiro do parˆametro e a amplitude dos intervalos. Amostras do modelo bivariado com τ = 0, 80. . . 47 4.11 V´ıcio e erro quadr´atico m´edio obtido para as amostras do modelo

bivariado com τ = 0, 80. . . 47 4.12 Percentual das vezes em que o intervalo de credibilidade 95% cont´em o

valor verdadeiro do parˆametro e amplitude dos intervalos. Amostras do modelo univariado. . . 48 4.13 V´ıcio e erro quadr´atico m´edio obtido para as amostras do modelo

univariado. . . 48 5.1 Valores verdadeiros dos parˆametros, distribui¸c˜oes a priori e propostas

do MCMC utilizadas no exerc´ıcio. . . 65 5.2 Sum´arios das distribui¸c˜oes a posteriori quando se adota para Σ−1

distribui¸c˜oes a priori Wishart com diferentes parˆametros, correla¸c˜ao dos efeitos aleat´orios igual a 0, 50 e variˆancia 0, 50. . . 68 5.3 Sum´ario da distribui¸c˜ao a posteriori quando se adota para Σ−1

distribui¸c˜ao a priori Wishart vaga (Priori 3), correla¸c˜ao dos efeitos aleat´orios igual a 0, 50 e variˆancia 0, 50. . . 69 5.4 Valores verdadeiros dos parˆametros, distribui¸c˜oes a priori e propostas

do MCMC utilizadas no exerc´ıcio. . . 72 5.5 Sum´ario da distribui¸c˜ao a posteriori quando se adota para Σ−1

distribui¸c˜ao a priori Wishart informativa, correla¸c˜ao dos efeitos aleat´orios igual a 0, 20 e variˆancia 0, 50. . . 73 5.6 Sum´arios das distribui¸c˜oes a posteriori quando se adota para Σ−1

distribui¸c˜oes a priori Wishart com diferentes parˆametros, correla¸c˜ao dos efeitos aleat´orios igual a 0, 10 e variˆancia 0, 25. . . 74

(19)

5.7 Sum´ario da distribui¸c˜ao a posteriori quando se adota para Σ−1 distribui¸c˜ao a priori Wishart. Modelo hier´arquico de regress˜ao beta com c´opulas, uma vari´avel explicativa e efeitos aleat´orios nos interceptos. . . 77 5.8 Crit´erios de compara¸c˜ao DIC, AIC, BIC, n´umero de parˆametros e

logaritmo da verossimilhan¸ca preditiva obtidos pelos ajustes dos modelos hier´arquicos com resposta normal (Modelo 1), com resposta beta sem c´opulas (Modelo 2) e com resposta beta e c´opula Gaussiana (Modelo 3). 80 5.9 Sum´arios das distribui¸c˜oes a posteriori dos Modelos 2 e 3. . . 81 6.1 Correla¸c˜oes parciais entre as vari´aveis resposta de acordo com a presen¸ca

das vari´aveis regressoras no modelo. . . 95 6.2 Sum´arios das distribui¸c˜oes a posteriori dos modelos que utilizam as

c´opulas Clayton e FGM. . . 96 6.3 Sum´arios das distribui¸c˜oes a posteriori dos modelos que utilizam as

c´opulas Frank e Gaussiana. . . 96 6.4 Sum´arios das distribui¸c˜oes a posteriori obtidas a partir dos modelos

separados. . . 97 6.5 M´edias e desvios a posteriori das previs˜oes das observa¸c˜oes faltantes nos

modelos bivariados com diferentes c´opulas e no modelo univariado. . . . 97 6.6 V´ıcios relativos absolutos dos valores verdadeiros das observa¸c˜oes

consideradas desconhecidas e as previs˜oes fornecidas pelos modelos (em %). . . 98 6.7 Raz˜oes entre as variˆancias e as amplitudes dos intervalos de credibilidade

95% fornecidas pelos modelos bivariados e univariados (em %). . . 98 6.8 Crit´erios de compara¸c˜ao de modelos considerando as observa¸c˜oes

ausentes como parˆametros. . . 99 6.9 Aplica¸c˜ao 1: Estat´ısticas descritivas das distribui¸c˜oes dos erros, erros

relativos absolutos, erros quadr´aticos e coeficientes de varia¸c˜ao obtidos pelos modelos hier´arquicos multivariado e univariados para as escolas n˜ao amostradas nas disciplinas L´ıngua Portuguesa e Matem´atica. . . . 110 6.10 Sum´ario da distribui¸c˜ao a posteriori dos parˆametros do Modelo 2. . . . 111

(20)

6.11 Crit´erio de compara¸c˜ao DIC, n´umero de parˆametros e logaritmo da verossimilhan¸ca preditiva obtidos pelos ajustes dos modelos hier´arquicos multivariados com respostas beta sem c´opula (Modelo 1) e com c´opula Gaussiana (Modelo 2), bem como os univariados para L´ıngua Portuguesa e Matem´atica. . . 112 6.12 Sum´ario da distribui¸c˜ao a posteriori dos parˆametros do modelo. . . 122 D.1 Sum´ario da distribui¸c˜ao a posteriori das previs˜oes das observa¸c˜oes

(21)

Lista de Abreviaturas

AIC Crit´erio de Informa¸c˜ao Akaike (Akaike Information Criterion). BIC Crit´erio de Informa¸c˜ao Bayesiano (Bayesian Information Criterion).

DIC Crit´erio de Informa¸c˜ao Baseado no Desvio (Deviance Information Criterion). EBLUP Melhor preditor emp´ırico linear n˜ao-viesado (Empirical Best Linear

Unbiased Predictor ).

EPD Desvio Preditivo Esperado (Expected Prediction Deviation). FGM C´opula Farlie-Gumbel-Morgenstern.

IBGE Funda¸c˜ao Instituto Brasileiro de Geografia e Estat´ıstica. IDH ´Indice de Desenvolvimento Humano.

INEP Instituto Nacional de Estudos e Pesquisas Educacionais An´ısio Teixeira. IPEA Instituto de Pesquisa Econˆomica Aplicada.

(22)

Cap´ıtulo 1

Introdu¸

ao

Existem situa¸c˜oes nas quais deseja-se explicar o comportamento de uma vari´avel dependente atrav´es de um conjunto de p vari´aveis chamadas explicativas ou regressoras. Quando h´a mais de uma vari´avel dependente e estas s˜ao relacionadas entre si, a an´alise multivariada torna-se mais apropriada por considerar as associa¸c˜oes entre essas vari´aveis. Ent˜ao, espera-se que haja ganho de precis˜ao das estimativas dos parˆametros dos modelos e das previs˜oes que estes possam fornecer.

O objetivo desta tese ´e contribuir com novas formas de modelagem de vari´aveis que representam ´ındices, taxas e propor¸c˜oes, comumente estimadas com baixa precis˜ao em amostras pequenas e, por esta raz˜ao, consideradas inst´aveis. Exemplos de vari´aveis mensuradas no intervalo (0, 1) ou num intervalo (a, b) s˜ao a propor¸c˜ao de pobres, taxas de mortalidade, raz˜ao entre gasto alimentar e despesa total, raz˜ao entre renda dos mais pobres e renda total, taxa de desemprego. Embora a motiva¸c˜ao do trabalho seja a estima¸c˜ao de taxas e propor¸c˜oes em pequenas ´areas (ou pequenos dom´ınios), a estrat´egia para atingir este objetivo parte do desenvolvimento de modelos aplic´aveis em contextos mais gerais, com a posterior apresenta¸c˜ao dos estimadores para pequenas ´areas. Assim, modelos multivariados s˜ao desenvolvidos para a modelagem de taxas e propor¸c˜oes, oferecendo a possibilidade de tratar conjuntamente quantidades relacionadas, aproveitando os benef´ıcios que a abordagem conjunta oferece. A troca de informa¸c˜oes entre as vari´aveis nos modelos multivariados aqui propostos auxilia a obten¸c˜ao de estimativas mais precisas das quantidades alvo e permitem tamb´em que os erros das estimativas sejam calculados.

Nos ´ultimos anos, tem-se desenvolvido grande n´umero de aplica¸c˜oes envolvendo a distribui¸c˜ao beta, apropriada para modelar taxas e propor¸c˜oes, pois est´a definida no intervalo (0, 1), al´em de considerar caracter´ısticas de assimetria presentes nesses tipos de vari´aveis, assumindo diferentes formas dependendo de seus parˆametros. A

(23)

regress˜ao beta permite tamb´em que as observa¸c˜oes sejam heteroced´asticas. No entanto, as propostas de utiliza¸c˜ao da distribui¸c˜ao beta no contexto de regress˜ao, em sua maioria, tem se restringido aos casos em que h´a apenas uma vari´avel dependente e sob abordagem Bayesiana, faltam estudos sobre a utiliza¸c˜ao de diferentes distribui¸c˜oes a priori para os coeficientes de regress˜ao e outros parˆametros.

A presente tese desenvolve modelos de regress˜ao multivariada nos quais as vari´aveis dependentes seguem, marginalmente, uma distribui¸c˜ao beta cuja densidade foi reparametrizada em fun¸c˜ao dos parˆametros de m´edia e precis˜ao, como em Ferrari e Cribari-Neto (2004). Esses modelos foram desenvolvidos para tratar dados em contextos gerais, por´em uma aplica¸c˜ao em pequenas ´areas mostra que s˜ao vantajosos especialmente nesta situa¸c˜ao. Por hip´otese, nos modelos constru´ıdos ao longo deste texto, as vari´aveis resposta n˜ao somam um, como em alguns modelos para propor¸c˜oes discutidos, por exemplo, em Melo et al. (2009) e Fabrizi et al. (2011).

A associa¸c˜ao entre as vari´aveis resposta ´e considerada atrav´es de uma fun¸c˜ao c´opula aplicada `as densidades marginais. As c´opulas s˜ao ferramentas ´uteis para constru¸c˜ao de distribui¸c˜oes multivariadas quando as marginais s˜ao dadas ou conhecidas, permitindo que modelos individuais sejam analisados conjuntamente. Al´em disso, possibilitam a representa¸c˜ao de diversos tipos de dependˆencia entre as vari´aveis. As c´opulas possuem flexibilidade para tratamento de rela¸c˜oes n˜ao-lineares entre as vari´aveis envolvidas, sendo portanto mais gerais que, por exemplo, a distribui¸c˜ao normal multivariada a qual permite apenas rela¸c˜oes lineares.

Fundamentalmente, duas classes de modelos multivariados com resposta beta s˜ao constru´ıdas ao longo do trabalho: um modelo de regress˜ao e um modelo hier´arquico que admite dois n´ıveis. O segundo considera efeitos fixos e aleat´orios que s˜ao supostamente correlacionados. Ambos podem ser utilizados em situa¸c˜oes em que o pesquisador precisa analisar dados de vari´aveis relacionadas, medidas no intervalo (0, 1), e essas rela¸c˜oes auxiliam as previs˜oes de observa¸c˜oes faltantes. O modelo hier´arquico pode ser utilizado para melhorar a previs˜ao de observa¸c˜oes e parˆametros populacionais em pequenas ´areas, permitindo que estas troquem informa¸c˜oes entre si, possibilitando ainda que as informa¸c˜oes de vari´aveis auxiliares sejam consideradas no processo de previs˜ao. O modelo hier´arquico possui alguns casos particulares interessantes que s˜ao analisados no Cap´ıtulo 5.

(24)

disponibilidade de vari´aveis auxiliares e dados de m´ultiplas caracter´ısticas, ´e poss´ıvel aplicar uma modelagem multivariada. Diversos autores argumentam que este tipo de abordagem fornece melhores estimativas, no sentido de aumento de precis˜ao, por considerar as correla¸c˜oes entre as diferentes caracter´ısticas. Fay (1987) modela o comportamento conjunto da renda mediana nos domic´ılios de trˆes, quatro e cinco pessoas, constituindo-se num exemplo de modelagem multivariada em pequenas ´areas. Datta et al. (1999) aplicaram um modelo linear misto multivariado e conclu´ıram, a partir de um estudo de simula¸c˜ao, que a modelagem multivariada fornecia melhores resultados que o ajuste de um modelo separado para cada vari´avel. Os m´etodos mais comuns empregados se baseiam no empr´estimo de informa¸c˜oes entre ´areas vizinhas ou relacionadas, nas correla¸c˜oes com outras vari´aveis dependentes e nas informa¸c˜oes de registros administrativos. O modelo hier´arquico proposto neste trabalho tem aplica¸c˜ao direta no problema de estima¸c˜ao em pequenas ´areas por favorecer a troca de informa¸c˜oes entre as ´areas e entre vari´aveis, particularmente entre suas m´edias o que ajuda no aumento de precis˜ao de suas estimativas. Uma aplica¸c˜ao deste modelo a dados de pequenas ´areas ´e feita no Cap´ıtulo 6, reservado `as previs˜oes.

O processo de inferˆencia sobre os parˆametros dos modelos propostos ´e feito sob abordagem Bayesiana e alguns aspectos sobre reparametriza¸c˜oes e algoritmos de simula¸c˜ao de amostras das distribui¸c˜oes a posteriori s˜ao abordados. M´etodos de sele¸c˜ao de modelos foram aplicados nos exemplos.

Alguns temas que aparecem nesta tese s˜ao modelos hier´arquicos, estima¸c˜ao em pequenas ´areas, crit´erios de compara¸c˜ao de modelos, c´opulas e regress˜ao beta, sendo necess´ario introduz´ı-los, mostrando em que situa¸c˜oes aparecem na literatura. Modelos hier´arquicos, estima¸c˜ao em pequenas ´areas e crit´erios de compara¸c˜ao s˜ao abordados no Cap´ıtulo 2, no qual se faz uma introdu¸c˜ao desses temas, juntamente com uma revis˜ao bibliogr´afica de suas aplica¸c˜oes. O Cap´ıtulo 3 tem por finalidade apresentar o modelo de regress˜ao beta univariado utilizado como base para constru¸c˜ao dos modelos multivariados e discutir sobre a abordagem Bayesiana nesse modelo. O Cap´ıtulo 4 prop˜oe um modelo multivariado de regress˜ao beta, fornecendo uma breve descri¸c˜ao sobre a defini¸c˜ao e utiliza¸c˜ao de c´opulas na constru¸c˜ao de modelos multivariados. Exerc´ıcios de simula¸c˜ao mostram a vantagem da modelagem conjunta sobre a separada, constituindo-se numa das contribui¸c˜oes desta tese. O referido cap´ıtulo tamb´em aborda a inferˆencia sobre os parˆametros, todos considerados desconhecidos. O Cap´ıtulo 5

(25)

contribui com o desenvolvimento do modelo hier´arquico multivariado de regress˜ao beta, destacando alguns casos particulares. Reparametriza¸c˜oes que ajudam na amostragem dos parˆametros da distribui¸c˜ao a posteriori s˜ao comentadas e implementadas em exemplos com dados simulados. O Cap´ıtulo 6 versa sobre previs˜ao de dados faltantes e cont´em aplica¸c˜oes em pequenas ´areas, onde pode-se destacar a modelagem do parˆametro de precis˜ao da regress˜ao beta como fun¸c˜ao do tamanho de amostra, resultando em mais uma contribui¸c˜ao desta tese. Por fim, no Cap´ıtulo 7 apresentam-se as conclus˜oes, coment´arios finais e as propostas de trabalhos futuros.

(26)

Cap´ıtulo 2

Revis˜

ao bibliogr´

afica

Neste cap´ıtulo, realiza-se revis˜ao bibliogr´afica sobre temas abordados nos cap´ıtulos seguintes: modelos hier´arquicos, estima¸c˜ao em pequenas ´areas, crit´erios de compara¸c˜ao de modelos e diagn´ostico de convergˆencia nos m´etodos de Monte Carlo via Cadeias de Markov (MCMC). Na Se¸c˜ao inicial, s˜ao descritos modelos hier´arquicos e suas aplica¸c˜oes. Na Se¸c˜ao 2.2, introduz-se o problema de estima¸c˜ao em pequenas ´areas ou pequenos dom´ınios, revisando os conceitos de estimadores diretos e indiretos, com destaque para os modelos em n´ıvel de ´area e de unidade. Exemplos desses modelos encontrados na literatura s˜ao citados, tanto em abordagens univariadas quanto multivariadas. Na Se¸c˜ao 2.3, s˜ao descritos alguns crit´erios de compara¸c˜ao de modelos, que s˜ao citados e utilizados ao longo do texto nas se¸c˜oes de aplica¸c˜oes com dados reais. Na ´ultima se¸c˜ao, apresentam-se os crit´erios mais usados para avalia¸c˜ao da convergˆencia nos algoritmos MCMC empregados para simular amostras da distribui¸c˜ao a posteriori quando sua forma ´e desconhecida. A revis˜ao de regress˜ao beta e de c´opulas ´e realizada na parte introdut´oria dos cap´ıtulos referentes a estes assuntos.

2.1 Modelos hier´arquicos

Um modelo hier´arquico leva em conta a estrutura hier´arquica da popula¸c˜ao a ser investigada, no qual as unidades de n´ıvel mais baixo na popula¸c˜ao devem estar organizadas hierarquicamente em n´ıveis superiores. Por exemplo, alunos est˜ao agrupados em turmas, por sua vez organizadas em escolas e estas em munic´ıpios. Podemos, ent˜ao, descrever os resultados de um aluno como uma soma de efeitos do aluno, da turma, da escola e do munic´ıpio aos quais pertence. Estes efeitos podem ser considerados permut´aveis e com uma distribui¸c˜ao descrita por um componente de variˆancia. Tamb´em pode haver coeficientes de regress˜ao em alguns ou todos os n´ıveis.

(27)

Um modelo hier´arquico normal muito utilizado tem a forma yij ∼ N (µ + νi, σ2), i = 1, ..., M, j = 1, ..., Ni,

νi ∼ N (0, σ2ν),

onde µ representa uma m´edia global, νi ´e um efeito aleat´orio espec´ıfico da ´area ou

grupo i, σ2 se refere `a variˆancia das unidades individuais e σ2

ν ´e a variˆancia associada

aos efeitos aleat´orios.

No modelo acima, dependendo do problema estudado, pode-se supor distribui¸c˜oes para yij diferentes da normal, como distribui¸c˜oes na fam´ılia exponencial e, no caso

deste trabalho, distribui¸c˜ao beta quando a resposta ´e uma taxa ou propor¸c˜ao. Um ponto importante na estima¸c˜ao dos parˆametros dos modelos hier´arquicos refere-se `as variˆancias, muitas vezes supostas conhecidas pela dificuldade de estim´a-las. Gelman (2006) prop˜oe distribui¸c˜oes a priori para os parˆametros de variˆancia em modelos hier´arquicos. Modelos hier´arquicos mais complexos j´a foram propostos de modo a contemplar componentes dinˆamicas, como em Gamerman e Migon (1993) e Landim e Gamerman (2000).

Modelos hier´arquicos s˜ao aplicados frequentemente na modelagem de dados de amostras com desenho complexo, que usualmente envolvem estratifica¸c˜ao e conglomera¸c˜ao em v´arios est´agios para investigar popula¸c˜oes com estrutura hier´arquica. Tal estrutura ´e refletida no modelo atrav´es de efeitos aleat´orios e componentes de variˆancia que diferenciam os n´ıveis hier´arquicos.

Uma vez que tal modelo ´e especificado, a inferˆencia pode ser realizada a partir dos dados dispon´ıveis para os parˆametros populacionais em qualquer n´ıvel. Essa modelagem ´e ´util no problema de estima¸c˜ao em pequenas ´areas, ou seja, na estima¸c˜ao para unidades ou dom´ınios nos quais a informa¸c˜ao ´e bastante limitada, porque favorece a troca de informa¸c˜ao entre as ´areas. Mais detalhes na Se¸c˜ao 2.2.

Em Goldstein et al. (2009) prop˜oe-se uma classe de modelos para respostas multivariadas mistas cont´ınuas e categ´oricas, ordenadas ou n˜ao. Cada vari´avel pode ser definida em qualquer n´ıvel de dados hierarquizados em m´ultiplos n´ıveis. Al´em disso, procurou-se resolver problemas como de dados faltantes e parcialmente observados. Goldstein et al. (2009) propuseram um modelo bastante geral em que as vari´aveis cont´ınuas podem seguir qualquer distribui¸c˜ao cont´ınua, n˜ao sendo necessariamente normais. No entanto, ´e preciso utilizar transforma¸c˜oes, como as de Box-Cox, nas vari´aveis resposta n˜ao normais. Por sua vez, esta tese prop˜oe modelos em que as

(28)

vari´aveis dependentes s˜ao mantidas na escala original. 2.2 Estima¸c˜ao em pequenas ´areas

Os termos pequena ´area e pequeno dom´ınio comumente se referem a popula¸c˜oes nas quais n˜ao podem ser produzidas estimativas confi´aveis para alguma vari´avel de interesse devido a limita¸c˜oes nos dados dispon´ıveis, principalmente em rela¸c˜ao ao tamanho de amostra. Os dom´ınios podem ser regi˜oes geogr´aficas, como os estados e munic´ıpios, ou grupos formados pelo cruzamento de vari´aveis, tais como idade, sexo e faixa de renda. Estat´ısticas em n´ıveis mais desagregados s˜ao necess´arias para direcionamento de pol´ıticas p´ublicas e planejamento de pesquisas. No entanto, as limita¸c˜oes mencionadas dificultam a obten¸c˜ao de tais dados.

Estimativas de totais, m´edias e outras fun¸c˜oes das vari´aveis de interesse podem ser obtidas a partir de estimadores diretos, derivados do desenho amostral, ou indiretamente, com base em modelos. O estimador direto utiliza apenas os valores da vari´avel de interesse observados nas unidades amostrais do dom´ınio e alguma informa¸c˜ao auxiliar dispon´ıvel. Em geral, as pesquisas por amostragem fornecem estimativas diretas confi´aveis para dom´ınios em que o tamanho de amostra ´e grande. No contexto de pequenas ´areas, estimadores diretos apresentam erros elevados devido aos pequenos tamanhos de amostra. Assim, torna-se necess´ario o desenvolvimento de estimadores indiretos que relacionem as diversas ´areas de maneira que estas emprestem informa¸c˜ao entre si, fazendo com que “cres¸cam” os tamanhos efetivos das amostras, reduzindo-se os erros das estimativas.

Exemplos de estimadores indiretos s˜ao os estimadores sint´etico e composto. O estimador sint´etico obt´em as estimativas das pequenas ´areas supondo que estas tenham o mesmo comportamento da ´area maior a qual pertencem. A estimativa direta da ´area maior ´e repartida entre as ´areas menores. O estimador composto pode ser definido como uma m´edia ponderada de dois estimadores. Por exemplo, sejam ˆYi1 e ˆYi2,

respectivamente, os estimadores direto e sint´etico da caracter´ıstica Y na pequena ´area i. Ent˜ao o estimador composto ´e ˆYiC = wiYˆi1+ (1 − wi) ˆYi2, com 0 ≤ wi ≤ 1. Uma

poss´ıvel escolha de wi ´e aquela que minimiza o erro quadr´atico m´edio do estimador

composto. Mais detalhes sobre estes estimadores podem ser vistos em Rao (2003), assim como uma extensa revis˜ao de m´etodos empregados em pequenas ´areas.

Para estima¸c˜ao indireta, destacam-se os modelos em n´ıvel de ´area e de unidade. Seja θi uma fun¸c˜ao da caracter´ıstica de interesse, como total ou propor¸c˜ao, na i-´esima

(29)

pequena ´area e ˆθi uma estimativa direta de θi. O modelo b´asico em n´ıvel de ´area sup˜oe

que θi esteja relacionado a um conjunto de vari´aveis auxiliares xi = (x1i, ..., xpi) atrav´es

de um modelo linear

θi = xiβ + vi, i = 1, ..., M,

onde M ´e o n´umero de ´areas, β ´e um vetor p × 1 de coeficientes de regress˜ao e vi ´e

um efeito aleat´orio espec´ıfico da ´area i, normalmente distribu´ıdo, com m´edia zero e variˆancia σv2. O modelo em n´ıvel de ´area se completa com a suposi¸c˜ao de que

ˆ

θi = θi+ ei,

onde ei ´e interpretado como o erro introduzido pelo desenho amostral, tem m´edia zero

e variˆancia ψi, supostamente conhecida. Al´em disso, ei segue distribui¸c˜ao normal e ´e

independente de vi. O modelo b´asico em n´ıvel de ´area foi utilizado por Fay e Herriot

(1979) para estima¸c˜ao de renda per capita em dom´ınios cujo tamanho da popula¸c˜ao era inferior a 1000.

No modelo b´asico em n´ıvel de unidade, sup˜oe-se que existem dados auxiliares xij = (xij1, ..., xijp) dispon´ıveis para cada elemento j da pequena ´area i. A vari´avel de

interesse se relaciona com xij da seguinte forma

yij = xijβ + vi+ eij, j = 1, ..., Ni, i = 1, ..., M,

onde M ´e o n´umero de ´areas, vis˜ao efeitos espec´ıficos de ´area com m´edia zero e variˆancia

σ2

v. As vari´aveis aleat´orias eij e vi s˜ao consideradas independentes e normalmente

distribu´ıdas, ∀i.

Rao (2003) revisa o ajuste de modelos lineares generalizados mistos, especialmente utilizados para respostas bin´arias no n´ıvel de unidade e para contagens no n´ıvel de ´

area. Nestes casos, a propor¸c˜ao ou taxa ´e a quantidade de interesse e est´a relacionada a vari´aveis explicativas atrav´es de uma fun¸c˜ao de liga¸c˜ao, tal como a fun¸c˜ao log´ıstica, da seguinte forma

logit (pij) = xTijβ + vi

onde vi ∼ N (0, σ2v) s˜ao efeitos aleat´orios espec´ıficos das ´areas e xij s˜ao covari´aveis

relativas `as unidades. O estimador da propor¸c˜ao Pi da pequena ´area i ´e dado por

  X j∈Si yij + X j /∈Si ˆ pij  /Ni

onde Si ´e a amostra na pequena ´area i e ˆpij ´e obtido pela equa¸c˜ao anterior ap´os a

(30)

Pfeffermann (2010) atualiza a revis˜ao de estima¸c˜ao em pequenas ´areas cobrindo publica¸c˜oes posteriores ao ano de 2003, enfatizando a predi¸c˜ao das quantidades de interesse nas ´areas e o c´alculo do erro de predi¸c˜ao, tanto para estimadores diretos baseados no desenho amostral, quanto para aqueles baseados em modelos.

Embora os modelos anteriormente descritos sejam tamb´em utilizados na pr´atica para estima¸c˜ao de taxas e propor¸c˜oes, a hip´otese de normalidade pode n˜ao ser realista devido aos pequenos tamanhos de amostra em alguns dom´ınios e quando os valores s˜ao pr´oximos de 0 ou de 1, indicando assimetria da vari´avel resposta. O mesmo ocorre em rela¸c˜ao `a hip´otese de conhecimento das variˆancias ou dos coeficientes de varia¸c˜ao. Por essa raz˜ao, alguns autores propuseram modelos espec´ıficos para tratar vari´aveis no intervalo (0, 1).

Moura e Migon (2002) prop˜oem um modelo hier´arquico log´ıstico de dois n´ıveis com estrutura espacial para previs˜ao de propor¸c˜oes em pequenas ´areas. Os autores utilizaram os dados do Censo Escolar Brasileiro de Educa¸c˜ao B´asica do Estado do Rio de Janeiro em 1996. Os dados consistem nos graus obtidos por 15288 alunos no exame de matem´atica. As quantidades de interesse eram as propor¸c˜oes de alunos com baixa proficiˆencia em M = 34 regi˜oes, consideradas como pequenas ´areas. Uma amostra de 10% dos estudantes de cada regi˜ao foi retirada com o objetivo de comparar a estimativa obtida em cada pequena ´area com o respectivo valor verdadeiro da propor¸c˜ao. A abordagem adotada sup˜oe a existˆencia de covari´aveis que podem ser obtidas para todos os estudantes a partir dos registros das escolas. O objetivo ´e inferir sobre a i-´esima propor¸c˜ao, i = 1, . . . , M , que pode ser escrita como

θi = Ni−1   X j∈Si yij + X j /∈Si yij  

onde: yij ´e vari´avel bin´aria, indicando se o j-´esimo indiv´ıduo da pequena ´area i

possui a caracter´ıstica de interesse; Si ´e a amostra da pequena ´area i; Ni e ni s˜ao,

respectivamente, o tamanho da popula¸c˜ao e o n´umero de unidades amostradas da i-´

esima pequena ´area.

Note que a informa¸c˜ao yij ´e conhecida somente para as unidades amostrais (j ∈

Si). A abordagem consiste em construir um modelo que relacione yij ao conjunto de

vari´aveis dispon´ıveis para todas as unidades populacionais. A distribui¸c˜ao a posteriori para cada propor¸c˜ao θi pode ser obtida a partir da distribui¸c˜ao preditiva de yij para

j /∈ Si, as unidades n˜ao amostradas. Esta abordagem pode ser vista como um caso

(31)

Um modelo hier´arquico log´ıstico de dois n´ıveis com estrutura espacial e heterogˆenea foi considerado para relacionar a resposta yij `as covari´aveis, sendo o segundo n´ıvel, a

pequena ´area, e o primeiro, a unidade amostral.

Assume-se que as vari´aveis aleat´orias yij s˜ao independentes com distribui¸c˜ao de

Bernoulli de parˆametros πij. Al´em disso, dados o vetor de covari´aveis de dimens˜ao

p + 1, x0ij = (1, x1,ij, . . . , xp,ij) e o vetor de parˆametros de regress˜ao βi = δi+ φi, ent˜ao

log πij 1 − πij

!

= x0ijβi

onde o vetor δi tem uma distribui¸c˜ao a priori n˜ao estruturada, enquanto φi tem

uma priori espacialmente estruturada. Neste caso, os autores preferiram modelar as unidades amostrais para depois inferir sobre as propor¸c˜oes. Com os modelos com resposta beta ´e poss´ıvel modelar as propor¸c˜oes ou taxas diretamente.

Liu et al. (2007) comparam quatro modelos para estima¸c˜ao indireta de propor¸c˜oes em pequenas ´areas, sob abordagem Bayesiana, utilizando dados de pesquisas amostrais. O primeiro modelo corresponde `aquele de Fay e Herriot (1979), em n´ıvel de ´area, dado por piw|Pi ∼ N (Pi, ψi) Pi|β, σ2ν ∼ N  xiβ, σν2 

onde Pi ´e a propor¸c˜ao de interesse na ´area i, piw representa uma estimativa direta

de Pi e N (a, b) se refere `a distribui¸c˜ao normal com m´edia a e variˆancia b. Neste

modelo, as propor¸c˜oes s˜ao supostas normalmente distribu´ıdas. Esta hip´otese pode n˜ao ser razo´avel, uma vez que o modelo n˜ao garante que a vari´avel resposta perten¸ca ao intervalo (0, 1). O segundo modelo ´e tal que

piw|Pi ∼ N (Pi, ψi)

g(Pi)|β, σν2 ∼ N



xiβ, σν2



onde piw ´e estimada diretamente pela pesquisa amostral e g(·) ´e a fun¸c˜ao de liga¸c˜ao

log´ıstica. Ambos os modelos consideram ψi conhecido. O terceiro modelo ´e idˆentico ao

segundo, mas considera a variˆancia ψi desconhecida. O quarto e ´ultimo modelo atribui

distribui¸c˜ao beta para as propor¸c˜oes, de tal forma que piw|Pi ∼ Beta (ai, bi) logit (Pi)|β, σν2 ∼ N  xiβ, σν2  . (2.1)

(32)

A segunda distribui¸c˜ao do modelo (2.1) corresponde a fazer logit (Pi) = xiβ + i, i ∼ N (0, σν2),

diferindo do modelo (3.3), mostrado em detalhe no Cap´ıtulo 3, por considerar uma vari´avel aleat´oria i no preditor linear. A variˆancia de piw e suposta [P´ i(1−Pi)/ni]epaiw,

onde epaiw ´e o efeito do plano amostral da i-´esima pequena ´area, sob amostragem

estratificada simples e pode ser aproximado por epaiw = niPhWih2/nih, com Wih =

Nih/Ni, Ni =PhNih, em que Nih e nih s˜ao respectivamente, os n´umeros de unidades

total e na amostra da ´area i do estrato h. Assim, ai e bi em (2.1) s˜ao tais que

ai = Pi ni epaiw − 1 ! e bi = (1 − Pi) ni epaiw − 1 ! .

Liu et al. (2007) relatam problemas com o algoritmo MCMC quando piw = 0.

Para contorn´a-los, os valores de piw foram perturbados de forma que tivessem valores

positivos pr´oximos de zero. Os autores ainda estudam formas de considerar os zeros das estimativas diretas.

Jiang e Lahiri (2006) utilizam um modelo em n´ıvel de ´area em que piw segue

distribui¸c˜ao beta com m´edia Pi e variˆancia Pi(1 − Pi)δiw, com δiw =Pnj=1i w2ij onde wij

´

e o peso amostral da j-´esima observa¸c˜ao da pequena ´area i, definido como o inverso da probabilidade de inclus˜ao sob o plano amostral utilizado. A especifica¸c˜ao do modelo se completa com a equa¸c˜ao logit (Pi) = xiβ + vi, com vi ∼ N (0, σ2v). Os autores estimam

os parˆametros a partir do melhor preditor emp´ırico linear n˜ao-viesado (EBLUP), sigla em inglˆes para Empirical Best Linear Unbiased Predictor.

Os modelos propostos em Liu et al. (2007) e Jiang e Lahiri (2006) levam em conta algumas informa¸c˜oes provenientes da amostra e de seu desenho, pois incluem os tamanhos e pesos amostrais. Ambas as abordagens levam a simplifica¸c˜oes da variˆancia, de forma que apenas um parˆametro da regress˜ao beta seja estimado. Nos modelos propostos pelos autores citados, ocorre dificuldade na estima¸c˜ao da variˆancia σ2

v do

efeito aleat´orio das ´areas. O modelo hier´arquico no qual a vari´avel resposta possui distribui¸c˜ao beta ser´a visto mais adiante no Cap´ıtulo 5, com variˆancias supostamente desconhecidas.

Em muitas pesquisas por amostragem, existem informa¸c˜oes para um conjunto de caracter´ısticas e informa¸c˜oes auxiliares. Dependendo do grau de associa¸c˜ao entre essas caracter´ısticas, uma an´alise multivariada pode trazer benef´ıcios ao processo de estima¸c˜ao, pois pode ocorrer maior empr´estimo de informa¸c˜ao entre as ´areas,

(33)

melhorando a qualidade das estimativas. A vers˜ao multivariada do modelo Fay-Herriot faz uso das seguintes equa¸c˜oes

ˆ

θi = θi+ ei, i = 1, ..., M (2.2)

θi = Zβ + vi, (2.3)

onde ˆθi = (ˆθi1, ..., ˆθiK)T ´e um vetor K × 1 de estimadores das caracter´ısticas θi =

(θi1, ..., θiK)T, ei ∼ NK(0, Ψ), vi ∼ NK(0, Σv) e NK(a, B) denota a distribui¸c˜ao

normal multivariada de ordem K com vetor de m´edias a e matriz de variˆ ancias-covariˆancias B. Assim, o modelo de Fay-Herriot relaciona estimadores diretos de pequenas ´areas de K caracter´ısticas a covari´aveis auxiliares.

Datta et al. (1999) utilizaram um modelo linear misto multivariado e, a partir de simula¸c˜oes, conclu´ıram que houve um ganho de precis˜ao das estimativas obtidas com o modelo multivariado quando comparados aos modelos univariados ajustados em separado. A estima¸c˜ao foi feita com base no EBLUP. O trabalho de Datta et al. (1998) utilizou abordagem Bayesiana para ajustar o mesmo modelo.

Fabrizi et al. (2011) modelam taxas de pobreza, que representam propor¸c˜oes de pobres computadas em limiares crescentes. O objetivo ´e prever as taxas em pequenos dom´ınios n˜ao selecionados para amostra de uma pesquisa. Dentro de cada ´area, sup˜ oe-se que as diferen¸cas entre as taxas sucessivas oe-seguem condicionalmente distribui¸c˜ao beta e s˜ao permut´aveis. A modelagem das diferen¸cas se justifica devido ao fato dos estimadores das taxas com limiares crescentes n˜ao serem independentes, enquanto diferen¸cas sucessivas possuem correla¸c˜ao muito baixa. Os autores argumentam que esta hip´otese evita a generaliza¸c˜ao da distribui¸c˜ao beta para o caso multivariado. Sua proposta de modelagem refere-se a um modelo hier´arquico de dois n´ıveis, com fun¸c˜ao de liga¸c˜ao log´ıstica para as m´edias das distribui¸c˜oes beta. No modelo, a diferen¸ca δijk´e tal

que δijk = exp(ζijk)/[1 +Pkexp(ζijk)], com ζij ∼ NK(µij, Σ) e µijk = αjk+ xiβjk onde

αjk e βjk s˜ao coeficientes de regress˜ao. O modelo de Fabrizi et al. (2011) ´e semelhante

a um dos casos particulares do modelo descrito no Cap´ıtulo 5. No referido cap´ıtulo, as vari´aveis resposta, que podem ser taxas ou propor¸c˜oes, n˜ao necessariamente somam um, como em Fabrizi et al. (2011). Al´em disso, no modelo do Cap´ıtulo 5, as marginais s˜ao fixadas como beta e unidas por uma fun¸c˜ao c´opula, permitindo que seja tratado um caso ainda mais geral, no qual existe associa¸c˜ao entre as respostas no n´ıvel mais desagregado do modelo hier´arquico.

(34)

resultados que os modelos separados, especialmente na estima¸c˜ao em pequenas ´areas. Este trabalho se insere no contexto de modelagem de dados multivariados nos quais as respostas pertencem ao intervalo (0, 1). A abordagem multivariada ainda n˜ao foi tratada na literatura de pequenas ´areas quando as vari´aveis resposta seguem distribui¸c˜oes beta e sua distribui¸c˜ao conjunta ´e obtida pela aplica¸c˜ao de fun¸c˜oes c´opula. Da´ı, a relevˆancia da proposta realizada por este trabalho.

2.3 Crit´erios de compara¸c˜ao de modelos

No processo de modelagem, frequentemente ocorrem situa¸c˜oes em que ´e necess´ario decidir sobre a inclus˜ao e/ou exclus˜ao de parˆametros ou mesmo sobre a forma da distribui¸c˜ao adotada para as observa¸c˜oes. Tais situa¸c˜oes criam a necessidade de compara¸c˜ao de modelos alternativos atrav´es da utiliza¸c˜ao de crit´erios que permitam avaliar a qualidade do ajuste proporcionada pelo modelo, bem como sua complexidade. Nesta se¸c˜ao, s˜ao descritos os crit´erios de sele¸c˜ao de modelos utilizados neste trabalho.

2.3.1 Verossimilhan¸ca preditiva

Este crit´erio compara as capacidades preditivas de diferentes modelos atrav´es da verossimilhan¸ca preditiva, dada por,

p(yr|y, M ) =

Z

p(yr, Ψ|y, M )dΨ (2.4)

onde Ψ ´e o conjunto de todos os parˆametros do modelo M , y = (y1, ..., yN)T ´e o vetor

N × 1 de observa¸c˜oes e yr = (y1r, ..., yHr)T ´e um vetor H × 1 de dados n˜ao observados

ou que n˜ao foram utilizados na obten¸c˜ao da distribui¸c˜ao a posteriori de Ψ. O modelo escolhido ser´a aquele que apresentar o maior valor da verossimilhan¸ca preditiva. Do desenvolvimento de (2.4), obt´em-se

p(yr|y, M ) = Z p(yr, Ψ|y, M )dΨ = Z p(yr|Ψ, y, M )p(Ψ|y, M )dΨ = EΨ|y,M[p(yr|Ψ, y, M )]. (2.5)

Se temos uma amostra da distribui¸c˜ao a posteriori de Ψ formada pornΨ(1), ..., Ψ(L)o,

ent˜ao uma aproxima¸c˜ao para (2.5) ´e dada por ˆ EΨ|y,M[p(yr|Ψ, y, M )] = 1 L L X l=1 H Y i=1 p(yir|Ψ(l), y, M ).

No caso multivariado, a aproxima¸c˜ao tem a mesma forma com yir substitu´ıdo pelo vetor

yir = (yi1r, ..., yiKr)T onde K ´e o n´umero de vari´aveis observadas e com dependˆencia

(35)

2.3.2 Crit´erios de informa¸c˜ao baseados no desvio

Seja L(y|Ψk, Mk) a fun¸c˜ao de verossimilhan¸ca para o modelo MK, onde Ψk

re´une todos os parˆametros do modelo. Defina a fun¸c˜ao desvio como D(Ψk) =

−2 log L(y|Ψk, Mk). Os crit´erios DIC (Deviance Information Criterion), definido em

Spiegelhalter et al. (2002), e os crit´erios AIC (Akaike Information Criterion), em Akaike (1973), e BIC (Bayesian Information Criterion), em Schwarz (1978) s˜ao dados por

AIC(Mk) = D(E[Ψk|y, Mk]) + 2dk;

BIC(Mk) = D(E[Ψk|y, Mk]) + log(n)dk;

DIC(Mk) = 2E[D(Ψk)|y, Mk] − D(E[Ψk|y, Mk]).

onde dk representa o n´umero de parˆametros do modelo Mk. Quanto menor o valor dos

crit´erios, melhor o modelo. O crit´erio DIC tamb´em pode ser escrito como DIC(Mk) = E[D(Ψk)|y, Mk] + pD(Mk)

onde pD(Mk) = E[D(Ψk)|y, Mk] − D(E[Ψk|y, Mk]) ´e o n´umero efetivo de parˆametros.

Note que os trˆes crit´erios conjugam qualidade de ajuste e complexidade, atrav´es das parcelas envolvendo a fun¸c˜ao desvio e o n´umero de parˆametros.

Suponha que {Ψ(1)k , ..., Ψ(L)k } corresponda a uma amostra da distribui¸c˜ao a posteriori. Ent˜ao, as seguintes aproxima¸c˜oes de Monte Carlo podem ser aplicadas, de acordo com Silva e Lopes (2008): E[D(Ψk)|y, Mk] ≈ L−1 L X l D(Ψ(l)k ) e E[Ψk|y, Mk] ≈ L−1 L X l Ψ(l)k . (2.6) Os crit´erios definidos nesta se¸c˜ao podem apresentar valores negativos. No entanto, a parcela pD deve ser positiva. Caso n˜ao seja, pode haver indica¸c˜ao de m´a especifica¸c˜ao

do modelo. As equa¸c˜oes dos trˆes crit´erios valem diretamente para o caso multivariado, pois dependem da fun¸c˜ao de verossimilhan¸ca que incorpora a estrutura dependˆencia entre as vari´aveis observadas.

(36)

2.4 Diagn´ostico de convergˆencia

Nesta tese, utiliza-se inferˆencia Bayesiana para obten¸c˜ao de estimativas dos parˆametros dos modelos propostos, bem como daqueles empregados em algumas compara¸c˜oes. Na maioria dos exemplos, as densidades a posteriori n˜ao possuem forma conhecida e recorre-se a m´etodos de simula¸c˜ao indireta para amostrar os parˆametros dos modelos. Os m´etodos de simula¸c˜ao aplicados em todo o trabalho foram o Amostrador de Gibbs e algoritmo de Metropolis-Hastings, que se baseiam em algoritmos de Monte Carlo via Cadeias de Markov (MCMC). Suas descri¸c˜oes podem ser vistas em Gamerman e Lopes (2006). Quando h´a convergˆencia da cadeia, se atinge a distribui¸c˜ao alvo (posteriori), ap´os uma fase de aquecimento. Para verificar se de fato houve convergˆencia, existem m´etodos para diagnosticar ou monitorar tal convergˆencia, descritos a seguir.

2.4.1 Inspe¸c˜ao Visual

A inspe¸c˜ao visual de gr´aficos das cadeias dos algoritmos MCMC consiste numa forma simples de monitoramento da convergˆencia. A observa¸c˜ao das trajet´orias de diferentes cadeias partindo de valores iniciais distintos permite que se verifique se h´a mistura das cadeias `a medida em que aumenta o n´umero de itera¸c˜oes, indicando convergˆencia em distribui¸c˜ao. A partir dos gr´aficos das autocorrela¸c˜oes, verifica-se se as amostras geradas podem ser consideradas independentes dos valores iniciais. Os histogramas possibilitam a an´alise da forma da densidade a posteriori, identificando bimodadidade, por exemplo.

2.4.2 Crit´erio de Geweke

Geweke (1992) sugere um crit´erio para verifica¸c˜ao de convergˆencia com base na compara¸c˜ao de m´edias, em intervalos diferentes, ap´os o per´ıodo de aquecimento do algoritmo. Se a convergˆencia foi alcan¸cada, os comportamentos nesses intervalos devem ser semelhantes.

Considere ψ = h(θ) uma fun¸c˜ao real de um parˆametro de interesse θ, para o qual foi obtida uma amostra a partir de algoritmo MCMC. Seja t o n´umero de itera¸c˜oes correspondente `a fase de aquecimento e t + n o total de itera¸c˜oes. Construa as m´edias

¯

ψa e ¯ψb com base nos grupos de itera¸c˜oes na< n e nb < n. Segue que

zG = ¯ ψa− ¯ψb q V ar( ¯ψa) + V ar( ¯ψb) → N (0, 1) em distribui¸c˜ao, (2.7)

(37)

Dessa forma, valores grandes de zG indicam falta de convergˆencia. No entanto,

valores pequenos desta estat´ıstica n˜ao significam que houve convergˆencia. A decis˜ao deve ser tomada juntamente com outros crit´erios e com a inspe¸c˜ao visual. Para realizar o crit´erio de Geweke, basta apenas uma cadeia longa do algoritmo MCMC.

2.4.3 Crit´erio de Gelman e Rubin

Ap´os a convergˆencia, espera-se uma mistura entre cadeias paralelas com diferentes pontos de partida. Gelman e Rubin (1992) propuseram um crit´erio que consiste na compara¸c˜ao das variˆancias entre e dentro das cadeias. Para desenvolver o crit´erio s˜ao necess´arias I ≥ 2 cadeias, observando que I n˜ao deve ser muito grande para evitar desperd´ıcio de tempo computacional. Sejam: θ o parˆametro de interesse; θij o j-´esimo valor amostrado na i-´esima cadeia, para i = 1, ..., I e j = 1, ..., J ; ¯θi, a m´edia das

observa¸c˜oes da cadeia i; ¯θ, a m´edia global. Ent˜ao as variˆancias entre cadeias ˆB e dentro das cadeias ˆW s˜ao dadas por

ˆ B = J (I − 1)−1 I X i=1 (¯θi− ¯θ)2 e ˆ W = I(J − 1)−1 I X i=1 J X j=1 (θji − ¯θi)2.

Ap´os a convergˆencia, todos os IJ valores de θ foram amostrados de sua distribui¸c˜ao a posteriori e a variˆancia de θ pode ser estimada por ˆB, ˆW e pela m´edia ponderada ˆ

σ2 = (1 − 1/J ) ˆW + (1/J ) ˆB.

Enquanto as cadeias n˜ao convergem, as trajet´orias dos parˆametros ainda s˜ao influenciadas pelos valores iniciais. At´e que a convergˆencia seja alcan¸cada, σ2 ser´a

superestimada por ˆσ2 e subestimada por ˆW . Seguindo este racioc´ınio, Brooks e Gelman (1998) propuseram uma an´alise gr´afica que objetiva verificar se: as variˆancias ˆσ2 e ˆW

estabilizam-se como fun¸c˜ao de J ; o fator ˆR = ˆσ2/ ˆW se aproxima de 1. Assim, ocorre

(38)

Cap´ıtulo 3

Modelo de regress˜

ao beta univariado

Este cap´ıtulo revisa a regress˜ao beta univariada, destacando os principais aspectos envolvidos na estima¸c˜ao Bayesiana de seus parˆametros.

3.1 Regress˜ao beta univariada

O modelo de regress˜ao linear normal ´e comumente usado em situa¸c˜oes nas quais se deseja analisar o comportamento de uma vari´avel relacionando-a com um conjunto de vari´aveis ditas explicativas. Tal modelo n˜ao ´e apropriado quando a vari´avel resposta est´a restrita ao intervalo (0, 1). Al´em disso, uma resposta que represente uma taxa ou propor¸c˜ao pode apresentar caracter´ısticas de assimetria, o que n˜ao condiz com o comportamento esperado de uma vari´avel com distribui¸c˜ao normal. Para tratar de casos como esses, Ferrari e Cribari-Neto (2004) propuseram um modelo de regress˜ao para situa¸c˜oes nas quais a vari´avel dependente ´e medida continuamente em (0, 1). Assim a vari´avel dependente (y) segue uma distribui¸c˜ao beta de parˆametros a e b, cuja densidade ´e dada por

f (y|a, b) = Γ(a + b) Γ(a)Γ(b)y

a−1

(1 − y)b−1, 0 < y < 1, (3.1) onde a > 0, b > 0 e Γ(·) denota a fun¸c˜ao gama. Os autores utilizam uma parametriza¸c˜ao da fun¸c˜ao de densidade da distribui¸c˜ao beta de forma que esta tenha como parˆametros a m´edia µ e a precis˜ao φ. Na nova parametriza¸c˜ao, a densidade da distribui¸c˜ao beta ´e reescrita como

f (y|µ, φ) = Γ(φ)

Γ(µφ)Γ((1 − µ)φ)y

µφ−1(1 − y)(1−µ)φ−1, 0 < y < 1, (3.2)

onde a = µφ, b = (1 − µ)φ, 0 < µ < 1 e φ > 0. O parˆametro φ est´a relacionado `

a variˆancia da distribui¸c˜ao beta, pois V ar(Y ) = µ(1 − µ)/(1 + φ). Com esta parametriza¸c˜ao, foi poss´ıvel associar uma estrutura de regress˜ao `a m´edia da distribui¸c˜ao beta. Assim, o modelo proposto em Ferrari e Cribari-Neto (2004) ´e dado por

(39)

yi|µi, φ ∼ Beta(µi, φ), i = 1, ..., n (3.3) g(µi) = ηi = p X k=1 xikβk, p < n

onde n ´e o n´umero de observa¸c˜oes, p ´e o n´umero de coeficientes de regress˜ao, g(·) ´e uma fun¸c˜ao estritamente mon´otona e duas vezes diferenci´avel que mapeia o intervalo (0, 1) em IR, βT = (β1, ..., βp) ´e um vetor de coeficientes de regress˜ao e xi1, ..., xip

s˜ao as observa¸c˜oes de p covari´aveis, i = 1, ..., n. Uma vantagem do modelo (3.3) ´e a manuten¸c˜ao da vari´avel na escala original, o que facilita a interpreta¸c˜ao dos parˆametros do modelo.

As escolhas mais comuns de g(µ), 0 < µ < 1, s˜ao

g(µ) =                    log1−µµ log´ıstica

Φ−1(µ) inversa da fun¸c˜ao de distribui¸c˜ao

acumulada da distribui¸c˜ao normal padr˜ao log(− log(1 − µ)) complemento log-log.

No caso particular da fun¸c˜ao log´ıstica, para cada unidade acrescentada `a vari´avel xk,

mantendo-se as demais constantes, tem-se que a raz˜ao de chances ´e dada por exp(βk).

A fun¸c˜ao log´ıstica corresponde a uma escolha comum nas aplica¸c˜oes e ser´a utilizada em todo este trabalho. Kieschnick e McCullough (2003) propuseram a regress˜ao beta mantendo-se o parˆametro a e fazendo b(xi) = a exp(−xiβ), na parametriza¸c˜ao usual

da densidade da distribui¸c˜ao beta dada pela f´ormula (3.1).

Aplica¸c˜oes da regress˜ao beta em diferentes contextos podem ser vistas em Korhonen et al. (2007) e Branscum et al. (2007). O ´ultimo artigo apresenta aplica¸c˜oes da regress˜ao beta em que havia interesse em duas vari´aveis resposta, por´em os ajustes dos modelos foram realizados separadamente. Em Espinheira et al. (2008a) e Espinheira et al. (2008b) encontram-se propostas de medidas de diagn´ostico de influˆencia e de res´ıduos para avalia¸c˜ao dos ajustes de modelos de regress˜ao beta.

Extens˜oes do modelo (3.3) podem ser encontradas, por exemplo, em Smithson e Verkuilen (2006), que prop˜oem a modelagem do parˆametro φ, permitindo que seu valor varie de acordo com as observa¸c˜oes e, para tanto, sup˜oem

h(φi) = wiδ

onde h ´e uma fun¸c˜ao de liga¸c˜ao, δ ´e um vetor de coeficientes e wi ´e um vetor

(40)

estritamente positivo. Huang e Oosterlee (2008) apresentam um modelo de regress˜ao beta generalizado misto no qual inserem um efeito aleat´orio no preditor linear, da seguinte forma

g(µ) = xβ + ν.

Rydlewski (2007) considera a vari´avel resposta, Y , beta distribu´ıda variando no tempo e descreve a dependˆencia temporal como combina¸c˜ao de uma fun¸c˜ao c´ıclica e linear. Assim, E(yi) = µ(ti) = θ(ti) + β0+ p X k=1 αksen 2πk T ti+ βkcos 2πk T ti ! ,

i = 1, ..., n onde θ(·) ´e cont´ınua e diferenci´avel, sendo respons´avel por modelar a tendˆencia e T ´e o per´ıodo. Rydlewski (2007) define estat´ısticas de diagn´ostico de ajuste e res´ıduos para este caso espec´ıfico. Da-Silva et al. (2011) desenvolvem um modelo beta dinˆamico Bayesiano para modelagem de s´eries temporais de taxas e propor¸c˜oes.

O valor y observado no intervalo (c, d) pode ser transformado para o intervalo (0, 1), fazendo-se y0 = (y − c)/(d − c). Com o objetivo de tratar dados que contˆem valores iguais a zero ou um, Smithson e Verkuilen (2006) propuseram transformar o conjunto de dados de tal forma que

y00 = [y0(n − 1) + 1/2]/n (3.4)

onde n ´e o tamanho da amostra.

Cook et al. (2008) e Ospina e Ferrari (2010) prop˜oem modelos de regress˜ao beta para dados inflacionados (ou com pontos de massa) de zeros ou uns. Os artigos citados mostram modifica¸c˜oes do modelo (3.3) e a importˆancia pr´atica de modelar dados no intervalo (0, 1) com distribui¸c˜ao beta.

3.2 Inferˆencia Bayesiana no modelo de regress˜ao beta univariado

Para estimar os parˆametros do modelo (3.3), Ferrari e Cribari-Neto (2004) adotaram uma abordagem frequentista. Neste trabalho, que segue abordagem Bayesiana, a especifica¸c˜ao do modelo ´e conclu´ıda atribuindo-se distribui¸c˜oes a priori, p(β, φ), para β e φ. Para fazer inferˆencia Bayesiana sobre estes parˆametros, suponha que dispomos da informa¸c˜ao de Y1, ..., Yn vari´aveis aleat´orias cujos valores perten¸cam ao intervalo

(0, 1), ou equivalentemente, ao intervalo (c, d), transformando-se as vari´aveis em (Y1 − c/(d − c), ..., Yn − c/(d − c)). Suponha, ainda, que haja a informa¸c˜ao de p

vari´aveis explicativas. Seja β = (β1, ..., βp)T e suponha que g(µi) = logit (µi). Com

(41)

em (3.2), para a i-´esima observa¸c˜ao ´e dada por f (yi|β, φ) = Γ(φ) Γ(µi(β)φ)Γ((1 − µi(β))φ) yµi(β)φ−1 i (1 − yi)[1−µi(β)]φ−1

∝ exp {log Γ(φ) − [log Γ(µi(β)φ) + log Γ((1 − µi(β))φ)] +

+µi(β)φlogit (yi) + φ log(1 − yi)} .

Segue que a fun¸c˜ao de verossimilhan¸ca L(β, φ) para uma amostra de n observa¸c˜oes independentes ´e L(β, φ) = n Y i=1 f (yi|β, φ) = Γ(φ)n n Y i=1 1 Γ(µi(β)φ)Γ((1 − µi(β))φ) yµi(β)φ−1 i (1 − yi)[1−µi(β)]φ−1.

Ent˜ao, considerando uma densidade a priori p(β, φ), tem-se que a densidade a posteriori destes parˆametros ´e tal que

p(β, φ|y) ∝ L(β, φ)p(β, φ) ∝ [Γ(φ)]n n Y i=1 1 Γ(µi(β)φ)Γ((1 − µi(β))φ) yµi(β)φ−1 i (1 − yi)[1−µi(β)]φ−1p(β, φ).

A densidade a priori p(β, φ) pode ser escolhida de v´arias formas. Uma delas considera p(β, φ) = p(β)p(φ), o que equivale a φ e β independentes a priori. Por exemplo, pode-se adotar βk ∼ N (mk, σ2k) e φ ∼ Gama(a, b), pois βk ∈ (−∞, ∞),

k = 1, ..., p e φ > 0, resultando no modelo de regress˜ao beta univariada, dado por yi|µi, φ ∼ Beta(µi(β), φ), i = 1, ..., n g(µi) = ηi = p X k=1 xikβk (3.5) βk ∼ N (mk, σk2) φ ∼ Gama(a, b),

com distribui¸c˜oes a priori independentes para φ e βk, k = 1, ..., p.

Os termos envolvendo Γ(µi(β)φ) e Γ(φ) indicam que a densidade a posteriori de

φ e β n˜ao possui forma fechada. Para gerar amostras dessa distribui¸c˜ao, utilizou-se o m´etodo de Monte Carlo via Cadeias de Markov (MCMC, em inglˆes). O uso das distribui¸c˜oes a priori mencionadas, bem como daquelas citadas mais adiante, leva `

a obten¸c˜ao de distribui¸c˜oes condicionais completas a posteriori para φ e β tamb´em de forma desconhecida. Portanto, um m´etodo de simula¸c˜ao apropriado para gerar amostras da distribui¸c˜ao a posteriori ´e o algoritmo de Metropolis-Hastings. Detalhes sobre o algoritmo podem ser vistos em Gamerman e Lopes (2006).

Referências

Documentos relacionados

Assistência Social, com a atribuição de avaliar a Política de Assistência Social do município de Wenceslau Guimarães, e propor diretrizes para o aperfeiçoamento do

Foi observada durante o desenvolvimento da presente pesquisa a presença de latrinas (figura ?) localizadas a céu aberto e sem nenhum tipo de proteção ao solo, sendo todos os

Por sua vez, para problemas de convecção-difusão com coeficientes constantes, os dois métodos apresentaram resultados muito semelhantes quando utilizados hexaedros com 8 nós para

Pode ser utilizado em varias situações como: processo de solução de problemas; pesquisa social; saúde pública; aprimoramento da qualidade de processos, para fazer

A primeira etapa da prova da existência dos corpos apresenta, então, um argumento que não envolve a tese da realidade objetiva das idéias, em- bora recorra a um princípio análogo

Após intensos dias de pesquisa concluiu-se que as Cortes de Contas, além das funções administrativas de assessoramento ao Poder Legislativo na emissão de Parecer Prévio sobre

476, de 16 de janeiro de 2009, conforme alterada (“Instrução CVM 476” e “Oferta”), em regime de garantia firme de colocação para o Valor Total da Emissão, de forma individual

Os resultados dos parâmetros de estabilidade mini Marshall, resistência máxima à compressão radial, referente aos corpos-de-prova de tatajuba (Figura 3A) e jatobá