• Nenhum resultado encontrado

Modelos de mistura para dados longitudinais de habilidade cognitiva em idosos

N/A
N/A
Protected

Academic year: 2021

Share "Modelos de mistura para dados longitudinais de habilidade cognitiva em idosos"

Copied!
100
0
0

Texto

(1)

Instituto de Matem´

atica, Estat´ıstica

e Computa¸c˜

ao Cient´ıfica

Eric Krishna Peres Barbosa

Modelos de mistura para dados longitudinais de habilidade

cognitiva em idosos

CAMPINAS 2018

(2)

Modelos de mistura para dados longitudinais de habilidade

cognitiva em idosos

Disserta¸c˜ao apresentada ao Instituto de Ma-tem´atica, Estat´ıstica e Computa¸c˜ao Cient´ıfica da Universidade Estadual de Campinas como parte dos requisitos exigidos para a obten¸c˜ao do t´ıtulo de Mestre em estat´ıstica.

Orientadora: Hildete Prisco Pinheiro

Este exemplar corresponde `a vers˜ao final da

dissertac¸˜ao defendida pelo aluno Eric Krishna

Peres Barbosa, e orientada pela Profa. Dra. Hil-dete Prisco Pinheiro.

Assinatura da Orientadora

Campinas 2018

(3)

Ficha catalográfica

Universidade Estadual de Campinas

Biblioteca do Instituto de Matemática, Estatística e Computação Científica Ana Regina Machado - CRB 8/5467

Barbosa, Eric Krishna Peres,

B234m BarModelos de mistura para dados longitudinais de habilidade cognitiva em idosos / Eric Krishna Peres Barbosa. – Campinas, SP : [s.n.], 2018.

BarOrientador: Hildete Prisco Pinheiro.

BarDissertação (mestrado) – Universidade Estadual de Campinas, Instituto de Matemática, Estatística e Computação Científica.

Bar1. Misturas finitas. 2. Problemas de ponto de mudança. 3. Análise de regressão. 4. Distribuição binomial. 5. Cognição. I. Pinheiro, Hildete Prisco, 1966-. II. Universidade Estadual de Campinas. Instituto de Matemática, Estatística e Computação Científica. III. Título.

Informações para Biblioteca Digital

Título em outro idioma: Longitudinal mixture models for the analysis of elderly people's

cognition Palavras-chave em inglês: Finite mixtures Change-point problems Regression analysis Binomial distribution Cognition

Área de concentração: Estatística Titulação: Mestre em Estatística Banca examinadora:

Hildete Prisco Pinheiro [Orientador] Mariana Rodrigues Motta

Clarice Garcia Borges Demétrio

Data de defesa: 23-03-2018

Programa de Pós-Graduação: Estatística

(4)

pela banca examinadora composta pelos Profs. Drs.

Prof(a). Dr(a). HILDETE PRISCO PINHEIRO

Prof(a). Dr(a). MARIANA RODRIGUES MOTTA

Prof(a). Dr(a). CLARICE GARCIA BORGES DEMÉTRIO

(5)

Agrade¸co `as ag^encias CAPES e CNPq pelo apoio financeiro e `a ag^encia FAPESP por ter usufruido do projeto tem´atico 2013/09357-9.

Ao IMECC pela infraestrutura que me ofereceu durante estes anos. Em particular, ao Celso e Quintino da inform´atica, aos professores Alberto Saa e Benilton S´a pelo suporte dado.

`

As professoras Clarice Garcia Borges Dem´etrio e Mariana Rodrigues Motta, por terem participado da banca examinadora e contribu´ıdo com importantes levantamentos acerca do meu trabalho.

`

As professoras Tatiana Andrea Benaglia e Graciela Muniz-Terrera pela oportunidade de trabalho, orienta¸c˜ao e companheirismo. Aos professores Hildete Prisco Pinheiro, Luiz Koodi Hotta, Nancy Lopes Garcia e Victor Hugo Lachos D´avila, pessoas que admiro e fizeram enorme contribui¸c˜ao para minha forma¸c˜ao como estat´ıstico. Em especial, ainda `a professora Hildete pelo “apadrinhamento”, orienta¸c˜ao e ajuda imprescind´ıvel pra resolver os problemas inerentes ao projeto de mestrado.

Aos meus amigos, aos que me ajudaram e `aqueles os quais tive a oportunidade de ajudar.

Obrigado rep´ublica XIII de Ja´u. `A todos que tive o prazer de conviver neste lugar e `as incont´aveis reflex˜oes feitas nos finais de tarde vistos da minha querida varanda.

Por ´ultimo e mais importante, aos meus pais e fam´ılia. Pelo exemplo das suas trajet´orias, pelo respeito e apoio incondicionais aos meus planos.

(6)

Se eu n˜ao sei tudo que sou Ent˜ao eu n˜ao sou tudo que sei? Tudo que penso que sei? Sou humano ou sou um mosquito? Sou parte do universo, sou parte do infinito Sou humano ou sou um produto? Produto do que querem que eu seja Produto do que me ´e permitido ser

Ser´a que sou tudo que sou? Ser´a que sei tudo que sei? N˜ao, n˜ao sou nada disso Ou ser´a que sou tudo isso? [...]

Pois essa busca parece incessante Hist´oria sem fim, inferno de Dante [...]”

Pedro Augusto de Almeida Rosa, amigo e poeta.

(7)

Neste trabalho, prop˜oe-se um modelo de mistura de regress˜oes para lidar com dados de habilidade cognitiva em idosos at´e seu falecimento. A cogni¸c˜ao ´e mensurada longitudinalmente por question´arios padr˜ao em geriatria, com perguntas que avaliam a mem´oria, linguagem, racioc´ınio l´ogico, dentre outros, e comp˜oem um escore enumer´avel e finito dos acertos. Diferente de grande parte da literatura na ´area, em que aplicam modelos lineares mistos cl´assicos com ou sem transforma¸c˜oes logar´ıtmicas, s˜ao ajustados modelos para vari´aveis resposta Binomial e Beta-Binomial. A especifica¸c˜ao de mistura de regress˜oes ´e feita para discriminar dois comportamentos prevalentes encontrados nos dados: um grupo de idosos apresenta decl´ınio cognitivo `a taxa constante no tempo; enquanto outro grupo passa, a partir de um momento, a ter um decl´ınio acelerado. Para o ´ultimo comportamento, preditores n˜ao lineares com pontos de quebra aleat´orios s˜ao propostos. Um estudo de simula¸c˜ao ´e conduzido para avaliar a qualidade da estima¸c˜ao Bayesiana dos efeitos fixos e aleat´orios sob diferentes configura¸c˜oes amostrais e emp´ıricas do modelo proposto: quantidade de observa¸c˜oes longitudinais, propor¸c˜ao de indiv´ıduos em cada componente da mistura e abruptude da acelera¸c˜ao do decl´ınio. Na pr´atica, o intuito ´e estudar e quantificar associa¸c˜oes entre a perda da capacidade cognitiva e o diagn´ostico de dem^encias como a doen¸ca de Alzheimer, al´em de fatores sociodemogr´aficos. Por fim, uma aplica¸c˜ao dos modelos descritos ´e feita ao banco de dados produzido pelo Rush Memory and Aging Project da Universidade Rush – Chicago, Estados Unidos, entre os anos de 1997 e 2016.

Palavras-chave: modelos de mistura, modelos longitudinais, modelos de efeitos mistos, pontos de quebra aleat´orios, habilidade cognitiva em idosos, distribui¸c˜ao beta-binomial, distribui¸c˜ao binomial.

(8)

A regression mixture model to handle elderly’s cognitive ability up to their death is presen-ted. Cognition is measured across time with standard questionnaires from geriatrics which involve, amongst others, memory, language and reasoning issues. The output of such questionnaires is recor-ded with a countable and finite score. Many authors in the literature apply classical linear mixed models for the raw scores or use some logarithmic transformation. Differently, models for Binomial and Beta-Binomial response variables are discussed here. The mixture specification rises to discri-minate two prevalent behaviors in the data: one group of elderly people presents cognition decline at constant rate; whilst the other experiences a spontaneous accelerated decline at some time. The latter aspect is dealt with random change points nonlinear predictors. To assess the Bayesian esti-mation performance of fixed and random effects, a simulation study is conducted under the following sampling and empirical different aspects: number of repeated measures across time, individuals pro-portion in each mixture component and the decline’s acceleration abruptness. Finally, the study’s goal is to quantify associations amidst cognition loss and the diagnostics of dementias like Alzhei-mer’s disease, besides sociodemographic factors. The proposed model is evaluated in the database provided by the Rush University – Chicago, United States, through the Rush Memory and Aging Project from 1997 to 2016.

Keywords: mixture models, longitudinal models, mixed effects models, random change points, elderly people cognition, beta-binomial distribution, binomial distribution.

(9)

2.1 Fun¸c˜oes de probabilidade da vari´avel aleat´oria 𝑌 ∼ Beta-Binomial(10, 𝜑𝜇, 𝜑(1 − 𝜇)) para diferentes valores de 𝜇 e 𝜑. . . 20 2.2 Limite inferior do espa¸co param´etrico da correla¸c˜ao intraclasse 𝜌 = (𝜑+1)−1, de acordo

com diferentes valores de 𝜇 = 𝛼1/(𝛼1 + 𝛼2) e quantidade de ensaios 𝑛. . . 21

2.3 Preditor Broken-Stick com 𝛽2 ∈ (−7, −1). Al´em disso, 𝜏 = 5, 𝛽0 = 40 e 𝛽1 = 0, 5. . . . 23

2.4 Preditor em (2.2.2) com 𝐾1 = 1 e 𝐾2 = 2. Em todos os casos, 𝜏 = 5, 𝛽0 = 40 e

𝛽1 = 0, 5. Al´em disso, todos os grids de 𝛽2ou 𝛽3possuem 14 valores. Especificamente,

(a)𝛽3 = −0, 8 e 𝛽2 ∈ (−7, −1); (b)𝛽2 = −4 e 𝛽3 ∈ (−4; −0, 05); (c)𝛽2 ∈ (−7, −1),

enquanto 𝛽3 ∈ (−4; −0, 05). . . 23

4.1 Exemplo de dados fict´ıcios gerados pela estrutura (4.1.3). Em todos os casos, a pro-por¸c˜ao de indiv´ıduos em cada grupo foi gerada com 𝜆 = (0, 0)′ na express˜ao (4.1.2) e os efeitos do preditor (4.1.1) iguais a 𝛽 = (1, 5; −0, 2; 𝛽3; −1)′. Na primeira linha,

𝛽3 = −2, 5; na linha central, 𝛽3 = −1, 5; e na ´ultima linha, 𝛽3 = −0, 5. . . 54

4.2 Gr´aficos dos erros quadr´aticos m´edios (4.2.1), estratificados pelas caracter´ısticas de in-teresse: magnitude do efeito ap´os o ponto de quebra (𝛽3 ∈ {−2, 5; −1, 5; −0, 5}),

pro-por¸c˜ao de indiv´ıduos no grupo de mistura com decaimento acelerado (𝐺2 ∈ {Pequeno,

M´edio, Grande} ≈ {14%, 50%, 92%}) e quantidade de medidas repetidas ao longo do tempo simulado (𝐽 ∈ {5, 10}). . . 59 4.3 Gr´aficos das probabilidades de cobertura (4.2.2) com 95% de confian¸ca,

estratifica-dos pelas caracter´ısticas de interesse: magnitude do efeito ap´os o ponto de quebra (𝛽3 ∈ {−2, 5; −1, 5; −0, 5}), propor¸c˜ao de indiv´ıduos no grupo de mistura com

decai-mento acelerado (𝐺2 ∈ {Pequeno, M´edio, Grande} ≈ {14%, 50%, 92%}) e quantidade

de medidas repetidas ao longo do tempo simulado (𝐽 ∈ {5, 10}). . . 60 4.4 Gr´aficos de dispers˜ao entre a Taxa de Verdadeiros Positivos (4.2.3) vs Taxa de

Fal-sos Positivos (4.2.4), estratificados pelas caracter´ısticas de interesse: magnitude do efeito ap´os o ponto de quebra (𝛽3 ∈ {−2, 5; −1, 5; −0, 5}), propor¸c˜ao de indiv´ıduos

no grupo de mistura com decaimento acelerado (𝐺2 ∈ {Pequeno, M´edio, Grande} ≈

{14%, 50%, 92%}) e quantidade de medidas repetidas ao longo do tempo simulado (𝐽 ∈ {5, 10}). Adicionalmente, apresenta-se a Acur´acia M´edia - ACM (4.2.6) para cada configura¸c˜ao. . . 61

(10)

4.6 Hist´orico das cadeias a posteriori para simula¸c˜ao do modelo Beta-Binomial com 𝐽 = 5, 𝐺2 m´edio e 𝛽3 = −1, 5. . . 63

5.1 Box-plots dos escores mmse dos invid´ıduos do estudo RUSH, estratificados para cada tempo at´e a morte, de 19 a 0 anos at´e o falecimento. . . 68 5.2 Frequ^encias de indiv´ıduos para cada quantidade de acompanhamentos feitos. Na

pa-leta de cores, a idade de entrada dos indiv´ıduos no estudo. . . 69 5.3 Gr´afico longitudinal dos escores individuais ao longo do tempo at´e a morte. A

estra-tifica¸c˜ao ´e feita com base nas vari´aveis indicadoras AD - pelo menos um diagn´ostico da doen¸ca de Alzheimer e MCI - pelo menos um diagn´ostico de dano cognitivo moderado. 70 5.4 Mapa de calor dos escores individuais ao longo do tempo at´e a morte. A estratifica¸c˜ao

´e feita com base nas vari´aveis indicadoras AD - pelo menos um diagn´ostico da doen¸ca de Alzheimer e MCI - pelo menos um diagn´ostico de dano cognitivo moderado. Truncou-se a disposi¸c˜ao do gr´afico para 𝑡 ∈ {−10, . . . , 0} para melhor visualiza¸c˜ao, visto que entre 𝑡 ∈ {−19, . . . , −11} os escores s˜ao majoritariamente altos (vide 5.1). . . 71 5.5 Mapa de calor dos escores individuais ao longo do tempo at´e a morte. A estratifica¸c˜ao

´e feita com base na vari´avel indicadora de educa¸c˜ao superior EDUC: B´asica caso ≤ 12 anos de estudo ou Superior, caso contr´ario. Truncou-se a disposi¸c˜ao do gr´afico para 𝑡 ∈ {−10, . . . , 0} para melhor visualiza¸c˜ao, visto que entre 𝑡 ∈ {−19, . . . , −11} os escores s˜ao majoritariamente altos (vide 5.1). . . 71 5.6 Medianas e intervalos de credibilidade 95% para cadeias finais do modelo com

dis-tribui¸c˜ao Binomial, preditores dados por (5.3.2) e (5.3.3). Em (a), tem-se a es-pecifica¸c˜ao com ℳlogito : ℎ(𝑥) = log(𝑥/(1 − 𝑥)), enquanto em (b) ℳcloglog : ℎ(𝑥) = log(−log(1 − 𝑥)). . . 74 5.7 Gr´aficos de res´ıduos quant´ılicos aleatorizados para o modelo ℳ𝑏𝑖𝑛. No gr´afico (a),

calculam-se 30 conjuntos de res´ıduos. A curva ´e uma refer^encia para o caso ideal. Nos gr´aficos (b)-(d), por outro lado, apenas um conjunto ´e utilizado para avaliar, respectivamente, a rela¸c˜ao com os valores ajustados ^𝑦𝑖𝑗, tempo at´e a morte e covari´avel

que d´a o efeito ap´os os pontos de quebra estimados: [𝑡𝑖𝑗− ^𝜏𝑖]+ = max(0, 𝑡𝑖𝑗− ^𝜏𝑖). Nestes,

as curvas s˜ao suaviza¸c˜oes dos dados via modelos aditivos genealizados (GAM). . . 76 5.8 Hist´orico de cadeias a posteriori do par^ametro 𝜑 da distribui¸c˜ao Beta-Binomial como

resultado de ajuste do modelo ℳ𝑏𝑏. `A esquerda, ajuste com burn-in de 1,1 milh˜ao de

(11)

´e uma refer^encia para o caso ideal. Nos gr´aficos (b) e (c), por outro lado, apenas um conjunto ´e utilizado para avaliar, respectivamente, a rela¸c˜ao com os valores ajustados ^

𝑦𝑖𝑗 e tempo at´e a morte. Nestes, as curvas s˜ao suaviza¸c˜oes dos dados via modelos

aditivos generalizados (GAM). . . 78 5.10 Gr´afico longitudinal dos escores individuais observados e ajustados ao longo do tempo

at´e a morte. A estratifica¸c˜ao ´e feita com base nas vari´aveis indicadoras AD - pelo menos um diagn´ostico da doen¸ca de Alzheimer e MCI - pelo menos um diagn´ostico de dano cognitivo moderado. Linhas tracejadas no modelo com mistura indicam indiv´ıduos classificados no grupo com decaimento acelerado (𝐺2). . . 79

5.11 Histograma dos pontos de quebra estimados para o grupo com decaimento acelerado (𝐺2), segundo modelo final ℳ𝑏𝑖𝑛. . . 81

5.12 Histograma das idades estimadas em que os pontos de quebra aconteceram para o grupo com decaimento acelerado (𝐺2), segundo modelo final ℳ𝑏𝑖𝑛. . . 81

C.1 Box-plots da vari´avel resposta escore mmse de acordo com as covari´aveis categ´oricas. Segundo legenda da Tabela 5.1, (a) - ad; (b) - mci; (c) - educ; (d) - sexo; (e) - etnia. 96 C.2 Diagonal principal: densidades suavizadas dos escores mmse para tempos at´e a morte

diferentes, 𝑡 ∈ {−19, . . . , −10}. Gr´aficos da parte triangular inferior: dispers˜ao entre escores para tempos cruzados. Informa¸c˜oes da parte triangular superior: correla¸c˜oes entre escores para tempos cruzados. . . 97 C.3 Diagonal principal: densidades suavizadas dos escores mmse para tempos at´e a morte

diferentes, 𝑡 ∈ {−9, . . . , −0}. Gr´aficos da parte triangular inferior: dispers˜ao entre escores para tempos cruzados. Informa¸c˜oes da parte triangular superior: correla¸c˜oes entre escores para tempos cruzados. . . 98 C.4 Nas primeiras 4 linhas de gr´aficos, densidades a posteriori e nas ´ultimas 4 linhas,

(12)

2.1 Fun¸c˜oes de liga¸c˜ao comuns para regress˜ao com dados bin´arios. . . 26

3.1 Fun¸c˜oes de perdas usuais e os respectivos estimadores Bayesianos encontrados pela minimiza¸c˜ao em (3.1.1). . . 31 3.2 Fun¸c˜oes de discrep^ancia comuns para avaliar reproducibilidade dos dados originais sob

modelos Bayesianos. . . 40

5.1 Vari´aveis retiradas e/ou modificadas do banco de dados Rush Memory and Ageing Project. . . 67 5.2 Tempo de ajuste, medidas de diagn´ostico (valores-p Bayesianos amostrados 𝑠𝑝𝑏(𝑦)) e

compara¸c˜ao de modelos (DIC7 e LMPL) para modelos com distribui¸c˜ao Binomial dos

escores mmse condicionais, preditores dados por (5.3.2) e (5.3.3). Valores em negrito por coluna indicam melhores indicadores. Para os valores-p Bayesianos amostrados em (3.1.11), tomou-se a moda das cadeias finais como quantidades 𝜃𝑓 𝑖𝑥𝑜. . . . . 74

5.3 Tempo de ajuste, n´umero de itera¸c˜oes (burn-in + rodadas finais), medidas de di-agn´ostico (valores-p Bayesianos anostrados 𝑠𝑝𝑏(𝑦)) e compara¸c˜ao de modelos (DIC7 e

LMPL) para modelo com distribui¸c˜ao Binomial dos escores mmse condicionais e predi-tor dado por (5.3.5). Para os valores-p Bayesianos amostrados em (3.1.11), tomou-se a moda das cadeias finais como quantidades 𝜃𝑓 𝑖𝑥𝑜. . . . 76

5.4 Estat´ıstica ^R, mediana, bandas inferior (Inf) e superior (Sup) de credibilidade 95% para cadeias finais do modelo com distribui¸c˜ao Binomial, preditores dados por (5.3.5) e (5.3.3). . . 80

C.1 Mediana, bandas inferior (Inf) e superior (Sup) de credibilidade 95% para cadeias finais do modelo com distribui¸c˜ao Binomial, preditores dados por (5.3.2) e (5.3.3). Os ajustes s˜ao feitos com ℳlogito : ℎ(𝑥) = log(𝑥/(1 − 𝑥)), enquanto ℳcloglog : ℎ(𝑥) = log(−log(1 − 𝑥)). . . 99

(13)

Lista de Figuras ix

Lista de Tabelas xii

1 Introdu¸c˜ao 15

1.1 Nota¸c˜ao utilizada . . . 17

1.2 Organiza¸c˜ao do trabalho . . . 17

2 Modelo de Mistura de Regress˜oes Com Componente de Decl´ınio Acelerado 18 2.1 Vari´aveis aleat´orias de ensaios com respostas dicot^omicas . . . 18

2.2 Preditores para dados longitudinais com ponto de quebra . . . 21

2.3 O modelo de mistura de regress˜oes com componente de decl´ınio acelerado . . . 24

2.3.1 Verossimilhan¸ca para o modelo proposto . . . 26

3 M´etodo de Estima¸c˜ao 29 3.1 Infer^encia Bayesiana . . . 30

3.1.1 Algoritmos de simula¸c˜ao . . . 32

3.1.2 Softwares para infer^encia Bayesiana . . . 38

3.1.3 Diagn´ostico dos modelos . . . 39

3.1.4 Compara¸c˜ao dos modelos . . . 41

3.2 Estima¸c˜ao Bayesiana para o modelo proposto de mistura de regress˜oes . . . 43

3.2.1 Amostrador de Gibbs para o caso Beta-Binomial . . . 44

3.2.2 Amostrador de Gibbs para o caso Binomial . . . 47

4 Estudo de Simula¸c˜ao 52 4.1 Configura¸c˜oes de par^ametros e exemplos de dados simulados . . . 53

4.2 Medidas para avalia¸c˜ao das cadeias geradas e suas estimativas . . . 54

4.3 Resultados das simula¸c˜oes . . . 56

4.4 Considera¸c˜oes sobre o caso Beta-Binomial . . . 61

5 Aplica¸c˜ao do Modelo em Dados Reais 64 5.1 Rush Memory and Aging Project . . . 65

(14)

6 Considera¸c˜oes Finais 83

Bibliografia 85

A Exemplo question´ario MMSE 92

B Algoritmos de simula¸c˜ao 93

C Rush Memory and Aging Project 96

C.1 Gr´aficos an´alise descritiva . . . 96 C.2 Material suplementar dos ajustes . . . 99

(15)

Cap´ıtulo 1

Introdu¸

ao

A tend^encia de crescimento da expectativa de vida mundial ´e evidenciada desde meados da d´ecada de 1840, de acordo com Oeppen and Vaupel (2002). Com isso, estudos relacionados aos idosos t^em sido uma ´area de grande interesse em medicina quantitativa e bioestat´ıstica nos ´ultimos anos. Capacidade motora e aspectos neurol´ogicos do envelhecimento s˜ao caracter´ısticas que podem estar associadas a doen¸cas cognitivas comuns da idade avan¸cada (como a dem^encia e, em particular, a doen¸ca de Alzheimer). Alguns estudos se baseiam no acompanhamento prospectivo de coortes, tais como o OCTO - Twin (Origins of Variance in the Old-old: Octagenarian Twins) McClearn

et al.(1997), pelo Departamento de Epidemiologia M´edica e Bioestat´ıstica do Karolinska Institutet ;

o Bronx aging study Katzman et al. (1989) e o Honolulu Asia Aging Study, Launer et al. (1995). Para medir a capacidade neurol´ogica dos participantes, s˜ao aplicados periodicamente question´arios padr˜ao de habilidade cognitiva e mem´oria, por exemplo, o Mini Mental Status Examination (MMSE)

Cockrell and Folstein (2002), o Selective Reminding Test Hannay and Levin (1985) e o Cognitive

Abilities Screening Instrument Teng et al. (1994). Estes s˜ao formulados por quest˜oes relacionadas `a pron´uncia, dom´ınio de linguagem, mem´oria, l´ogica e at´e a habilidades motoras. Apresenta-se como resultado um escore ordinal de acertos cuja amplitude varia de teste para teste.

An´alises de dados longitudinais relacionados `a habilidade cognitiva (como Hall et al. (2007)

e van den Hout et al. (2013)) evidenciam dois tipos prevalentes de comportamento dos idosos,

separando-os essencialmente em dois grupos. Um deles apresenta trajet´oria dos escores com perda da capacidade neurol´ogica a uma taxa que pode ser considerada constante com o passar dos anos; enquanto no outro grupo, a partir de um determinado momento aleat´orio (que pode, inclusive, ser diferente entre indiv´ıduos), o escore de habilidade cognitiva passa a decair mais rapidamente at´e a morte ou censura. Essa caracter´ıstica ´e referenciada na literatura como ponto de quebra ou ponto de mudan¸ca. Ela aparece em outros tipos de dados, como em s´eries temporais com quebras estruturais

-Bauwens and Rombouts (2012) - e em modelos log´ısticos para epidemiologia - Muggeo (2003), por

exemplo.

(16)

s˜ao introduzidos em Hall et al. (2000), em que prop˜oem modelos lineares de efeitos mistos com o par^ametro ponto de quebra comum a todos os indiv´ıduos. Artigos posteriores utilizam t´ecnicas completa ou parcialmente Bayesianas com o objetivo de estimar pontos de quebra como efeitos aleat´orios dos indiv´ıduos. Alguns exemplos destes est˜ao emDominicus et al.(2008) com o amostrador de Gibbs (Casella and George(1992)) ou emvan den Hout et al. (2013), com uma estima¸c˜ao cl´assica seguida da t´ecnica de m´aximo a posteriori MAP (DeGroot(2005)) para o vetor de pontos de quebra. Ainda assim, dado que n˜ao se pode falar que todos os participantes apresentam o ponto de mudan¸ca, modelos com tal suposi¸c˜ao podem sub ou superestimar esta caracter´ıstica. Al´em disso, n˜ao h´a garantia de que os efeitos estimados das vari´aveis explicativas representem adequadamente o conjunto de dados.

Uma recorr^encia notada na literatura ´e a utiliza¸c˜ao de modelos de efeitos mistos com a distribui¸c˜ao gaussiana para as perturba¸c˜oes aleat´orias. Dessa maneira, alguns autores Hall et al. (2001), Yu and

Ghosh (2010) prop˜oem especifica¸c˜oes para transforma¸c˜oes logar´ıtmicas dos escores, como tentativa

de eliminar a assimetria emp´ırica do desempenho dos participantes. Com tal conduta, os autores tamb´em evitam lidar com modelos para vari´aveis respostas discretas, o que pode enfraquecer a qualidade do ajuste e/ou previs˜ao.

Outros aspectos que t^em sido estudados para obten¸c˜ao de modelos mais fidedignos e informativos s˜ao: (i) a inclus˜ao dos pontos de quebra com transi¸c˜oes suaves, como propostos emBacon and Watts

(1971),Tishler and Zang(1981),van den Hout et al.(2011); (ii) tratar o problema como um modelo

de mistura, no qual especifica¸c˜oes de regress˜ao para grupos subjacentes de indiv´ıduos s˜ao feitas

-veja McLachlan and Peel (2004), Benaglia et al. (2009). Neste caso, a distin¸c˜ao entre os grupos ´e a

presen¸ca ou n˜ao do ponto de quebra. An´alises que englobam os quesitos (i) e (ii) encontram-se em

Yu and Ghosh (2010), van den Hout et al. (2013).

O objetivo deste trabalho ´e propor um modelo de mistura para discriminar entre o grupo de idosos que possuem decaimento da cogni¸c˜ao `a taxa constante e o grupo que apresenta um ponto de quebra ao longo da trajet´oria. A formula¸c˜ao ´e feita supondo que a vari´avel resposta tem distribui¸c˜ao condicional Binomial ou Beta-Binomial. Ambas as escolhas levam a uma distribui¸c˜ao marginal dos escores mais vers´atil do que a Binomial. Al´em disso, essas escolhas n˜ao negligenciam a natureza dos escores, diferentemente de grande parte da literatura no assunto, como Hall et al. (2001),

Jacqmin-Gadda et al. (2006), Yu and Ghosh (2010). Alguns aspectos t´ecnicos como situa¸c˜oes em que vale a

pena tal postula¸c˜ao e custo versus benef´ıcio computacional ser˜ao avaliados por meio de simula¸c˜oes.

Assim, um estudo de simula¸c˜ao ´e conduzido para avaliar a qualidade da estima¸c˜ao Bayesiana dos efeitos fixos e aleat´orios sob diferentes configura¸c˜oes amostrais e emp´ıricas do modelo proposto: quantidade de observa¸c˜oes longitudinais, propor¸c˜ao de indiv´ıduos em cada componente da mistura e abruptude da acelera¸c˜ao do decl´ınio.

De uma maneira geral, pesquisadores desta ´area buscam rela¸c˜oes entre o ponto de quebra e o surgimento de algum tipo de dem^encia, como a doen¸ca de Alzheimer. H´a tamb´em interesse em

(17)

verificar o efeito no ponto de quebra de covari´aveis como sexo e n´ıvel de instru¸c˜ao do participante

Hall et al. (2007), bem como fatores que atrasem o decl´ınio cognitivo acelerado, como a pr´atica de

esportes. Em primeira inst^ancia, ´e de interesse saber o que pode estar associado `a presen¸ca de tal caracter´ıstica, isto ´e, ser classificado no grupo com mudan¸ca no decaimento da cogni¸c˜ao. Em seguida, caso perten¸ca a este grupo, saber que covari´aveis podem melhorar o ajuste e/ou previs˜ao da mudan¸ca na acelera¸c˜ao da taxa de decaimento.

Uma aplica¸c˜ao do modelo proposto ser´a feita usando o banco de dados gerado pelo Rush Memory and Aging Project, disponibilizado pelo Centro M´edico da Universidade RUSH,Bennett et al.(2005a). Este conjunto cont´em informa¸c˜oes longitudinais de uma coorte da regi˜ao metropolitana de Chicago, nos Estados Unidos, de Setembro/1997 at´e Abril/2005. Al´em da habilidade cognitiva medida uti-lizando o Mini Mental Status Examination (MMSE), coletaram-se vari´aveis dos indiv´ıduos como g^enero, etnia, anos de educa¸c˜ao, bem como diagn´osticos cl´ınicos da presen¸ca ou n˜ao de dem^encias.

1.1

Nota¸

ao utilizada

Fun¸c˜oes de probabilidade ou fun¸c˜oes densidade ser˜ao representadas por 𝑓 ou 𝜋. Par^ametros conhecidos e fixos ser˜ao, por simplicidade, suprimidos da escrita em 𝑓 . Assim, uma vari´avel aleat´oria pode ser definida pelo seu nome, como em 𝑋 ∼ Normal(𝜇, 𝜎2), por 𝑋 ∼ 𝑓 (𝑥; 𝛼) = 𝑓 (𝑥) ou 𝑋 ∼ 𝜋(𝑥).

Distribui¸c˜oes condicionais ser˜ao representadas por 𝑋|𝑌 ∼ 𝑓 (𝑥|𝑦) ou 𝑋|𝑌 ∼ 𝜋(𝑥|𝑦). Densidades de vari´aveis truncadas no conjunto A por 𝑋 ∼ 𝑓 (𝑥)1{𝑥 ∈ A}, em que 1{𝑥 ∈ 𝐴} = 1, se 𝑥 ∈ A, e 1{𝑥 ∈ 𝐴} = 0, caso contr´ario.

A nota¸c˜ao 𝑋 −→ 𝑌 indica converg^encia quase certa da vari´𝑞.𝑐. avel aleat´oria 𝑋 para a vari´avel 𝑌 , que pode tamb´em ser degenerada. 𝑎𝑝𝑟∼ indica distribui¸c˜ao aproximada,𝑖𝑛𝑑∼ e 𝑖𝑛𝑑= indicam, respectivamente, com distribui¸c˜oes independentes e por independ^encia. Por ´ultimo, 𝑖𝑖𝑑∼ representa vari´aveis aleat´orias independentes e identicamente distribu´ıdas.

1.2

Organiza¸

ao do trabalho

No pr´oximo cap´ıtulo, discutem-se algumas caracter´ısticas t´ecnicas para constru¸c˜ao do modelo, e a apresenta¸c˜ao deste na Se¸c˜ao 2.3. Em seguida, apresentam-se a metodologia de estima¸c˜ao e os algoritmos necess´arios para tal no Cap´ıtulo 3. Os estudos de simula¸c˜ao e an´alise do banco de dados encontram-se, respectivamente, nos cap´ıtulos 4 e 5. Finalmente, uma discuss˜ao sobre os resultados das metodologias ´e feita no Cap´ıtulo 6.

(18)

Cap´ıtulo 2

Modelo de Mistura de Regress˜

oes Com

Componente de Decl´ınio Acelerado

A natureza dos escores que medem a habilidade cognitiva ´e discreta e com suporte finito. ´E adequado, portanto, que esses sejam modelados por meio de vari´aveis aleat´orias que contam a quan-tidade de sucessos dentre um n´umero de ensaios. Sob esta perspectiva, dentro de um question´ario padr˜ao de mensura¸c˜ao cognitiva em idosos (conjunto de perguntas que medem mem´oria, racioc´ınio l´ogito, linguagem etc), cada pergunta representa um ensaio e cada resposta correta um sucesso.

As vari´aveis aleat´orias Binomial e Beta-Binomial s˜ao utilizadas como postula¸c˜oes `as quantidades de sucessos (ou fracassos) em um conjunto de ensaios Feller (1968). Para modelar o n´umero de acertos dos question´arios padr˜ao aqui tratados, entretanto, a suposi¸c˜ao de ensaios independentes (que ´e amplamente empregada) pode n˜ao ser adequada. Isto se d´a porque as perguntas aplicadas compartilham caracter´ısticas e ´areas de enfoque, tais como mem´oria e linguagem. Por exemplo, o Mini Mental Status Examination (MMSE) Cockrell and Folstein (2002) ´e composto por quatro quest˜oes que avaliam pron´uncia/linguagem, duas que demandam reflexos motores, entre outros, vide exemplo no Ap^endice A. Logo, se indiv´ıduos t^em dificuldade em algum construto do question´ario, ´e esperado que as respostas para perguntas relacionadas tamb´em o sejam. Ainda assim, neste trabalho, n˜ao se explorar˜ao alternativas a essa quest˜ao.

2.1

Vari´

aveis aleat´

orias de ensaios com respostas dicot^

omicas

Defini¸c˜ao 2.1.1. Uma vari´avel aleat´oria 𝑌 ∈ {0, . . . , 𝑛} tem distribui¸c˜ao 𝑌 ∼ Binomial(𝑛, 𝑝), 𝑛 ∈ N sendo a quantidade de ensaios independentes com probabilidade de sucesso 𝑝 ∈ (0, 1), se sua fun¸c˜ao de probabilidade for da forma

𝑓 (𝑦) =(︂𝑛 𝑦

)︂

(19)

Tendo em vista que 𝑌 ∼ Binomial(𝑛, 𝑝) ⇔ 𝑌 = ∑︀𝑛 𝑖=1𝑋𝑖, 𝑋𝑖 𝑖𝑖𝑑 ∼ Bernoulli(𝑝), as caracter´ısticas de 𝑌 s˜ao obtidas por: E[𝑌 ] = E[︁ 𝑛 ∑︁ 𝑖=1 𝑋𝑖 ]︁ = 𝑛 ∑︁ 𝑖=1 E[𝑋𝑖] = 𝑛𝑝, (2.1.2) Var[𝑌 ] = Var[︁ 𝑛 ∑︁ 𝑖=1 𝑋𝑖 ]︁ = 𝑛 ∑︁ 𝑖=1 Var[𝑋𝑖] = 𝑛𝑝(1 − 𝑝). (2.1.3)

Defini¸c˜ao 2.1.2. Sejam 𝑌 e 𝑝 vari´aveis aleat´orias tais que 𝑌 ∈ {0, ..., 𝑛}, 𝑛 ∈ N fixo e conhecido, e 𝑝 ∈ (0, 1). Considere 𝑌 |𝑝 ∼ Binomial(𝑛, 𝑝) e 𝑝 ∼ Beta(𝛼1, 𝛼2), em que 𝛼1, 𝛼2 > 0 s˜ao par^ametros fixos

e desconhecidos. Com esta estrutura, 𝑌 tem distribui¸c˜ao marginal 𝑌 ∼ Beta-Binomial(𝑛, 𝛼1, 𝛼2),

com fun¸c˜ao densidade dada por:

𝑓 (𝑦) = ∫︁ 1 0 𝑓 (𝑦|𝑝)𝑓 (𝑝) d𝑝 = ∫︁ 1 0 (︂𝑛 𝑦 )︂ 𝑝𝑦(1 − 𝑝)𝑛−𝑦 1 B(𝛼1, 𝛼2) 𝑝𝛼1−1(1 − 𝑝)𝛼2−1d𝑝 =(︂𝑛 𝑦 )︂ 1 B(𝛼1, 𝛼2) ∫︁ 1 0 𝑝𝑦+𝛼1−1(1 − 𝑝)𝑛−𝑦+𝛼2−1d𝑝 =(︂𝑛 𝑦 )︂ B(𝑦 + 𝛼1, 𝑛 − 𝑦 + 𝛼2) B(𝛼1, 𝛼2) , 𝑦 ∈ {0, . . . , 𝑛}, (2.1.4)

sendo B(𝑎, 𝑏) = Γ(𝑎)Γ(𝑏)Γ(𝑎+𝑏) a fun¸c˜ao Beta, e Γ(𝑎) = ∫︀0∞𝑥𝑎−1𝑒−𝑥d𝑥 a fun¸c˜ao Gamma.

Uma parametriza¸c˜ao importante para o contexto de regress˜ao considera a transforma¸c˜ao un´ıvoca (𝛼1, 𝛼2) ↦→ (𝜑𝜇, 𝜑(1 − 𝜇)), em que 𝜇 = 𝛼1/(𝛼1+ 𝛼2) e 𝜑 = 𝛼1 + 𝛼2. As caracter´ısticas da vari´avel

𝑌 ∼ Beta-Binomial(𝑛, 𝛼1, 𝛼2) = Beta-Binomial(𝑛, 𝜑𝜇, 𝜑(1 − 𝜇)) s˜ao dadas por:

E[𝑌 ] = E[E[𝑌 |𝑝]] = 𝑛E[𝑝] = 𝑛𝜇, (2.1.5)

Var[𝑌 ] = E[Var[𝑌 |𝑝]] + Var[E[𝑌 |𝑝]] = E[𝑛𝑝(1 − 𝑝)] + Var[𝑛𝑝]

= 𝑛(︁E[𝑝] − E[𝑝2])︁+ 𝑛2Var[𝑝]

= 𝑛 (︁

E[𝑝] −(︀Var[𝑝] + E2[𝑝])︀ )︁

+ 𝑛2Var[𝑝]

= 𝑛E[𝑝] − 𝑛Var[𝑝] − 𝑛E2[𝑝] + 𝑛2Var[𝑝]

= 𝑛(︁E[𝑝](1 − E[𝑝]) + (𝑛 − 1)Var[𝑝])︁

= 𝑛(︁𝜇(1 − 𝜇) + (𝑛 − 1)𝜇(1 − 𝜇)(𝜑 + 1)−1)︁ = 𝑛𝜇(1 − 𝜇) [︃ 1 + 𝑛 − 1 𝜑 + 1 ]︃ , (2.1.6)

(20)

V^e-se pela express˜ao da vari^ancia (2.1.6) um aspecto essencial que difere a Beta-Binomial da Binomial: a sobredispers˜ao dos valores gerados pela primeira, em compara¸c˜ao com a segunda. Num contexto de regress˜ao para vari´aveis dicot^omicas, a utiliza¸c˜ao da distribui¸c˜ao Beta-Binomial para os dados ´e uma alternativa relevante quando o modelo Binomial n˜ao se faz adequado Williams (1982).

A parametriza¸c˜ao 𝑌 ∼ Beta-Binomial(𝑛, 𝜑𝜇, 𝜑(1 − 𝜇)) ´e mais conveniente para desenvolver os modelos de regress˜ao e, em conformidade com os prop´ositos deste trabalho, adotaremos esta estrutura de agora em diante. O par^ametro 𝜇 pode ser interpretado como a probabilidade de sucesso num ensaio, enquanto 𝜌 = (𝜑 + 1)−1 ´e visto como o par^ametro de correla¸c˜ao intraclasse, e est´a relacionado `

a sobredispers˜ao que os dados podem apresentar. Considerando que 𝜑 > 0, 𝜌 ´e necessariamente n˜ao negativo. Por´em,Prentice(1986) mostra que (2.1.4) ´e uma fun¸c˜ao de probabilidade v´alida para certos valores negativos da correla¸c˜ao intraclasse, expandindo o espa¸co param´etrico dessa caracter´ıstica a 𝜌 > −min(︀𝑛−𝜇−1𝜇 ,𝑛+𝜇−21−𝜇 )︀,Ridout et al.(1999). Nas figuras 2.1 e 2.2, s˜ao mostrados alguns exemplos da versatilidade da distribui¸c˜ao Beta-Binomial e os valores m´ınimos que o par^ametro 𝜌 pode assumir.

µ =0,25 µ =0,50 µ =0,70 φ = 0 ,5 φ = 5 φ = 10 φ = 100 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 0.0 0.2 0.4 0.0 0.2 0.4 0.0 0.2 0.4 0.0 0.2 0.4 k P(Y=k)

Figura 2.1: Fun¸c˜oes de probabilidade da vari´avel aleat´oria 𝑌 ∼ Beta-Binomial(10, 𝜑𝜇, 𝜑(1 − 𝜇)) para diferentes valores de 𝜇 e 𝜑.

(21)

−0.06 −0.04 −0.02 0.00 0.00 0.25 0.50 0.75 1.00 µ V alor mínimo ρ n 10 20 30 40 50 60

Figura 2.2: Limite inferior do espa¸co param´etrico da correla¸c˜ao intraclasse 𝜌 = (𝜑 + 1)−1, de acordo com diferentes valores de 𝜇 = 𝛼1/(𝛼1+ 𝛼2) e quantidade de ensaios 𝑛.

2.2

Preditores para dados longitudinais com ponto de

que-bra

Sob a perspectiva dos Modelos Lineares Generalizados Nelder and Wedderburn (1972), tem-se o intuito de modelar a m´edia condicional da propor¸c˜ao de sucessos, E[𝑌*] = E[𝑌 /𝑛] = 𝜇, equivalente `

a probabilidade de acerto ao responder um question´ario. Isto ´e feito por meio das chamadas fun¸c˜oes de liga¸c˜ao, que relacionam a probabilidade de sucesso a efeitos das vari´aveis explicativas utilizadas no estudo.

Segundo Paula (2004), o modelo de regress˜ao para respostas independentes Binomiais 𝑌1, . . . , 𝑌𝑛

com 𝑌𝑖 ∼ Binomial(𝐾, 𝜇𝑖) ´e dado pela express˜ao 𝑔(𝜇𝑖) = 𝜂𝑖, em que 𝜂𝑖 ´e o preditor do 𝑖-´esimo

indiv´ıduo. 𝑔 : (0, 1) ↦→ R ´e uma fun¸c˜ao de liga¸c˜ao, e pode ser da forma 𝑔(𝑥) = log(𝑥/(1 − 𝑥)), por exemplo. Em geral, avalia-se a rela¸c˜ao de uma vari´avel explicativa, 𝑥𝑖, com o preditor 𝜂𝑖 de uma

maneira linear no vetor de par^ametros 𝛽 = (𝛽0, 𝛽1)′, ou seja, 𝑔(𝜇𝑖) = log(𝜇𝑖/(1−𝜇𝑖)) = 𝜂𝑖 = 𝛽0+𝛽1𝑥𝑖.

Adicionalmente, a postula¸c˜ao de modelos com ponto de quebra para indiv´ıduos ´e feita por meio de preditores 𝜂𝑖 n˜ao lineares nos par^ametros Muggeo (2003). Nesses casos, a dimens˜ao do vetor 𝛽

aumenta para contemplar os efeitos das vari´aveis explicativas ap´os a ocorr^encia do ponto de mudan¸ca. Veja a seguinte ilustra¸c˜ao desta nova perspectiva:

Exemplo 2.2.1. Seja 𝑌1, . . . , 𝑌𝑛 com 𝑌𝑖 ∼ Binomial(𝐾, 𝜇𝑖). 𝛽 = (𝛽0, 𝛽1, 𝛽2)′ e 𝜏 s˜ao par^ametros

e 𝑥𝑖 o valor de uma covari´avel cont´ınua para o 𝑖-´esimo indiv´ıduo. Uma poss´ıvel rela¸c˜ao entre as

quantidades 𝜇𝑖 e as vari´aveis explicativas 𝑥𝑖 ´e dada por:

log (︂ 𝜇𝑖 1 − 𝜇𝑖 )︂ = 𝛽0+ 𝛽1𝑥𝑖+ 𝛽2(𝑥𝑖− 𝜏 )+,

(22)

∀𝑖 ∈ {1, . . . , 𝑛}, em que (𝑎)+ = max(𝑎, 0). O interesse neste modelo reside majoritariamente na

estima¸c˜ao das quantidades 𝛽2 e 𝜏 , sendo os par^ametros que refletem o surgimento do ponto de

quebra e a magnitude do seu efeito, respectivamente.

Considere agora que cada unidade experimental possui mensura¸c˜oes longitudinais em 𝑡𝑖 = (𝑡𝑖1, . . . ,

𝑡𝑖𝑛𝑖)

, ∀𝑖 ∈ {1, . . . , 𝑁 } com T sendo a amplitude dos tempos observados. Por simplicidade, suponha

que todos os indiv´ıduos tenham um ponto de quebra desconhecido, denotado por 𝜏𝑖 ∈ T. Neste

contexto, os preditores n˜ao lineares mais comuns s˜ao listados abaixo:

1. O chamado Broken-Stick Toms and Lesperance (2003):

𝜂1,𝑖𝑗 =

{︃

𝛽0+ 𝛽1𝑡𝑖𝑗 𝑡𝑖𝑗 < 𝜏𝑖,

𝛽0+ 𝛽1𝜏𝑖+ 𝛽2(𝑡𝑖𝑗− 𝜏𝑖) 𝑡𝑖𝑗 ≥ 𝜏𝑖,

(2.2.1)

∀(𝑗, 𝑖) ∈ {1, . . . , 𝑛𝑖} × {1, . . . , 𝑁 }. Se o ponto de quebra 𝜏𝑖 fosse conhecido, ter-se-ia um

preditor linear em 𝛽. Apesar de n˜ao o ser, preservaremos a nota¸c˜ao tradicional, com sub´ındice representando que as covari´aveis podem depender de 𝜏𝑖. 𝜂1,𝑖𝑗 pode ser escrito, ent˜ao, da forma:

𝜂1,𝑖𝑗 = 𝛽0+ 𝛽1min(𝑡𝑖𝑗, 𝜏𝑖) + 𝛽2(𝑡𝑖𝑗 − 𝜏𝑖)+ = 𝑥′𝑖𝑗,𝜏𝑖𝛽,

com 𝑥𝑖𝑗,𝜏𝑖 = (1, min(𝑡𝑖𝑗, 𝜏𝑖), (𝑡𝑖𝑗− 𝜏𝑖)

+)e 𝛽 = (𝛽

0, 𝛽1, 𝛽2)′.

Claramente, as desvantagens de utilizar o modelo Broken-Stick s˜ao pela sua n˜ao diferenciabi-lidade em 𝑡𝑖𝑗 = 𝜏𝑖, ∀𝑗 ∈ {1, . . . , 𝑛𝑖}. Em abordagens de otimiza¸c˜ao cl´assica ´e uma especifica¸c˜ao

que deve ser evitada.

2. Um conjunto de preditores cont´ınuos, utilizados em diversas aplica¸c˜oes Hall et al. (2001),

Jacqmin-Gadda et al.(2006), Yu and Ghosh (2010):

𝜂2,𝑖𝑗 = ⎧ ⎪ ⎪ ⎨ ⎪ ⎪ ⎩ 𝛽0+ 𝐾1 ∑︀ 𝑘=1 𝛽𝑘𝑡𝑘𝑖𝑗, 𝑡𝑖𝑗 < 𝜏𝑖, 𝛽0+ 𝐾1 ∑︀ 𝑘=1 𝛽𝑘𝑡𝑘𝑖𝑗 + 𝐾2 ∑︀ 𝑘=1 𝛽𝑘+𝐾1(𝑡𝑖𝑗 − 𝜏𝑖) 𝑘, 𝑡 𝑖𝑗 ≥ 𝜏𝑖. (2.2.2)

Podemos escrever 𝜂2,𝑖𝑗 como:

𝜂2,𝑖𝑗 = 𝛽0+ 𝐾1 ∑︁ 𝑘=1 𝛽𝑘𝑡𝑘𝑖𝑗+ 𝐾2 ∑︁ 𝑘=1 𝛽𝑘+𝐾1[(𝑡𝑖𝑗 − 𝜏𝑖) + ]𝑘 = 𝑥′𝑖𝑗,𝜏𝑖𝛽, em que 𝑥𝑖𝑗,𝜏𝑖 =(︀1, 𝑡 1 𝑖𝑗, . . . , 𝑡 𝐾1 𝑖𝑗 , [(𝑡𝑖𝑗− 𝜏𝑖)+]1, . . . , [(𝑡𝑖𝑗 − 𝜏𝑖)+]𝐾2 )︀′ e 𝛽 = (𝛽0, 𝛽1, . . . , 𝛽𝐾1+𝐾2) ′.

O problema da falta de suavidade do preditor com respeito ao tempo 𝑡𝑖𝑗 = 𝜏𝑖 ´e contornado no

preditor dado em (2.2.2) desde que 𝐾2 ≥ 2 Seber and Wild (1989). Sua desvantagem, por outro

lado, ´e o acr´escimo na dimens˜ao do vetor de efeitos fixos para estima¸c˜ao, com rela¸c˜ao `a especifica¸c˜ao (2.2.1). O comportamento das duas fun¸c˜oes ´e mostrado nas figuras 2.3 e 2.4.

(23)

10 20 30 40 2.5 5.0 7.5 10.0 Tempo Preditor

Figura 2.3: Preditor Broken-Stick com 𝛽2 ∈ (−7, −1). Al´em disso, 𝜏 = 5, 𝛽0 = 40 e 𝛽1 = 0, 5.

−20 0 20 40 2.5 5.0 7.5 10.0 Tempo Preditor (a) −80 −40 0 40 2.5 5.0 7.5 10.0 Tempo Preditor (b) −50 0 2.5 5.0 7.5 10.0 Tempo Preditor (c)

Figura 2.4: Preditor em (2.2.2) com 𝐾1 = 1 e 𝐾2 = 2. Em todos os casos, 𝜏 = 5, 𝛽0 = 40 e 𝛽1 = 0, 5.

Al´em disso, todos os grids de 𝛽2 ou 𝛽3 possuem 14 valores. Especificamente, (a)𝛽3 = −0, 8 e

𝛽2 ∈ (−7, −1); (b)𝛽2 = −4 e 𝛽3 ∈ (−4; −0, 05); (c)𝛽2 ∈ (−7, −1), enquanto 𝛽3 ∈ (−4; −0, 05).

A cria¸c˜ao de preditores com pontos de quebra com transi¸c˜oes suaves ´e um tema ativo de pesquisa nessa ´area. Tem-se, por exemplo, as especifica¸c˜oes com a fun¸c˜ao tangente hiperb´olica de Bacon and

Watts(1971), o Bent-Cable Tishler and Zang (1981),Chiu et al.(2006) e a polinomialvan den Hout

et al.(2011). Elas possuem vantagens para o contexto de estima¸c˜ao cl´assica dos pontos de mudan¸ca,

assim como uma maior flexibilidade de din^amica, considerando que trazem par^ametros de suavidade adicionais.

(24)

2.3

O modelo de mistura de regress˜

oes com componente de

decl´ınio acelerado

Suponha que 𝑌1(𝑡1), . . . , 𝑌𝑁(𝑡𝑁) sejam vetores aleat´orios independentes. Cada componente 𝑌𝑖(𝑡𝑖) =

𝑌𝑖 = (𝑌 (𝑡𝑖1), . . . , 𝑌 (𝑡𝑖𝑛𝑖))

= (𝑌

𝑖1, . . . , 𝑌𝑖𝑛𝑖)

, representa o escore no tempo 𝑡

𝑖𝑗 do 𝑖-´esimo indiv´ıduo,

𝑗 ∈ {1, . . . , 𝑛𝑖}, 𝑖 ∈ {1, . . . , 𝑁 }. 𝑌𝑖𝑗 ∈ {0, . . . , 𝐾}, ∀(𝑖, 𝑗), em que 𝐾 ´e o n´umero de quest˜oes do

question´ario padr˜ao aplicado longitudinalmente. Al´em disso, considere os seguintes agrupamentos:

∙ 𝐺1 - indiv´ıduos com decl´ınio dos escores `a taxa constante;

∙ 𝐺2- indiv´ıduos com ponto de quebra na trajet´oria dos escores (total de acertos do question´ario).

Sabendo que as especifica¸c˜oes de preditores em (2.2.1) e (2.2.2) trazem par^ametros adicionais por conta do ponto de quebra, deve-se ter cautela ao postular o modelo para os diferentes grupos. Em outras palavras, ´e interessante que a proposta garanta a mesma dimens˜ao do espa¸co gerado pelas covari´aveis entre os grupos 𝐺1 e 𝐺2, como nas especifica¸c˜oes tradicionais de misturaMcLachlan and Peel (2004). A solu¸c˜ao para a quest˜ao da dimensionalidade ´e dada propondo um ponto de quebra para cada indiv´ıduo, como um efeito aleat´orio, mas que assume a seguinte forma Yu and Ghosh

(2010): 𝜏𝑖 = {︃ 𝜏∞,𝑖, com probabilidade (1 − 𝑝𝑖) 𝜏𝑎,𝑖, com probabilidade 𝑝𝑖, em que 𝜏∞,𝑖 𝑞.𝑐.

−→ +∞ , 𝜏𝑎,𝑖 ∼ Normal(𝜇𝜏, 𝜎2𝜏)1{𝜏𝑖 ∈ T} e T ´e a amplitude dos tempos observados.

Assim, se o indiv´ıduo n˜ao apresenta um decl´ınio acelerado na sua trajet´oria, ent˜ao a vari´avel assume algum valor 𝜏𝑖

𝑞.𝑐.

−→ +∞ e a contribui¸c˜ao das covari´aveis [(𝑡𝑖𝑗 − 𝜏𝑖)+]𝑘 ´e nula para todo 𝑘. Pode-se

determinar, ainda, os pontos de quebra com aux´ılio de vari´aveis latentes 𝑆1, . . . , 𝑆𝑁 𝑖𝑛𝑑

∼ Bernoulli(𝑝𝑖)

que indicam a aloca¸c˜ao do 𝑖-´esimo indiv´ıduo: caso 𝑆𝑖 = 0, ent˜ao, 𝑖 ∈ 𝐺1, e se 𝑆𝑖 = 1, ent˜ao, 𝑖 ∈ 𝐺2,

isto ´e, 𝜏𝑖 =(︀𝜏∞,𝑖 )︀1{𝑆𝑖=0} (︀𝜏𝑎,𝑖 )︀1{𝑆𝑖=1} ,

com 𝜏∞,𝑖 e 𝜏𝑎,𝑖 j´a definidos anteriormente.

Assim como na extens˜ao dos Modelos Lineares Generalizados de Efeitos Mistos McCulloch and

Neuhaus (2001), outro conjunto de efeitos aleat´orios ser˜ao introduzidos no estudo. Considere a

amostra independente 𝑏1, . . . , 𝑏𝑁 ∼ Normal𝑞𝑏(0, D), e componentes 𝑏𝑖 = (𝑏𝑖1, . . . , 𝑏𝑖𝑞𝑏)

. Com estes,

o objetivo ´e de capturar particularidades dos indiv´ıduos nas trajet´orias de escore m´edio obtidas. A representa¸c˜ao hier´arquica do modelo ´e, ent˜ao, dada por:

𝑌𝑖𝑗|𝑏𝑖, 𝜏𝑎,𝑖, 𝑆𝑖 𝑖𝑛𝑑 ∼ 𝑓 (𝑦𝑖𝑗|𝑏𝑖, 𝜏𝑎,𝑖, 𝑆𝑖) (2.3.1) 𝑏𝑖 𝑖𝑖𝑑 ∼ Normal𝑞𝑏(0, D) 𝜏𝑎,𝑖 𝑖𝑖𝑑 ∼ Normal(𝜇𝜏, 𝜎𝜏2)1{𝜏𝑎,𝑖∈ T}

(25)

𝑆𝑖 𝑖𝑛𝑑 ∼ Bernoulli(𝑝𝑖), 𝜏𝑖 =(︀𝜏∞,𝑖 )︀1{𝑆𝑖=0} (︀𝜏𝑎,𝑖 )︀1{𝑆𝑖=1} 𝜇𝑖𝑗 = 𝑔−1(𝑥′𝑖𝑗,𝜏𝑖𝛽 + 𝑧 ′ 𝑖𝑗,𝜏𝑖𝑏𝑖) (2.3.2) 𝑝𝑖 = ℎ−1(𝑤′𝑖𝜆), (2.3.3)

∀(𝑖, 𝑗) ∈ {1, . . . , 𝑁 } × {1, . . . , 𝑛𝑖}. 𝑓 (𝑦𝑖𝑗|𝑏𝑖, 𝜏𝑎,𝑖, 𝑆𝑖) assume as formas (2.1.1) ou (2.1.4), isto ´e, pode-se

ter em (2.3.1) que[︀𝑌𝑖𝑗|𝑏𝑖, 𝜏𝑎,𝑖, 𝑆𝑖

]︀ 𝑖𝑛𝑑

∼ Binomial(𝐾, 𝜇𝑖𝑗) ou[︀𝑌𝑖𝑗|𝑏𝑖, 𝜏𝑎,𝑖, 𝑆𝑖

]︀𝑖𝑛𝑑

∼ Beta-Binomial(𝐾, 𝜑𝜇𝑖𝑗, 𝜑(1−

𝜇𝑖𝑗)). Al´em disso, 𝑔, ℎ : (0, 1) ↦→ R s˜ao fun¸c˜oes de liga¸c˜ao, 𝛽 e 𝜆 vetores de efeitos fixos com

di-mens˜oes 𝑞𝛽 × 1 e 𝑞𝜆 × 1, respectivamente. 𝑤𝑖 = (𝑤𝑖1, . . . , 𝑤𝑖𝑞𝜆)

ao as covari´aveis para modelar a

probabilidade de classifica¸c˜ao no grupo com ponto de quebra, como em Yu and Ghosh (2010).

De acordo com as express˜oes dos preditores n˜ao lineares (2.2.1) e (2.2.2), os vetores de co-vari´aveis para os efeitos fixos e aleat´orios das m´edias 𝜇𝑖𝑗 dependem dos valores 𝜏1, . . . , 𝜏𝑁 e dos vetores

𝑡1, . . . , 𝑡𝑁. Ent˜ao, intrinsecamente, 𝑥𝑖𝑗,𝜏𝑖 = (𝑥𝑖𝑗1(𝜏𝑖), . . . , 𝑥𝑖𝑗𝑞𝛽(𝜏𝑖))

e 𝑧

𝑖𝑗,𝜏𝑖 = (𝑧𝑖𝑗1(𝜏𝑖), . . . , 𝑧𝑖𝑗𝑞𝑏(𝜏𝑖))

.

Tenha em vista, entretanto, que para ´ındices arbitr´arios 𝑘1 e 𝑘2, 𝑥𝑖𝑗𝑘1(𝜏𝑖) e 𝑧𝑖𝑗𝑘2(𝜏𝑖) podem tanto

depender do tempo ou ponto de quebra como ser uma caracter´ıstica fixa, por exemplo, o g^enero do indiv´ıduo.

Segundo as f´ormulas (2.1.2), (2.1.3), (2.1.5) e (2.1.6), as caracter´ısticas para as vari´aveis resposta 𝑌𝑖𝑗, ∀(𝑖, 𝑗) ∈ {1, . . . , 𝑁 } × {1, . . . , 𝑛𝑖} sob os modelos Binomial e Beta-Binomial se tornam:

∙ Caso 𝑌𝑖𝑗|𝑏𝑖, 𝜏𝑎,𝑖, 𝑆𝑖 𝑖𝑛𝑑 ∼ Binomial(𝐾, 𝜇𝑖𝑗) : E[𝑌𝑖𝑗] = E𝑏𝑖,𝑆𝑖,𝜏𝑎,𝑖[E[𝑌𝑖𝑗|𝑏𝑖, 𝑆𝑖, 𝜏𝑎,𝑖]] = 𝐾 E𝑏𝑖,𝑆𝑖,𝜏𝑎,𝑖[𝜇𝑖𝑗] = 𝐾 E𝑏𝑖,𝑆𝑖,𝜏𝑎,𝑖[𝑔 −1 (𝑥′𝑖𝑗,𝜏 𝑖𝛽 + 𝑧 ′ 𝑖𝑗,𝜏𝑖𝑏𝑖)],

Var[𝑌𝑖𝑗] = E𝑏𝑖,𝑆𝑖,𝜏𝑎,𝑖[Var[𝑌𝑖𝑗|𝑏𝑖, 𝑆𝑖, 𝜏𝑎,𝑖]] + Var𝑏𝑖,𝑆𝑖,𝜏𝑎,𝑖[E[𝑌𝑖𝑗|𝑏𝑖, 𝑆𝑖, 𝜏𝑎,𝑖]]

= 𝐾 E𝑏𝑖,𝑆𝑖,𝜏𝑎,𝑖 [︁ 𝑔−1(𝑥′𝑖𝑗,𝜏 𝑖𝛽 + 𝑧 ′ 𝑖𝑗,𝜏𝑖𝑏𝑖)(1 − 𝑔 −1 (𝑥′𝑖𝑗,𝜏 𝑖𝛽 + 𝑧 ′ 𝑖𝑗,𝜏𝑖𝑏𝑖)) ]︁ + 𝐾2Var𝑏𝑖,𝑆𝑖,𝜏𝑎,𝑖[𝑔 −1 (𝑥′𝑖𝑗,𝜏𝑖𝛽 + 𝑧𝑖𝑗,𝜏𝑖𝑏𝑖)], Cov[𝑌𝑖𝑗, 𝑌𝑖𝑘] = E𝑏𝑖,𝑆𝑖,𝜏𝑎,𝑖[Cov[(𝑌𝑖𝑗, 𝑌𝑖𝑘)|𝑏𝑖, 𝑆𝑖, 𝜏𝑎,𝑖]]

+ Cov𝑏𝑖,𝑆𝑖,𝜏𝑎,𝑖[E[𝑌𝑖𝑗|𝑏𝑖, 𝑆𝑖, 𝜏𝑎,𝑖], E[𝑌𝑖𝑘|𝑏𝑖, 𝑆𝑖, 𝜏𝑎,𝑖]]

= E[0] + Cov𝑏𝑖,𝑆𝑖,𝜏𝑎,𝑖[𝐾𝜇𝑖𝑗, 𝐾𝜇𝑖𝑘] = 𝐾2Cov𝑏𝑖,𝑆𝑖,𝜏𝑎,𝑖[𝑔 −1 (𝑥′𝑖𝑗,𝜏 𝑖𝛽 + 𝑧 ′ 𝑖𝑗,𝜏𝑖𝑏𝑖), 𝑔 −1 (𝑥′𝑖𝑘,𝜏 𝑖𝛽 + 𝑧 ′ 𝑖𝑘,𝜏𝑖𝑏𝑖)], ∀𝑗 ̸= 𝑘; ∙ Caso 𝑌𝑖𝑗|𝑏𝑖, 𝜏𝑎,𝑖, 𝑆𝑖 𝑖𝑛𝑑 ∼ Beta-Binomial(𝐾, 𝜑𝜇𝑖𝑗, 𝜑(1 − 𝜇𝑖𝑗)) : E[𝑌𝑖𝑗] = E𝑏𝑖,𝑆𝑖,𝜏𝑎,𝑖[E[𝑌𝑖𝑗|𝑏𝑖, 𝑆𝑖, 𝜏𝑎,𝑖]]

(26)

= 𝐾 E𝑏𝑖,𝑆𝑖,𝜏𝑎,𝑖[𝜇𝑖𝑗]

= 𝐾 E𝑏𝑖,𝑆𝑖,𝜏𝑎,𝑖[𝑔

−1

(𝑥′𝑖𝑗,𝜏𝑖𝛽 + 𝑧′𝑖𝑗,𝜏𝑖𝑏𝑖)],

Var[𝑌𝑖𝑗] = E𝑏𝑖,𝑆𝑖,𝜏𝑎,𝑖[Var[𝑌𝑖𝑗|𝑏𝑖, 𝑆𝑖, 𝜏𝑎,𝑖]] + Var𝑏𝑖,𝑆𝑖,𝜏𝑎,𝑖[E[𝑌𝑖𝑗|𝑏𝑖, 𝑆𝑖, 𝜏𝑎,𝑖]]

= 𝐾 [︃ 1 + 𝐾 − 1 𝜑 + 1 ]︃ E𝑏𝑖,𝑆𝑖,𝜏𝑎,𝑖 [︁ 𝑔−1(𝑥′𝑖𝑗,𝜏𝑖𝛽 + 𝑧𝑖𝑗,𝜏𝑖𝑏𝑖)(1 − 𝑔−1(𝑥′𝑖𝑗,𝜏𝑖𝛽 + 𝑧 ′ 𝑖𝑗,𝜏𝑖𝑏𝑖)) ]︁ + 𝐾2Var𝑏𝑖,𝑆𝑖,𝜏𝑎,𝑖[𝑔 −1 (𝑥′𝑖𝑗,𝜏𝑖𝛽 + 𝑧𝑖𝑗,𝜏𝑖𝑏𝑖)], Cov[𝑌𝑖𝑗, 𝑌𝑖𝑘] = E𝑏𝑖,𝑆𝑖,𝜏𝑎,𝑖[Cov[(𝑌𝑖𝑗, 𝑌𝑖𝑘)|𝑏𝑖, 𝑆𝑖, 𝜏𝑎,𝑖]]

+ Cov𝑏𝑖,𝑆𝑖,𝜏𝑎,𝑖[E[𝑌𝑖𝑗|𝑏𝑖, 𝑆𝑖, 𝜏𝑎,𝑖], E[𝑌𝑖𝑘|𝑏𝑖, 𝑆𝑖, 𝜏𝑎,𝑖]]

= E[0] + Cov𝑏𝑖,𝑆𝑖,𝜏𝑎,𝑖[𝐾𝜇𝑖𝑗, 𝐾𝜇𝑖𝑘] = 𝐾2Cov𝑏𝑖,𝑆𝑖,𝜏𝑎,𝑖[𝑔 −1 (𝑥′𝑖𝑗,𝜏 𝑖𝛽 + 𝑧 ′ 𝑖𝑗,𝜏𝑖𝑏𝑖), 𝑔 −1 (𝑥′𝑖𝑘,𝜏 𝑖𝛽 + 𝑧 ′ 𝑖𝑘,𝜏𝑖𝑏𝑖)], ∀𝑗 ̸= 𝑘.

A associa¸c˜ao entre escores em diferentes tempos ser´a uma decorr^encia da distribui¸c˜ao dos efeitos aleat´orios 𝑏𝑖, 𝜏𝑎,𝑖, 𝑆𝑖, ∀𝑖, e das fun¸c˜oes de liga¸c˜ao 𝑔, ℎ escolhidas. Nos casos em que o m´etodo de

es-tima¸c˜ao se der sob a perspectiva Bayesiana, as caracter´ısticas num´ericas calculadas ainda depender˜ao da distribui¸c˜ao a priori dos par^ametros envolvidos.

As fun¸c˜oes de liga¸c˜ao mais difundidas s˜ao a logito, logito(𝑝) = log(𝑝/(1 − 𝑝)) e a probito, probito(𝑝) = Φ−1(𝑝), em que Φ(·) denota a fun¸c˜ao de distribui¸c˜ao acumulada de uma vari´avel aleat´oria Normal padr˜ao. A primeira possui uma interpreta¸c˜ao conveniente, pois a raz˜ao de chances entre as probabilidades 𝑝 e (1 − 𝑝) ´e facilmente derivada da express˜ao. Por outro lado, estas formas s˜ao pouco flex´ıveis caso os preditores [𝑥′𝑖𝑗,𝜏

𝑖𝛽 + 𝑧

𝑖𝑗,𝜏𝑖𝑏𝑖] em (2.3.2) e [𝑤

𝑖𝜆] em (2.3.3) apresentem

assi-metria em termos de alguma covari´avel em 𝑥𝑖𝑗,𝜏𝑖 ou 𝑧𝑖𝑗,𝜏𝑖. Fun¸c˜oes de liga¸c˜ao sim´etricas e assim´etricas

tradicionais s˜ao apresentadas na Tabela 2.1.

Tabela 2.1: Fun¸c˜oes de liga¸c˜ao comuns para regress˜ao com dados bin´arios.

Nome Express˜ao 1o Quartil Mediana 3o Quartil

Logito 𝑔(𝑥) = log(︀𝑥/(1 − 𝑥))︀ -1,099 0,000 1,099

Probito 𝑔(𝑥) = Φ−1(𝑥) -0,674 0,000 0,674

Log-Log complementar 𝑔(𝑥) = log(−log(1 − 𝑥)) -1,246 -0,367 0,327 Reversa Log-Log complementar 𝑔(𝑥) = −log(−log(𝑥)) -0,327 0,367 1,246

2.3.1

Verossimilhan¸

ca para o modelo proposto

De acordo com a representa¸c˜ao hier´arquica em (2.3.1)-(2.3.3) e as suposi¸c˜oes delineadas na Se¸c˜ao 2.3, a fun¸c˜ao densidade conjunta das vari´aveis respostas 𝑦𝑖 = (𝑦𝑖1, . . . , 𝑦𝑖𝑛𝑖) de um indiv´ıduo ´e obtida

(27)

com base na aplica¸c˜ao sucessiva do Teorema da Multiplica¸c˜ao: 𝑓 (𝑦𝑖, 𝑏𝑖, 𝜏𝑎,𝑖, 𝑆𝑖) = 𝑓 (𝑦𝑖|𝑏𝑖, 𝜏𝑎,𝑖, 𝑆𝑖)𝑓 (𝑏𝑖|𝜏𝑎,𝑖, 𝑆𝑖)𝑓 (𝜏𝑎,𝑖|𝑆𝑖)𝑓 (𝑆𝑖) 𝑖𝑛𝑑 = [︂ 𝑛𝑖 ∏︁ 𝑗=1 𝑓 (𝑦𝑖𝑗|𝑏𝑖, 𝜏𝑎,𝑖, 𝑆𝑖) ]︂ 𝑓 (𝑏𝑖)𝑓 (𝜏𝑎,𝑖)𝑓 (𝑆𝑖). Seja 𝜃 = (𝛽′, 𝜆′, vec(D)′, 𝜇𝜏, 𝜎𝜏2, 𝜑)

o vetor de par^ametros associados ao modelo. Assim, a fun¸c˜ao

densidade marginal dos escores alcan¸cados por um indiv´ıduo e a verossimilhan¸ca s˜ao dados por:

𝑓 (𝑦𝑖) = ∫︁ ∫︁ 𝐴 1 ∑︁ 𝑆𝑖=0 [︂ 𝑛𝑖 ∏︁ 𝑗=1 𝑓 (𝑦𝑖𝑗|𝑏𝑖, 𝜏𝑎,𝑖, 𝑆𝑖) ]︂ 𝑓 (𝑏𝑖)𝑓 (𝜏𝑎,𝑖)𝑓 (𝑆𝑖) d𝑏𝑖d𝜏𝑎,𝑖, 𝐿(𝜃|𝑦) = 𝑁 ∏︁ 𝑖=1 [︃ ∫︁ ∫︁ 𝐴 1 ∑︁ 𝑆𝑖=0 [︂ 𝑛𝑖 ∏︁ 𝑗=1 𝑓 (𝑦𝑖𝑗|𝑏𝑖, 𝜏𝑎,𝑖, 𝑆𝑖) ]︂ 𝑓 (𝑏𝑖)𝑓 (𝜏𝑎,𝑖)𝑓 (𝑆𝑖) d𝑏𝑖d𝜏𝑎,𝑖 ]︃ , (2.3.4) ∀𝑖 ∈ {1, . . . , 𝑁 }, em que 𝐴 = T × R𝑞𝑏.

Em modelos de regress˜ao com efeitos aleat´orios, ´e recorrente a dificuldade de se trabalhar com a distribui¸c˜ao marginal das vari´aveis resposta, visto que necessitam do c´alculo de integrais para sua obten¸c˜ao Pinheiro and Bates (1995). Portanto, ´e conveniente calcular a chamada verossimilhan¸ca completa (ou aumentada), como em Little and Rubin (1983), Tan et al. (2009). M´etodos de es-tima¸c˜ao como o Algoritmo EM (Expectation-Maximization) e suas varia¸c˜oes Dempster et al.(1977),

Delyon et al. (1999) ou em infer^encia Bayesiana Gelman et al. (2014) se utilizam fortemente da

verossimilhan¸ca completa.

Considere Ω = (𝑦′, 𝑏′, 𝜏𝑎′, 𝑆′)′ o vetor de observa¸c˜oes aumentado. As verossimilhan¸cas completas para as duas postula¸c˜oes da vari´avel resposta condicional 𝑌𝑖𝑗|𝑏𝑖, 𝜏𝑎,𝑖, 𝑆𝑖 s˜ao como se segue:

Caso 𝑌𝑖𝑗|𝑏𝑖, 𝜏𝑎,𝑖, 𝑆𝑖 𝑖𝑛𝑑

∼ Binomial(𝐾, 𝜇𝑖𝑗), o vetor de par^ametros ´e reduzido a 𝜃 = (𝛽′, 𝜆′, vec(D)′, 𝜇𝜏, 𝜎𝜏2) ′

e tem-se a seguinte verossimilhan¸ca completa:

𝐿𝑐(𝜃|Ω) = 𝑁 ∏︁ 𝑖=1 [︃ [︂ 𝑛𝑖 ∏︁ 𝑗=1 𝑓 (𝑦𝑖𝑗|𝑏𝑖, 𝜏𝑎,𝑖, 𝑆𝑖) ]︂ 𝑓 (𝑏𝑖)𝑓 (𝜏𝑎,𝑖)𝑓 (𝑆𝑖) ]︃ = 𝑁 ∏︁ 𝑖=1 [︃ [︂ 𝑛𝑖 ∏︁ 𝑗=1 (︂ 𝐾 𝑦𝑖𝑗 )︂ 𝜇𝑦𝑖𝑗 𝑖𝑗 (1 − 𝜇𝑖𝑗)𝐾−𝑦𝑖𝑗 ]︂ × (2𝜋)−𝑞𝑏/2|D|−1/2exp {︂ − 1 2𝑏 ′ 𝑖D −1 𝑏𝑖 }︂ × 𝑝𝑆𝑖 𝑖 (1 − 𝑝𝑖)1−𝑆𝑖 × (2𝜋𝜎2 𝜏) −1/2 exp{︁− 1 2𝜎2 𝜏 (𝜏𝑎,𝑖− 𝜇𝜏)2 }︁ [P(𝜏𝑎,𝑖 ∈ T)]−1 ]︃ = 𝑁 ∏︁ 𝑖=1 [︃ [︂ 𝑛𝑖 ∏︁ 𝑗=1 (︂ 𝐾 𝑦𝑖𝑗 )︂(︂ 𝑔−1(𝑥′𝑖𝑗,𝜏𝑖𝛽 + 𝑧𝑖𝑗,𝜏𝑖𝑏𝑖) )︂𝑦𝑖𝑗(︂ 1 − 𝑔−1(𝑥′𝑖𝑗,𝜏𝑖𝛽 + 𝑧𝑖𝑗,𝜏𝑖𝑏𝑖) )︂𝐾−𝑦𝑖𝑗]︂ × (2𝜋)−𝑞𝑏/2|D|−1/2exp {︂ − 1 2𝑏 ′ 𝑖D −1 𝑏𝑖 }︂ ×[︀ℎ−1 (𝑤𝑖′𝜆)]︀𝑆𝑖[︀1 − ℎ−1(𝑤′𝑖𝜆)]︀1−𝑆𝑖

(28)

× (2𝜋𝜎2 𝜏) −1/2 exp{︁− 1 2𝜎2 𝜏 (𝜏𝑎,𝑖− 𝜇𝜏)2 }︁ [P(𝜏𝑎,𝑖 ∈ T)]−1 ]︃ . Caso 𝑌𝑖𝑗|𝑏𝑖, 𝜏𝑎,𝑖, 𝑆𝑖 𝑖𝑛𝑑 ∼ Beta-Binomial(𝐾, 𝜑𝜇𝑖𝑗, 𝜑(1 − 𝜇𝑖𝑗)), 𝜃 = (𝛽′, 𝜆′, vec(D)′, 𝜇𝜏, 𝜎𝜏2, 𝜑) ′ e tem-se 𝐿𝑐(𝜃|Ω) = 𝑁 ∏︁ 𝑖=1 [︃ [︂ 𝑛𝑖 ∏︁ 𝑗=1 𝑓 (𝑦𝑖𝑗|𝑏𝑖, 𝜏𝑎,𝑖, 𝑆𝑖) ]︂ 𝑓 (𝑏𝑖)𝑓 (𝜏𝑎,𝑖)𝑓 (𝑆𝑖) ]︃ = 𝑁 ∏︁ 𝑖=1 [︃ [︂ 𝑛𝑖 ∏︁ 𝑗=1 (︂ 𝐾 𝑦𝑖𝑗 )︂ B[︀𝑦𝑖𝑗 + 𝜑𝜇𝑖𝑗, 𝐾 − 𝑦𝑖𝑗 + 𝜑(1 − 𝜇𝑖𝑗) ]︀ B[︀𝜑𝜇𝑖𝑗, 𝜑(1 − 𝜇𝑖𝑗) ]︀ ]︂ × (2𝜋)−𝑞𝑏/2|D|−1/2exp {︂ −1 2𝑏 ′ 𝑖D −1 𝑏𝑖 }︂ × 𝑝𝑆𝑖 𝑖 (1 − 𝑝𝑖)1−𝑆𝑖× (2𝜋𝜎2𝜏) −1/2 exp {︁ − 1 2𝜎2 𝜏 (𝜏𝑎,𝑖− 𝜇𝜏)2 }︁ [P(𝜏𝑎,𝑖∈ T)]−1 ]︃ = 𝑁 ∏︁ 𝑖=1 [︃ [︂ 𝑛𝑖 ∏︁ 𝑗=1 (︂ 𝐾 𝑦𝑖𝑗 )︂B[︀𝑦 𝑖𝑗 + 𝜑𝑔−1(𝑥′𝑖𝑗,𝜏𝑖𝛽 + 𝑧 ′ 𝑖𝑗,𝜏𝑖𝑏𝑖), 𝐾 − 𝑦𝑖𝑗 + 𝜑(1 − 𝑔 −1(𝑥′ 𝑖𝑗,𝜏𝑖𝛽 + 𝑧 ′ 𝑖𝑗,𝜏𝑖𝑏𝑖)) ]︀ B[︀𝜑𝑔−1(𝑥′ 𝑖𝑗,𝜏𝑖𝛽 + 𝑧 ′ 𝑖𝑗,𝜏𝑖𝑏𝑖), 𝜑(1 − 𝑔 −1(𝑥′ 𝑖𝑗,𝜏𝑖𝛽 + 𝑧 ′ 𝑖𝑗,𝜏𝑖𝑏𝑖)) ]︀ ]︂ × (2𝜋)−𝑞𝑏/2|D|−1/2exp {︂ − 1 2𝑏 ′ 𝑖D −1 𝑏𝑖 }︂ ×[︀ℎ−1 (𝑤𝑖′𝜆)]︀𝑆𝑖[︀1 − ℎ−1 (𝑤′𝑖𝜆)]︀1−𝑆𝑖 × (2𝜋𝜎𝜏2)−1/2exp {︁ − 1 2𝜎2 𝜏 (𝜏𝑎,𝑖− 𝜇𝜏)2 }︁ [P(𝜏𝑎,𝑖 ∈ T)]−1 ]︃ . (2.3.5)

(29)

Cap´ıtulo 3

etodo de Estima¸

ao

No presente trabalho, as escolhas por delinear o modelo para an´alise dos escores de habilidade cognitiva com grupos latentes, efeitos aleat´orios tanto para a m´edia como para os pontos de quebra tornam a verossimilhan¸ca em (2.3.4) de dif´ıcil manuseio. Isto se d´a pelas integrais e somat´orio inerentes ao c´alculo das densidades marginais 𝑓 (𝑦1), . . . , 𝑓 (𝑦𝑁). Optou-se, portanto, pelos m´etodos

Bayesianos de estima¸c˜ao dos par^ametros, os quais carregam vantagens explicadas no decorrer deste cap´ıtulo.

A infer^encia Bayesiana tem como princ´ıpio uma formula¸c˜ao inteiramente probabil´ıstica para a vari´avel resposta e os par^ametros de interesseBox and Tiao(2011). As vantagens destes procedimen-tos de estima¸c˜ao v^em tanto de um ponto de vista pr´atico como te´orico. Os algoritmos de estima¸c˜ao s˜ao baseados na combina¸c˜ao de informa¸c˜ao do pesquisador/usu´ario (com as distribui¸c˜oes a priori dos par^ametros, 𝜋(𝜃)), e a informa¸c˜ao vinda dos dados coletados, pela fun¸c˜ao de verossimilhan¸ca. Com isso, o objetivo ´e encontrar a forma da distribui¸c˜ao a posteriori, 𝜋(𝜃|𝑦) Gilks et al. (1995).

No que diz respeito `a especifica¸c˜ao do fen^omeno, a infer^encia Bayesiana permite que par^ametros de modelos complexos e com representa¸c˜oes hier´arquicas extensas sejam convenientemente estimados. Isto ´e feito ao transformar o paradigma de maximiza¸c˜ao da fun¸c˜ao de verossimilhan¸ca, em infer^encia cl´assica, para um de gera¸c˜ao de (pseudo-) vari´aveis aleat´orias Robert (2007). Assim, algoritmos de simula¸c˜ao se fazem necess´arios para encontrar amostras da distribui¸c˜ao a posteriori e extrair informa¸c˜ao da estrutura delineada. Uma vez que amostras da distribui¸c˜ao a posteriori dos par^ametros s˜ao obtidas, tanto as infer^encias como ferramentas de diagn´ostico e medidas para compara¸c˜ao de modelos Bayesianos s˜ao calculadas sem maiores problemas.

Al´em disso, para problemas que incluem efeitos aleat´orios, o procedimento Bayesiano ´e bastante conveniente, pois evita o c´alculo de integrais para a obten¸c˜ao da distribui¸c˜ao marginal dos dados. Nestes casos, trabalha-se com a estrutura de dados aumentados, como nos algoritmos EMDempster

et al. (1977) e suas extens˜oes.

(30)

Assim como suposi¸c˜oes acerca das distribui¸c˜oes a priori podem enriquecer as an´alises, elas tamb´em podem levar a conclus˜oes err^oneas: veja Alvarez et al. (2014), por exemplo, sobre a estima¸c˜ao Bayesiana de matrizes de covari^ancia. ´E sempre v´alido, tamb´em, checar a sensibilidade do modelo para diferentes postula¸c˜oes da estrutura a priori dos par^ametrosBerger (1990).

3.1

Infer^

encia Bayesiana

Suponha que 𝑦 ´e um vetor de dados observados da distribui¸c˜ao condicional 𝑌 |𝜃 ∼ 𝑓 (·|𝜃), e 𝜃 ∈ Θ ⊆ R𝑑´e um vetor aleat´orio com distribui¸c˜ao a priori 𝜃 ∼ 𝜋(·). Pelo Teorema de Bayes, temos que a distribui¸c˜ao a posteriori de 𝜃 condicionada aos dados 𝑦, 𝜋(𝜃|𝑦), ser´a resumida por

𝜋(𝜃|𝑦) = 𝑓 (𝜃, 𝑦) 𝑓 (𝑦) =

𝑓 (𝑦|𝜃)𝜋(𝜃)

𝑓 (𝑦) ∝ 𝑓 (𝑦|𝜃)𝜋(𝜃). (3.1.1)

O lado direito da rela¸c˜ao (3.1.1) ´e o n´ucleo da distribui¸c˜ao a posteriori 𝜋(𝜃|𝑦), e determina comple-tamente sua forma, visto que o denominador 𝑓 (𝑦) independe de 𝜃 (´e, portanto, somente a constante de proporcionalidade da densidade).

Toda infer^encia sobre o par^ametro 𝜃 ´e feita com base na densidade 𝜋(𝜃|𝑦), agora que tamb´em considera informa¸c˜ao baseada na amostra obtida. Em problemas de estima¸c˜ao pontual, opta-se por encontrar um valor que represente melhor determinado par^ametro. Note que “representar melhor” aqui ´e um conceito subjetivo, e sempre deve ser entendido como um crit´erio (com ou sem restri¸c˜oes) sob o qual a estima¸c˜ao das quantidades de interesse ´e feita. Por exemplo, no conhecido m´etodo de M´ınimos Quadrados para regress˜ao linear simples homoced´astica, o objetivo ´e encontrar os valores (𝛽0, 𝛽1)′ tais que a fun¸c˜ao 𝑄(𝛽0, 𝛽1) =

∑︀

𝑖(𝑦𝑖− 𝛽0− 𝛽1𝑥𝑖)2 seja m´ınima.

Sem perda de generalidade, seja 𝜃 o par^ametro unidimensional com espa¸co param´etrico Θ ⊆ R, 𝒟 ⊆ R𝑛 o suporte do vetor aleat´orio 𝑌 e 𝛿𝜋(𝑌 ) uma decis˜ao para 𝜃, isto ´e, um estimador desta

quantidade. Todo procedimento de infer^encia Bayesiana deve ser embasado pela determina¸c˜ao de tr^es fatores:

1. a distribui¸c˜ao das observa¸c˜oes, 𝑓 (𝑦|𝜃);

2. a distribui¸c˜ao a priori do par^ametro, 𝜋(𝜃);

3. a fun¸c˜ao de perda ℒ : Θ × 𝒟 ↦→ [0, +∞) associada `a decis˜ao 𝛿𝜋.

Defini¸c˜ao 3.1.1. O risco integrado ´e a fun¸c˜ao 𝑟(𝜋, 𝛿) dada por

𝑟(𝜋, 𝛿) = ∫︁ Θ (︃ ∫︁ 𝒟 ℒ(𝜃, 𝛿(𝑦))𝑓 (𝑦|𝜃) d𝑦 )︃ 𝜋(𝜃) d𝜃.

(31)

Teorema 3.1.1 (Robert(2007)). Um estimador 𝛿𝜋 que minimiza a fun¸c˜ao de risco integrado pode ser obtido ao minimizar a perda esperada a posteriori ,

𝑔(𝜋, 𝛿𝜋(𝑦)|𝑦) = ∫︁

Θ

ℒ(𝜃, 𝛿𝜋(𝑦)) 𝜋(𝜃|𝑦) d𝜃,

para cada 𝑦 ∈ 𝒟.

Prova do Teorema 3.1.1. Como ℒ(𝜃, 𝛿) ≥ 0, vale o Teorema de Fubini para trocar a ordem de inte-gra¸c˜ao, e 𝛿𝜋 = arg min 𝛿 ∫︁ ∫︁ Θ×𝒟 ℒ(𝜃, 𝛿(𝑦))𝑓 (𝑦|𝜃) d𝑦 𝜋(𝜃) d𝜃 = arg min 𝛿 ∫︁ ∫︁ 𝒟×Θ ℒ(𝜃, 𝛿(𝑦))𝑓 (𝑦|𝜃)𝜋(𝜃) 𝑓 (𝑦) 𝑓 (𝑦) d𝜃 d𝑦 = arg min 𝛿 ∫︁ 𝒟 𝑔(𝜋, 𝛿(𝑦)|𝑦)𝑓 (𝑦) d𝑦 = arg min 𝛿 𝑔(𝜋, 𝛿(𝑦)|𝑦), para cada 𝑦 ∈ 𝒟,

Assim, diz-se que 𝛿𝜋 encontrado pela minimiza¸c˜ao da fun¸ao de perda esperada a posteriori

´e um estimador de Bayes, sob fun¸c˜ao de perda L e a priori 𝜋(·). De agora em diante, utilizaremos simplesmente a nota¸c˜ao ^𝜃 para denotar estimadores Bayesianos do par^ametro 𝜃. As fun¸c˜oes de perda mais usuais e seus respectivos estimadores s˜ao listadas na Tabela 3.1:

Tabela 3.1: Fun¸c˜oes de perdas usuais e os respectivos estimadores Bayesianos encontrados pela minimiza¸c˜ao em (3.1.1).

Nome Express˜ao Estimador associado

Perda Absoluta ℒ(𝜃, 𝛿) = |𝜃 − 𝛿| 𝜃 = mediana{︀𝜋(𝜃|𝑦)}︀^ Perda Quadr´atica ℒ(𝜃, 𝛿) = (𝜃 − 𝛿)2 𝜃 = E[𝜃|𝑦]^

Perda 0-1 ℒ(𝜃, 𝛿) = {︃ 0, se 𝜃 = 𝛿 1, se 𝜃 ̸= 𝛿 ^ 𝜃 = moda{︀𝜋(𝜃|𝑦)}︀ Perda Multilinear ℒ𝑘1,𝑘2(𝜃, 𝛿) = {︃ 𝑘1(𝛿 − 𝜃), se 𝜃 ≤ 𝛿 𝑘2(𝜃 − 𝛿), se 𝜃 > 𝛿 ^ 𝜃 ´e o 𝑘2 𝑘1+𝑘2-´esimo quantil de 𝜋(𝜃|𝑦)

Na pr´atica, a distribui¸c˜ao 𝜋(𝜃|𝑦) ´e dificilmente obtida de maneira expl´ıcita. A solu¸c˜ao para en-contrar os estimadores do vetor 𝜃 ´e conseguir uma amostra da densidade a posteriori, por m´etodos de simula¸c˜ao de vari´aveis aleat´oriasGelman et al. (2014). Ainda assim, em casos multiparam´etricos,

(32)

nem sempre o n´ucleo de 𝜋(𝜃|𝑦) ´e de alguma distribui¸c˜ao completamente conhecida. Uma das es-trat´egias poss´ıveis ´e ent˜ao obter amostras via simula¸c˜ao das chamadas distribui¸c˜oes condicionais completas, que nada mais s˜ao do que a cole¸c˜ao de densidades {𝜋(𝜃𝑘|𝑦, 𝜃−𝑘); ∀𝑘 ∈ {1, . . . , 𝑑}}, em

que 𝜃−𝑘 = (𝜃1, . . . , 𝜃𝑘−1, 𝜃𝑘+1, . . . , 𝜃𝑑)′. Esta t´ecnica pertence aos conhecidos algoritmos Markov Chain

Monte Carlo - MCMC Gilks et al.(1995).

Desde que o suporte da densidade 𝜋(𝜃|𝑦) seja o produto cartesiano dos suportes das condicionais completas {𝜋(𝜃𝑘|𝑦, 𝜃−𝑘); ∀𝑘 ∈ {1, . . . , 𝑑}}, as cadeias de amostras das condicionais completas geradas

via MCMC s˜ao erg´odicas Robert (2007). Cuidados adicionais devem ser tomados para eliminar a depend^encia das cadeias de cada par^ametro: escolher uma amostra gerada a cada 𝑙 valores e eliminar as 𝐵 primeiras simula¸c˜oes, para desconsiderar o efeito dos valores iniciais. Assim, conforme o n´umero de simula¸c˜oes cresce, espera-se que as amostras obtidas sejam representativas da distribui¸c˜ao estacion´aria 𝜋(𝜃|𝑦). Os c´alculos das estimativas Bayesianas s˜ao feitos com base nas vers˜oes amostrais das estat´ısticas mostradas na Tabela 3.1.

3.1.1

Algoritmos de simula¸

ao

Ferramentas tradicionais para encontrar estimativas Bayesianas se baseiam em conceitos de inte-gra¸c˜ao num´erica, aproxima¸c˜ao anal´ıtica de Laplace ou m´etodos de Monte Carlo para calcular inte-grais da distribui¸c˜ao a posteriori Robert(2004). Por exemplo, supondo fun¸c˜ao de perda quadr´atica, o estimador de 𝜃 ´e dado por:

^

𝜃 = E[𝜃|𝑦] = ∫︁

𝜃 𝜋(𝜃|𝑦) d𝜃 = ∫︀ 𝜃𝑓 (𝑦|𝜃)𝜋(𝜃) d𝜃

∫︀ 𝑓 (𝑦|𝜃)𝜋(𝜃) d𝜃 . (3.1.2) Assim, ^𝜃 poderia ser estimado por quadraturas gaussianas ou gerando uma amostra 𝜃(1), . . . , 𝜃(𝑀 ) da distribui¸c˜ao a priori 𝜋(𝜃) e aproximando (3.1.2) por ^𝜃 ≈ 𝐴

𝐵, 𝐵 > 0, com 𝐴 = 1 𝑀 𝑀 ∑︁ 𝑘=1 𝜃(𝑘)𝑓 (𝑦|𝜃(𝑘))−→𝑞.𝑐. ∫︁ 𝜃𝑓 (𝑦|𝜃)𝜋(𝜃) d𝜃, (3.1.3) 𝐵 = 1 𝑀 𝑀 ∑︁ 𝑘=1 𝑓 (𝑦|𝜃(𝑘))−→𝑞.𝑐. ∫︁ 𝑓 (𝑦|𝜃)𝜋(𝜃) d𝜃, (3.1.4)

visto que 𝐵𝐴 −→ E[𝜃|𝑦]. Este resultado ´e decorrente das propriedades de converg^encia quase certa,𝑞.𝑐. juntamente com (3.1.3) e (3.1.4). Esta abordagem torna-se menos acurada `a medida que a dimens˜ao do espa¸co param´etrico cresce. Al´em disso, a infer^encia acerca destes estimadores n˜ao ´e feita de maneira direta.

Com o avan¸co das capacidades de processamento e armazenamento de informa¸c˜ao dos computa-dores na d´ecada de 1990, os algoritmos MCMC tornaram-se mais vantajosos em rela¸c˜ao aos m´etodos Monte Carlo tradicionais. Eles s˜ao, em princ´ıpio, amplamente aplic´aveis a problemas de infer^encia

(33)

Bayesiana e trabalham melhor com espa¸cos param´etricos de alta dimens˜ao.

Os algoritmos MCMC baseiam-se na constru¸c˜ao de cadeias de Markov dos par^ametros, de forma que sua distribui¸c˜ao estacion´aria seja a densidade de interesse 𝜋(𝜃|𝑦). Como o n´umero de simula¸c˜oes para que a estacionariedade e n˜ao correla¸c˜ao das cadeias seja atingida pode ser grande, estes m´etodos t^em um custo computacional alto. Dentro desta categoria de algoritmos, encontram-se os conhecidos m´etodos de simula¸c˜ao Amostrador de Gibbs Casella and George (1992) e Metropolis-Hastings

Has-tings (1970). ´E poss´ıvel ainda combinar t´ecnicas de simula¸c˜ao como o Slice Sampling Neal (1997)

ou o m´etodo de Aceita¸c˜ao-Rejei¸c˜ao Devroye (1986) dentro do Amostrador de Gibbs, por exemplo.

Amostrador de Gibbs

O Amostrador de Gibbs, `as vezes chamado de amostragem condicional alternada, ´e uma ferra-menta importante e muito utilizada quando o par^ametro de interesse 𝜃 ´e multidimensional. Considere ainda a estrutura 𝜃 ∈ Θ ⊆ R𝑑. O algoritmo em quest˜ao faz uso das distribui¸c˜oes condicionais com-pletas, definidas na Se¸c˜ao 3.1, e o procedimento ´e descrito no Algoritmo B.2.

Caso as condicionais completas tenham a forma de distribui¸c˜oes conhecidas, opera-se com m´etodos de simula¸c˜ao de vari´aveis aleat´orias tradicionais, como o M´etodo da Invers˜ao, o M´etodo da Aceita¸c˜ ao-Rejei¸c˜ao, M´etodo da Composi¸c˜ao ou M´etodo da Representa¸c˜ao Estoc´astica, para explica¸c˜ao e exem-plos, vejaTan et al. (2009).

Por outro lado, se para pelo menos um 𝑘, a distribui¸c˜ao 𝜋(𝜃𝑘|𝜃−𝑘) n˜ao tiver forma conhecida,

deve-se simular desta(s) vari´avel(is) aleat´oria(s) com outros m´etodos, como os que seguem.

Metropolis-Hastings

Suponha que queiramos simular uma vari´avel aleat´oria da densidade ℎ(·), de suporte ℋ. Escolhe-se uma densidade auxiliar 𝑔 : ℋ ↦→ [0, +∞), da qual Escolhe-se sabe gerar valores aleat´orios. Sob o algoritmo de Metropolis-Hastings, ℎ ´e vista como a distribui¸c˜ao estacion´aria de um processo aleat´orio Markovi-ano. Assim, seus valores s˜ao gerados atrav´es de uma cadeia de Markov e, de acordo com um crit´erio das condi¸c˜oes de balan¸co, estes valores podem ou n˜ao ser aceitos, segundo o esquema do Algoritmo B.1.

Note que da maneira como se define a probabilidade de aceita¸c˜ao, 𝑎, ´e suficiente saber o n´ucleo da densidade objetivo ℎ para que o algoritmo funcione. Uma desvantagem desta ferramenta ´e a arbitrariedade na escolha da fun¸c˜ao 𝑔, visto que ela interfere na taxa de aceita¸c˜ao e define, ent˜ao, a velocidade/efic´acia do procedimento Chib and Greenberg (1995).

Referências

Documentos relacionados

No sentido de reverter tal situação, a realização deste trabalho elaborado na disciplina de Prática enquanto Componente Curricular V (PeCC V), buscou proporcionar as

Para garantir a sustentabilidade de uma atividade típica de longo prazo, a Pradaria utiliza procedimentos operacionais compatíveis com as melhores práticas de uso do solo

As análises serão aplicadas em chapas de aços de alta resistência (22MnB5) de 1 mm de espessura e não esperados são a realização de um mapeamento do processo

Os principais objectivos definidos foram a observação e realização dos procedimentos nas diferentes vertentes de atividade do cirurgião, aplicação correta da terminologia cirúrgica,

3259 21 Animação e dinamização de actividades lúdico-expressivas - expressão musical 50 3260 22 Animação e dinamização de actividades lúdico-expressivas -

O objetivo deste artigo é justamente abordar uma metodologia alternativa para a elaboração de análises contábeis e financeiras, denominada de balanço perguntado e

O Workshop de Sensibilização foi realizado nos dias 22 e 23 de Agosto de 2003, no hotel Pergamont com representantes da Secretaria de Governo Municipal - SGM e a Secretaria

De fato, ao lermos Uma teoria da paródia, mesmo que a autora se refira constantemente ao potencial da ironia, apontando o contexto irônico como forma de ativação de passado