• Nenhum resultado encontrado

Modelos Hierárquicos Funcional e Dinâmico

N/A
N/A
Protected

Academic year: 2021

Share "Modelos Hierárquicos Funcional e Dinâmico"

Copied!
188
0
0

Texto

(1)

Modelos Hier´arquicos

Funcional e Dinˆamico

TESE DE DOUTORADO

por

Josiane S. Cordeiro Coelho

Universidade Federal do Rio de Janeiro

Instituto de Matem´atica

Departamento de M´etodos Estat´ısticos

Programa de P´os-Graduac¸˜ao em Estat´ıstica

(2)
(3)

Modelos Hier´arquicos Funcional e Dinˆamico

Josiane S. Cordeiro Coelho

Tese de doutorado submetida ao Corpo Docente do Instituto de Matem´atica - Departa-mento de M´etodos Estat´ısticos da Universidade Federal do Rio de Janeiro - UFRJ, como parte dos requisitos necess´arios `a obtenc¸˜ao do grau de Doutor em Estat´ıstica.

Orientador: Alexandra Mello Schmidt

Rio de Janeiro, RJ - Brasil Junho de 2014

(4)

FICHA CATALOGR ´AFICA

Coelho, Josiane da Silva Cordeiro.

Modelos Hier´arquicos Funcional e Dinˆamico / Josiane da Silva Cordeiro Coelho.

Rio de Janeiro: UFRJ, IM, DME, 2014.

Tese (Doutorado) - Universidade Federal do Rio de Janeiro, IM, DME. 1. Introduc¸˜ao.

2. Modelagem Funcional de Sinais Biom´edicos com Estrutura Hier´arquica 3. Modelagem Hier´arquica Dinˆamica de Sinais Biom´edicos

4. Modelos Hier´arquicos Robustos e Priori de Referˆencia. (Doutorado-UFRJ/IM/DME) I. Schmidt, Alexandra M. II. IM/UFRJ III. T´ıtulo.

(5)

Modelos Hier´arquicos Funcional e Dinˆamico

Josiane S. Cordeiro Coelho

Tese de doutorado submetida ao Corpo Docente do Instituto de Matem´atica - Departamento de M´etodos Estat´ısticos da Universidade Federal do Rio de Janeiro - UFRJ, como parte dos requisitos necess´arios `a obtenc¸˜ao do grau de Doutor em Estat´ıstica.

Aprovada por:

Profa. Alexandra M. Schmidt.

Ph.D. - IM - UFRJ - Presidente.

Prof. Dani Gamerman. Ph.D. - IM - UFRJ.

Profa. Tha´ıs Fonseca.

D.Sc. - IM - UFRJ.

Prof. Francisco Louzada. D.Sc. - ICMC - USP.

Prof. Ronaldo Dias. D.Sc. - IMECC - UNICAMP. Rio de Janeiro, RJ - Brasil

(6)
(7)

Agradecimentos

Agradec¸o a Deus por cada oportunidade e experiˆencia vividas, pela forc¸a e sa´ude concedi-das, pela imensa grac¸a e amor que me fazem crescer a cada dia. E, pelos muitos milagres.

`

A minha orientadora Alexandra pelo incentivo, conhecimento, dedicac¸˜ao e fraternidade durante todos os meus anos de p´os-graduac¸˜ao. Ao meu coorientador H´elio por todo conhe-cimento compartilhado, cordialidade e imenso prazer demonstrados em fazer seu trabalho. A todos os outros professores da p´os-graduac¸˜ao do DME pelas diversas contribuic¸˜oes em minha formac¸˜ao acadˆemica.

`

A Capes pela bolsa concedida durante 4 anos do doutorado. Ao DEMAT/UFRRJ pela colaborac¸˜ao e dispensas que foram necess´arias para a conclus˜ao deste trabalho. Aos meus colegas e amigos tamb´em deste departamento por todo incentivo.

Ao professor Gauss Cordeiro por me apresentar a func¸˜ao Meijer G a fim de resolver uma integral que surge no Cap´ıtulo 4 desta tese.

Ao meu amado esposo Felipe pela compreens˜ao di´aria, forc¸a nos diversos momentos, ajuda tanto nas tarefas dom´esticas quanto em aulas, contas e programas, por muitas vezes abrir m˜ao de si mesmo por mim, e pelo amor.

`

A minha fam´ılia amada que cresceu mais ainda com a inclus˜ao da fam´ılia do Felipe. Aos meus pais, Josias e Maria, que n˜ao consigo dimensionar ou descrever o tanto que fazem por mim, com diversas lutas e conquistas que vivemos juntos. M˜ae, valeu a pena brigar para po-der me colocar naquele “Brizol˜ao” onde n˜ao aceitavam uma menina de 5 anos na classe de alfabetizac¸˜ao. Aos meus irm˜aos que s˜ao companheiros e que foram feitos sob medida para mim, auxiliando em diversas situac¸˜oes, um com todo o seu conhecimento matem´atico, We-lington, e o outro com sua disponibilidade sem medida, Welton. Aos meus sogros, cunhados, novos avˆos que s˜ao maravilhosos, tios(as), primos(as), enfim, todos familiares e amigos pelo amor, carinho e compreens˜ao.

Aos meus amigos especiais que fiz no DME/UFRJ, que comecei listando mas voltei atr´as porque achei injusto n˜ao escrever o nome de todos. Nossos momentos de superac¸˜ao e de divers˜ao levarei para sempre em meu corac¸˜ao e, sei que teremos muitos mais.

(8)

Resumo

Nesta tese, temos interesse na modelagem de um conjunto de sinais estruturados tempo-ralmente e aninhados. Este tipo de modelagem ´e relevante em diversos problemas como, por exemplo, aqueles envolvendo a an´alise de sinais biom´edicos. Baseados na equivalˆencia entre suavizac¸˜ao por splines e modelos dinˆamicos, propomos dois modelos distintos a fim de eluci-darmos quest˜oes inerentes `a doenc¸a conhecida como fenˆomeno de Raynaud (FR), que ocorre devido a espasmos dos vasos sangu´ıneos. Temos dispon´ıvel uma amostra de indiv´ıduos per-tencentes a duas formas diferentes de FR e um grupo de controle. Para cada indiv´ıduo, temos v´arias s´eries temporais geradas atrav´es de t´ecnicas de imagem infravermelha t´ermica. Estes sinais representam curvas de temperaturas medidas na ponta dos dedos das m˜aos, os quais documentam a recuperac¸˜ao t´ermica de um indiv´ıduo a partir de um estresse t´ermico (frio) padronizado. Primeiro, consideramos os dados como amostras de curvas de temperaturas, e propomos um modelo hier´arquico funcional cuja func¸˜ao m´edia envolve uma expans˜ao por K func¸˜oes bases B-splines e com estrutura de covariˆancia que permite correlac¸˜oes entre as dife-rentes curvas dos dedos, correlac¸˜oes entre m˜aos e ao longo do tempo. Nossos resultados trazem v´arias elucidac¸˜oes interessantes no contexto da doenc¸a. Por outro lado, propomos um modelo hier´arquico dinˆamico que tamb´em ´e capaz de descrever a natureza hier´arquica dos dados e as variabilidades dentro e entre as curvas. Mostramos que este modelo sugere diferenciac¸˜oes claras entre os grupos estudados. Motivados por este problema de diferenciac¸˜ao entre gru-pos, exploramos modelos hier´arquicos robustos com apenas um ´unico n´ıvel a fim de acomodar poss´ıveis observac¸˜oes discrepantes e/ou grupos discrepantes que levam a mudanc¸as estruturais. Neste contexto, exploramos modelos t-Student e derivamos distribuic¸˜oes a priori de referˆencia para seus graus de liberdade sob diversas parametrizac¸˜oes destes modelos hier´arquicos. Para ilustrar o desempenho das distribuic¸˜oes a priori encontradas neste tipo de problema, realiza-mos um estudo simulado e aplicarealiza-mos a dois conjuntos de dados reais, comparando com outras distribuic¸˜oes dispon´ıveis na literatura.

Palavras Chaves: modelos hier´arquicos, inferˆencia bayesiana, processos gaussianos, B-splines, modelos hier´arquicos dinˆamicos, priori de referˆencia, fenˆomeno de Raynaud.

(9)

Abstract

In this thesis, we are interested in modeling a set of temporally and nested structured sig-nals. This type of modeling is relevant in several problems, for example, those involving the analysis of biomedical signals. Based on the equivalence between smoothing splines and dy-namic models, we propose two distinct models to elucidate issues related to the Raynaud’s phenomenon (RP), a disease that occurs because of spasm of blood vessels. We have avai-lable a sample of individuals belonging to two different forms of RP and a control group. For each individual we have multiple time series generated through thermal infrared imaging techniques. These signals represent fingertip temperature curves documenting the thermal re-covery of an individual from a standardized thermal (cold) stress. First, we consider the data as samples of temperature curves, and we propose a functional hierarchical model where the mean function involves an expansion of K B-splines functions and covariance structure that allows correlations between the different curves of the fingers, correlations between hands and correlations across time. Our results provide several interesting elucidations in the context of disease. Furthermore, we propose a dynamic hierarchical model which is also able to describe the hierarchical nature of the data and variability within and between curves. We show that this model suggests clear differences between the groups. Motivated by this problem of differenti-ating between groups, we explore robust hierarchical models with only a single level in order to accommodate possible outliers and/or disparate groups that lead to structural changes. In this context, we explore Student-t models and derive reference priors to its degrees of freedom under various parameterizations of these hierarchical models. To illustrate the performance of the refrence priors encountered for this kind of problem, we conducted a simulation study and applied to two real data sets, comparing with other prior distributions available in the literature. Key Words: hierarchical model, Bayesian inference, Gaussian processes, B-splines, dyna-mic hierarchical model, reference prior, Raynaud’s Phenomenon.

(10)

Sum´ario

1 Introduc¸˜ao 1

1.1 Modelos Hier´arquicos . . . 5

1.2 Motivac¸˜ao . . . 6

1.2.1 Imagem Infravermelha T´ermica . . . 7

1.2.2 Processamento dos Dados . . . 8

1.3 Organizac¸˜ao do Texto . . . 10

2 Modelagem Funcional de Sinais Biom´edicos com Estrutura Hier´arquica 12 2.1 Dados Funcionais . . . 13

2.2 Splines Polinomiais . . . 14

2.3 Processos Gaussianos . . . 16

2.4 Equivalˆencia entre Suavizac¸˜ao por Splines Polinomiais e Processos Gaussianos 17 2.5 Um modelo funcional n˜ao-param´etrico hier´arquico . . . 19

2.5.1 Modelando a func¸˜ao m´edia . . . 19

2.5.2 Modelando a func¸˜ao de covariˆancia . . . 22

2.5.3 Procedimento de Inferˆencia . . . 26

2.5.4 Comparac¸˜ao de Modelos . . . 27

2.6 An´alise de Dados . . . 29

2.7 Conclus˜ao . . . 41

3 Modelagem Hier´arquica Dinˆamica de Sinais Biom´edicos 43 3.1 Modelos Lineares Dinˆamicos Normais (MLDN) . . . 44

(11)

3.3 Equivalˆencia entre Splines Polinomiais e Modelos

Lineares Dinˆamicos . . . 47

3.4 Modelo Hier´arquico Dinˆamico (MHD) . . . 50

3.5 Modelagem Dinˆamica de Sinais Biom´edicos com Estrutura Hier´arquica . . . . 53

3.5.1 Modelando a estrutura de covariˆancia Ωgi . . . 55

3.5.2 Procedimento de Inferˆencia . . . 56

3.6 An´alise de Dados . . . 58

3.6.1 Distribuic¸˜ao Preditiva . . . 68

3.7 Conclus˜ao . . . 71

4 Modelos Hier´arquicos Robustos e Priori de Referˆencia 74 4.1 Modelos Robustos . . . 75

4.2 Priori de Referˆencia . . . 79

4.3 Priori de Referˆencia sob a Distribuic¸˜ao t-Student na Equac¸˜ao da Observac¸˜ao . . 94

4.3.1 Priori de Referˆencia Marginalizando o Modelo em Relac¸˜ao a φ . . . . 95

4.3.2 Priori de Referˆencia Marginalizando o Modelo em Relac¸˜ao a µ . . . . 96

4.3.3 Priori de Referˆencia com Variˆancias Desconhecidas . . . 98

4.4 Priori de Referˆencia sob a Distribuic¸˜ao t-Student na Equac¸˜ao Estrutural . . . 99

4.4.1 Priori de Referˆencia Marginalizando o Modelo em Relac¸˜ao a λ . . . . 100

4.4.2 Priori de Referˆencia Marginalizando o Modelo em Relac¸˜ao a µ . . . . 101

4.4.3 Priori de Referˆencia com Variˆancias Desconhecidas . . . 102

4.5 Priori de referˆencia sob a Distribuic¸˜ao t-Student na Equac¸˜ao de Observac¸˜ao e na Equac¸˜ao Estrutural . . . 103

4.5.1 Priori de Referˆencia Marginalizando em Relac¸˜ao a λ . . . 103

4.5.2 Priori de Referˆencia Marginalizando em Relac¸˜ao a φ . . . 104

4.5.3 Priori de Referˆencia Marginalizando em Relac¸˜ao a φ e a λ . . . 105

4.6 Estudo Simulado . . . 105

4.6.1 An´alise dos Resultados sob o modelo com t-Student na equac¸˜ao obser-vacional - apresentado na Sec¸˜ao 4.3 . . . 107

(12)

4.6.2 An´alise dos Resultados sob o modelo com t-Student na equac¸˜ao

estru-tural - apresentado na Sec¸˜ao 4.4 . . . 111

4.7 Aplicac¸˜oes . . . 115

4.7.1 Exemplo West (1984) . . . 115

4.7.2 Dados dos Pesos de Ratos . . . 127

4.8 Discuss˜ao . . . 134

A Distribuic¸˜oes Condicionais Completas a Posteriori 144 A.1 Sob o Modelo descrito na Sec¸˜ao 2.5 . . . 144

A.2 Sob o Modelo descrito na Sec¸˜ao 3.5 . . . 147

A.3 Sob os Modelos descritos na Sec¸˜ao 4.6 . . . 149

A.3.1 Sob o Modelo com t-Student na Equac¸˜ao de Observac¸˜ao Marginal em φ 149 A.3.2 Sob o Modelo com t-Student na Equac¸˜ao Estrutural Marginal em λ . . 150

A.4 Sob o Modelo descrito na Sec¸˜ao 4.7.1 com t-Student em Ambas as Equac¸˜oes de Observac¸˜ao e Estrutural . . . 150

A.5 Sob o Modelo descrito na Sec¸˜ao 4.7.2 . . . 152

B C´alculos envolvidos na derivac¸˜ao das distribuic¸˜oes a priori de referˆencia do Cap´ıtulo 4 154 B.1 Sob a Distribuic¸˜ao t-Student na Equac¸˜ao da Observac¸˜ao . . . 154

B.1.1 Marginalizando o Modelo em Relac¸˜ao a µ . . . 155

B.1.2 Supondo as Variˆancias Desconhecidas . . . 156

B.2 Sob a Distribuic¸˜ao t-Student na Equac¸˜ao Estrutural . . . 157

B.2.1 Marginalizando o Modelo em Relac¸˜ao a λ . . . 158

B.2.2 Marginalizando o Modelo em Relac¸˜ao a µ . . . 159

B.2.3 Supondo as Variˆancias Desconhecidas . . . 160

B.3 Sob a Distribuic¸˜ao t-Student em Ambas as Equac¸˜oes de Observac¸˜ao e Estrutural 161 B.3.1 Marginalizando o Modelo em relac¸˜ao a λ . . . 162

C Resultados para C´alculos de Esperanc¸as 164 C.1 Algumas Esperanc¸as . . . 164

(13)

C.1.1 Func¸˜ao Meijer G . . . 164 C.2 C´alculo da esperanc¸a Eφ−k(φ−1V + s)−r, para φ ∼ G(ν/2, ν/2) . . . 165

(14)

Lista de Tabelas

2.1 Valores de EPD, DIC e CRPS, e suas respectivas componentes, para cada mo-delo ajustado. Valores menores de D, DIC e CRPS indicam momo-delos melhores.

. . . 31 2.2 Resumo a posteriori, m´edia e limites do intervalo de 95% de credibilidade (em

parˆenteses), das correlac¸˜oes entre os dedos das m˜aos de qualquer indiv´ıduo (resumo a posteriori dos elementos da matriz de correlac¸˜ao Γ). . . 33 3.1 Crit´erios de comparac¸˜ao de modelos: valores do crit´erio da informac¸˜ao da

desviˆancia e suas componentes (DIC) para os modelos M1-M5. A ´ultima co-luna mostra os valores do crit´erio do continuous ranking probability (CRPS).

. . . 59 3.2 Resumo a posteriori, m´edia e limites do intervalo de 95% de credibilidade (em

parˆenteses), das correlac¸˜oes entre os dedos das m˜aos de um indiv´ıduo gen´erico (resumo a posteriori dos elementos da matriz de correlac¸˜ao Γ). Resultados obtidos sob o modelo M4. . . 68 3.3 Log-Verossimilhanc¸a preditiva avaliada sob cada grupo e para os dois

conjun-tos de validac¸˜ao no procedimento de classificac¸˜ao. O grupo ao qual o mo-delo indica que o indiv´ıduo pertence ´e denotado em it´alico e os n´umeros em parˆentesis na primeira coluna representam o n´umero de identificac¸˜ao do in-div´ıduo amostrado. Resultados obtidos sob o modelo M4. . . 70 4.1 Efeito da aplicac¸˜ao de tratamento de enxofre na reduc¸˜ao de doenc¸as em batatas. 77 4.2 Cen´arios considerados na simulac¸˜ao. . . 105

(15)

4.3 Crit´erios de comparac¸˜ao de modelos: valores de EPD e DIC, e suas respec-tivas componentes, e do CRPS, e o log da verossimilhanc¸a para cada modelo ajustado. . . 131 4.4 Resumo a posteriori dos graus de liberdade ν. Mediana e intervalos de 95%

(16)

Lista de Figuras

1.1 Dinˆamicas das curvas de reaquecimento por grupo para todos os dedos de todos os indiv´ıduos na amostra. Painel `a esquerda: indiv´ıduos do grupo saud´avel (HC). Painel do meio: indiv´ıduos do grupo no caso prim´ario (PRP). Painel `a direita: indiv´ıduos do grupo com esclerose sistˆemica (SS). . . 9 1.2 Temperatura m´edia atrav´es do tempo e dedos para cada um dos 72 indiv´ıduos. . 10 2.1 Painel superior esquerdo: resumo a posteriori (m´edia e intervalo de 95% de

credibilidade) das variˆancias (τg2) da temperatura de qualquer indiv´ıduo dentro do grupo g. Painel superior direito: resumo a posteriori (m´edia e intervalo de 95% de credibilidade) dos parˆametros de decaimento (φg) para cada grupo,

HC, PRP, e SS. Painel inferior esquerdo: distribuic¸˜ao a posteriori da correlac¸˜ao entre as m˜aos de qualquer indiv´ıduo dentro do grupo g (ρg). Painel inferior

direito: distribuic¸˜ao a posteriori da variˆancia do erro de medic¸˜ao (ν2). . . 32 2.2 Resumo a posteriori (m´edia (c´ırculos) e intervalo de 95% de credibilidade

(li-nhas s´olidas)) da m´edia global µgi ao longo dos indiv´ıduos do grupo saud´avel

(HC), do caso prim´ario e com esclerose sistˆemica (SS). As trˆes linhas traceja-das preta representam o intervalo de 95% de credibilidade da respectiva m´edia global (µg) do grupo e os triˆangulos as m´edias a posteriori dos grupos. . . 34

2.3 Resumo a posteriori das curvas de temperatura de trˆes dedos de trˆes indiv´ıduos dos grupos: HC (primeira coluna), PRP (coluna do meio), e SS (´ultimo coluna). Para todos os pain´eis, as linhas s´olidas representam a m´edia a posteriori da curva de temperatura do indiv´ıduo, a ´area sombreada ´e o respectivo intervalo de 95% de credibilidade, e os c´ırculos representam os dados observados. . . 35

(17)

2.4 Resumo a posteriori das curvas de temperatura de trˆes indiv´ıduos: nos grupos HC (primeiro painel), PRP (painel do meio), e SS (´ultimo painel). Para todos os pain´eis, as linhas s´olidas representam a m´edia a posteriori da curva de tem-peratura do indiv´ıduo, a ´area sombreada ´e o respectivo intervalo de 95% de credibilidade, e as outras linhas (uma para cada dedo diferente) representam as respectivas curvas de temperatura m´edia de cada dedo do indiv´ıduo. . . 36 2.5 Resumo a posteriori das curvas de temperatura por grupo: nos grupos HC

(primeiro painel), PRP (painel do meio), e SS (´ultimo painel). Para todos os pain´eis, as linhas s´olidas representam a m´edia a posteriori da curva de tempe-ratura do grupo, a ´area sombreada ´e o respectivo intervalo de 95% de credibili-dade, e as linhas pontilhadas representam as curvas de temperatura m´edia dos indiv´ıduos dentro do seu respectivo grupo. . . 37 2.6 Distinc¸˜ao entre as curvas m´edias de reaquecimento a posteriori dos trˆes grupos:

HC (painel esquerdo), PRP e SS (painel direito). . . 38 2.7 Resumo a posteriori das curvas de temperatura de trˆes dedos de trˆes indiv´ıduos

dos grupos: HC (primeira coluna), PRP (coluna do meio), e SS (´ultima coluna). Para todos os pain´eis, as linhas s´olidas representam a m´edia a posteriori da curva de temperatura do indiv´ıduo, a ´area sombreada ´e o respectivo intervalo de 95% de credibilidade, e os c´ırculos representam os dados observados. . . 39 2.8 Distinc¸˜ao entre as curvas m´edias de reaquecimento a posteriori dos trˆes grupos.

M´edia a posteriori da temperatura m´edia do grupo HC (linha tracejada menor), PRP (linha tracejada maior) e SS (linha cheia), e seus limites do intervalo de 95% de credibilidade (linhas pontilhadas), PRP (linhas tracejadas/pontilhadas) e SS (sombra cinza). . . 40

(18)

3.1 Resumo a posteriori das curvas de temperatura de trˆes dedos de trˆes indiv´ıduos dos grupos: HC (primeira coluna), PRP (coluna do meio), e SS (´ultima co-luna). Para todos os pain´eis, as linhas s´olidas representam a m´edia a posteriori da curva de temperatura do indiv´ıduo, a ´area sombreada ´e o respectivo inter-valo de 95% de credibilidade, e os c´ırculos representam os dados observados. Resultados sob o modelo M4. . . 61 3.2 Painel esquerdo: resumo a posteriori (m´edia e limites do intervalo de 95%

de credibilidade em parˆentesis) da temperatura m´edia global, θ4(t). Painel

direito: M´edia a posteriori da temperatura m´edia de cada grupo θ3g(t) HC

(linha tracejada menor), PRP (linha tracejada maior) e SS (linha cheia), e seus limites do intervalo de 95% de credibilidade (linhas pontilhadas), PRP (linhas tracejadas/pontilhadas) e SS (sombra cinza). Resultados obtidos sob o modelo M4. . . 63 3.3 Resumo a posteriori (m´edia - linha s´olida e limites do intervalo de 95% de

credibilidade - ´area sombreada) da temperatura m´edia de cada grupo, θ3g(t).

Linhas tracejadas representam as temperaturas m´edia, θ2gi(t), dos indiv´ıduos

nos seus respectivos grupos. Resultados sob o modelo M4. . . 64 3.4 Resumo a posteriori (m´edia - linha s´olida e limites do intervalo de 95% de

cre-dibilidade - ´area sombreada) da temperatura m´edia de trˆes indiv´ıduos, θ2gi(t),

um de cada grupo. Linhas tracejadas representam as temperaturas m´edia, θ1gij(t), dos dedos de cada um destes indiv´ıduos. Resultados sob o modelo

M4. . . 65 3.5 Distribuic¸˜oes a posteriori das variˆancias, ν2, W , σ2 (1a coluna), u1, u2, e u3

(19)

3.6 Resumo das distribuic¸˜oes a posteriori (intervalos de 95% de credibilidade (seg-mentos) e m´edia a posteriori (c´ırculos abertos)) das variˆancias dos dedos de cada m˜ao, de cada indiv´ıduo dentro de um grupo, isto ´e, os elementos da dia-gonal da matriz de covariˆancia Ωgi. Para os pain´eis (a) e (b) a primeira linha

representa indiv´ıduos no grupo HC, a segunda linha no grupo PRP, e a terceira linha no grupo SS, para as m˜aos esquerda e direita, respectivamente. Resulta-dos obtiResulta-dos sob o modelo M4. . . 67 3.7 S´eries m´edias dos indiv´ıduos 45 e 46 que s˜ao deixados fora do procedimento

de classificac¸˜ao (ver tamb´em Tabela 3.3). Resultados sob o modelo M4. . . 71 4.1 Priori de referˆencia para o modelo exponencial com parˆametro θ, calculada

nu-mericamente para uma sequˆencia de valores de θ atrav´es do algoritmo (c´ırculos) sobreposta a priori de referˆencia expl´ıcita 1/θ, multiplicada por 5,2 (linha cont´ınua). . . 88 4.2 Priori de referˆencia para o modelo t-Student padr˜ao com ν graus de liberdade,

calculada numericamente para uma sequˆencia de valores de ν atrav´es do algo-ritmo (c´ırculos) sobreposta a priori de Jeffreys (linha cont´ınua). . . 89 4.3 Raiz quadrada do erro quadr´atico m´edio relativo dos estimadores de ν

base-ados na priori Geweke com λ = 0, 1 (quadrbase-ados), na priori J-S com d = 10 (triˆangulos) e a priori de referˆencia proposta na equac¸˜ao (4.20) (c´ırculos) para os diferentes cen´arios. Os diferentes tamanhos de amostra, n × J = 6 × 4, n × J = 12 × 8 e n × J = 20 × 15 s˜ao distinguidos nas colunas e, os valores da constante k, para 0, 1; 0, 5; 0, 8, nas linhas. . . 108 4.4 Vi´es dos estimadores de ν baseados na priori Geweke com λ = 0, 1

(quadra-dos), na priori J-S com d = 10 (triˆangulos) e a priori de referˆencia proposta na equac¸˜ao (4.20) (c´ırculos). Os diferentes tamanhos de amostra, n × J = 6 × 4, n × J = 12 × 8 e n × J = 20 × 15 s˜ao distinguidos nas colunas e, os valores da constante k, para 0, 1; 0, 5; 0, 8, nas linhas. . . 109

(20)

4.5 Cobertura frequentista dos intervalos de 95% de credibilidade dos estimado-res de ν baseados na priori Geweke com λ = 0, 1 (quadrados), na priori J-S com d = 10 (triˆangulos) e a priori de referˆencia proposta na equac¸˜ao (4.20) (c´ırculos). Os diferentes tamanhos de amostra, n × J = 6 × 4, n × J = 12 × 8 e n × J = 20 × 15 s˜ao distinguidos nas colunas e, os valores da constante k, para 0, 1; 0, 5; 0, 8, nas linhas. . . 110 4.6 Raiz quadrada do erro quadr´atico m´edio relativo dos estimadores de ν

base-ados na priori Geweke com λ = 0, 1 (quadrbase-ados), na priori J-S com d = 10 (triˆangulos) e a priori de referˆencia proposta na equac¸˜ao (4.27) (c´ırculos). Os diferentes tamanhos de amostra, n×J = 6×4, n×J = 12×8 e n×J = 20×15 s˜ao distinguidos nas colunas e, os valores da constante k, para 0, 1; 0, 5; 0, 8, nas linhas. . . 112 4.7 Vi´es dos estimadores de ν baseados na priori Geweke com λ = 0, 1

(quadra-dos), na priori J-S com d = 10 (triˆangulos) e a priori de referˆencia proposta na equac¸˜ao (4.27) (c´ırculos). Os diferentes tamanhos de amostra, n × J = 6 × 4, n × J = 12 × 8 e n × J = 20 × 15 s˜ao distinguidos nas colunas e, os valores da constante k, para 0, 1; 0, 5; 0, 8, nas linhas. . . 113 4.8 Cobertura frequentista dos intervalos de 95% de credibilidade dos

estimado-res de ν baseados na priori Geweke com λ = 0, 1 (quadrados), na priori J-S com d = 10 (triˆangulos) e a priori de referˆencia proposta na equac¸˜ao (4.27) (c´ırculos). Os diferentes tamanhos de amostra, n × J = 6 × 4, n × J = 12 × 8 e n × J = 20 × 15 s˜ao distinguidos nas colunas e, os valores da constante k, para 0, 1; 0, 5; 0, 8, nas linhas. . . 114 4.9 Resumo a posteriori com linhas cont´ınuas representando os intervalos de 95%

de credibilidade e c´ırculos fechados as medianas, sob diferentes especificac¸˜oes para ν: priori Geweke (G); priori de referˆencia (R); modelo normal (N); t-Student com ν = 2 (t). Painel superior esquerdo: graus de liberdade ν. Painel superior direito: m´edia global µ. Painel inferior esquerdo: variˆancia σ2.

(21)

4.10 Resumo a posteriori das m´edias por grupo, µi, com linhas cont´ınuas

represen-tando os intervalos de 95% de credibilidade e c´ırculos fechados as medianas, sob o modelo normal e as diferentes especificac¸˜oes para ν (St-t(2), Geweke e Reference). Resultados sob o modelo com t-Student na equac¸˜ao de observac¸˜ao. 118 4.11 Resumo a posteriori das escalas φij, por unidade j dentro de cada grupo i, com

linhas cont´ınuas representando os intervalos de 95% de credibilidade e c´ırculos fechados as medianas, sob as diferentes especificac¸˜oes para ν (St-t(2), Geweke e Reference). As linhas pontilhadas verticais dividem os indiv´ıduos de cada grupo. Resultados sob o modelo com t-Student na equac¸˜ao de observac¸˜ao. . . 119 4.12 Resumo a posteriori com linhas cont´ınuas representando os intervalos de 95%

de credibilidade e c´ırculos fechados as medianas sob diferentes especificac¸˜oes para ν: priori Geweke (G); priori de referˆencia (R); modelo normal (N); t-Student com ν = 2 (t). Painel superior esquerdo: graus de liberdade ν. Painel superior direito: m´edia global µ. Painel inferior esquerdo: variˆancia σ2.

Re-sultados sob o modelo com t-Student na equac¸˜ao estrutural. . . 120 4.13 Resumo a posteriori das m´edias por grupo, µi, com linhas cont´ınuas

represen-tando os intervalos de 95% de credibilidade e c´ırculos fechados as medianas, sob o modelo normal e as diferentes especificac¸˜oes para ν (St-t(2), Geweke e Reference). Resultados sob o modelo com t-Student na equac¸˜ao estrutural. . . . 121 4.14 Resumo a posteriori das escalas λi, por grupo i, com linhas cont´ınuas

represen-tando os intervalos de 95% de credibilidade e c´ırculos fechados as medianas, sob as diferentes especificac¸˜oes para ν (St-t(2), Geweke e Reference). Resul-tados sob o modelo com t-Student na equac¸˜ao estrutural. . . 123 4.15 Resumo a posteriori com linhas cont´ınuas representando os intervalos de 95%

de credibilidade e c´ırculos fechados as medianas sob diferentes especificac¸˜oes para ν: priori Geweke (G); priori de referˆencia (R); modelo normal (N); t-Student com ν = 2 (t). Painel superior esquerdo: graus de liberdade ν. Painel superior direito: m´edia global µ. Painel inferior esquerdo: variˆancia σ2.

(22)

4.16 Resumo a posteriori das m´edias por grupo, µi, com linhas cont´ınuas

represen-tando os intervalos de 95% de credibilidade e c´ırculos fechados as medianas, sob diferentes especificac¸˜oes para ν (St-t(2), Geweke e Reference). Resultados sob o modelo com t-Student nas equac¸˜oes de observac¸˜ao e estrutural. . . 125 4.17 Resumo a posteriori das escalas φij, por unidade j dentro de cada grupo i, com

linhas cont´ınuas representando os intervalos de 95% de credibilidade e c´ırculos fechados as medianas, sob diferentes especificac¸˜oes para ν (St-t(2), Geweke e Reference). As linhas pontilhadas verticais dividem os indiv´ıduos de cada grupo. Resultados sob o modelo com t-Student nas equac¸˜oes de observac¸˜ao e estrutural. . . 126 4.18 Resumo a posteriori das escalas λi, por grupo i, com linhas cont´ınuas

represen-tando os intervalos de 95% de credibilidade e c´ırculos fechados as medianas, sob diferentes especificac¸˜oes para ν (St-t(2), Geweke e Reference). Resultados sob o modelo com t-Student nas equac¸˜oes de observac¸˜ao e estrutural. . . 127 4.19 Pesos ao longo de 5 semanas para os 30 ratos. Linhas pontilhadas destacam as

duas s´eries mais discrepantes. . . 128 4.20 Resumo a posteriori das escalas λi por rato i, sob os modelos Normal (N),

Reference (R) e Geweke com λ = 0, 05 (G). Linhas cont´ınuas representam os intervalos de 95% de credibilidade e os c´ırculos fechados representam as m´edias.133 4.21 Resumo a posteriori da m´edia global dos pesos (α), do efeito global das idades

(β), do intercepto no instante do nascimento (α0) e da variˆancia observacional

(σ2) sob os modelos Normal (N), Reference (R) e Geweke com λ = 0, 05

(G). Linhas cont´ınuas representam os intervalos de 95% de credibilidade, os c´ırculos fechados representam as m´edias e as linhas tracejadas representam os valores m´edios das estimativas sob o modelo Normal . . . 134

(23)

Cap´ıtulo 1

Introduc¸˜ao

Tecnologias modernas de aquisic¸˜ao de dados geram grandes conjuntos de dados coletando v´arias medidas que descrevem, por exemplo, na ´area biom´edica: atividades cerebrais, de teci-dos ou de c´elulas. Recentemente, o desenvolvimento de aplicac¸˜oes computacionais no campo das ciˆencias da vida, em particular para os ambientes cl´ınicos e biom´edicos, tamb´em ganhou uma atenc¸˜ao crescente devido aos resultados promissores no tratamento de pacientes. De fato, as potenciais aplicac¸˜oes no campo biom´edico incluem a construc¸˜ao de regras de diagn´ostico ou de progn´ostico e, em geral, isto ´e quase imposs´ıvel sem a ajuda de t´ecnicas estat´ısticas e de computac¸˜ao eficientes.

Aplicac¸˜oes biom´edicas utilizando t´ecnicas de estat´ıstica multivariada formam uma ´area de interesse importante que tem sido investigada por v´arios pesquisadores cient´ıficos. Sinais biom´edicos se originam a partir de uma variedade de fontes, tais como sinais bioel´etricos, bi-oac´usticos, biomecˆanicos, bioqu´ımicos e biomagn´eticos. Em v´arios experimentos estes sinais surgem atrav´es de um processo naturalmente descrito como funcional, embora os registros se-jam de dados discretos ao longo do tempo e, assim, o conjunto de dados ´e dito ser funcional. Como uma s´erie temporal ´e um conjunto de observac¸˜oes ordenadas ao longo do tempo, estes dados observados podem ser tratados como s´eries temporais. De fato, ´e uma pr´atica comum na pesquisa biom´edica realizar registros de m´ultiplas s´eries temporais e isso ´e especialmente verdadeiro para eletro- ou magneto-encefalografia (Kami´nski et al., 2005) e estudos de imagem t´ermica infravermelha - IR - (Merla et al., 2002a). O registro do estado do paciente em con-juntos de dados multivariados ´e, assim, um procedimento padr˜ao di´ario da vida cl´ınica. Uma

(24)

tarefa importante para analisar esses dados ´e extrair a informac¸˜ao essencial representativa dos processos biol´ogicos ou biof´ısicos subjacentes. No entanto, n˜ao existe uma ´unica abordagem que pode ser considerada de modo uniforme como sendo a soluc¸˜ao mais apropriada para um problema espec´ıfico. A escolha da abordagem ´e geralmente ditada pelo objetivo do estudo, se ´e a obtenc¸˜ao de previs˜oes dos sinais, estimac¸˜ao de tendˆencias ou aumento do conhecimento cient´ıfico dos mecanismos subjacentes. Em qualquer caso, seja qual for a escolha para a mode-lagem dos dados dispon´ıveis, devem haver crit´erios derivados dos pr´oprios dados para julgar o que ´e a dinˆamica inerente e quais s˜ao as contribuic¸˜oes de fatores externos e ru´ıdos nos dados. Nas formulac¸˜oes dos nossos modelos, vamos mostrar que podemos cuidar desses aspectos para a an´alise estat´ıstica.

O foco deste trabalho ´e a modelagem de dados com estrutura hier´arquica (aninhada). Neste contexto, temos interesse em dados que representam fam´ılias de s´eries temporais biom´edicas e que compartilham um forte relacionamento f´ısico. A necessidade do estudo de s´eries observa-das ocorre em v´arios problemas m´edicos e psico-fisiol´ogicos. Um exemplo cl´assico ´e na ´area de cardiologia, onde os sinais de eletrocardiograma de pacientes diferentes s˜ao classificados a fim de ver se determinado tipo de pacientes tˆem um padr˜ao diferente de um grupo de controle saud´avel (HC), por exemplo, pacientes com hist´orico de alguma doenc¸a. Outros estudos de caso podem ser encontrados, por exemplo, em Fontanella et al. (2012) e Ramsay e Silverman (2002).

A modelagem de m´ultiplas s´eries requer manejo adequado a fim de se obter resultados apropriados. Por exemplo, o estudo de cada sinal separadamente e, portanto, negligenciando a estrutura de covariˆancia subjacente “completa”(ou seja, as interdependˆencias dentro e entre as s´eries temporais) dos dados, pode levar a resultados que podem ser mal interpretados. Por outro lado, uma an´alise simultˆanea de todos os sinais pode proporcionar uma vis˜ao melhor das relac¸˜oes entre as fontes investigadas a partir das quais as s´eries se originam e tamb´em permite estimativas de propriedades ao n´ıvel individual. Existem v´arias caracter´ısticas que devem ser consideradas na modelagem de fam´ılias de s´eries. Aquelas que s˜ao relevantes para o nosso trabalho s˜ao as seguintes:

(25)

b) estimac¸˜ao das s´eries individuais dos dados com ru´ıdos; c) caracterizac¸˜ao de padr˜oes de variabilidade entre as s´eries; d) caracterizac¸˜ao da hierarquia aninhada das s´eries;

e) modelagem da correlac¸˜ao para cada s´erie e entre as s´eries.

O desenvolvimento te´orico dos ´ultimos trˆes pontos representam uma parte metodol´ogica importante do nosso trabalho. Em geral, a estimac¸˜ao de matrizes de covariˆancia constitui um problema dif´ıcil e isto n˜ao ´e uma excec¸˜ao no nosso estudo, onde tamb´em consideramos o problema adicional de parametrizar a matriz de covariˆancias para m´ultiplos sinais dentro de um indiv´ıduo. Diferentemente de v´arios outros estudos, consideramos a modelagem de um conjunto de sinais replicados com uma estrutura hier´arquica e que tamb´em s˜ao correlacionados no n´ıvel mais alto da hierarquia.

Devido a natureza destas s´eries, podemos consider´a-las amostras de func¸˜oes/curvas, ou seja, dados funcionais. V´arios estudos na literatura padr˜ao de an´alise de dados funcionais, dis-cutidos por exemplo em Ramsay e Silverman (2005), utilizam combinac¸˜oes lineares de splines para descrever func¸˜oes suaves do tempo. Aplicac¸˜oes mais recentes s˜ao tamb´em fornecidas por Behseta et al. (2005) e Baladandayuthapani et al. (2008), com o ´ultimo propondo um modelo baseado em splines, que permite a modelagem da correlac¸˜ao espacial entre func¸˜oes. Entre-tanto, o uso de splines requer a fixac¸˜ao do n´umero e da localizac¸˜ao dos n´os. Stone et al. (1997) e Smith e Kohn (1996) fornecem soluc¸˜oes para a selec¸˜ao dos n´os com uma ´unica curva, mas para nosso caso, com m´ultiplas curvas, seria necess´ario estender estas t´ecnicas. Botts e Dani-els (2008) sugerem o uso de m´etodos de Monte Carlo via cadeias de Markov (MCMC) com saltos revers´ıveis que, na pr´atica, tornam a abordagem computacionalmente intensiva. Neste contexto, Ferreira e Sanyal (2014) estendem os algoritmos de MCMC evolucion´arios, que s˜ao mais eficientes em modelos multiparam´etricos, para uma nova classe chamada por eles de n˜ao-homogˆenea a partir de ideias destes algoritmos e de simulated annealing. Estes autores aplicam o m´etodo em um problema de regress˜ao n˜ao param´etrica, novamente para uma ´unica curva, descrito por um processo gaussiano com func¸˜ao m´edia sendo uma combinac¸˜ao linear de B-splines c´ubicos para estimar o n´umero e as localizac¸˜oes dos n´os.

(26)

Por outro lado, as s´eries de dados tamb´em podem ser consideradas s´eries temporais (dis-cretas) ao longo do tempo. Neste contexto, encontramos na literatura padr˜ao de s´eries tem-porais, apresentada por exemplo em West e Harrison (1997), v´arias abordagens atrav´es dos modelos dinˆamicos que s˜ao ferramentas poderosas e flex´ıveis para capturar diferentes estru-turas de correlac¸˜ao temporal das s´eries de dados. Gamerman e Migon (1993) prop˜oem para observac¸˜oes univariadas uma nova classe de modelos dinˆamicos normais que assumem hi-erarquia sobre os estados do processo, conhecidos como os modelos hier´arquicos dinˆamicos. Considerando observac¸˜oes na forma matricial, ? estendem esses modelos que possibilitam uma an´alise conjunta de v´arias s´eries temporais multivariadas. Al´em disso, adicionando a hip´otese de correlac¸˜ao espacial e permitindo que coeficientes e interceptos possam variar no tempo e espac¸o, Paez et al. (2008) exploram uma parametrizac¸˜ao eficiente para estimar as matrizes de covariˆancias. Shaddick e Wakefield (2002) modelam a relac¸˜ao espacial e temporal entre po-luentes atrav´es de um modelo linear dinˆamico espac¸o-temporal com hierarquia mas n˜ao nos estados. Bortot et al. (2010) prop˜oem um modelo dinˆamico para modelar medidas temporais da durac¸˜ao do ciclo menstrual completo de uma mulher individualmente e, a fim de capturar variabilidades entre as mulheres e permitir o compartilhamento de informac¸˜oes, cada processo individual ´e incorporado em um sistema multivariado no qual os parˆametros do modelo variam ao longo dos indiv´ıduos. Neste caso, a hierarquia tamb´em n˜ao ´e nos parˆametros de estado.

Em geral, em problemas que envolvem dados hier´arquicos temos interesse nas estimac¸˜oes individuais e nas estimac¸˜oes por grupo. Por exemplo, considere um problema gen´erico no qual temos n grupos cada um com ni observac¸˜oes, para i = 1, · · · , n. Podemos ter interesse em

obter estimativas para as m´edias por unidade j, j = 1, · · · , ni, e por grupo i, i = 1, · · · , n.

A presenc¸a de poss´ıveis dados discrepantes e/ou grupos discrepantes pode influenciar nestas estimativas se negligenciarmos esta hip´otese na formulac¸˜ao do modelo. Neste contexto, mo-delos robustos representam uma poderosa ferramenta e, em momo-delos hier´arquicos, podemos assumir uma distribuic¸˜ao robusta nos diferentes n´ıveis da hierarquia de acordo com o pro-blema explorado (West, 1984). Uma distribuic¸˜ao robusta sim´etrica importante e, em geral, aplicada ´e a t-Student cujo parˆametro de graus de liberdade determina o peso das caudas da distribuic¸˜ao. Alternativamente, a classe de distribuic¸˜oes exponencial potˆencia, tamb´em conhe-cida como normal generalizada, ´e sim´etrica, acomoda observac¸˜oes discrepantes e depende de

(27)

trˆes parametros assim como a t-Student. Essa ´ultima pode ser escrita como uma mistura dis-creta das distribuic¸˜oes normal e gama, enquanto que para escrever a distribuic¸˜ao exponencial potˆencia como uma mistura de normal combinamos com distribuic¸˜oes est´aveis (West, 1984).

1.1

Modelos Hier´arquicos

Modelos hier´arquicos, ou multin´ıveis, surgem em diversas situac¸˜oes devido a natureza ine-rente dos dados e da aplicac¸˜ao em si, sendo ´uteis quando h´a informac¸˜ao em difeine-rentes n´ıveis das unidades observacionais. Segundo Gelman et al. (1995), em problemas que envolvem v´arios parˆametros relacionados entre si, a distribuic¸˜ao de probabilidade conjunta destes parˆametros deve refletir a dependˆencia entre eles. Em um modelo hier´arquico, ´e poss´ıvel ter permutabili-dade em cada n´ıvel das unipermutabili-dades.

Exemplos pr´aticos s˜ao conjuntos de dados de indiv´ıduos que s˜ao acompanhados por um per´ıodo de tempo para o estudo de medicac¸˜ao ou doenc¸a, e de estac¸˜oes monitoradoras de dados clim´aticos, que podem ser divididos em grupos que podem ser subdivididos ainda algumas vezes, dependendo do estudo. V´arios outros exemplos s˜ao apresentados em Migon et al. (2008) e Gelman et al. (1995).

Baseados na id´eia de permutabilidade de distribuic¸˜oes, Lindley e Smith (1972) formaliza-ram o desenvolvimento de uma estrutura hier´arquica para a distribuic¸˜ao a priori do vetor pa-ram´etrico do modelo. A distribuic¸˜ao a priori ´e assumida ser permut´avel e, assim, pode ser des-crita por uma mistura de distribuic¸˜oes independentes e identicamente distribu´ıdas. Neste con-texto, modelam-se as observac¸˜oes condicionalmente a certos parˆametros, e assume-se uma es-trutura probabil´ıstica para estes parˆametros em termos de outras quantidades, os hiperparˆametros. E, se ainda se mostrar necess´ario, assume-se tamb´em uma estrutura para estes hiperparˆametros, obtendo-se um modelo de trˆes n´ıveis de hierarquia. Al´em disto, pode-se fazer extens˜oes para qualquer n´umero de n´ıveis que for necess´ario. Portanto, para a especificac¸˜ao da distribuic¸˜ao a prioriprimeiro estabelecemos os n´ıveis e, depois atribu´ımos distribuic¸˜oes condicionais para cada n´ıvel.

Uma classe importante de modelos hier´arquicos ´e formada pelos modelos hier´arquicos li-neares. O termo linear caracteriza estruturas de dependˆencias lineares entre os diferentes n´ıveis

(28)

da hierarquia.

1.2

Motivac¸˜ao

Este trabalho ´e motivado pelo estudo do chamado Fenˆomeno de Raynaud - FR. Este ´e um dist´urbio vasosp´astico parox´ıstico, de pequenas art´erias, art´erias pr´e-capilares e shunts art´erio-venosos das extremidades, tipicamente induzidos por exposic¸˜ao ao frio e estresse emocional (Belch, 2005). FR pode ser classificado como prim´ario (PRP), sem nenhum dist´urbio pa-tol´ogico identific´avel subjacente, e secund´ario, geralmente associado a uma doenc¸a do tecido conjuntivo, o uso de certas drogas, ou a exposic¸˜ao a agentes t´oxicos (Block e Sequeira, 2001). FR secund´ario ´e frequentemente associado com esclerose sistˆemica (SS). Neste caso, o FR pode preceder o aparecimento de outros sintomas e sinais da doenc¸a por v´arios anos (Belch, 2005). Estudos epidemiol´ogicos apontam a importˆancia de um diagn´ostico diferencial precoce e adequado para distinguir as diferentes formas do FR (Belch, 2005).

Estudos de imagens infravermelhas t´ermicas tˆem sido amplamente utilizados para tentar diferenciar FR prim´ario do secund´ario, frequentemente em combinac¸˜ao com o monitoramento da resposta do dedo a um estresse t´ermico controlado. Desde que a temperatura cutˆanea de-pende da perfus˜ao de sangue local e propriedades t´ermicas do tecido, imagens infravermelhas t´ermicas fornecem informac¸˜ao indireta importante sobre a circulac¸˜ao, propriedades t´ermicas e funcionalidade termoregulat´oria do tecido cutˆaneo (Merla et al., 2002a). Em geral, tais informac¸˜oes s˜ao extra´ıdas das s´eries de reaquecimento/reperfus˜ao - ver Sec¸˜ao 1.2.2. Alguns au-tores, por exemplo Merla et al. (2002a), Mariotti et al. (2009), Anderson et al. (2007) e Murray et al. (2009), utilizam recursos simples destas s´eries (como, por exemplo, a ´area sob a curva e a temperatura m´axima) como covari´aveis em an´alises de discriminantes ou modelo de regress˜ao log´ıstica para fins de classificac¸˜ao. Entretanto, nenhum destes estudos fornecem informac¸˜ao espec´ıfica sobre mecanismos subjacentes do Fenˆomeno de Raynaud e em algumas situac¸˜oes o problema ´e tamb´em simplificado por apenas considerar pacientes doentes e saud´aveis, ao inv´es de diferenciar doentes PRP e doentes SS. Aretusi et al. (2011) prop˜oem uma classificac¸˜ao su-pervisionada das imagens infravermelhas t´ermicas atrav´es de t´ecnicas de an´alise discriminante linear (passo a passo) sobre um n´umero grande de caracter´ısticas extra´ıdas dessas imagens.

(29)

Essas t´ecnicas tamb´em s˜ao exploradas por Ippoliti et al. (2014), que ainda tratam do problema de singularidade da matriz de covariˆancias de cada grupo que possui alta dimens˜ao.

Neste trabalho propomos duas abordagens distintas ao problema do FR. Uma modela-gem por um processo gaussiano hier´arquico que ´e capaz de descrever a natureza funcional hier´arquica dos dados. A outra ´e feita por um modelo hier´arquico dinˆamico normal que sup˜oe os dados temporalmente discretizados mas tamb´em ´e capaz de descrever a estrutura hier´arquica dos dados. Mostraremos que ambas as abordagens s˜ao capazes de sintetizar as dinˆamicas das s´eries de reaquecimento, tanto para indiv´ıduos isolados quanto para os trˆes grupos. Al´em disso, v´arios dos parˆametros estimados dos modelos possuem interpretac¸˜ao direta e s˜ao ´uteis para des-crever caracter´ısticas espec´ıficas do FR. Atrav´es da distribuic¸˜ao preditiva tamb´em predizemos o grupo de um novo indiv´ıduo em uma das trˆes classes consideradas aqui. Inspirados por este problema de diferenciac¸˜ao entre os grupos, investigamos modelos hier´arquicos robustos no sentido de acomodar observac¸˜oes discrepantes e poss´ıveis mudanc¸as estruturais com grupos discrepantes. Neste contexto, tamb´em exploramos distribuic¸˜oes a priori de referˆencia para os graus de liberdade da distribuic¸˜ao t-Student sob diversos modelos hier´arquicos.

Observe que, embora grande parte da nossa discuss˜ao seja baseada na an´alise do fenˆomeno de Raynaud, a metodologia ´e aplic´avel para modelar quaisquer dados onde as observac¸˜oes aparecem com uma estrutura hier´arquica e s˜ao inerentemente correlacionadas.

1.2.1

Imagem Infravermelha T´ermica

Os dados para este estudo foram fornecidos pelo Laborat´orio de Imagem Infravermelha Funcional - Instituto para Tecnologia Biom´edica Avanc¸ada (ITAB), na Escola de Medicina da G. d’Annunzio University, Chieti, It´alia. O estudo foi aprovado pelos Conselhos de Revis˜ao Institucional e Comitˆes de ´Etica local e todos os participantes deram o seu consentimento in-formando por escrito. Os dados brutos consistem de vetores de temperaturas das pontas dos dedos documentando a recuperac¸˜ao t´ermica a partir de um estresse t´ermico/frio padronizado de ambas as m˜aos (Merla et al., 2002b). Especificamente, as medidas referem-se a pacientes dos trˆes grupos: 20 indiv´ıduos saud´aveis (grupo de controle), 24 indiv´ıduos no caso prim´ario, e 28 indiv´ıduos com esclerose sistˆemica. Os pacientes s˜ao classificados de acordo com os crit´erios

(30)

do American College of Rheumatology e crit´erios padr˜ao de exclus˜ao (Merla et al., 2002a). Pacientes s˜ao submetidos a imagens infravermelhas t´ermicas depois de observadas as regras normais de preparac¸˜ao para o teste (Merla et al., 2002b). Imagens infravermelhas t´ermicas de alta resoluc¸˜ao s˜ao adquiridas a cada 30 segundos para o monitoramento da resposta ao estresse t´ermico. A aquisic¸˜ao das imagens comec¸a 2,5 minutos antes do est´ımulo t´ermico e termina 20 minutos depois. As imagens s˜ao adquiridas usando uma cˆamera t´ermica digital 14-bit (FLIR SC3000 QWIP, Su´ecia). O estresse t´ermico consiste em uma imers˜ao por dois minutos das m˜aos em uma ´agua fria (10◦C), usando luvas de pl´astico finas. No final do experimento, para cada indiv´ıduo, uma sequˆencia temporal de 46 imagens de valores de temperatura ´e disponibi-lizado. Na pr´oxima Sec¸˜ao descrevemos como essas imagens obtidas foram processadas para a obtenc¸˜ao de curvas temporais.

1.2.2

Processamento dos Dados

Uma dificuldade que ´e encontrada pela comparac¸˜ao de 46 imagens de uma m˜ao de um indiv´ıduo ´e que as caracter´ısticas principais ocorrem em diferentes pontos no tempo; portanto para cada indiv´ıduo as m˜aos precisam ser registradas no tempo antes da an´alise ser realizada. O procedimento que seguimos para o alinhamento consiste nos trˆes passos seguintes: 1) para cada tempo t, o contorno das m˜aos ´e identificado pela segmentac¸˜ao da imagem; 2) o contorno ´e sintetizado por uma colec¸˜ao de k pontos, chamados marcos. Em cada tempo t, denotamos por Yt, a matriz de coordenadas cartesianas da configurac¸˜ao dos k marcos em 2 dimens˜oes,

assim Yt ∈ R2; 3) todas as configurac¸˜oes, Yt, t = 2, . . . , 46, s˜ao alinhadas ao “modelo”(ou

seja a primeira configurac¸˜ao) Y1, minimizando a soma de quadrados Procrustes

S Y1, Yt = inf

ξ,Ξ

kY1− YtΞ − 1kξ>k2

onde Ξ ´e um elemento de SO(2), o grupo de rotac¸˜oes no plano, ξ ´e um parˆametro de translac¸˜ao correspondente ao vetor de k valores, e 1k um vetor de dimens˜ao k de 1’s. Essencialmente,

as configurac¸˜oes Yt, t = 2, . . . , 46, s˜ao comparadas com a primeira, Y1, sob transformac¸˜oes

do corpo r´ıgido. Para uma introduc¸˜ao aos m´etodos Procrustes em an´alise de forma veja por exemplo, Dryden e Mardia (1998), Cap´ıtulo 5.

(31)

Ap´os o registro da imagem, a regi˜ao da ponta de cada dedo ´e considerada como a regi˜ao de interesse para produzir um sinal unidimensional de valores de temperaturas. Em cada ponto no tempo t, o sinal unidimensional ´e obtido como uma m´edia dos valores para os pixels naquela regi˜ao. Este procedimento gera uma matriz de dados brutos de 720 curvas, cada uma repre-sentando o processo de reaquecimento de um dedo. A figura 1.1 fornece uma representac¸˜ao pict´orica destas curvas de reaquecimento para todos os dedos de todos os indiv´ıduos, separadas em trˆes pain´eis sendo um para cada grupo.

HC tempo (min) T emper atur a (ºC) 0 10 22.5 10 20 30 40 PRP tempo (min) 0 10 22.5 SS tempo (min) 0 10 22.5

Figura 1.1: Dinˆamicas das curvas de reaquecimento por grupo para todos os dedos de todos os indiv´ıduos na amostra. Painel `a esquerda: indiv´ıduos do grupo saud´avel (HC). Painel do meio: indiv´ıduos do grupo no caso prim´ario (PRP). Painel `a direita: indiv´ıduos do grupo com esclerose sistˆemica (SS).

A partir da Figura 1.1 ´e evidente que a aplicac¸˜ao de um estresse t´ermico determina uma queda de temperatura imediata do estado estacion´ario est´avel (ou seja, a temperatura basal). Em seguida, a partir do sexto tempo parece que as dinˆamicas das curvas de reaquecimento s˜ao bastante diferentes de dedo para dedo e, principalmente de grupo para grupo.

Na Figura 1.2 mostramos as m´edias das temperaturas (para todos os tempos e dedos) de cada indiv´ıduo. Podemos observar claramente que pode haver alguns problemas de confus˜ao entre os grupos. O processo de reaquecimento, de fato, n˜ao parece homogˆeneo em geral, e isso coloca um problema desafiador de modelagem.

(32)

●● ● ●● ● ● ● ● ●● ● ●●●●●●●● ● ● ● ● ● ● ● ● ● ● ●●● ● ● ● ● ● ●● ● ●● ● ● ● ●● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● Indivíduos T emper atur a média (ºC) HC PRP SS 0 10 20 30 40 50 60 70 15 25 35

Figura 1.2: Temperatura m´edia atrav´es do tempo e dedos para cada um dos 72 indiv´ıduos.

1.3

Organizac¸˜ao do Texto

Este texto est´a organizado da seguinte forma. No Cap´ıtulo 2, propomos uma modelagem por um processo gaussiano hier´arquico com K func¸˜oes bases splines na estrutura de m´edia do processo para descrever os dados de temperatura dos pacientes submetidos ao experimento des-crito na Sec¸˜ao 1.2. Nesta modelagem, tratamos os dados observados como dado funcional ao longo do tempo. Neste sentido, comec¸amos o Cap´ıtulo 2 introduzindo os conceitos b´asicos na literatura de dados funcionais e apresentamos as func¸˜oes bases splines polinomiais que s˜ao am-plamente utilizadas para a representac¸˜ao de dados de natureza funcional e que ser˜ao exploradas neste trabalho. Em seguida, definimos os processos gaussianos que tamb´em ser˜ao utilizados nesta modelagem. O interesse consiste em descrever as curvas temporais de cada dedo, de cada indiv´ıduo, pertencente a cada grupo de estudo (sadio, doente no caso prim´ario e doente com esclerose sistˆemica). Desta forma, permitimos correlac¸˜oes ao longo do tempo atrav´es do uso de uma func¸˜ao de correlac¸˜ao temporal, correlac¸˜oes entre as curvas de temperaturas dos dedos de cada m˜ao de um indiv´ıduo e entre as m˜aos atrav´es de uma estrutura de covariˆancia v´alida. Comparamos diferentes variac¸˜oes do modelo em termos da estrutura de covariˆancia e atrav´es de crit´erios de selec¸˜ao, escolhemos o “melhor” modelo entre os ajustados e, discutimos os resultados alcanc¸ados atrav´es deste modelo. Embora a modelagem seja feita focando os dados de reaquecimento, a modelagem n˜ao ´e restrita a este conjunto de dados.

Fundamentados na relac¸˜ao entre a suavizac¸˜ao por splines polinomiais, os processos gaussi-anos e os modelos dinˆamicos, no Cap´ıtulo 3 modelamos o mesmo conjunto de dados atrav´es de um modelo hier´arquico dinˆamico normal que sup˜oe os dados discretizados ao longo do tempo.

(33)

Neste caso, a estrutura temporal ´e imposta pela pr´opria dinˆamica do modelo podendo abranger diferentes estruturas de dependˆencia temporal. Al´em disto, tamb´em permitimos estruturas de correlac¸˜ao entre as s´eries dos diferentes dedos de uma m˜ao e entre as m˜aos atrav´es de matrizes de covariˆancias similares `aquelas adotadas no Cap´ıtulo 2. Assim como no Cap´ıtulo 2, selecio-namos um modelo dentre v´arios atrav´es de crit´erios de selec¸˜ao e apresentamos seus resultados, discutindo suas interpretac¸˜oes e comparando com os resultados obtidos no Cap´ıtulo 2.

Finalmente, no Cap´ıtulo 4, discutimos a hip´otese de robustez em modelos hier´arquicos assumindo-se a distribuic¸˜ao t-Student para a modelagem dos erros em diferentes n´ıveis. A estimac¸˜ao do parˆametro de graus de liberdade da t-Student ´e uma tarefa desafiadora e, por isto, propomos o uso de distribuic¸˜oes a priori de referˆencia para refletir nosso grau de conhe-cimento a priori sobre este parˆametro. Neste contexto, como n˜ao s˜ao dispon´ıveis na litera-tura distribuic¸˜oes a priori de referˆencia para os graus de liberdade da t-Student em modelos hier´arquicos, derivamos tais distribuic¸˜oes sob modelos hier´arquicos com um ´unico n´ıvel assu-mindo a t-Student (i) na equac¸˜ao de observac¸˜ao, (ii) na equac¸˜ao estrutural e, (iii) em ambas as equac¸˜oes, a partir de diferentes parametrizac¸˜oes de cada um destes modelos. Um estudo simulado foi realizado para explorarmos algumas propriedades frequentistas das distribuic¸˜oes a prioriencontradas neste Cap´ıtulo comparadas com outras distribuic¸˜oes a priori para os graus de liberdade conhecidas na literatura. Aplicamos as distribuic¸˜oes a priori de referˆencia encon-tradas em dois conjuntos de dados reais retirados de West (1984) e de Gelfand et al. (1990), e discutimos seus resultados.

Em todo este texto, Np(D, E) representa uma distribuic¸˜ao normal de dimens˜ao p com vetor

de m´edia D e matriz de covariˆancia E, IG(a, b) representa a distribuic¸˜ao gama invertida com m´edia b/(a − 1) e variˆancia b2/[(a − 1)2(a − 2)], G(a, b) representa a distribuic¸˜ao gama com m´edia a/b e variˆancia a/b2, U nif orme[x

1, x2] representa a distribuic¸˜ao uniforme no intervalo

real [x1, x2], I[a,b](x) representa a func¸˜ao indicadora para uma vari´avel aleat´oria x, a qual ´e 1

(34)

Cap´ıtulo 2

Modelagem Funcional de Sinais

Biom´edicos com Estrutura Hier´arquica

Neste Cap´ıtulo, propomos uma modelagem por um processo gaussiano hier´arquico que ´e capaz de descrever a estrutura hier´arquica dos dados descritos na Sec¸˜ao 1.2 e, que considera os dados observados como sendo de natureza funcional. Desta forma, consideramos que as medidas observadas s˜ao amostras das curvas de temperatura de cada dedo, de cada indiv´ıduo, ao longo do tempo. A fim de capturar o comportamento das curvas ao longo do tempo, utili-zamos func¸˜oes bases B-splines na estrutura de m´edia do processo. Nesta modelagem tamb´em permitimos que estas curvas possuam correlac¸˜oes temporais e, entre si, atrav´es de diferentes estruturas de covariˆancia v´alidas.

Este Cap´ıtulo est´a organizado da seguinte forma. Na Sec¸˜ao 2.1, discutimos sobre an´alise de dados funcionais e, na Sec¸˜ao 2.2, apresentamos os splines polinomiais e as func¸˜oes bases B-splines que ser˜ao exploradas na modelagem deste Cap´ıtulo. Os processos gaussianos s˜ao apresentados na Sec¸˜ao 2.3. Na Sec¸˜ao 2.4, apresentamos a equivalˆencia entre os splines po-linomiais e os processos gaussianos. O modelo funcional hier´arquico proposto est´a descrito na Sec¸˜ao 2.5, assim como o detalhadamento das especificac¸˜oes da hierarquia e a matriz de covariˆancias considerados para capturar a estrutura dos dados. Ainda nesta Sec¸˜ao, apresenta-mos os crit´erios de comparac¸˜ao de modelos utilizados para selecionar o melhor modelo dentre aqueles que ser˜ao descritos na Sec¸˜ao 2.6. A an´alise do conjunto de dados descrito em 1.2 e a interpretac¸˜ao dos resultados tamb´em s˜ao apresentadas na Sec¸˜ao 2.6, enquanto que, a Sec¸˜ao

(35)

2.7, conclui esta proposta com uma discuss˜ao.

2.1

Dados Funcionais

Segundo Ramsay e Silverman (2005), dados funcionais geralmente s˜ao observados discre-tamente, embora sua estrutura inerente seja funcional. A observac¸˜ao de uma func¸˜ao yi ´e um

conjunto de Ni pares (tij, yij), para j = 1, · · · , Ni. Assim, yi n˜ao ´e observada em todo o

seu dom´ınio, que ´e um conjunto n˜ao-enumer´avel de pontos, mas assume-se que existe uma func¸˜ao dando origem aos dados observados. Em geral, a construc¸˜ao das func¸˜oes originais a partir dos dados observados pode ocorrer separada ou independentemente para cada func¸˜ao i. A hip´otese de suavidade ´e geralmente considerada j´a que, sem esta hip´otese, n˜ao poder´ıamos utilizar alguma t´ecnica de an´alise multivariada. A suavidade de uma func¸˜ao est´a relacionada ao n´umero de derivadas cont´ınuas que esta func¸˜ao possui. Em v´arias aplicac¸˜oes, o interesse consiste na estimativa da func¸˜ao e de um certo n´umero de suas derivadas. Entretanto, os da-dos observada-dos podem n˜ao refletir o grau de suavidade da func¸˜ao original devido a erros de medic¸˜ao. Assumindo-se que as observac¸˜oes n˜ao possuem erros de medic¸˜ao, o processo utili-zado para representar os dados de forma funcional ´e a interpolac¸˜ao, caso contr´ario, utiliza-se a suavizac¸˜ao.

Um m´etodo amplamente utilizado para a representac¸˜ao de func¸˜oes ´e a combinac¸˜ao linear de func¸˜oes bases. Este m´etodo permite flexibilidade suficiente e fornece uma eficiˆencia compu-tacional para o ajuste de grandes conjuntos de dados. Al´em disto, podemos reduzir o problema de buscar uma func¸˜ao em um espac¸o com dimens˜ao infinita a um espac¸o com dimens˜ao fi-nita. Uma base de func¸˜oes para um espac¸o ´e um conjunto de func¸˜oes conhecidas fk que s˜ao

linearmente independentes e, que permitem uma aproximac¸˜ao razo´avel a uma dada func¸˜ao deste espac¸o atrav´es de uma combinac¸˜ao linear de um n´umero suficientemente grande, K ∈ Z (inteiro positivo), destas func¸˜oes bases. Isto ´e, podemos expandir uma func¸˜ao y como

y(t) =

K

X

k=1

βkfk(t), (2.1)

tais que βk, para k = 1, · · · , K s˜ao os coeficientes da expans˜ao. A escolha do n´umero K de

(36)

esperando-se refletir o grau de suavidade e de repreesperando-sentac¸˜ao das curvas de dados. Dependendo do n´umero de func¸˜oes bases utilizadas na expans˜ao, podemos obter uma interpolac¸˜ao ou uma suavizac¸˜ao. Em geral, quando K ´e igual ao n´umero de dados observados discretamente, te-mos uma interpolac¸˜ao. Exemplos de bases de func¸˜oes s˜ao sistemas de monˆomios, de s´eries de Fourier, exponencial, polinomial, splines, ondaletas, entre outras.

Neste trabalho, utilizamos func¸˜oes B-splines que formam uma base para o espac¸o vetorial dos splines polinomiais. Na pr´oxima Sec¸˜ao apresentamos os splines polinomiais e as bases B-splines.

2.2

Splines Polinomiais

Uma func¸˜ao spline s pode ser definida como um polinˆomio por partes que s˜ao ligadas por n´os ξ1, ξ2, · · · , ξK de forma que a func¸˜ao seja cont´ınua, possua um certo n´umero de

de-rivadas cont´ınuas e, possivelmente, satisfac¸a algumas condic¸˜oes de fronteiras (Wahba, 2000). Uma importante caracter´ıstica dos splines polinomiais consiste em, simultaneamente, preser-var a flexibilidade dos polinˆomios por partes e alcanc¸ar certo grau de suavidade global, com sua ordem de aproximac¸˜ao n˜ao dependendo do grau do polinˆomio (Schumaker, 1981). Uma definic¸˜ao mais formal segue abaixo.

Definic¸˜ao 2.2.1. Sejam a = ξ0 < ξ1 < · · · ξK < ξK+1 = b e ∆ = {ξ0, ξ1, · · · , ξK+1}. O

con-junto∆ particiona o intervalo [a, b] em K +1 subintervalos, [ξi, ξi+1), para i = 0, 1, · · · , K −1

e [ξK, ξK+1]. Um spline univariado de ordem m ∈ Z+ com n´os nos pontos ξ1, ξ2, · · · , ξK ´e

uma func¸˜ao da forma s(x) = m−1 X i=0 θixi+ K X k=1 δk(x − ξk)m−1+ , parax ∈ [a, b] (2.2)

tais que(t)+ = max{0, t} e os coeficientes θ0, θ1, · · · , θm−1,δ1, δ2, · · · , δKs˜ao n´umeros reais.

O espac¸o formado pelas func¸˜oes da forma (2.2) ´e o espac¸o de splines polinomiais de or-dem m e n´os nos pontos ξ1, ξ2, · · · , ξK. O grau de um spline de ordem m ´e igual a m − 1.

Segundo Schumaker (1981), splines polinomiais possuem v´arias caracter´ısticas interessantes: s˜ao func¸˜oes relativamente suaves; de f´acil armazenamento, manipulac¸˜ao e avaliac¸˜ao compu-tacional; s˜ao espac¸os com bases muito convenientes; toda func¸˜ao cont´ınua no intervalo [a, b]

(37)

pode ser arbitrariamente bem aproximada por splines polinomiais com a ordem m fixada, for-necido um n´umero suficiente de n´os; splines de ordem baixa s˜ao muito flex´ıveis, e n˜ao exibem as oscilac¸˜oes geralmente associadas aos polinˆomios. Bases splines s˜ao geralmente preferidas para representar func¸˜oes e dados funcionais n˜ao peri´odicos.

Schumaker (1981) mostra que o espac¸o dos splines polinomiais de ordem m e n´os nos pontos ξ1, ξ2, · · · , ξK ´e um espac¸o vetorial com dimens˜ao finita. Portanto, este espac¸o admite

uma base de func¸˜oes que o gera. Uma base de func¸˜oes amplamente utilizada em aplicac¸˜oes e que fornece eficiˆencia computacional e estabilidade num´erica ´e formada pelos B-splines.

Para definirmos os B-splines, introduziremos o conceito de diferenc¸as divididas apresen-tado em de Boor (2001).

Definic¸˜ao 2.2.2. A k-´esima diferenc¸a dividida de uma func¸˜ao f nos pontos ξi, · · · , ξi+k ´e o

coeficiente dexkdo polinˆomio p(x) de ordem k +1 que coincide com f nos pontos ξ

i, · · · , ξi+k,

e ´e denotada por [ξi, · · · , ξi+k]f . Aqui, dizemos que um polinˆomio p coincide com a func¸˜ao g

se para todo pontoξ∗ que ocorren vezes na sequˆencia ξ, vale que pi−1) = gi−1), para

i = 1, · · · , n.

Se o polinˆomio de ordem i, pi, coincide com a func¸˜ao f em ξ1, · · · , ξi, para i = k e

i = k + 1, ent˜ao podemos escrever

pk+1(x) = pk(x) + (x − ξ1) · · · (x − ξk)[ξ1, · · · , ξk]f,

logo, pk+1(x) − pk(x) ´e um polinˆomio de ordem k + 1 e pk+1(x) − pk(x) = (x − ξ1) · · · (x −

ξk)[ξ1, · · · , ξk]f . Diferenc¸as divididas podem ser usadas para estabelecer a interpolac¸˜ao

poli-nomial de Newton, obtendo-se

pn(x) = p1(x) + (p2(x) − p1(x)) + (p3(x) − p2(x)) + · · · + (pn(x) − pn−1(x)),

com p1(x) = [ξ1]f, (p2(x) − p1(x)) = (x − ξ1)[ξ1, ξ2]f , (p3(x) − p2(x)) = (x − ξ1)(x −

ξ2)[ξ1, ξ2, ξ3]f, · · · , (pn(x) − pn−1(x)) = (x − ξ1) · · · (x − ξn−1)[ξ1, · · · , ξn]f .

Segue abaixo a definic¸˜ao de B-spline baseada na construc¸˜ao feita em de Boor (2001). Definic¸˜ao 2.2.3. Seja ξ = {ξi} uma sequˆencia n˜ao decrescente (finita ou infinita). O i-´esimo

B-spline (normalizado) de ordemm para a sequˆencia de n´os ξ ´e definido por

(38)

tal que[ξi, · · · , ξi+m](· − x)m−1+ representa que am-´esima diferenc¸a dividida da func¸˜ao (ξ −

x)m−1+ ´e func¸˜ao somente de ξ, fixando x.

Chamamos o B-spline definido acima de normalizado pois R−∞∞ Bm

i (x) = 1, que ´e

garan-tido pelo termo (ξi+m− ξi).

Schumaker (1981) tamb´em mostra que um spline polinomial s de ordem m e n´os nos pontos ξ1, ξ2, · · · , ξKpossui uma ´unica expans˜ao por B-splines normalizados. Devido a esta unicidade

de representac¸˜ao, para o armazenamento de uma func¸˜ao s basta armazenar seus coeficientes. A eficiˆencia computacional tamb´em ´e garantida pela propriedade de suporte compacto que diz que a func¸˜ao base B-spline de ordem m ´e positiva em n˜ao mais do que m intervalos, portanto, para calcular s basta calcular uma soma envolvendo m dos B-splines.

Wahba (1983) mostra que chegamos a um paradoxo se o espac¸o das func¸˜oes onde deseja-mos escolher a func¸˜ao de regress˜ao tiver dimens˜ao infinita. Desta forma, a fim de solucionar este problema, podemos considerar um espac¸o com dimens˜ao finita. E, neste contexto, a ex-pans˜ao por K func¸˜oes bases B-splines torna-se apelativa (Green e Silverman, 1994).

2.3

Processos Gaussianos

Definic¸˜ao 2.3.1. Um processo gaussiano ´e uma colec¸˜ao de vari´aveis aleat´orias tais que qual-quer n´umero finito destas vari´aveis possuam distribuic¸˜ao conjunta normal multivariada.

Um processo gaussiano f ´e completamente especificado pelas func¸˜oes de m´edia m(.) e de covariˆancia c(., .). Neste caso, usaremos a notac¸˜ao

f (.) ∼ PG(m(.), c(., .)).

A func¸˜ao de covariˆancia de um processo gaussiano exerce um papel fundamental sobre as hip´oteses assumidas pelo modelo. Dado um conjunto de pontos {x1, x2, · · · , xn}, uma func¸˜ao

de covariˆancia c(., .) define uma matriz de covariˆancia C com entradas C(xi, xj) = cov(f (xi),

f (xj)) = c(xi, xj) para todo i, j = 1, · · · , n. Toda matriz de covariˆancias induzida por uma

func¸˜ao de covariˆancia v´alida ´e tamb´em v´alida. A condic¸˜ao de validade de uma func¸˜ao de covariˆancia ´e que ela seja positiva definida, isto ´e, se para quaisquer n ∈ Z+ e ci ∈ R, i =

(39)

1, · · · , n, vale que X i,j cicjC(xi, xj) > 0, comP i,jcicjC(xi, xj) = 0 ⇔ ci = 0, ∀i.

Wahba (1978) demonstrou que o m´etodo de suavizac¸˜ao por splines polinomiais ´e equi-valente a estimac¸˜ao bayesiana sob uma distribuic¸˜ao a priori gaussiana. Descrevemos este resultado na pr´oxima Sec¸˜ao.

2.4

Equivalˆencia entre Suavizac¸˜ao por Splines Polinomiais e

Processos Gaussianos

Uma abordagem muito comum de problemas com dados funcionais ´e a suavizac¸˜ao por splines polinomiais. Apresentamos a seguir a equivalˆencia entre os processos gaussianos e a suavizac¸˜ao por splines polinomiais, que ´e um resultado derivado em Wahba (1978).

Suponha que Y1, · · · , Yn s˜ao observac¸˜oes nos pontos x1 < · · · < xn. Dada uma func¸˜ao

suave f desconhecida, assuma o modelo de regress˜ao para i = 1, · · · , n

yi = f (xi) + i, i ∼ N(0, σ2), (2.4)

tais que os erros s˜ao independentes. O objetivo ´e estimar a func¸˜ao de regress˜ao f a partir dos dados observados. Neste contexto, suponha ainda que f possua derivada segunda cont´ınua e de quadrado integr´avel, ent˜ao um crit´erio para obtermos esta estimativa ´e minimizar a soma penalizada dos quadrados que ´e definida por

SP Q(f ) = n X i=1 [Yi− f (xi)]2+ λ Z b a [f00(x)]2dx, (2.5) com parˆametro de suavizac¸˜ao λ. O termo de penalidade por rugosidade λRab[f00(x)]2dx garante

que n˜ao ´e apenas levado em conta a bondade de ajuste aos dados quantificada pelo termo da soma dos quadrados dos res´ıduosPn

i=1[Yi− f (xi)]2, mas tamb´em a suavidade (variac¸˜ao local)

que ´e medida pela curvatura da func¸˜ao em cada x. O parˆametro de suavizac¸˜ao λ representa a ponderac¸˜ao entre os dois crit´erios. Schoenberg (1964) mostra que a func¸˜ao que minimiza SP Q(f ) ´e uma func¸˜ao spline c´ubico (spline polinomial de ordem 4).

(40)

Wahba (1978) mostra que esta func¸˜ao spline ´e uma estimativa bayesiana para f supondo-se uma distribuic¸˜ao a priori “parcialmente difusa”, que ´e dada pela soluc¸˜ao da equac¸˜ao diferencial estoc´astica d2f (x) dx2 = λ −1/2 σdW (x) dx , para x > x1, (2.6) tal que W (x) ´e um processo de Wiener padr˜ao (movimento Browniano) com W (x1) = 0, e para

todo i e x, W (x) ´e independente de i. E, a condic¸˜ao inicial para x = x1s˜ao (f (x1), f

0

(x1))0 ∼

Normal(0, kI2), que com k → ∞ torna-se difusa. Assim, a func¸˜ao spline c´ubica ˆf que

mini-miza a express˜ao em (2.5) ´e o limite, quando k → ∞, da m´edia a posteriori de f , isto ´e, ˆ

f (t) = lim

k→∞E[f (t) | y1, · · · , yn].

Este resultado demonstrado por Wahba (1978) estabelece uma relac¸˜ao entre m´etodos de suavizac¸˜ao por splines e a abordagem bayesiana sob esta distribuic¸˜ao a priori, pois ambas as formulac¸˜oes resultam em um mesmo spline polinomial c´ubico. Na verdade, Wahba (1978) mostra esta equivalˆencia para um spline polinomial de grau 2m − 1, tal que m ´e o n´umero de derivadas requerido para a func¸˜ao f na SP Q.

Como ambas as func¸˜oes de densidade, na escala logar´ıtmica, a priori e a posteriori para f dependem de f de forma quadr´atica, ent˜ao elas s˜ao processos gaussianos. Segundo Green e Silverman (1994), como a distribuic¸˜ao a priori ´e invariante sob `a soma de uma func¸˜ao linear ou constante de seu argumento, uma maneira de escrevˆe-la ´e

f (x) = A + Bx + λ−1/2 Z x

0

W (s)ds,

onde A e B tˆem distribuic¸˜ao uniforme impr´opria sobre os reais. Al´em disso, ´e poss´ıvel mostrar que a distribuic¸˜ao a posteriori conjunta de f (x1), · · · , f (xn) ´e uma normal multivariada com

matriz de covariˆancias igual a σ2A(σ2λ), onde a matriz A(σ2λ) ´e tal que o spline, que ´e soluc¸˜ao do problema de suavizac¸˜ao, depende linearmente dos dados Y atrav´es de A(σ2λ)Y. Green e

Silverman (1994) discutem detalhadamente esta matriz que mapeia o vetor de observac¸˜oes Yi

para seus valores preditos ˆf (xi).

Neste contexto, ambas as ferramentas estat´ısticas, suavizac¸˜ao por splines e processos gaus-sianos, podem ser equivalentes para a descric¸˜ao de dados consideradas as especificac¸˜oes pecu-liares de cada processo de modelagem e estimac¸˜ao. Assim, utilizaremos processos gaussianos

Referências

Documentos relacionados

O candidato que necessitar de atendimento especial para a realização das provas deverá indicar, no ato da inscrição exclusivamente, o(s) recurso(s) especial(is) necessários a

Corporate Control and Policies Page 12 UNIVERSIDAD DE PIURA UNIVERSIDAD DEL PACÍFICO UNIVERSIDAD ESAN UNIVERSIDAD NACIONAL AGRARIA LA MOLINA UNIVERSIDAD NACIONAL

A psicanálise foi acusada de normatizadora (FOUCAULT, 1996) por haver mantido o modelo familiar burguês nuclear como o centro de sua teoria como é manifestado

Para este ano o Conselho Diretor de nossa igreja optou novamente por um tema de cunho social, tema este relacionado com uma das questões mais explosivas em nosso

O cometimento de transgressão disciplinar por parte dos bombeiros militares deve ser seguido de apuração disciplinar na forma de PAD, em que deverão ser garantidos ao

Provine (ibid.) adota o termo “constrição evolutiva” para representar esse movimento teórico, enfatizando os aspectos que ficaram de fora da “síntese”.

Pode ser utilizado em varias situações como: processo de solução de problemas; pesquisa social; saúde pública; aprimoramento da qualidade de processos, para fazer

Você pode até dar o furo, mas digo assim: você dar o furo on-line significa que você vai ter muito mais zelo para poder saber o que você está falando. Essa velocidade