Modelagem Hierárquica para Processos Estocásticos de Lévy

(1)

U

NIVERSIDADE

F

EDERAL DO

R

IO DE

J

ANEIRO

I

NSTITUTO DE

M

ATEMÁTICA

D

EPARTAMENTO DE

M

ÉTODOS

E

STATÍSTICOS

Modelagem Hierárquica para Processos

Estocásticos de Lévy

Estelina Serrano de Marins Capistrano

Rio de Janeiro – RJ 2012

(2)

Modelagem Hierárquica para Processos Estocásticos de

Lévy

Estelina Serrano de Marins Capistrano

Dissertação de Mestrado submetida ao Programa de Pós-Graduação em Estatística do Instituto de Matemática da Universidade Federal do Rio de Janeiro como parte dos requisitos necessários à obtenção do título de Mestre em Estatística.

Orientadora: Alexandra M. Schmidt Coorientador: Marco A. Rodríguez

(3)

Modelagem Hierárquica para Processos Estocásticos de

Lévy

Estelina Serrano de Marins Capistrano

Dissertação de Mestrado submetida ao Programa de Pós-Graduação em Estatística do Instituto de Matemática da Universidade Federal do Rio de Janeiro como parte dos requisi-tos necessários à obtenção do título de Mestre em Estatística.

Aprovada por:

(4)

FICHACATALOGRÁFICA

C243m Capistrano, Estelina Serrano de Marins

Modelagem hierárquica para processos estocásticos de Lévy / Estelina Serrano de Marins Capistrano. – Rio de Janeiro: UFRJ/ IM, 2012.

xxviii, 110f. : il. ; 30 cm.

Orientadora: Alexandra Mello Schmidt. Coorientador: Marco Aurelio Rodríguez.

Dissertação (mestrado) – UFRJ / Instituto de Matemática, Programa de Pós-graduação em Estatística, 2012.

Referências: f.108-110.

1. Distribuições estáveis de Lévy 2. Processos estocásticos 3. Modelos hierárquicos 4. Inferência Bayesiana – Tese. I. Schmidt, Alexandra Mello II. Rodríguez, Marco Aurelio III. Universidade Federal do Rio de Janeiro, Instituto de

Matemática IV. Título.

(5)

Aos meus queridos irmãos, Evelyn e Eduardo.

(6)

"Our world, our life, our destiny, are dominated by uncertainty; this is perhaps the only statement we may assert without uncertainty."

(7)

Agradecimentos

A Deus, Senhor de todo o conhecimento, agradeço por tudo que tenho e por tudo que sou. Pelo Seu infinito amor e cuidado, por guiar os meus passos e me oferecer vida a cada manhã. Sou grata por Ele estar sempre presente em minha vida, me dando forças para prosseguir nos momentos mais difíceis e por colocar pessoas tão especiais em meu caminho.

À minha família, pelo carinho e compreensão nos períodos de ausência. Em especial, ao meus pais, Darcy e Marta, pelo amor incondicional, pelos momentos de dedicação e por todos os esforços realizados para minha formação pessoal e profissional. Obrigada pela total confiança depositada em mim e por aceitarem minhas escolhas, mesmo sem muita das vezes entenderem o porquê.

À minha querida irmã Evelyn, pela amizade, apoio e companheirismo. Obrigada por estar sempre presente e por me entender com um simples olhar, ou até mesmo sem isso. Por ouvir as minhas inúmeras apresentações mesmo odiando estatística e sem entender nada do assunto, só para me apoiar. Agradeço pela sua compreensão ao longo dos últimos anos, pelas noites mal dormidas e por ser um exemplo de determinação.

Ao meu querido irmão Eduardo, por simplesmente existir e ser um anjo de Deus na minha vida. Obrigada por suas palavras carinhosas, pelas massagens relaxantes e pelo lindo sorriso que me acalma nos momentos de tensão. Você é um grande exemplo de luta, de superação, de coragem, de vida! É impossível não te amar, não te admirar. Você é tudo para mim e eu te amo demais!

Aos meus avós, em especial ao vovô Áureo (in memoriam) e vovó Nete. Agradeço por estarem presentes em cada etapa da minha vida e por tudo que fizeram por mim. Pela educação e conselhos, pelo aconchego do lar e delícias da cozinha. Vó, obrigada por tudo, eu não conseguiria chegar até aqui sem sua ajuda.

À minha orientadora, Alexandra Schmidt, por me incentivar sempre e acreditar no meu potencial. Obrigada por todo ensinamento, pela dedicação, perseverança, paciência, carinho e por todos os conselhos profissionais e pessoais. Suas palavras sempre me serviram de ânimo e reflexão, e certamente ecoarão por muito tempo em minha mente e em meu coração.

(8)

Ao meu coorientador, Marco Rodríguez, por seu apoio, paciência e palavras de incentivo. Obrigada pelos conhecimentos transmitidos, pela disponibilidade em ajudar e pelas ricas contribuições feitas a este trabalho. Em extensão, agradeço a toda sua equipe da UQTR pelos fornecimento dos dados.

À todos os meus amigos, obrigada pela amizade e por entenderem os inúmeros momentos de ausência e as minhas “preferências”.

Aos meus colegas da turma de mestrado, em especial aos que sobreviveram esses 2 lon-gos anos, agradeço pela companhia e por compartilharem momentos de angustias e alegrias. Afinal, as aulas não seriam tão divertidas sem os “desperdícios de talentos”.

Aos demais colegas da pós-graduação, agradeço pelos momentos de descontração, por todo apoio e por tornarem o laboratório um lugar de refúgio em dias tensos.

À todos os professores, que de certa forma contribuíram para minha formação profissio-nal com seus ensinamentos e conhecimentos, em especial aos professores do programa de pós-graduação em Estatística da UFRJ. Ao professor Carlos Abanto-Valle, agradeço pelas conversas descontraídas em meio ao cafezinho. À professora Flávia Landim, por me pro-porcionar oportunidades ainda na fase da graduação, o que permitiu percorrer o caminho até aqui. Ao professor Basílio Pereira, meu primeiro orientador em pesquisas de Iniciação Científica, obrigada por seu incentivo e carinho, e por me mostrar o mundo da pesquisa.

Aos professores Helio Migon e Francisco Louzada Neto, agradeço por aceitarem o con-vite de fazer parte desta banca. À professora Thais Fonseca, por gentilmente aceitar a posição de suplente na banca.

Ao Marco Lombardi, por gentilmente disponibilizar os códigos do seu programa.

(9)

Resumo

Muitos processos ecológicos importantes são consequências de movimentos de animais em seus habitats. Entretanto, o procedimento para a compreensão desses movimentos tem sido dificultado devido à falta de uma estrutura de modelagem geral que considere, de forma mais realista, importantes características que muitas vezes descrevem as curvas de dispersão na natureza.

Trabalhos recentes mostraram que as distribuições estáveis de Lévy podem fornecer um modelo alternativo poderoso aos modelos usualmente utilizados, uma vez que podem gerar caudas pesadas e permitir assimetria. Para tanto, considera-se que os deslocamentos dos animais são processos estocásticos de Lévy α-estáveis e, portanto, torna-se razoável modelar tais deslocamentos através das distribuições estáveis de Lévy.

Entretanto, com exceção de poucos casos, as distribuições estáveis não possuem expres-são de forma fechada para a função de densidade de probabilidade, o que impede a avaliação da função de verossimilhança. Consequentemente, o processo de estimação dos parâmetros de uma distribuição estável torna-se uma tarefa não trivial. Alguns métodos existentes na literatura para fazer inferência sobre tais parâmetros são descritos nesta dissertação.

A abordagem utilizada neste trabalho recorre à transformada rápida de Fourier (FFT, do inglês, fast Fourier transform) da função característica a fim de aproximar a função de verossimilhança. Um modelo hierárquico é, então, proposto para os processos de Lévy. Estudos com dados artificiais são realizados e o modelo proposto é aplicado a dados de deslocamento de peixes.

Todo o procedimento de inferência é feito sob o enfoque bayesiano, isto é, atribuímos uma distribuição a priori para os parâmetros do modelo a fim de obter a distribuição a poste-riori. Como a distribuição a posteriori resultante não tem forma analítica fechada, métodos de Monte Carlo via cadeias de Markov (MCMC, do inglês, Markov Chain Monte Carlo) são utilizados para obter amostras desta distribuição.

Palavras-chave: Distribuições estáveis de Lévy, processos estocásticos de Lévy, modelagem hierárquica, inferência bayesiana, transformada rápida de Fourier.

(10)

Abstract

Many important ecological processes are consequences of animal movements in their habitats. However, the procedure for the understanding of these movements has been ham-pered by the lack of a general modeling framework to consider, more realistically, important characteristics that often describe dispersal curves in nature.

Recent work showed that Lévy stable distributions can provide a powerful alternative model to the models commonly used, since they can generate heavy tails and allow asym-metry. To this end, it is considered that the displacements of the animals are Lévy α-stable processes, and therefore it is reasonable to model such displacements by Lévy stable distri-butions.

However, with the exception of a few cases, the stable distributions do not have closed-form expression for the probability density function, which prevents the evaluation of the likelihood function. Consequently, the process of estimating parameters of a stable distribu-tion becomes non-trivial. Some existing methods in the literature to make inferences about these parameters are described in this dissertation.

The approach used in this work resorts to the fast Fourier transform (FFT) of the characte-ristic function in order to approximate the likelihood function. A hierarchical model is then proposed for Lévy processes. Studies with artificial data are performed and the proposed model is applied to some fish displacement data.

All the inference procedure is performed under the Bayesian paradigm, that is, we assign a prior distribution for the model parameters in order to obtain the posterior distribution. As the resultant posterior distribution does not have a closed form, Markov chain Monte Carlo methods (MCMC) are used to obtain samples from this distribution.

Keywords: Lévy stable distributions, Lévy processes, hierarchical modeling, Bayesian in-ference, fast Fourier transform.

(11)

Sumário

1 Introdução 1

1.1 Motivação . . . 1

1.2 Processos Estocásticos de Lévy . . . 4

1.3 Organização da Dissertação . . . 5

2 Distribuições Estáveis 7 2.1 Revisão da Literatura . . . 7

2.1.1 Caracterização das Distribuições Estáveis . . . 7

2.1.2 Propriedades Gerais . . . 8

2.1.3 Parametrizações da Função Característica . . . 11

2.2 Geração de Variáveis Estáveis . . . 13

2.3 Inferência sob Enfoque Clássico . . . 14

2.3.1 Método dos Quantis . . . 15

2.3.2 Método Numérico de Máxima Verossimilhança . . . 15

2.4 Inferência sob Enfoque Bayesiano . . . 16

2.4.1 Método MCMC via Ampliação de Dados . . . 17

2.4.2 Método MCMC via Aproximação da Verossimilhança por FFT . . . 18

2.4.3 Método MCMC via Filtro de Partículas . . . 20

2.5 Discussão . . . 23

3 Modelagem Hierárquica Utilizando Distribuições Estáveis 24 3.1 Revisão da Literatura . . . 24

3.1.1 Teoria dos Modelos Hierárquicos . . . 24

3.1.2 Especificação das Distribuições a Priori . . . 25

3.2 Modelo Hierárquico Proposto . . . 26

3.3 Aproximação da Função de Verossimilhança . . . 27

(12)

3.4.1 Cálculo da Densidade a Priori de αi . . . 30

3.4.2 Cálculo da Densidade a Priori de βi . . . 31

3.4.3 Cálculo das Densidades Condicionais Completas . . . 31

3.5 Discussão . . . 36 4 Análise de Dados 37 4.1 Dados Artificiais . . . 37 4.1.1 Caso Particular αc∈ (0, 1) . . . 38 4.1.2 Caso Particular αc∈ (1, 2] . . . 46 4.2 Dados Reais . . . 54

4.2.1 Dados Reais - Truta das Fontes . . . 56

4.2.2 Dados Reais - Salmão . . . 68

4.3 Discussão . . . 76

5 Discussão 77 A Traços das Cadeias dos Parâmetros do Modelo Hierárquico para Processos de Lévy 82 A.1 Caso Particular αc∈ (0, 1) . . . 82

A.2 Caso Particular αc∈ (1, 2] . . . 95

(13)

Lista de Abreviaturas

ABC Computação Bayesiana Aproximada - Approximate Bayesian Computation

EMV Estimador de Máxima Verossimilhança - Maximum Likelihood Estimate

FFT Transformada Rápida de Fourier - Fast Fourier Transform

MCMC Monte Carlo via Cadeias de Markov - Markov Chain Monte Carlo

PRC Controle de Rejeição Parcial - Partial Rejection Control

SMC Monte Carlo Sequencial - Sequential Monte Carlo

(14)

Lista de Símbolos

α Índice de estabilidade da distribuição estável β Parâmetro de assimetria da distribuição estável γ Parâmetro de escala da distribuição estável δ Parâmetro de localização da distribuição estável θ Parâmetro ou vetor paramétrico em geral

Θ Espaço paramétrico

ΦX Função característica de X

Φ0 Função característica de uma variável estável na parametrização 0 Φ1 Função característica de uma variável estável na parametrização 1

y Dados observados

χ Espaço dos dados observados

x Dados auxiliares ou variável em geral qp(x) p-ésimo quantil de x

ˆ

q_p(x) Estimador do p-ésimo quantil de x π (θ ) Distribuição a priori de θ

π (θ |y) Distribuição a posteriori de θ

(15)

Lista de Tabelas

4.1 Número de observações e valores dos parâmetros atribuídos ao indivíduo i, i= 1, · · · , n, considerando o caso αc∈ (0, 1). . . 38 4.2 Número de observações e valores dos parâmetros atribuídos ao indivíduo i,

i= 1, · · · , n, considerando o caso αc∈ (1, 2]. . . 47 4.3 Número de observações dos deslocamentos de 14 peixes da espécie truta das

fontes observados no riacho Ganelon, no Canadá, em 1998. . . 57 4.4 Estimação pontual utilizando métodos dos quantis e de máxima verossimilhança

indireto e mediana a posteriori das estimativas do modelo hierárquico para os parâ-metros estáveis atribuídos a cada truta das fontes. . . 58 4.5 Número de observações dos deslocamentos dos 7 salmões observados no rio

Nidelva, na Noruega, em 1998. . . 68 4.6 Estimação pontual utilizando métodos dos quantis e de máxima verossimilhança

indireto e mediana a posteriori das estimativas do modelo hierárquico para os parâ-metros estáveis atribuídos a cada salmão. . . 69

A.1 Valores iniciais atribuídos aos parâmetros envolvidos no modelo, conside-rando o caso αc∈ (0, 1). . . 82 A.2 Valores iniciais atribuídos aos parâmetros envolvidos no modelo,

(16)

Lista de Figuras

1.1 Deslocamentos observados para 14 peixes da espécie truta das fontes encontrados no riacho Ganelon, no Canadá, em 1998.. . . 3

2.1 Densidade estável com parâmetro α variando e demais parâmetros fixos, sendo: (a) β = 0, γ = 1 e δ = 0; (b) β = 0.5, γ = 1 e δ = 0. . . 9 2.2 Densidade estável com parâmetro β variando e demais parâmetros fixos,

sendo: (a) α = 0.6, γ = 1 e δ = 0; (b) α = 1.6, γ = 1 e δ = 0. . . 9 2.3 Densidade estável com parâmetro γ variando e demais parâmetros fixos,

sendo: (a) α = 0.6, β = 0 e δ = 0; (b) α = 1.6, β = 0 e δ = 0. . . 10

4.1 Resumo da estimação utilizando o conjunto de dados 1 para o caso αc∈ (0, 1).

Bar-ras verticais representam os intervalos de 95% de credibilidade para os parâmetros estáveis, cujos verdadeiros valores são denotados pelos círculos sólidos. Linhas pontilhadas em azul representam a média a posteriori das estimativas para os parâ-metros centrais, cujos valores verdadeiros estão indicados pelas linhas tracejadas. . 40 4.2 Resumo da estimação utilizando o conjunto de dados 2 para o caso αc∈ (0, 1).

Bar-ras verticais representam os intervalos de 95% de credibilidade para os parâmetros estáveis, cujos verdadeiros valores são denotados pelos círculos sólidos. Linhas pontilhadas em azul representam a média a posteriori das estimativas para os parâ-metros centrais, cujos valores verdadeiros estão indicados pelas linhas tracejadas. . 40 4.3 Resumo da estimação utilizando o conjunto de dados 3 para o caso αc∈ (0, 1).

Bar-ras verticais representam os intervalos de 95% de credibilidade para os parâmetros estáveis, cujos verdadeiros valores são denotados pelos círculos sólidos. Linhas pontilhadas em azul representam a média a posteriori das estimativas para os parâ-metros centrais, cujos valores verdadeiros estão indicados pelas linhas tracejadas. . 41

(17)

4.4 Histograma dos hiperparâmetros centrais, com verdadeiros valores e médias a pos-teriori indicados pelas barras vermelhas e verdes, respectivamente. As linhas tra-cejadas representam o intervalo de 95% de credibilidade, utilizando o conjunto de dados 1 para o caso αc∈ (0, 1). . . 42

4.7 Traços das cadeias para as variâncias do modelo e histograma da amostra com seus respectivos intervalos de 95% de credibilidade tracejados em azul e verdadeiros valores indicados pelas barras vermelhas, bem como as curvas de densidade a priori considerando a base de dados 1 para o caso αc∈ (0, 1).. . . 44

4.10 Resumo da estimação utilizando o conjunto de dados 1 para o caso αc∈ (1, 2].

Bar-ras verticais representam os intervalos de 95% de credibilidade para os parâmetros estáveis, cujos verdadeiros valores são denotados pelos círculos sólidos. Linhas pontilhadas em azul representam a média a posteriori das estimativas para os parâ-metros centrais, cujos valores verdadeiros estão indicados pelas linhas tracejadas. . 48

(18)

4.11 Resumo da estimação utilizando o conjunto de dados 2 para o caso αc∈ (1, 2].

Bar-ras verticais representam os intervalos de 95% de credibilidade para os parâmetros estáveis, cujos verdadeiros valores são denotados pelos círculos sólidos. Linhas pontilhadas em azul representam a média a posteriori das estimativas para os parâ-metros centrais, cujos valores verdadeiros estão indicados pelas linhas tracejadas. . 48 4.12 Resumo da estimação utilizando o conjunto de dados 3 para o caso αc∈ (1, 2].

Bar-ras verticais representam os intervalos de 95% de credibilidade para os parâmetros estáveis, cujos verdadeiros valores são denotados pelos círculos sólidos. Linhas pontilhadas em azul representam a média a posteriori das estimativas para os parâ-metros centrais, cujos valores verdadeiros estão indicados pelas linhas tracejadas. . 49 4.13 Histograma dos hiperparâmetros centrais, com verdadeiros valores e médias a

pos-teriori indicados pelas barras vermelhas e verdes, respectivamente. As linhas tra-cejadas representam o intervalo de 95% de credibilidade, utilizando o conjunto de dados 1 para o caso αc∈ (1, 2]. . . 50

4.14 Histograma dos hiperparâmetros centrais, com verdadeiros valores e médias a pos-teriori indicados pelas barras vermelhas e verdes, respectivamente. As linhas tra-cejadas representam o intervalo de 95% de credibilidade, utilizando o conjunto de dados 2 para o caso αc∈ (1, 2]. . . 50

4.15 Histograma dos hiperparâmetros centrais, com verdadeiros valores e médias a pos-teriori indicados pelas barras vermelhas e verdes, respectivamente. As linhas tra-cejadas representam o intervalo de 95% de credibilidade, utilizando o conjunto de dados 3 para o caso αc∈ (1, 2]. . . 51

4.16 Traços das cadeias para as variâncias do modelo e histograma da amostra com seus respectivos intervalos de 95% de credibilidade tracejados em azul e verdadeiros valores indicados pelas barras vermelhas, bem como as curvas de densidade a priori considerando a base de dados 1 para o caso αc∈ (1, 2]. . . 52

(19)

4.19 Traços das cadeias obtidas para os parâmetros estáveis, com seus respectivos inter-valos de 95% de credibilidade tracejados em azul, relacionados ao peixe 1 dos dados de truta das fontes. . . 59 4.20 Traços das cadeias obtidas para os parâmetros estáveis, com seus respectivos

inter-valos de 95% de credibilidade tracejados em azul, relacionados ao peixe 2 dos dados de truta das fontes. . . 59 4.21 Traços das cadeias obtidas para os parâmetros estáveis, com seus respectivos

inter-valos de 95% de credibilidade tracejados em azul, relacionados ao peixe 9 dos dados de truta das fontes. . . 62

(20)

4.28 Traços das cadeias obtidas para os parâmetros estáveis, com seus respectivos in-tervalos de 95% de credibilidade tracejados em azul, relacionados ao peixe 10 dos dados de truta das fontes. . . 62 4.29 Traços das cadeias obtidas para os parâmetros estáveis, com seus respectivos

in-tervalos de 95% de credibilidade tracejados em azul, relacionados ao peixe 11 dos dados de truta das fontes. . . 62 4.30 Traços das cadeias obtidas para os parâmetros estáveis, com seus respectivos

in-tervalos de 95% de credibilidade tracejados em azul, relacionados ao peixe 14 dos dados de truta das fontes. . . 63 4.33 Traços das cadeias para os hiperparâmetros centrais, com seus respectivos intervalos

de 95% de credibilidade tracejados em azul, estimados para os dados de truta das fontes. . . 65 4.34 Histograma dos hiperparâmetros centrais, com seus respectivos intervalos de 95%

de credibilidade tracejados em azul e medianas a posteriori indicadas pelas linhas verdes, estimados para os dados de truta das fontes. . . 65 4.35 Traços das cadeias para as variâncias do modelo e histograma da amostra com seus

respectivos intervalos de 95% de credibilidade tracejados em azul e medianas a posteriori indicadas pelas barras verdes, estimados para os dados de truta das fontes, bem como as curvas de densidade a priori atribuídas. . . 66 4.36 Histograma dos deslocamentos observados para cada uma das 14 trutas das fontes,

bem como o ajuste da densidade estável considerando como parâmetros as medianas a posteriori obtidas pelo modelo hierárquico.. . . 67 4.37 Traços das cadeias obtidas para os parâmetros estáveis, com seus respectivos

inter-valos de 95% de credibilidade tracejados em azul, relacionados ao peixe 1 dos dados de salmão. . . 70

(21)

4.38 Traços das cadeias obtidas para os parâmetros estáveis, com seus respectivos inter-valos de 95% de credibilidade tracejados em azul, relacionados ao peixe 2 dos dados de salmão. . . 71 4.39 Traços das cadeias obtidas para os parâmetros estáveis, com seus respectivos

inter-valos de 95% de credibilidade tracejados em azul, relacionados ao peixe 3 dos dados de salmão. . . 71 4.40 Traços das cadeias obtidas para os parâmetros estáveis, com seus respectivos

inter-valos de 95% de credibilidade tracejados em azul, relacionados ao peixe 7 dos dados de salmão. . . 72 4.44 Traços das cadeias para os hiperparâmetros centrais, com seus respectivos intervalos

de 95% de credibilidade tracejados em azul, estimados para os dados de salmão. . 73 4.45 Histograma dos hiperparâmetros centrais, com seus respectivos intervalos de 95%

de credibilidade tracejados em azul e medianas a posteriori indicadas pelas linhas verdes, estimados para os dados de salmão. . . 73 4.46 Traços das cadeias para as variâncias do modelo e histograma da amostra com seus

respectivos intervalos de 95% de credibilidade tracejados em azul e medianas a posteriori indicadas pelas barras verdes, estimados para os dados de salmão, bem como as curvas de densidade a priori atribuídas. . . 74 4.47 Histograma dos deslocamentos observados para cada um dos 7 salmões, bem como

o ajuste da densidade estável considerando como parâmetros as medianas a posteri-ori obtidas pelo modelo hierárquico. . . 75

(22)

A.1 Traços das cadeias para os hiperparâmetros centrais, com seus respectivos intervalos de 95% de credibilidade tracejados em azul e verdadeiros valores indicados pelas linhas vermelhas, considerando a base de dados 1 para o caso αc∈ (0, 1). . . 83

A.4 Traços das cadeias A (em preto) e B (em verde) para os parâmetros estáveis, com seus respectivos intervalos de 95% de credibilidade tracejados em azul e verdadeiros valores indicados pelas linhas vermelhas, para o indivíduo 1 considerando o caso αc∈ (0, 1) e valores iniciais descritos na Tabela A.1. . . 84

(23)

(24)

(25)

A.25 Traços das cadeias para os hiperparâmetros centrais com seus respectivos intervalos de 95% de credibilidade tracejados em azul e verdadeiros valores indicados pelas linhas vermelhas, considerando a base de dados 1 para o caso αc∈ (1, 2]. . . 95

A.28 Traços das cadeias A (em preto) e B (em verde) para os parâmetros estáveis, com seus respectivos intervalos de 95% de credibilidade tracejados em azul e verdadeiros valores indicados pelas linhas vermelhas, para o indivíduo 1 considerando o caso αc∈ (1, 2] e valores iniciais descritos na Tabela A.2. . . 97

(26)

(27)

(28)

(29)

Capítulo 1

Introdução

Muitos processos ecológicos importantes são consequências de movimentos de animais em seus habitats naturais. Tais movimentos estão diretamente relacionados à dinâmica po-pulacional e à preservação da diversidade de espécies. O movimento dos peixes mantém ligações dinâmicas entre habitats e contribui para processos tais como colonização de habi-tats recém-disponíveis e transferências de energia e nutrientes (Rodríguez,2010).

Entretanto, o procedimento para a compreensão dos deslocamentos dos animais tem sido dificultado, de um modo geral, pela falta de uma estrutura de modelagem integrativa a fim de entender melhor as complexidades dos sistemas ecológicos reais. Os passeios aleatórios usualmente utilizados não podem gerar duas características chave: leptocurtose e caudas pesadas, que muitas vezes caracterizam as curvas de dispersão na natureza (Clark et al.,

1998).

Trabalhos recentes mostraram que as distribuições estáveis de Lévy podem fornecer um modelo alternativo poderoso aos modelos clássicos de difusão (Bartumeus et al.,2005), uma vez que podem gerar caudas pesadas e permitir assimetria (Nolan, 2009). Essas distribui-ções têm grande potencial para fornecer uma estrutura unificadora para os estudos sobre movimento animal.

1.1 Motivação

O deslocamento de peixe pode ser definido pelas diferenças de sua posição entre duas observações consecutivas, considerando a posição atual e a posição imediatamente anterior. Deste modo, é razoável assumir independência entre os deslocamentos de um determinado peixe.

(30)

Em geral, a hipótese de normalidade é considerada válida para este tipo de análise, em-bora podemos observar uma curva com leptocurtose para os deslocamentos dos peixes. Na Figura 1.1 apresentamos os deslocamentos observados para uma das bases de dados reais que serão tratadas neste trabalho.

Na literatura, geralmente usa-se uma mistura de normais para a modelagem dos desloca-mentos animais, porém mesmo assim a cauda é curta e tem decaimento mais lento do que o decaimento exponencial. Além disso, se usamos uma mistura de normais, não podemos assumir que todas as distribuições para um determinado peixe são iguais.

Entretanto, se utilizamos uma distribuição α-estável, a distribuição será igual e estável ao longo do tempo. Podemos considerar estabilidade e saltos nas observações do mesmo peixe. Além disso, se a cauda da distribuição é longa, o estudo dos movimentos de peixes podem evitar vários problemas ecológicos. A maioria dos artigos em Ecologia que falam da distribuição α-estável, usam-na apenas para modelar a cauda das observações.

Diante disso, o objetivo é modelar estes deslocamentos de peixes através das distribui-ções estáveis de Lévy, pois espera-se um comportamento descrito por caudas pesadas e que, possivelmente, possa apresentar assimetria. Além disso, do ponto de vista biológico, o des-locamento de um peixe deve manter a mesma distribuição ao longo do tempo.

No entanto, como temos observações para vários peixes, podemos utilizar a modelagem hierárquica, que permitirá utilizarmos a informação entre os peixes, objetivando obter um modelo que descreva de forma realista o comportamento dos peixes através do deslocamen-tos observados. O modelo hierárquico proposto será descrito mais adiante na Seção 3.2.

A análise do movimento de animais em grandes escalas espaciais ou em longas escalas temporais deu origem a uma nova categoria de modelos de passeios aleatórios conhecidos como movimentos de Lévy. Na literatura, é usual assumir que os deslocamentos dos animais podem ser considerados como processos de incrementos estacionários e independentes, de-nominados processos estocásticos de Lévy, que serão descritos a seguir.

(31)

0 10 20 30 −40 0 Peixe 1 t ∆xt ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● 0 10 20 −30 0 30 Peixe 2 t ∆xt ● ● ● ● ●● ● ● ● ●●●●●●●●● ● ● ● ● ● ● ● ●● ● 5 15 −300 0 300 Peixe 3 t ∆xt ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● 0 10 20 30 −60 20 Peixe 4 t ∆xt ●_●●●●_●● ● ●● ●● ●_●●● ● ● ●●●●●_●●_●●●●● ● ● ● ● ● 0 10 20 30 −300 200 Peixe 5 t ∆xt ●●● ●●●●●●●●●●●●●●●●●●●●● ● ● ●●●●●● ● ● ● 0 10 20 −500 −100 Peixe 6 t ∆xt ●●●●●●●●● ●●●● ● ● ● ●●● ● ● ● ●●●●● ● 0 10 20 30 −400 200 Peixe 7 t ∆xt ● ● ● ●●●●●● ● ●●●● ● ●●●●● ● ●● ● ● ● ● ●●●● ● ● ● 0 10 20 −200 100 Peixe 8 t ∆xt ●●● ● ●●●●●_● ● ●●●●●●●●●●● ● ● ● ● ● ● 0 10 20 30 −60 0 Peixe 9 t ∆xt ● ● ● ●● ● ● ●●●●●●●●●●●●● ● ● ● ● ●●●●●● ● ● ● ● 0 10 20 −60 0 60 Peixe 10 t ∆xt ●_● ● ● ● ● ● ●●● ● ●●● ● ● ● ●● ● ●● ● ●● ● ● 5 15 25 −50 100 Peixe 11 t ∆xt ● ● ● ● ● ● ●● ● ●●●● ● ● ● ●●●●●● ● ● ● 0 10 20 −50 100 Peixe 12 t ∆xt ● ● ●●●●●●●●●●● ● ● ● ●●●●● ● ● ●● ● ● 0 10 20 30 −60 0 Peixe 13 t ∆xt ● ●●●● ● ● ●●● ● ● ●●●● ●●●●● ● ● ● ● ● ● ● ● 0 10 20 30 −50 50 Peixe 14 t ∆xt ● ●●●● ● ● ●●●●● ● ●●●●●●●●●●●●●● ● ●●●

Figura 1.1: Deslocamentos observados para 14 peixes da espécie truta das fontes encontrados no riacho Ganelon, no Canadá, em 1998.

(32)

1.2 Processos Estocásticos de Lévy

Para melhor compreensão das suposições consideradas neste trabalho, é de suma impor-tância introduzir os conceitos de processos estocásticos de Lévy e, em particular, de proces-sos de Lévy α-estáveis. Para tanto, considere as seguintes definições:

Definição 1. Processo Estocástico de Lévy: Um processo estocástico X = {X (t) : t ≥ 0} com valores em IRd é dito um processo de Lévy se:

• P{X (0) = 0} = 1 ou X (0) = 0 quase certamente;

• X tem incrementos independentes, isto é, para quaisquer 0 ≤ t1< t2< · · · < tn< ∞, X(t2) − X (t1), X (t3) − X (t2), . . . , X (tn) − X (tn−1) são independentes;

• X tem incrementos estacionários, isto é, X (t + h) − X (t) e X (h) são iguais em distri-buição, para todo t > 0;

• X é estocasticamente contínua, isto é, lim t→t0

P{|X(t) − X(t0)| > ε} = 0;

• t 7→ X (t) é quase certamente uma trajetória contínua à direita com limite à esquerda.

Alguns exemplos de processos estocásticos de Lévy são o movimento Browniano, o pro-cesso de Poisson, o propro-cesso de Poisson composto e o propro-cesso de Lévy α-estável. Vejamos a definição para este último.

Definição 2. Processo de Lévy α-estável: Dizemos que Zα= {Zα(t) : t ≥ 0} é um processo (ou movimento) de Lévy α-estável se:

• P{Zα(0) = 0} = 1 ou Zα(0) = 0 quase certamente;

• Z_α possui incrementos independentes;

• Zα(t + h) − Zα(t) e Zα(h) são iguais em distribuição.

A saber, Zα(h) tem distribuição estável, mais precisamente, Zα(h) ∼ S(α, β , σ h

1/α_{, 0).}

Tal notação bem como os parâmetros envolvidos nesta distribuição serão tratados mais adiante no Capítulo 2.

(33)

Por suposição, assumimos que os incrementos do deslocamento animal são independen-tes e estacionários e os deslocamentos iniciais são considerados nulos. Portanto, pode-se dizer que os deslocamentos dos animais são processo de Lévy α-estáveis e, portanto, é ra-zoável querermos modelá-los através das distribuições estáveis de Lévy.

A importância das distribuições de Lévy deve-se ao fato delas serem as distribuições limites de processos envolvendo soma de variáveis independentes e identicamente distribuí-das (iid’s). O matemático Paul Lévy generalizou o Teorema Central do Limite (TCL) não impondo nenhuma restrição à variância. Considere o teorema a seguir.

Teorema 1. Teorema Central do Limite Generalizado: Uma variável aleatória não de-generada Z é α-estável para algum 0 < α ≤ 2 se, e somente se, existir uma sequência de variáveis aleatórias iid’s X1, X2, X3, . . . e constantes an> 0, bn∈ IR com

an(X1+ · · · + Xn) − bn d −→ Z.

O símbolo−→ denota convergência em distribuição. O Teorema Central do Limite Ge-d neralizado afirma que se a suposição de variância finita for descartada, os únicos limites resultantes não-triviais possíveis são distribuições α-estáveis.

1.3 Organização da Dissertação

Este texto está organizado da seguinte forma: o Capítulo 2 introduz os conceitos de va-riável estável e distribuição estável de Lévy e apresenta uma revisão das principais caracte-rísticas e propriedades dessa distribuição. As duas parametrizações da função característica mais utilizadas neste contexto são descritas e algumas propriedades relevantes são adicio-nadas. Este capítulo aborda ainda as diversas propostas existentes na literatura para fazer inferência sobre os parâmetros de uma distribuição estável, mostrando tanto os métodos de inferência clássica, como os métodos de estimação sob enfoque bayesiano.

O Capítulo 3 inicia-se com uma breve introdução aos modelos hierárquicos, bem como uma visão geral sobre a especificação das distribuições a priori. Em seguida, o modelo hie-rárquico proposto para a modelagem de processos de Lévy é descrito. Este capítulo mostra

(34)

com detalhes como é feita a aproximação da função de verossimilhança via Transformada Rápida de Fourier (FFT) e descreve as variáveis envolvidas nesse processo. O procedimento de inferência adotado, sob o paradigma bayesiano, é então apresentado.

O Capítulo 4 é voltado para a aplicação do modelo hierárquico proposto nesta disserta-ção. Sua primeira seção contém uma análise descritiva dos dados artificiais e os resultados obtidos pela aplicação do modelo proposto. Em seguida, descreve também a base de dados reais utilizada neste trabalho e faz comentários sobre os resultados observados.

Finalmente, o Capítulo 5 conclui a dissertação destacando os principais resultados ob-tidos através deste estudo. As dificuldades inerentes à inferência dos parâmetros de uma distribuição estável são apontadas. Em seguida, apresenta sugestões para uma possível ex-tensão do trabalho aqui realizado.

O apêndice ao final desta dissertação contém os traços das cadeias de Monte Carlo via Cadeias de Markov (MCMC) para o modelo proposto no Capítulo 3 obtidas para uma base de dados artificiais específica, detalhando os resultados apresentados no Capítulo 4, com o intuito de analisar o comportamento da cadeia e convergência obtida.

Para a obtenção das amostras das distribuições a posteriori apresentadas no Capítulo 4, adaptamos o programa do Dr. Lombardi, feito em C++, para a estrutura do modelo hierár-quico aqui proposto. O software R foi utilizado para a construção das figuras apresentadas nesta dissertação. Todas as análises foram realizadas em um computador Intel(R) Core(TM) i3 CPU 550 @ 3.20 GHz com 4 GB de memória RAM no sistema operacional Windows 7.

(35)

Capítulo 2

Distribuições Estáveis

2.1 Revisão da Literatura

As distribuições estáveis são uma classe de distribuições de probabilidade que permi-tem assimetria e caudas pesadas e têm propriedades mapermi-temáticas interessantes, tais como estabilidade e independência de escala (Nolan, 2009). A classe foi introduzida pelo mate-mático francês Paul Lévy (1924) em seus estudos sobre soma de termos independentes e identicamente distribuídos (iid’s).

2.1.1 Caracterização das Distribuições Estáveis

As distribuições estáveis são descritas por quatro parâmetros: • α ∈ (0, 2] - índice de estabilidade ou expoente característico; • β ∈ [−1, 1] - parâmetro de assimetria;

• γ ∈ (0, +∞) - parâmetro de escala; • δ ∈ IR - parâmetro de localização.

O parâmetro α mede a espessura da cauda, valores menores indicam caudas pesadas com picos maiores. Se β = 0, então a distribuição é simétrica. Se β > 0, então a distribuição é enviesada com a cauda direita mais pesada que a cauda esquerda. Ou seja, P(X > x) > P(X < −x) para um x > 0 grande.

A forma mais concreta de descrever todas as possíveis distribuições estáveis é através da função característica (ou transformada de Fourier) dada por:

ΦX(u) = IE[exp(iuX )] =

Z ∞

(36)

Definição 3. Variáveis Estáveis: Uma variável aleatória X é estável se, e somente se, X =d γ Z + δ , onde α ∈ (0, 2], β ∈ [−1, 1], γ ∈ (0, +∞), δ ∈ IR e Z é uma variável aleatória com função característica dada por:

IE[exp(iuZ)] =       

expn− |u|αh_{1 − iβ tan} π α

2 sign(u) io

α 6= 1,

expn− |u|h1 + iβ2

πsign(u) log |u| io

α = 1.

O símbolo= denota igualdade em distribuição, isto é, ambas expressões têm a mesma leid de probabilidade. O termo sign(.) é utilizado para expressar a função sinal definida como:

sign(u) =      0 u = 0, u |u| u6= 0.

Denotaremos por X ∼ S(α, β , γ, δ ) uma variável aleatória X com distribuição estável de Lévy com parâmetros α, β , γ e δ .

2.1.2 Propriedades Gerais

As distribuições estáveis são consideradas generalizações importantes da distribuição normal e têm atraído muito interesse pelo fato de permitirem assimetria e caudas pesadas. Além disso, essa família de distribuições torna-se mais flexível à adaptação aos dados empíri-cos pelo fato de ser descrita por quatro parâmetros, em vez de dois, como no caso gaussiano.

As Figuras 2.1, 2.2 e 2.3 mostram exemplos da forma da função de densidade para dife-rentes valores dos parâmetros da distribuição estável. Na primeira figura, retratamos densi-dades padronizadas (γ = 1 e δ = 0) considerando alguns valores possíveis para α. No painel (a), as distribuições são simétricas em torno de zero e no painel (b), consideramos o caso assimétrico.

Na Figura 2.2, também consideramos densidades padronizadas, porém fixamos os valo-res de α e atribuímos alguns valovalo-res possíveis para β . No painel (a), adotamos α = 0.6 com o intuito de obter distribuições leptocúrticas. Neste caso, vemos claramente a influência dos valores de β com relação à simetria das curvas. No entanto, ao considerar α = 1.6, no painel

(37)

(b), podemos perceber que o parâmetro de assimetria β perde sua influência sobre a forma da função de densidade.

Na Figura 2.3, consideramos densidades simétricas em torno de zero (β = 0 e δ = 0) e variamos os valores atribuídos para γ. No painel (a), temos distribuições leptocúrticas com α = 0.6 e no painel (b), distribuições platicúrticas com α = 1.6. Em ambos os casos, percebemos que quanto maior o valor do parâmetro de escala, mais achatada será a função de densidade. −4 −2 0 2 4 0.0 0.1 0.2 0.3 0.4 0.5 0.6 x densidade α = 0.50 α = 0.75 α = 1.25 α = 2.00 β = 0 γ = 1 δ = 0

(a) distribuição simétrica: β = 0

−4 −2 0 2 4 0.0 0.1 0.2 0.3 0.4 0.5 0.6 x densidade α = 0.50 α = 0.75 α = 1.25 α = 2.00 β = 0.5 γ = 1 δ = 0 (b) distribuição assimétrica: β = 0.5

Figura 2.1: Densidade estável com parâmetro α variando e demais parâmetros fixos, sendo: (a) β = 0, γ = 1 e δ = 0; (b) β = 0.5, γ = 1 e δ = 0. −4 −2 0 2 4 0.0 0.1 0.2 0.3 0.4 0.5 x densidade β = 0.00 β = 0.25 β = 0.75 β = 1.00 α = 0.6 γ = 1 δ = 0

(a) distribuição leptocúrtica: α = 0.6

−4 −2 0 2 4 0.0 0.1 0.2 0.3 0.4 0.5 x densidade β = 0.00 β = 0.25 β = 0.75 β = 1.00 α = 1.6 γ = 1 δ = 0 (b) distribuição platicúrtica: α = 1.6

Figura 2.2: Densidade estável com parâmetro β variando e demais parâmetros fixos, sendo: (a) α = 0.6, γ = 1 e δ = 0; (b) α = 1.6, γ = 1 e δ = 0.

(38)

−4 −2 0 2 4 0.0 0.1 0.2 0.3 0.4 0.5 x densidade γ = 1 γ = 2 γ = 3 γ = 6 α = 0.6 β = 0 δ = 0

(a) distribuição leptocúrtica: α = 0.6

−4 −2 0 2 4 0.0 0.1 0.2 0.3 0.4 0.5 x densidade γ = 1 γ = 2 γ = 3 γ = 6 α = 1.6 β = 0 δ = 0 (b) distribuição platicúrtica: α = 1.6

Figura 2.3: Densidade estável com parâmetro γ variando e demais parâmetros fixos, sendo: (a) α = 0.6, β = 0 e δ = 0; (b) α = 1.6, β = 0 e δ = 0.

As funções de densidades de probabilidade para quase todas as distribuições estáveis não possuem fórmula fechada. Tal propriedade torna-se uma desvantagem que praticamente in-viabiliza seu uso. As excessões ocorrem para três distribuições conhecidas: Normal, Cauchy e Lévy.

• Se X ∼ N(µ, σ2) então X ∼ S(α = 2, β = 0, γ =σ_/√₂_{, δ = µ).}

• Se X ∼ Cauchy(µ, c) então X ∼ S(α = 1, β = 0, γ = c, δ = µ).

• Se X ∼ L ´evy(µ, c) então X ∼ S(α =1_/₂_{, β = 1, γ = c, δ = µ).}

Sabe-se também que todas as funções de densidade de distribuições estáveis são contí-nuas e unimodais, com densidade infinitamente diferenciável, embora não exista uma fór-mula conhecida para o local da moda (Nolan,2009).

Além disso, as distribuições estáveis possuem todos os momentos menor do que α, mas nenhum maior que α, exceto no caso particular α = 2. Assim, uma distribuição estável não tem variância, exceto quando α = 2, e não tem média quando α < 1. Por esta razão, e para evitar diversos problemas matemáticos, as análises em geral são restritas a α ∈ (0, 1) ou α ∈ (1, 2], dependendo se a média existe ou não.

(39)

Uma outra propriedade básica das distribuições estáveis é que somas de variáveis alea-tórias α-estáveis são α-estáveis. Note que é essencial que as parcelas tenham o mesmo α, pois caso contrário a soma não será estável.

Algumas relações de dependências entre os parâmetros da distribuição estável são co-nhecidas. Uma relação bastante óbvia envolve os parâmetros (α,β ). Sabemos que quando α → 2, as distribuições ficam muito próximas e simétricas. Neste caso, β torna-se menos significante e mais difícil de estimar com precisão. Tal comportamento pode ser observado no painel (b) da Figura 2.2.

Além disso, é intuitivo assumir uma relação entre (α,γ) pois uma redução da escala pode ser, em certa forma, compensada por um aumento da espessura da cauda, o que indica dimi-nuição do expoente característico α. E finalmente, identifica-se uma relação entre (α,β ,δ ) uma vez que uma mudança de posição pode ser compensada por um aumento tanto da largura da cauda, quando do viés (Buckle,1995).

2.1.3 Parametrizações da Função Característica

Existem muitas parametrizações da função característica para as distribuições estáveis, que devem ser escolhidas de acordo com as vantagens de suas propriedades. Entre elas, destacamos as duas parametrizações mais utilizadas para escrever a função característica de uma distribuição estável.

Parametrização 0

A Parametrização 0 é a mais recomendada para trabalhos numéricos e inferência estatís-tica pois tem a fórmula mais simples para a função caracterísestatís-tica que é contínua em todos os parâmetros. No entanto, a formulação da função característica apresenta uma expressão complexa e as propriedades analíticas têm significados menos intuitivos (Lombardi,2007). Neste caso, a função característica é expressa por:

Φ0(u) =        exp n

iδ u − γα_|u|αh_{1 + iβ tan} π α

2 sign(u) |γu| 1−α_{− 1}io α 6= 1, exp n iδ u − γ|u| h

1 + iβ_π2sign(u) log(γ|u|) io

(40)

Parametrização 1

Na Parametrização 1, a função característica tem uma expressão mais simples, que pode produzir diretamente vários resultados analíticos interessantes e possui boas propriedades algébricas. Por causa disso é a parametrização mais usada em demonstrações. Entretanto, ela tem uma grande desvantagem no que diz respeito à estimação e inferência: não é contínua em relação aos parâmetros no ponto α = 1 (Lombardi,2007). Neste caso, a função característica é expressa por: Φ1(u) =        exp n

iδ u − γα_|u|αh_{1 − iβ tan} π α

2 sign(u) io α 6= 1, exp n iδ u − γ|u| h

1 + iβ_π2sign(u) log |u| io

α = 1.

Considere a notação S(α, β , γ, δ ; k) para k = 0, 1 a fim de representar a distribuição está-vel sob a Parametrização 0 ou 1, respectivamente.

Embora a Parametrização 1 tenha grande importância teórica, na prática apresenta diver-sas desvantagens. A principal delas é que se X ∼ S(α, β , γ, δ ; 1) e β > 0 então a moda de X tende a ∞ quando α se aproxima de 1 pela direita e tende a −∞ quando α se aproxima de 1 pela esquerda.

Além disso, essa parametrização não tem propriedades intuitivas desejáveis em aplica-ções, como continuidade das distribuições quando os parâmetros variam, uma família de escala e localização, etc.

Outras propriedades da distribuição estável podem ser citadas com relação à parametri-zação adotada. Por exemplo, pode-se mostrar que, se X ∼ S(α, β , γ, δ ; 0) e Z = (X − δ )

γ ,

então Z ∼ S(α, β , 1, 0; 0).

Além disso, para quaisquer a 6= 0, b ∈ IR, se X ∼ S(α, β , γ, δ ; 0) segue que aX + b ∼ S(α, sign(a)β , |a|γ, aδ + b; 0). Estes resultados ainda são válidos para a Parametrização 1 quando α 6= 1 (Buckle,1995).

Nas duas parametrizações aqui apresentadas os parâmetros α, β e γ são sempre os mes-mos, mas os parâmetros de localização δ terão valores diferentes. Neste caso, podemos

(41)

adotar a notação S(α, β , γ, δ_k; k) para a distribuição estável sob a Parametrização 0 ou 1, respectivamente. Os parâmetros de localização são relacionados por:

δ0=      δ1+ β γ tan(π α₂ ) α 6= 1, δ1+ β γ_π2log(γ) α = 1.

Como citado anteriormente, a distribuição estável não tem média quando α < 1. Entre-tanto, quando α ∈ (1, 2] a média pode ser encontrada conforme a proposição a seguir:

Proposição 1. Quando 1 < α ≤ 2, IE(|X |) < ∞ e a média de X ∼ S(α, β , γ, δk; k) para k = 0, 1 é dada por: µ = IE(X ) = δ1= δ0− β γ tan(π α₂ ).

Para demais propriedades e parametrizações vejaNolan(2009).

2.2 Geração de Variáveis Estáveis

De acordo comNolan(2009), a simulação de variáveis aleatórias estáveis pode ser reali-zada através de uma extensão do algoritmo de Box-Müller, conforme o seguinte teorema:

Teorema 2. Sejam U e V variáveis aleatórias independentes, com U uniformemente distri-buída no intervalo −π

2, π

2 e V exponencialmente distribuída com média 1. Para quaisquer 0 < α ≤ 2 e −1 ≤ β ≤ 1, quando α 6= 1 defina: W = 1 α arctan β tan _{π α} 2 . Então: Z=                sen α(W +U ) cos(αW ) cosU1/α " cos(αW + (α − 1)U ) V #(1−α)/α α 6= 1, 2 π " _π 2+ βU tanU − β log π 2VcosU π 2+ βU !# α = 1. tem distribuição S(α, β , 1, 0; 1).

Assim, para simular variáveis aleatórias estáveis com escala e localização arbitrários basta aplicar as devidas transformações, de acordo com a parametrização desejada. Ou seja,

(42)

para gerar uma amostra aleatória X ∼ S(α, β , γ, δ ; 1) deve-se fazer: X =      γ Z + δ α 6= 1, γ [Z + β2 π log(γ)] + δ α = 1.

No entanto, se o objetivo é produzir uma amostra aleatória X ∼ S(α, β , γ, δ ; 0) deve-se levar em consideração a diferença existente no parâmetro δ em relação às parametrizações, como citado em 2.1.3. Então, aplica-se a seguinte transformação:

X =      γ [Z − β tan(π α₂ )] + δ α 6= 1, γ Z + δ α = 1.

2.3 Inferência sob Enfoque Clássico

Em geral, o ponto de partida em problemas de inferência estatística é um conjunto de n observações, y = (y1, · · · , yn), que representa os valores observados de uma amostra aleatória simples. Isto é, (Y1, · · · ,Yn) são variáveis aleatórias independentes e identicamente distribuí-das com distribuição de probabilidade f (y|θ ), onde θ é uma quantidade fixa e desconhecida, denominada parâmetro, a qual deseja-se estimar.

Na inferência clássica, em geral, a estimação sobre θ baseia-se apenas na função de den-sidade f (y|θ ). Os três métodos mais importantes são o método de máxima verossimilhança, o método dos mínimos quadrados e o método dos momentos.

O método de máxima verossimilhança é atualmente o método de estimação mais utili-zado na inferência clássica e é inteiramente baseado na função de verossimilhança. No caso da distribuição estável, note que a estimação é dificultada pela ausência de uma densidade de forma fechada, o que impede a avaliação da função de verossimilhança.

Essa dificuldade, aliada ao fato de que os momentos de ordem superior a α não existem sempre que α < 2, faz com que seja impossível usar os métodos de estimação usuais, como

(43)

o de máxima verossimilhança e o método dos momentos, de forma direta. Esquemas alter-nativos de estimação têm sido propostos, principalmente com base em quantis, que apesar de consistentes, não são eficientes.

Atualmente, existem vários métodos clássicos de estimação para os parâmetros de uma distribuição estável. Neste trabalho, vamos nos concentrar em dois métodos gerais que serão brevemente descritos a seguir. Referências a outros métodos podem ser obtidas no sítio

http://academic2.american.edu/~jpnolan.

2.3.1 Método dos Quantis

McCulloch(1986) estimou os parâmetros da distribuição estável baseado em quantis de

uma amostra, utilizando interpolação linear para estabelecer ˆqp(x), um estimador consistente do verdadeiro p-ésimo quantil de x. A inversão das funções

ˆ να = ˆ q_0.95(.) − ˆq_0.05(.) ˆ q_0.75(.) − ˆq_0.25(.) , νˆβ = ˆ q_0.95(.) + ˆq_0.05(.) − 2 ˆq_0.5(.) ˆ q_0.95(.) − ˆq_0.05(.) , νˆγ= ˆ q_0.75(.) − ˆq_0.25(.) γ

fornecem estimativas para α, β e γ, respectivamente. Entretanto, este método apresenta alguns inconvenientes visto que os parâmetros são estimados consistentemente de quantis amostrais pré-determinados com o auxílio de uma tabela. Além disso, o autor considera que α ∈ (0.6, 2].

Note que ˆνγ é uma função de γ. McCulloch(1986) fornece uma estimativa para γ em função de α e β , que pode ser calculada de forma exata, ou usando tabelas com valores pré-computados e interpolação.

2.3.2 Método Numérico de Máxima Verossimilhança

Nolan(2001) mostrou que é possível calcular de forma indireta o Estimador de Máxima

Verossimilhança (EMV). A estimação é baseada em densidades para certos valores dos parâmetros, restringindo α > 0.1 e utilizando aproximações por splines pré-calculadas para as densidades estáveis quando α ≥ 0.4.

(44)

A partir disso, usa-se o método quase-Newton, restrito ao espaço paramétrico, para rea-lizar a maximização da função de verossimilhança aproximada. Através da computação numérica da matriz de informação de Fisher, obtém-se intervalos de confiança para as esti-mativas dos parâmetros.

Além do processo de estimação ser mais lento que as outras técnicas propostas, o método numérico de máxima verossimilhança apresenta outros inconvenientes. Um deles é que os estimadores obtidos pelo método dos quantis são usados como aproximação inicial. Note que o método nem sempre é aplicável, pois restringe o domínio do parâmetro α.

Além disso, a precisão é muito baixa para valores pequenos de α, por causa dos picos da função densidade. Aliás, quando os parâmetros estão perto de seus limites, as distribuições dos estimadores tornam-se degeneradas, fazendo os procedimentos de inferência frequentis-tas ficarem não confiáveis.

2.4 Inferência sob Enfoque Bayesiano

Assim como na inferência clássica, o objetivo principal da inferência bayesiana é estimar o valor de θ a partir da amostra y. Ou seja, assumindo que θ ∈ Θ, queremos verificar quais são os valores de θ ∈ Θ mais prováveis de terem gerado as observações y. Entretanto, sob o enfoque bayesiano, admite-se que as incertezas relativas ao vetor paramétrico de interesse θ podem ser coerentemente descritas por uma distribuição de probabilidade π(θ ), denominada distribuição a priori de θ .

O paradigma de Bayes consiste em atualizar o conhecimento a priori de θ , expresso sob a forma da função π(θ ), usando a informação proveniente dos dados observados y através da função de densidade f (y|θ ). Uma vez que é possível encontrar a função de verossimilhança l(θ ; y), conseguimos obter, via teorema de Bayes, o núcleo da densidade a posteriori dado por: π(θ |y) ∝ l(θ ; y)π(θ ).

No caso das distribuições estáveis, a abordagem bayesiana tem sofrido dificuldades com relação à estimação paramétrica devido a ausência de uma densidade de forma fechada, o que impede a avaliação da função de verossimilhança e, consequentemente, da distribuição a