• Nenhum resultado encontrado

O modelo de regressão Birnbaum-Sanders bivariado baseado na cópula FGM

N/A
N/A
Protected

Academic year: 2021

Share "O modelo de regressão Birnbaum-Sanders bivariado baseado na cópula FGM"

Copied!
139
0
0

Texto

(1)

e Computação Científica

Victor de Andrade Corder

O Modelo de Regressão Birnbaum-Saunders

Bivariado Baseado na Cópula FGM

CAMPINAS 2017

(2)

O Modelo de Regressão Birnbaum-Saunders

Bivariado Baseado na Cópula FGM

Dissertação apresentada ao Instituto de Matemática, Estatística e Computação Ci-entífica da Universidade Estadual de Cam-pinas como parte dos requisitos exigidos para a obtenção do título de Mestre em es-tatística.

Orientador: Prof. Dr. Filidor Edilfonso Vilca Labra Coorientadora: Prof.(a) Dr.(a) Camila Borelli Zeller

Este exemplar corresponde à versão final da dissertação defendida pelo aluno Vic-tor de Andrade Corder, e orientada pelo Prof. Dr. Prof. Dr. Filidor Edilfonso Vilca Labra.

Campinas 2017

(3)

Ficha catalográfica

Universidade Estadual de Campinas

Biblioteca do Instituto de Matemática, Estatística e Computação Científica Maria Fabiana Bezerra Muller - CRB 8/6162

Corder, Victor de Andrade,

C811m CorO modelo de regressão Birnbaum-Sanders bivariado baseado na cópula

FGM / Victor de Andrade Corder. – Campinas, SP : [s.n.], 2017.

CorOrientador: Filidor Edilfonso Vilca Labra.

CorCoorientador: Camila Borelli Zeller.

CorDissertação (mestrado) – Universidade Estadual de Campinas, Instituto de

Matemática, Estatística e Computação Científica.

Cor1. Birnbaum-Saunders, Distribuição de. 2. Cópulas (Estatística

matemática). 3. Análise de regressão. 4. Estimativa de parâmetro. I. Vilca Labra, Filidor Edilfonso,1964-. II. Zeller, Camila Borelli. III. Universidade Estadual de Campinas. Instituto de Matemática, Estatística e Computação Científica. IV. Título.

Informações para Biblioteca Digital

Título em outro idioma: A bivariate Birnbaum-Sanders regression model based on FGM copula

Palavras-chave em inglês: Birnbaum-Sanders distribution Copulas (Mathematical statistics) Regression analysis

Parameter estimation

Área de concentração: Estatística Titulação: Mestre em Estatística Banca examinadora:

Filidor Edilfonso Vilca Labra [Orientador] Caio Lucidius Naberezny Azevedo Clécio da Silva Ferreira

Data de defesa: 09-03-2017

Programa de Pós-Graduação: Estatística

(4)

pela banca examinadora composta pelos Profs. Drs.

Prof(a). Dr(a). FILIDOR EDILFONSO VILCA LABRA

Prof(a). Dr(a). CAIO LUCIDIUS NABEREZNY AZEVEDO

Prof(a). Dr(a). CLÉCIO DA SILVA FERREIRA

A Ata da defesa com as respectivas assinaturas dos membros encontra-se no processo de vida acadêmica do(a) aluno(a).

(5)
(6)

Agradeço primeiramente á Deus, pois reconheço que, se não fosse por Ele, não teria conseguido nada. Obrigado pelo conforto e aprendizado nas horas difíceis e por me levar além do que imaginei.

Agradeço a minha família pelo seu total apoio e suporte. Obrigado por acreditar em mim.

Agradeço a minha minha namorada Bárbara pelo apoio e paciência.

Agradeço a todos os colegas envolvidos, os quais sempre se mostraram prontos a ajudar.

Agradeço ao meu professor e orientador, Professor Filidor Edilfonso Vilca Labra, pelos importantes ensinamentos, pela paciência, amizade e apoio. Obrigado por estar sempre disponível e sempre se mostrar paciente para me ajudar.

Agradeço a Professora Camila Borelli Zeller por todas as sugestões e pelo auxílio com as simulações. Obrigado pelo conjunto de dados fornecido, utilizado para aplicação no Capítulo 3.

Agradeço a CAPES, pelo apoio financeiro recebido na elaboração deste trabalho. Por fim, agradeço a todos aqueles que contribuíram diretamente ou indiretamente para a concretização deste trabalho.

(7)

Saunders (BS), motivada por problemas de vibração em aviões comerciais que causam fadiga nos materiais. Essa distribuição pode ser usada para modelar dados de tempo de vida, e tem recebido considerável atenção na literatura. Assim como muitas distri-buições têm sido generalizada para sua forma bivariada; a distribuição univariada BS foi estendida por Kundu et al. (2010). Eles propuseram uma distribuição BS bivariada com estrutura de dependência e estabeleceram várias propriedades atrativas usando a estreita relação da distribuição BS com a distribuição Normal. Este trabalho promove uma extensão da distribuição BS para um tipo diferente de distribuição BS bivari-ada, que é construída usando a Cópula Farlie-Gumbel-Morgenstern (FGM), Conway (1979), para modelar a dependência dos dados bivariados. A distribuição bivariada resultante é uma distribuição absolutamente contínua e suas distribuições marginais são BS. Também desenvolvemos um modelo de regressão bivariado para analisar o logaritmo do tempo de duas unidades correlacionadas. Para esse modelo de regres-são Birnbaum-Saunders bivariado baseado na Cópula FGM, regres-são discutidas algumas de suas propriedades e métodos de estimação. Além disso, um estudo de diagnóstico é discutido para o modelo proposto. Finalmente, exemplos numéricos são apresentados para ilustrar as metodologias propostas em conjuntos de dados reais.

Palavras-chave: Análise de Diagnóstico; Análise de Regressão Bivariada; Cópula FGM; Distribuição Birnbaum-Saunders; Distribuição Sinh-normal; Estimação.

(8)

Birnbaum and Saunders (1969 a,b) proposed the well-known Birnbaum Saunders (BS) distribution, motivated by problems of vibration in commercial aircraft that caused fatigue in materials. This distribution can be used to model lifetime data and it has received considerable attention in the literature. As well as many univariate distributions have been generalized to bivariate distributions, the univariate BS dis-tribution has been extended by Kundu et al. (2010). They proposed a bivariate BS distribution with dependence structure and established several attractive properties using the close relationship of the BS distribution with the normal distribution. This work provides an extension of the BS distribution to a different kind of bivariate BS distribution, which is built by using the Farlie-Gumbel-Morgenstern (FGM) Copula, Conway (1979), to model the dependence of bivariate data. The resulting bivariate distribution is an absolutely continuous distribution and its marginal distributions are univariate BS distributions. We also develop a bivariate regression model to study correlated log-time of two units. For this type of bivariate Birnbaum-Saunders regres-sion model based on FGM copula some properties are discussed: moment estimation and the maximum likelihood estimation. Moreover, a study of diagnostic analysis is discussed for the proposed model. Finally, numeric examples are presented to illustrate the proposed methodologies based on real data set.

Keywords: Birnbaum-Saunders distribution; Bivariate linear regression model; FGM copula; Estimation; Sinh-normal distribution; Diagnostic analysis

(9)

1 Introdução 11

1.1 Introdução . . . 11

1.2 Conceitos básicos de sobrevivência . . . 13

1.3 A Distribuição Birnbaum-Saunders . . . 13

1.4 Distribuição Sinh-Normal . . . 16

1.5 O Modelo de Regressão Birnbaum-Saunders . . . 17

1.6 Objetivos do Trabalho . . . 18

1.7 Organização do Trabalho . . . 18

2 Funções Cópulas 20 2.1 Conceitos Básicos sobre Cópulas . . . 20

2.1.1 Alguns exemplos . . . 22 2.2 A Cópula FGM . . . 23 2.2.1 Algumas Aplicações . . . 24 2.2.2 Coeficiente de Correlação . . . 24 2.2.3 Observações . . . 25 2.2.4 Geração de Dados . . . 26 2.3 Extensões da Cópula FGM . . . 26

3 O modelo BS Bivariado baseado na Cópula FGM 29 3.1 Revisão sobre a Distribuição BS Bivariada . . . 29

3.1.1 Propriedades . . . 33

3.2 Distribuição BS Bivariada baseado na Cópula FGM . . . 33

3.2.1 Propriedades . . . 40

3.2.2 Estimação pelo Método dos Momentos . . . 42

3.2.3 Estimação por Máxima Verossimilhança . . . 43

3.2.4 Qualidade do Ajuste . . . 46

3.2.5 Estudo de Simulação . . . 48

3.2.6 Análise de dados reais . . . 55

4 Regressão Birnbaum-Saunders 61 4.1 Modelo de Regressão BS Bivariado baseado na Distribuição Normal Bi-variada . . . 61

(10)

4.2.2 Método de Máxima Verossimilhança . . . 71

4.2.3 Estudo de Simulação . . . 75

4.2.4 Análise de dados reais . . . 89

5 Análise de Diagnóstico 100 5.1 Método de Eliminação de casos . . . 101

5.1.1 Distância Generalizada de Cook . . . 102

5.1.2 Afastamento pela Máxima Verossimilhança . . . 103

5.2 Avaliação de Outlier . . . 103

5.3 Análise de Influência Local . . . 104

5.3.1 Ponderação de Pertubação de casos . . . 107

5.4 Aplicação . . . 108 5.4.1 Distâncias 𝐿𝐷𝑖 e 𝐺𝐷𝑖 . . . 108 5.4.2 Avaliação de Outlier . . . 111 5.4.3 Ponderação de Casos . . . 113 5.4.4 Conclusões . . . 118 6 Considerações Finais 123 Referências 125

A Cálculo da Matriz de Informação Observada 131

(11)

Capítulo 1

Introdução

1.1

Introdução

Diversos fenômenos do mundo real podem ser descritos no contexto multivariado, motivando muitas generalizações de distribuições univariadas para formar distribuições multivariadas. Alguns exemplos podem ser encontrados em Johnson et al. (1994), Johnson et al. (1995), Kotz et al. (2000) e Balakrishnan e Lai (2009). Diante disso, tornou-se crucial a existência de modelos que permitam avaliar o comportamento de variáveis aleatórias separadamente e também capturar de que forma elas interagem. A estrutura de dependência se tornou um fator de extrema importância em muitas aplicações.

Sua incorporação pode se dar de forma simples, através de medidas de dependência, tais como o coeficiente de correlação linear ou medidas de concordância; ou de uma forma mais complexa através de distribuições conjuntas que têm explícita uma deter-minada estrutura de dependência. Apesar da primeira metodologia ser mais simples, em muitas situações, as medidas de dependência não são a ferramenta mais indicada para capturar a interação entre variáveis aleatórias, devido às suas limitações. A função de distribuição acumulada bivariada vigora então como alternativa mais eficaz.

Entretanto, em muitos casos a construção de uma distribuição conjunta nem sempre é possível de se obter. Para esse cenário, uma alternativa muito eficaz é a utilização de cópulas. As cópulas são funções de distribuição multivariadas que permitem agregar um conjunto de funções de distribuição univariadas com uma determinada estrutura de dependência. Alguns exemplos de distribuições bivaridas obtidas via cópula podem ser encontrados em Nelsen (2006), Clayton (1978) e Balakrishnan e Lai (2009). Algu-mas referências para aplicações de modelos de regressão bivaridos baseados em cópulas são Durling (1974), Lai (1978), Chinchilli e Breen (1985). No contexto de Análise de Sobrevivência, Teichmann (1986) aplicou essa distribuição para um estudo de confia-bilidade de componentes; Barriga et al (2010) consideraram um modelo de regressão bivariado, com erros seguindo a distribuição do valor extremo.

Principalmente em Análise de Sobrevivência ou Confiabilidade, o estudo bivariado é muito comum e trabalhos sobre tempos de vida bivariados são encontrados com

(12)

frequência na literatura. Um aspecto que tem sido investigado é o ajuste de modelos paramétricos, quando existem dois tempos, 𝑇1 e 𝑇2, associados ao mesmo indivíduo.

Muitas vezes é interessante também considerar o efeito de outros fatores, denominados covariáveis ou variáveis concomitantes. Por exemplo, num estudo de recorrência de uma certa doença, fatores como idade, sexo, estágio da doença, etc, podem ser considerados covariáveis.

No contexto de confiabilidade, as falhas podem ser ocasionadas por diversas causas e uma delas é a fadiga do material. Segundo Birnbaum e Saunders (1969a), a falha do material ocorre devido ao desenvolvimento e ao crescimento de uma rachadura domi-nante dentro do material após o material estar sujeito a um padrão cíclico de tensão e força. Na literatura, entre os modelos probabilísticos que têm sido popularmente propostos para descrever o tempo de vida relacionado à fadiga encontram-se as distri-buições gama, Gaussiana Inversa, log-normal e Weibull, que se ajustam com grande precisão na região central. Porém, em situações em que os tempos de vida são baixos ou bem grandes, tais distribuições não são apropriadas, produzindo um ajuste ruim. Uma alternativa muito utilizada para estes casos é a distribuição de tempo de vida proposta por Birnbaum e Saunders (1969a), que utilizaram o conhecimento sobre um tipo particular de fadiga para derivar uma família de distribuições que permite modelar tempos de vida de materiais e equipamentos sujeitos a cargas dinâmicas de estresse. O uso da distribuição Birnbaum-Saunders (BS) tem permitido melhorar o ajuste para estes casos; um dos motivos pelo qual ela vem sendo amplamente utilizada na área de engenharia e muitas pesquisas tem sido concentradas nela.

Embora tenha surgido no contexto de engenharia de materiais, a distribuição BS é apropriada para descrever processos de degradação acumulativa, de tal forma que essa distribuição têm sido aplicada em outras áreas, como por exemplo, em ciências da saúde, na área ambiental e florestal, em demografia, na área atuarial e financeira, entre outras. Para mais detalhes, veja, por exemplo, veja Leiva et al. (2007), Leiva et al. (2008), Barros et al. (2008), Leiva et al.(2009) e Paula et al. (2012). Todos estes aspectos mencionados têm permitido considerar a distribuição BS como um modelo de probabilidade, em vez de um modelo utilizado apenas em análise de sobrevivência.

Birnbaum e Saunders (1969b) obtiveram os estimadores de máxima verossimilhança para os dois parâmetros da distribuição. Man et al. (1974) mostraram que esta dis-tribuição é unimodal. Engelhardt et al. (1981) propuseram intervalos de confiança e testes de hipóteses paras os parâmetros desta distribuição. Rieck e Nedelman (1991) desenvolveram o modelo de regressão log-linear BS. Achcar (1993) desenvolveu pro-cedimentos de estimação bayesiana. Lu e Chang (1997) utilizaram método bootstrap para construir intervalos de predição.

No contexto multivariado, Kundu et al. (2010) apresentaram uma extensão da distribuição BS univariada para o caso bivariado. Com base nessa generalização e no modelo de regressão proposto por Rieck e Nedelman (1991), Vilca et al. (2016) propuseram um modelo de regressão BS bivariado. Uma extensão da distribuição BS o caso multivariado pode ser encontrada em Kundu et al. (2013).

(13)

bem como propor um modelo bivariado para a distribuição BS baseando-se na estrutura de cópulas e o respectivo modelo de regressão, algo que até o momento não foi estudado na literatura.

1.2

Conceitos básicos de sobrevivência

A análise de sobrevivência pode ser entendida como um método de estudo da Esta-tística no qual a variável resposta é o tempo até a ocorrência de um evento de interesse. O que diferencia os dados de análise de sobrevivência em relação aos de outros méto-dos tradicionais de análise estatística é a presença das chamadas censuras. A censura se refere a situações em que o acompanhamento da unidade amostral é interrompido sem que o evento de interesse tenha ocorrido. Isso deve ser levado em consideração na análise pois traz a informação de que o tempo até a ocorrência do evento de interesse é superior ao tempo então observado. A Função de Sobrevivência é definida como sendo:

𝑆𝑇(𝑡) = 𝑃 (𝑇 > 𝑡) = 1 − 𝐹𝑇(𝑡), 0 < 𝑡 < ∞, (1.2.1)

em que 𝐹𝑇(𝑡) representa a função de distribuição acumulada (fda) da variável aleatória

T. Outra função útil na análise de sobrevivência é a função de risco instantâneo, ℎ𝑇(𝑡):

ℎ𝑇(𝑡) = lim Δ𝑡→0

𝑃[𝑡 < 𝑇𝑚 ≤ 𝑡+ Δ𝑇 |𝑇𝑚 > 𝑡]

Δ𝑡 . (1.2.2)

1.3

A Distribuição Birnbaum-Saunders

Em seu artigo entitulado "A new family of life distributions", Birnbaum e Saunders (1969a) desenvolveram a distribuição univariada Birnbaum-Saunders (BS), a qual mo-dela o tempo de vida de materiais e equipamentos sujeitos a cargas dinâmicas através de modelos de dano acumulado, para um exemplo veja Mann et al. (1974). Essa distri-buição tem sido amplamente utilizada na área de engenharia e tem sido foco de muitas pesquisas. A distribuição BS tem propriedades interessantes e uma relação próxima com a distribuição normal e por isso, do ponto de vista de aplicação, é uma alternativa mais atraente para as bem conhecidas distribuições Weibul, Log-Logística, log-normal, gama e Gaussiana Inversa.

Suponha que 𝑇 seja uma variável aleatória que representa o tempo total até que ocorra a falha, então a distribuição de 𝑇 proposta por Birnbaum e Saunders (1969a) tem fda dada por

𝐹𝑇(𝑡; 𝛼, 𝛽) = 𝑃 (𝑇 ≤ 𝑡) = Φ [︂1 𝛼 (︂√︃𝑡 𝛽 − √︃ 𝛽 𝑡 )︂]︂ , (1.3.1)

em que Φ(·) é a fda da distribuição Normal padrão. Dizemos que 𝑇 segue uma dis-tribuição BS, com parâmetros de forma 𝛼 > 0 e de escala 𝛽 > 0, que é usualmente

(14)

denotada por 𝑇 ∼ 𝐵𝑆(𝛼, 𝛽). Fazendo 𝑎𝑡(𝛼, 𝛽) = 1 𝛼 [︂√︃𝑡 𝛽 − √︃ 𝛽 𝑡 ]︂ e 𝐴𝑡(𝛼, 𝛽) = 𝑑 𝑑𝑡𝑎𝑡(𝛼, 𝛽) = 𝑡3/2(𝑡 + 𝛽) 2𝛼𝛽 , (1.3.2)

a fda 𝐹𝑇(𝑡) pode ser reescrita como

𝐹𝑇(𝑡; 𝛼, 𝛽) = Φ(𝑎𝑡(𝛼, 𝛽)).

A função densidade de probabilidade (fdp) correspondente é dada por

𝑓𝑇(𝑡; 𝛼, 𝛽) = 1 2𝜋 exp {︂ − 1 2𝛼2 (︂𝑡 𝛽 + 𝛽 𝑡 −2 )︂}︂𝑡3/2(𝑡 + 𝛽) 2𝛼𝛽 , = 𝜑(𝑎𝑡(𝛼, 𝛽))𝐴𝑡(𝛼, 𝛽), 𝑡 >0, 𝛼 > 0, 𝛽 > 0, (1.3.3)

em que 𝜑(·) é a fdp da distribuição normal padrão.

Uma característica importante dessa distribuição é sua direta relação com a distri-buição normal padrão. Seja 𝑍 uma variável aleatória definida por

𝑍 = 𝛼−1 (︃√︃ 𝑇 𝛽 − √︃ 𝛽 𝑇 )︃ , (1.3.4) com 𝑇 ∼ 𝐵𝑆(𝛼, 𝛽). Então 𝑍 ∼ 𝑁(0, 1).

Dessa forma, utilizando essa relação com a distribuição normal podemos definir a distribuição BS através da seguinte representação estocástica

𝑇 = 𝛽 4 [︂ 𝛼𝑍+√︁(𝛼𝑍)2+ 4 ]︂2 . (1.3.5)

Essa relação é extremamente útil e pode ser usada para obtenção de números pseudo-aleatórios provenientes da distribuição BS.

Em Saunders (1974) diversas propriedades interessantes foram detalhadas. Algumas delas podem ser demonstradas utilizando a relação da distribuição BS com a distribui-ção normal. Assim, considerando 𝑇 ∼ 𝐵𝑆(𝛼, 𝛽) temos que

(i) 𝑐𝑇 ∼ 𝐵𝑆(𝛼, 𝑐𝛽), em que 𝑐 é uma constante positiva; (ii) 𝑇−1 ∼ 𝐵𝑆(𝛼, 𝛽−1).

Johnson et al. (1995) mostraram que quando 𝛽𝑇−1 e 𝛽−1𝑇 possuem a mesma

distribuição, o valor esperado de (𝑇

𝛽) 𝑟 é dado por E [︂𝑇 𝛽 ]︂𝑟 =∑︁𝑟 𝑗=0 (︃ 2𝑟 2𝑗 )︃ 𝑗 ∑︁ 𝑖=0 (︃ 𝑗 𝑖 )︃ [2(𝑟 − 𝑗 + 1)] 2𝑟−𝑗+𝑖(𝑟 − 𝑗 + 𝑖) (︂1 2𝛼 )︂2(𝑟−𝑗+1) .

(15)

Consequentemente, a esperança e a variância para a distribuição BS, são dadas, respectivamente, por E(𝑇 ) = 𝛽 (︁ 1 + 𝛼2 2 )︁ 𝑒 𝑉 𝑎𝑟(𝑇 ) = (𝛼𝛽)2(︁1 + 5 4𝛼2 )︁ .

Nas Figuras 1.1(a) e 1.1(b) apresentamos a fdp e fda da distribuição BS, respecti-vamente para alguns valores de 𝛼 e considerando 𝛽 = 1.

(a) 0 1 2 3 4 5 0.0 0.5 1.0 1.5 x f(x) α=0.25 α=0.50 α=0.75 α=1.0 (b) 0 1 2 3 4 5 0.0 0.2 0.4 0.6 0.8 1.0 x F(x) α=0.25 α=0.50 α=0.75 α=1.0

Figura 1.1: (a) Fdp e (b) Fda da distribuição BS para diferentes valores de 𝛼 e fixando

𝛽 = 1.

Na Figura 1.1(a) nota-se que à medida que o valor de 𝛼 decresce, a curva tende a ficar mais simétrica em torno de 𝛽, que é a mediana da distribuição, ou seja, 𝐹 (𝛽) = 0.5. Da mesma forma, nota-se que a variância também decresce com 𝛼.

A função de sobrevivência e a função risco podem ser obtidas da relação 1.2.1 e 1.2.2, respectivamente, e são dadas por

𝑆(𝑡) = 1 − Φ(𝑎𝑡(𝛼, 𝛽)).

e

ℎ(𝑡) = 𝜑(𝑎𝑡(𝛼, 𝛽))𝐴𝑡(𝛼, 𝛽)

1 − Φ(𝑎𝑡(𝛼, 𝛽))

.

A função risco ℎ(𝑡) é zero em 𝑡 = 0, cresce até um máximo para algum 𝑡0 e

final-mente decresce até um valor finito. De fato, o comportamento assintótico de ℎ(𝑡) é apresentado na Figura 1.2(b), e de acordo com Kundu et al. (2008), temos que

lim

𝑡→∞ℎ(𝑡) =

1 2𝛼2𝛽.

(16)

(a) 0 1 2 3 4 0.0 0.2 0.4 0.6 0.8 1.0 x S(x) α=1.75 α=1.50 α=1.25 α=1.00 α=0.75 (b) 0 1 2 3 4 0.0 0.2 0.4 0.6 0.8 1.0 1.2 x h(x) α=1.75 α=1.50 α=1.25 α=1.00 α=0.75

Figura 1.2: (a) Função de Sobrevivência e (b) Função Risco da distribuição BS, para diferentes valores de 𝛼 e fixando 𝛽 = 1.

1.4

Distribuição Sinh-Normal

Em situações práticas existem grandes dificuldades na análise de dados com base no pressuposto de normalidade, pois muitas vezes os dados não são distribuídos conforme a distribuição normal. É usual por muitos pesquisadores propor uma transformação nos dados, com intuito de obter um melhor ajuste, porém este procedimento pode levar a conclusões errôneas ou de difícil interpretação.

Uma alternativa para alguns conjunto de dados é o sistema de Johnson, original-mente apresentado por Johnson (1949), que fornece uma possível distribuição cobrindo muitas combinações possíveis de assimetria e curtose. Johnson (1949) mencionou que é natural e também conveniente construir distribuições não normais, transformando uma variável aleatória que segue uma distribuição normal. O algoritmo é dado através da transformação 𝑍 = 𝜈 + 𝛿𝑔 (︂𝑌 − 𝜇 𝜎 )︂ , (1.4.1)

em que 𝑍 ∼ 𝑁(0, 1) e 𝑔(·) é uma função monótona. Estas distribuições não normais têm quatro parâmetros 𝜈, 𝛿, 𝜇 e 𝜎; em que 𝜈 e 𝛿 correspondem aos parâmetros de forma, enquanto 𝜇 e 𝜎 são os parâmetros de locação e escala, respectivamente.

Baseado em (1.4.1), Rieck (1989) definiu o seguinte modelo

𝑍 = 𝜈 + 𝛼 2 sinh (︂𝑌 − 𝜇 𝜎 )︂ ∼ 𝑁(0, 1). em que sinh representa a função seno hiperbólico.

(17)

Neste caso é dito que Y segue uma distribuição Sinh-Normal (SN) de quatro parâme-tros. A notação utilizada é 𝑌 ∼ 𝑆𝑁(𝛼, 𝜇, 𝜎, 𝜈), que é reduzida para 𝑌 ∼ 𝑆𝑁(𝛼, 𝜇, 𝜎) quando 𝜈 = 0. Para mais detalhes e aplicações da distribuição SN, consulte Rieck (1989) e Rieck e Nedelman (1991).

Se 𝑌 ∼ 𝑆𝑁(𝛼, 𝜇, 𝜎 = 2) então 𝑇 = exp(𝑌 ) ∼ 𝐵𝑆(𝛼, 𝛽), com parâmetro de forma

𝛼 > 0 e parâmetro de escala 𝛽 = exp(𝜇) > 0; veja Birnbaum e Saunders (1969a),

Jonhson et al. (1995). Por este motivo, o modelo SN com 𝜎 = 2 é também chamado de modelo de regressão log-Birnbaum-Saunders (log-BS) ou modelo de regressão BS. Para mais detalhes veja Rieck e Nedelman (1991), Galea et al. (2004) e Leiva et al. (2007).

Em Vilca et al. (2016) uma extensão da distribuição SN para o cenário bivariado foi proposta assumindo a seguinte representação estocástica para as variáveis aleatórias 𝑌1

e 𝑌2: 𝑌𝑗 = 𝜇𝑗+ 𝜎𝑗arcsinh (︂𝛼 𝑗𝑍𝑗 2 )︂ , 𝑗 = 1, 2, (1.4.2)

em que Z = (𝑍1, 𝑍2)⊤ tem distribuição normal bivariada com parâmetro de correlação

𝜌. Dessa forma, o vetor aleatório bivariado Y = (𝑌1, 𝑌2)⊤ é dito ter distribuição SN

bivariada com parâmetros 𝛼 = (𝛼1, 𝛼2)⊤ ∈ R2+, 𝜇 = (𝜇1, 𝜇2)⊤ ∈ R2, 𝜎 = (𝜎1, 𝜎2)⊤ ∈

R2+ e 𝜌 ∈ (−1, 1); que será denotada por Y ∼ SN2(𝛼, 𝜇, 𝜎, 𝜌).

1.5

O Modelo de Regressão Birnbaum-Saunders

Utilizando a distribuição Sinh-Normal como base, Rieck e Nedelman (1991), desen-volveram o modelo de regressão log-linear BS, definido por

𝑌𝑖 = x𝑖 𝛽+ 𝜀𝑖, (1.5.1)

em que 𝑌𝑖 é o logaritmo do tempo de vida para a 𝑖-ésima unidade experimental; os

vetores x

𝑖 , 𝑖 = 1, . . . , 𝑛 são covariáveis conhecidas, que são as linhas da matriz X:𝑛×𝑝;

e 𝛽 é um vetor de parâmetros de dimensão 𝑝. Na literatura, assume-se que os erros

𝜀𝑖’s são independentes com distribuição comum 𝜀𝑖 ∼ 𝑆𝑁(𝛼, 0, 𝜎 = 2). Neste caso

𝑌𝑖 = log(𝑇𝑖), o qual segue uma distribuição 𝑆𝑁(𝛼, x𝑖 𝛽, 𝜎= 2).

Rieck e Nedelman (1991) estudaram algumas propriedades da distribuição Sinh-Normal; Galea et al. (2004) apresentaram um estudo de influência local e diagnóstico seguindo o trabalho de Cook (1986). Lemonte e Cordeiro (2009) propuseram o modelo de regressão não-linear Birnbaum-Saunders extendendo o trabalho de Rieck e Nedelman (1991); Barros et al. (2008) consideraram uma extensão da distribuição Sinh-Normal baseada na distribuição Student-𝑡, onde os graus de liberdade permitem controlar a curtose da distribuição resultante. Baseados nesta extensão, Barros et al. (2008) apresentaram um estudo de inferência e diagnóstico que representa uma extensão de alguns resultados obtidos por Galea et al. (2004). Leiva et al. (2010) consideraram, em lugar da distribuição normal, a distribuição skew-elíptica. Outras extensões da

(18)

distribuição Sinh-Normal, baseadas nas distribuições mistura de escala normal, podem ser encontradas em Balakrishnan e Lai (2009).

O modelo de regressão log-BS tem se mostrado muito apropriado para modelar problemas de tempo de vida que consideram a transformação logarítmica da variável resposta, porém, na literatura muitos problemas de sobrevivência ou confiabilidade envolvem dois tempos de vida associados a um mesmo indivíduo. Veja, por exemplo, Teichmann (1986), Wada et al. (2000) e destacamos Barriga et al. (2010), que con-sideraram um modelo de regressão linear bivariado baseado na cópula FGM, em que as marginais seguem uma distribuição do valor extremo. Vilca et al. (2016) propuse-ram um modelo de regressão BS bivariado construído utilizando a distribuição normal bivariada, seguindo a ideia de Kundu et al (2010), que propuseram a distribuição BS bivariada.

Muitas distribuições bivariadas ou multivariadas têm sido construídas via cópulas, com marginais específicas. Esta técnica tem sido aplicada com sucesso em diferentes áreas da estatística aplicada, para introduzir estrutura de dependência entre distri-buições marginais especificas. Algumas referências importantes para leitura, citamos por exemplo, Nelsen (2006), Balakrishnan e Lai (2009), Clayton (1978), Frank (1979), Conway (1979) e Gumbel (1958).

1.6

Objetivos do Trabalho

O objetivo deste trabalho é apresentar um estudo de inferência e diagnóstico do modelo de regressão Birnbaum-Saunders bivariado construído com base na cópula de Farlie-Gumbel-Morgentern (FGM), que denotamos por Modelo C-BS Bivariado. Os objetivos específicos podem ser resumidos em:

1. Descrever o modelo Birnbaum-Saunders bivariado construído a partir da cópula FGM. Discutir sua propriedades e propor estimadores consistentes.

2. A partir da classe de distribuições Sinh-Normal bivariada, apresentar o modelo de regressão C-BS bivariado. Realizar uma discussão na mesma direção do caso univariado estudado em Rieck (1989) e Rieck e Nedelman (1991).

3. Desenvolver um estudo de diagnóstico para esse modelo, seguindo a metodologia de Cook (1977).

Todos os processos de estimação e diagnóstico foram realizadas com auxilio do soft-ware estatístico R, que se encontra disponível no endereço www.r-project.org/.

1.7

Organização do Trabalho

A presente dissertação encontra-se dividida em seis capítulos. Neste primeiro capí-tulo é apresentada uma motivação acerca de análise sobrevivência; uma introdução do

(19)

modelo BS univariado e o respectivo modelo de regressão. Algumas de suas proprie-dades são discutidas.

No Capítulo 2, realizamos uma revisão dos conceitos básicos sobre cópulas, neces-sários para as aplicações futuras. Destacamos a cópula de Farlie-Gumbel-Morgentern (FGM), que será utilizada no desenvolvimento desse trabalho.

No Capítulo 3, iniciamos com uma revisão da distribuição Birnbaum-Saunders (BS) bivariada introduzida por Kundu et al. (2010). Em seguida, apresentamos uma nova proposta utilizando a cópula FGM, obtendo então o modelo C-BS bivariado. Para o qual discutimos suas propriedades; elaboramos uma metodologia de estimação apli-cando método dos momentos e máxima verossimilhança; construímos uma opção de resíduos; e para finalizar, realizamos um estudo de simulação e aplicação em dados reais.

Já no Capítulo 4, baseando-se no uso da distribuição SN proposta por Rieck (1989) e Vilca et al. (2016), construímos o modelo de regressão bivariado associado à distri-buição C-BS bivariada. Além disso, realizamos um estudo de inferência, apresentando os estimadores de máxima verossimilhança. Desenvolvemos também um estudo de si-mulação, com o objetivo de investigar o comportamento dos estimadores propostos. Por fim, uma aplicação em dados reais é apresentada.

No Capítulo 5, aplicamos um estudo de diagnóstico para o modelo de regressão C-BS bivariado, baseando-se na metodologia de Cook (1977) e Cook (1986). Apresentamos uma aplicação dos resultados obtidos ao conjunto de dados reais ajustado no Capítulo 4.

O Capítulo 6 finaliza a dissertação com algumas conclusões e possíveis direciona-mentos para estudos futuros.

(20)

Capítulo 2

Funções Cópulas

2.1

Conceitos Básicos sobre Cópulas

Uma característica comum das distribuições apresentadas neste capítulo é que sua distribuição conjunta 𝐹 (𝑥, 𝑦) pode ser descrita como função das marginais 𝐹1(𝑥) e

𝐹2(𝑦). Essa operação recebe o nome de cópula e é usualmente denotada por 𝐶𝜂(𝑢, 𝑣).

Nesta seção vamos apresentar um breve resumo de alguns conceitos básicos das funções cópulas. Informações complementares podem ser encontradas, por exemplo, em Nelsen (2006) e Balakrishnan e Lai (2009).

Nosso principal interesse é a cópula de Farlie-Gumbel -Morgentern (FGM), que será utilizada futuramente no desenvolvimento desse trabalho.

Definição 1. Uma função de distribuição multivariada 𝐹 é uma função crescente e

limitada em R𝑝, tal que:

1. F é monótona e não decrescente em cada variável; 2. F é contínua à direita em cada variável;

3. 0 ≤ 𝐹 (𝑥1, ..., 𝑥𝑝) ≤ 1; 4. 𝑥 lim 1,𝑥2,...,𝑥𝑝→+∞ 𝐹(𝑥1, ..., 𝑥𝑝) = 1 e lim 𝑥𝑖→−∞ 𝐹(𝑥1, ..., 𝑥𝑝) = 0 para 𝑖 = 1, 2, ..., 𝑝.

Definição 2. Uma cópula é uma distribuição multivariada cujas marginais seguem uma

distribuição uniforme em (0, 1), 𝑈(0, 1). Seja o vetor aleatório 𝑈 = (𝑈1, . . . , 𝑈𝑝) ∈ R𝑝

com cópula 𝑝-dimensional 𝐶𝜂, então

𝐶𝜂(𝑢1, . . . , 𝑢𝑝) = 𝑃 (𝑈1 ≤ 𝑢1, . . . , 𝑈𝑝 ≤ 𝑢𝑝),

(21)

(Teorema de Sklar) Seja 𝐹 uma função de distribuição conjunta com marginais 𝐹1(𝑡1), ..., 𝐹𝑝(𝑡𝑝). Então, existe uma cópula 𝑝-dimensinonal 𝐶𝜂 tal que

𝐹(𝑡1, ..., 𝑡𝑛; 𝜂) = 𝐶𝜂(𝐹1(𝑡1), ..., 𝐹𝑝(𝑡𝑝)).

Se 𝐹1(𝑡1), ..., 𝐹𝑝(𝑡𝑝) são todas contínuas, então 𝐶𝜂 é única.

Demonstração. Veja Nelsen (2006)

O teorema de Sklar é um dos resultados mais importantes no que diz respeito à teoria e aplicação de cópulas. A partir deste, temos que a cópula conecta as distribuições marginais univariadas formando uma distribuição multivariada. O caminho inverso também é válido, isto é, uma função multivariada pode ser decomposta nas marginais univariadas e na estrutura de dependência dada pela cópula.

Seja 𝐹 uma função de distribuição conjunta conforme definição no Teorema de Sklar. A densidade multivariada de 𝐹 é dada por:

𝑓(𝑥1, ..., 𝑥𝑝) = 𝜕𝑝𝐶 𝜂(𝐹1(𝑥1), ..., 𝐹𝑝(𝑥𝑝)) 𝜕𝐹1(𝑥1)...𝜕𝐹𝑝(𝑥𝑝) 𝑝 ∏︁ 𝑖=1 𝑓𝑖(𝑥𝑖) = 𝑐𝜂(𝐹1(𝑥1), ..., 𝐹𝑝(𝑥𝑝)) 𝑝 ∏︁ 𝑖=1 𝑓𝑖(𝑥𝑖),

em que 𝐹𝑖 e 𝑓𝑖 são as funções de distribuição e densidade marginais, respectivamente,

e

𝑐𝜂(𝐹1(𝑥1), ..., 𝐹𝑝(𝑥𝑝)) =

𝜕𝑝𝐶

𝜂(𝐹1(𝑥1), ..., 𝐹𝑝(𝑥𝑝))

𝜕𝐹1(𝑥1)...𝜕𝐹𝑝(𝑥𝑝)

Definição 3. Considere 𝜙:[0, 1] ↦→ [0, ∞] tal que 𝜙 é uma função contínua e

estrita-mente decrescente, com 𝜙(1) = 0. Também considere a pseudo-inversa de 𝜙 sendo a função 𝜙[−1]:[0, ∞] ↦→ [0, 1] dada por

𝜙[−1](𝑡) = ⎧ ⎨ ⎩ 𝜙−1(𝑡), 0 6 𝑡 6 𝜙(0); 0, 𝜙(0) 6 𝑡 6 ∞.

Note que 𝜙[−1] é contínua em [0, ∞], e estritamente decrescente em [0, 𝜙(0)]. Também

𝜙[−1](𝜙(𝑡)) = 𝑡 em [0, 1], e 𝜙(𝜙[−1](𝑡)) = min(𝑡, 𝜙(0)). Claramente se 𝜙(0) = ∞, então 𝜙[−1] = 𝜙−1.

Teorema 2. Considere 𝐶𝜂:[0, 1] × [0, 1] ↦→ [0, 1] dada por

𝐶𝜂(𝑢, 𝑣) = 𝜙[−1](𝜙(𝑢) + 𝜙(𝑣)),

em que 𝜙 e 𝜙[−1] são como na Definição 3. Então, 𝐶

𝜂 é uma cópula se, e somente se,

(22)

Demonstração. Veja Nelsen (2006)

Para todas as cópulas temos os limites de Fréchet-Hoeffding, que são os limites de variação e são dados por

max(︁ 0, 𝑝 ∑︁ 𝑖=1 𝐹𝑖(𝑡𝑖) − 𝑝 + 1 )︁ ≤ 𝐶𝜂(𝐹1(𝑡1), . . . , 𝐹𝑝(𝑡𝑝)) ≤ min(𝐹1(𝑡1), . . . , 𝐹𝑝(𝑡𝑝)).

Definição 4. Cópulas da forma apresentada no Teorema 2 são denominadas cópulas

arquimedianas com gerador 𝜙. É denominada cópula arquimediana estrita se 𝜙[−1] =

𝜙−1 e 𝐶𝜂(𝑢, 𝑣) = 𝜙[−1](𝜙(𝑢) + 𝜙(𝑣)).

Considere 𝐶𝜂(𝑢, 𝑣) uma cópula arquimediana bivariada. Então as seguintes

propri-edades são válidas:

(i) 𝐶𝜂(𝑢, 𝑣) = 𝐶𝜂(𝑣, 𝑢), ou seja, 𝐶𝜂 é simétrica (permutável);

(ii) 𝐶𝜂(𝐶𝜂(𝑢, 𝑣), 𝑤) = 𝐶𝜂(𝑢, 𝐶𝜂(𝑣, 𝑤)), para todo 𝑢, 𝑣, 𝑤 em [0, 1]. Isto é, 𝐶𝜂 é

associativa;

(iii) Seja 𝜙 a geradora de 𝐶𝜂. Então, para qualquer constante positiva 𝑎, tem-se que

𝑎𝜙também é uma geradora de 𝐶𝜂.

A seguir apresentaremos alguns exemplos de cópulas arquimedianas bivariadas.

2.1.1

Alguns exemplos

1) Cópula de Clayton

A cópula de Clayton, introduzida por Clayton (1978), é geralmente utilizada para análise de risco, devido à sua capacidade de reproduzir dependência na cauda infe-rior. Tem a forma

𝐶𝜂(𝑢, 𝑣) = (𝑢

1

𝜂 + 𝑣

1

𝜂 −1)−𝜂, 𝜂 >0.

O valor 𝜂 = 0 representa independência, ou seja, 𝐶𝜂(𝑢, 𝑣) = 𝑢𝑣. Quando 𝜂 → ∞ a

cópula atinge o limite superior de Fréchet, mas para nenhum valor atinge o limite inferior. Essa cópula não contempla a dependência negativa.

Sua função geradora é dada por 𝜙(𝑡) = 𝑡−1

𝜂 −1 (veja Genest e MacKay,1986).

2) Cópula de Frank

A cópula de Frank, considerada por Frank (1979), permite dependência negativa e é simétrica em ambas as caudas. Tem a forma

𝐶𝜂(𝑢, 𝑣) = log𝜂 (︃ 1 + (𝜂𝑢1)(𝜂𝑣−1) 𝜂 −1 )︃ .

(23)

(i) Para 0 < 𝜂 < 1, a associação é positiva (ii) Conforme 𝜂 → 1 temos independência. (iii) Para 𝜂 > 1, a associação é negativa. Sua função geradora é dada por 𝜙(𝑡) = ln(1−𝜂𝑡

1−𝜂).

A seguinte cópula, que discutiremos com mais detalhes, não é arquimediana, como pode ser visto em Genest e MacKay (1986), mas tem encontrado muitas aplicações em diferentes áreas da estatística.

2.2

A Cópula FGM

Nesta seção, destacamos a cópula de Farlie-Gumbel-Morgentern, Gumbel (1958) e Farlie (1960), usualmente conhecida como cópula FGM.

Sua função distribuição é dada por

𝐶𝜂(𝑢, 𝑣) = 𝑢𝑣[1 + 𝜂(1 − 𝑢)(1 − 𝑣)], −1 6 𝜂 6 1, (2.2.1)

em que o parâmetro 𝜂 representa a associação entre as variáveis 𝑢 e 𝑣. O valor 𝜂 = 0 representa independência, ou seja, se 𝜂 = 0 então 𝐶𝜂(𝑢, 𝑣) = 𝑢𝑣.

Pelo Teorema de Sklar, temos que a densidade de 𝑐 é dada por

𝑐𝜂(𝑢, 𝑣) = 1 + 𝜂(2𝑢 − 1)(2𝑣 − 1), −1 6 𝜂 6 1. (2.2.2)

Podemos definir 𝑢 e 𝑣 como funções de distribuição acumulada. Especificamente,

𝑢 = 𝐹𝑍1(𝑧1) e 𝑣 = 𝐹𝑍2(𝑧2). Então, a função de densidade conjunta de 𝑍1 e 𝑍2 através

da cópula FGM é dada por

𝑓𝑍1,𝑍2(𝑧1, 𝑧2) = 𝑐𝜂(𝐹𝑍1(𝑧1), 𝐹𝑍2(𝑧2))𝑓𝑍1(𝑧1)𝑓𝑍2(𝑧2)

= [1 + 𝜂(2𝐹𝑍1(𝑧1) − 1)(2𝐹𝑍2(𝑧2) − 1)]𝑓𝑍1(𝑧1)𝑓𝑍2(𝑧2),

em que 𝑐𝜂(·) é como em (2.2.2).

Partindo do mesmo princípio podemos obter também a função de sobrevivência conjunta. Sejam 𝑆1(𝑡1) e 𝑆2(𝑡2) as funções de sobrevivência referentes aos tempos de

falha 𝑡1 e 𝑡2, respectivamente. Então a função de sobrevivência conjunta gerada pela

cópula FGM é dada por

𝑆(𝑡1, 𝑡2) = 𝐶𝜂(𝑆1(𝑡1), 𝑆2(𝑡2))

= [1 + 𝜂(1 − 𝑆1(𝑡1))(1 − 𝑆2(𝑡2))]𝑆1(𝑡1)𝑆2(𝑡2).

A cópula FGM é atraente devido à sua forma analítica simples e tem sido muito utilizada em modelagem para testes de associação e no estudo de eficiência de proce-dimentos não paramétricos.

(24)

2.2.1

Algumas Aplicações

• Durling (1974) utilizou essa distribuição, com marginais logísticas, reanalisando sete conjuntos de dados previamente publicados sobre os efeitos de misturas de venenos.

• Considerando marginais exponenciais, Lai (1978) utilizou a distribuição FGM para modelar a distribuição conjunta de dois intervalos adjacentes em um processo de Markov.

• Chinchilli e Breen (1985) utilizaram uma versão de 6 dimensões, com marginais logísticas, para análise de experimentos toxicológicos.

• No contexto de Análise de Sobrevivência, Teichmann (1986) aplicou essa distri-buição para um estudo de confiabilidade de componentes.

• Long e Krzysztofowicz (1992) utilizaram a distribuição em estudos de Hidrologia. • Barriga et al (2010) consideraram um modelo de regressão bivariado, com erros

seguindo a distribuição do valor extremo.

Mais exemplos pode ser verificados em Balakrishnan e Lai (2009).

2.2.2

Coeficiente de Correlação

A estrutura de correlação para distribuições construídas a partir da cópula FGM foi estudada por Schucany et al. (1978), onde se verificou que a sua utilização é restrita a fraca dependência entre as variáveis. O coeficiente de correlação de Pearson (𝜌) é dado por 𝜌 = 𝜂

3, consequentemente varia entre −1/3 e 1/3.

Gumbel (1960) e Schucany et al. (1978) apontaram (i) que 𝜌 não pode exceder 1

3;

(ii) o valor de 𝜌 para alguns casos especiais. Como por exemplo, • Se as marginais são normais, então 𝜌 = 𝜂

𝜋.

• Se as marginais são exponenciais, então 𝜌 = 𝜂

4.

Segundo Nelsen (2006), no estudo de cópulas é comum também relacionar o parâ-metro de associação com outras medidas de dependência que são "escala-invariantes", isto é, permanecem inalteradas quando sujeitas à transformações estritamente crescen-tes. Visto que as estatísticas de ordem da cópula 𝐶𝜂(𝑢, 𝑣) não sofrem alteração quando

𝑢 e 𝑢 são submetidos a transformações estritamente crescentes, duas medidas muito

utilizadas são o "Tau de Kendall"(𝜏) e o coeficiente de correlação de Spearman (𝜌𝑠),

(25)

Definição 5. Sejam (𝑥𝑖, 𝑦𝑖) e (𝑥𝑗, 𝑦𝑗) duas observações de (𝑋, 𝑌 ), variáveis aleatórias

contínuas. Os pares (𝑥𝑖, 𝑦𝑖) e (𝑥𝑗, 𝑦𝑗) são concordantes se 𝑥𝑖 > 𝑥𝑗 e 𝑦𝑖 > 𝑦𝑗, ou 𝑥𝑖 < 𝑥𝑗

e 𝑦𝑖 < 𝑦𝑗. Por outro lado, serão discordantes se 𝑥𝑖 > 𝑥𝑗 e 𝑦𝑖 < 𝑦𝑗, ou 𝑥𝑖 < 𝑥𝑗 e 𝑦𝑖 > 𝑦𝑗.

O coeficiente 𝜏 de Kendall é definido como a probabilidade de concordância menos a probabilidade de discordância.

𝜏 = P[(𝑋 − 𝑋)(𝑌 − 𝑌) ≥ 0] − P[(𝑋 − 𝑋)(𝑌 − 𝑌) ≤ 0], em que (𝑋, 𝑌) é independente de (𝑋, 𝑌 ) e distribuído como (𝑋, 𝑌 ).

Uma versão simplificada é definida como 𝜏′ = 𝑐 − 𝑑 𝑐+ 𝑑 = 𝑐 − 𝑑 𝑛(𝑛−1) 2 ,

em que 𝑐 denota o número de pares concordantes e 𝑑 o número de pares discordantes de uma amostra de tamanho 𝑛 de (𝑋, 𝑌 ).

Definição 6. De forma análoga ao coeficiente de Kendall a medida de Spearman

tam-bém é baseada nos pares concordantes e discordantes. Sejam (𝑋1, 𝑌1),(𝑋2, 𝑌2) e (𝑋3, 𝑌3)

três pares independentes de variáveis aleatórias com uma função distribuição comum H. Então, 𝜌𝑆 é definida como a probabilidade de concordância menos a probabilidade

de discordância para os dois pares (𝑋1, 𝑌1) e (𝑋2, 𝑌3), isto é,

𝜌𝑠 = 3

(︁

P[(𝑋1− 𝑋2)(𝑌1− 𝑌3) ≥ 0] − P[(𝑋1− 𝑋2)(𝑌1− 𝑌3) ≤ 0]

)︁

. que pode ser expressada em função dos termos da cópula

𝜌𝑠= 12 ∫︁ 1 0 ∫︁ 1 0 𝐶𝜂(𝑢, 𝑣)𝑑𝑢𝑑𝑣 − 3 = 12 E [︁ 𝐶𝜂(𝑈, 𝑉 ) ]︁ −3.

A relação entre a medida 𝜏 de Kendall e o parâmetro de dependência 𝜂 da cópula FMG é dada por 𝜏 = 2𝜂

9. Note que − 2

9 6 𝜏 6 2

9. Já no caso da medida de Spearman a

relação entre a medida 𝜌𝑠 e o parâmetro de dependência 𝜂 da cópula FMG é dada por

𝜌𝑠 = 𝜂3. Note que −13 6 𝜌𝑠6 13. Para demonstração, veja Nelsen (2006).

2.2.3

Observações

• E(𝑉 |𝑈 = 𝑢) é linear em 𝑢, veja Balakrishnan e Lai (2009). • A fdp é simétrica entre (−1

2,

1

2), isto é, é a mesma em (1 − 𝑢, 1 − 𝑣) e em (𝑢, 𝑣).

Consequentemente a função de sobrevivência gerada pela cópula FGM coincide com a formulação original.

• Lai (1978) demonstrou que para 0 6 𝜂 6 1, a dependência entre 𝑈 e 𝑉 é positiva. • Para mais detalhes de aplicações, transformações, distribuições relacionadas, etc.;

(26)

2.2.4

Geração de Dados

Um algoritmo para gerar dados provenientes de uma distribuição bivariada obtida através de cópulas foi proposto por Nelsen (2006; pg. 41), que descreveremos resumi-damente a seguir:

1. Gere duas variáveis aleatórias independentes 𝑢 e 𝑡 de uma 𝑁(0, 1); 2. Calcule 𝑣 = 𝑐−1

𝑢 (𝑡), em que 𝑣 é a inversa generalizada ou quasi-inversa de 𝑐𝑢;

3. (𝑢, 𝑣) é o par desejado.

Para discussões e mais detalhes veja Johnson (1987) ou Devroye (1986).

No software R a geração de dados pode ser realizada através do pacote "Copula", disponível no CRAN-R, com atualizações em 2015 e 2017. Permite ao usuário diversas funcionalidades tais como: estimação, ajuste, testes, entre outros. Para mais detalhes; veja Hofert et al. (2015).

No que diz respeito à geração de dados é possível escolher o tipo de cópula, coeficiente de associação e as distribuições marginais de 𝑢 e 𝑣. Para os estudos de simulação, neste trabalho, os dados foram gerados através desse pacote.

2.3

Extensões da Cópula FGM

Vamos discutir aqui algumas extensões da cópula FGM, desenvolvidas primordial-mente para aumentar o valor máximo do coeficiente de correlação. A maioria delas são cópulas do tipo polinomial (cópulas expressadas em termos de polinômios em 𝑢 e 𝑣). Extensão de Huang e Kotz

Huang e Kotz (1999) consideraram

𝐶𝜂(𝑢, 𝑣) = 𝑢𝑣[1 + 𝜂(1 − 𝑢𝑝)(1 − 𝑣𝑝)], 𝑝 > 0, (2.3.1)

cuja densidade correspondente é dada por

𝑐𝜂(𝑢, 𝑣) = 1 + 𝜂[1 − (1 + 𝑝)𝑢𝑝][1 − (1 + 𝑝)𝑣𝑝],

Nesse caso, a variação para 𝜂 é

(max [1, 𝑝2])−2 ≤ 𝜂 ≤ 𝑝−1.

Quanto ao coeficiente de correlação usual, 𝜌 = 𝑐𝑜𝑟𝑟(𝑈, 𝑉 ) = 3𝜂( 𝑝

𝑝+2)

2 e

3(𝑝 + 2)−2min [1, 𝑝2] ≤ 𝜌 ≤ 3𝑝

(𝑝 + 2)2.

(27)

Outra extensão considerada pelos autores foi

𝐶𝜂(𝑢, 𝑣) = 𝑢𝑣[1 + 𝜂(1 − 𝑢)𝑝(1 − 𝑣)𝑝], 𝑝 > 0, (2.3.2)

com função densidade dada por

𝑐𝜂(𝑢, 𝑣) = 1 + 𝜂(1 − 𝑢)𝑝−1(1 − 𝑣)𝑝−1[1 − (1 + 𝑝)𝑢][1 − (1 + 𝑝)𝑣].

Quando 𝑝 < 1 o intervalo de variação de 𝜂 é vazio. Para 𝑝 > 11 ≤ 𝜂 ≤(︁𝑝+ 1 𝑝 −1 )︁𝑝−1 , e o coeficiente de correlação −12(︁ 1 (𝑝 + 1)(𝑝 + 2) )︁2 ≤ 𝜌 ≤12(𝑝 − 1) 1−𝑝(𝑝 + 1)𝑝−3 (𝑝 + 2)2 .

Assim, para 𝑝 = 1.877, 𝜌max= 0.3912 e 𝜌min = −13 , se mostrando superior à

correla-ção máxima obtida com a extensão em (2.3.1).

Podemos notar que a introdução do parâmetro 𝑝 permitiu considerar um limite maior para correlação na cópula FGM.

Extensão de Bairamov–Kotz

Bairamov e Kotz (2000a) consideraram a inclusão de dois parâmetros para extensão da cópula FGM

𝐶𝜂(𝑢, 𝑣) = 𝑢𝑣[1 + 𝜂(1 − 𝑢𝑎)𝑏(1 − 𝑣𝑎)𝑏], 𝑎 > 0, 𝑏 > 0, (2.3.3)

cuja função densidade correspondente é dada por

𝑐𝜂(𝑢, 𝑣) = 1 + 𝜂(1 − 𝑢𝑎)𝑏−1(1 − 𝑣𝑎)𝑏−1[1 − 𝑢𝑎(1 + 𝑎𝑏)][1 − 𝑣𝑎(1 + 𝑎𝑏)]. Para 𝑏 > 1 −min [︂ 1, 1 𝑎𝑏 (︁𝑎𝑏+ 1 𝑏 −1 )︁2]︂ ≤ 𝜂 ≤ [︂1 𝑎𝑏 (︁𝑎𝑏+ 1 𝑏 −1 )︁𝑏−1]︂ . Já quando 𝑏 ≤ 1 −min [︂ 1, 1 𝑎𝑏 ]︂ ≤ 𝜂 ≤ 1 𝑎𝑏

O coeficiente de correlação é dado por

𝜌= 12𝜂[︁ 𝑏 𝑎𝑏+ 2 Γ(𝑏)Γ(𝜂/2) Γ(𝑏 + 2 𝑎) ]︁2 ,

tomando 𝑎 = 2.8968 e 𝑏 = 1.4908, temos que 𝜌max = 0.5015. Para 𝑎 = 2 e 𝑏 = 1.5,

𝜌min = −0.48. Se 𝑎 > 0 e 𝑏 = 1, temos o caso particular descrito em (2.3.1); se 𝑎 = 1 e

(28)

Extensão de Bekrizadeh-Parham

Bekrizadeh e Parham (2012) consideraram a seguinte extensão da cópula FGM

𝐶𝜂(𝑢, 𝑣) = 𝑢𝑣[1 + 𝜂(1 − 𝑢𝛼)(1 − 𝑣𝛼)]𝑛, (2.3.4)

com 𝑛 = 0, 1, 2, . . . e 𝛼 > 0.

A função densidade correspondente é dada por

𝑐𝜂(𝑢, 𝑣) = (1 + 𝜂(1 − 𝑢𝛼)(1 − 𝑣𝛼))

𝑛−2{︁

1 + 𝜂(1 − 𝑢𝛼)(1 − 𝑣𝛼))2

[1 + 𝜂(1 − 𝑢𝛼)(1 − 𝑣𝛼)][𝑛𝛼𝜂𝑢𝛼(1 − 𝑣𝛼) + 𝑛𝛼𝜂𝑣𝛼(1 − 𝑢𝛼)

−𝑛𝛼2𝜂𝑢𝛼𝑣𝛼] + 𝑛𝛼2𝜂2(𝑛 − 1)𝑢𝛼(1 − 𝑢𝛼)𝑣𝛼(1 − 𝑣𝛼)}︁.

O intervalo de possíveis valores para 𝜂 é −min [︂ 1, 1 𝑛𝛼2 ]︂ ≤ 𝜂 ≤ 1 𝑛𝛼.

Para essa generalização, o coeficiente de correlação de Spearman satisfaz

𝜌𝑠 = 12 𝑛 ∑︁ 𝑟=1 (︃ 𝑟 𝑛 )︃ 𝜂𝑟 (︂ Γ(𝑟 + 1)Γ(2 𝛼) 𝛼Γ(𝑟 + 1 + 𝛼2) )︂2 ,

de tal forma que escolhendo valores propícios para 𝛼 e 𝑛 podemos obter correlação máxima 𝜌𝑠 = 0.43 e mínima 𝜌𝑠= −0.50.

(29)

Capítulo 3

O modelo BS Bivariado baseado na

Cópula FGM

Recentemente, seguindo estudos já considerados para outras distribuições assimé-tricas contínuas, Kundu et al. (2010) apresentaram uma extensão da distribuição BS univariada para o caso bivariado. Neste capítulo, iremos apresentar alguns desses re-sultados obtidos por Kundu et al. (2010) e propor um tipo diferente de generalização através da cópula FGM, descrita no Capítulo 2. Propriedades e aspectos de inferência serão investigados para ambos os casos. Um estudo de simulação será realizado para essa nova generalização.

3.1

Revisão sobre a Distribuição BS Bivariada

A distribuição BS univariada está relacionada com a distribuição normal univariada através da variável aleatória

𝑇 = 𝛽 [︃ 𝛼𝑍 2 + √︃ 𝛼2𝑍2 2 + 1 ]︃2 ,

em que 𝑍 ∼ 𝑁(0, 1), 𝛼 > 0, 𝛽 > 0. A variável aleatória T é dita ter uma distribuição BS, denotada por 𝑇 ∼ 𝐵𝑆(𝛼, 𝛽), com parâmetros forma e escala, 𝛼 e 𝛽, respectiva-mente. A fdp de T é dada por

𝐹𝑇(𝑡) = Φ(𝑎𝑡(𝛼, 𝛽)), 𝑡 > 0, (3.1.1)

em que 𝑎𝑡(𝛼, 𝛽) = (

√︁

𝑡/𝛽 −√︁𝛽/𝑡)/𝛼.

Nesta seção, apresentaremos a distribuição BS bivariada que foi proposta por Kundu et al. (2010) como uma extensão da distribuição BS univariada, proposta inicialmente por Birnbaum- Saunders (1969a). Trata-se de uma distribuição absolutamente contí-nua, com cinco parâmetros e com distribuições marginais BS univariadas. Além disso, está altamente relacionada com a distribuição normal bivariada, sendo utilizada na análise de dados bidimensionais de sobrevivência.

(30)

Segundo Kundu et al. (2010), um vetor aleatório bivariado T = (𝑇1, 𝑇2)⊤ segue

uma distribuição BS bivariada com parâmetros 𝛼1 > 0, 𝛼2 > 0, 𝛽1 > 0, 𝛽2 > 0, e

1 < 𝜌 < 1, se a fda conjunta de 𝑇1 e 𝑇2 pode ser expressa como

𝐹T(t) = 𝑃 (𝑇1 ≤ 𝑡1, 𝑇2 ≤ 𝑡2) = Φ2 [︂ 1 𝛼1 (︂√︃𝑡 1 𝛽1 − √︃ 𝛽1 𝑡1 )︂ , 1 𝛼2 (︂√︃𝑡 2 𝛽2 − √︃ 𝛽2 𝑡2 )︂ ; 𝜌]︂, (3.1.2)

em que Φ2(· , 𝜌) é a fda conjunta de Z = (𝑍1, 𝑍2)⊤ ∼ 𝑁2(0, Σ), com 𝜎11 = 𝜎22 = 1 e

coeficiente de correlação 𝜌, ou seja, Σ= (︃ 1 𝜌 𝜌 1 )︃ . Considerando agora 𝑎𝑡𝑗(𝛼𝑗, 𝛽𝑗) = 1 𝛼𝑗 (︂√︃𝑡 𝑗 𝛽𝑗 − ⎯ ⎸ ⎸ ⎷ 𝛽𝑗 𝑡𝑗 )︂ , 𝑗 = 1, 2,

a fda da BS bivariada, definida em (3.1.2), pode ser escrita de forma simplificada como

𝐹T(t) = Φ2(𝑎𝑡1(𝛼1, 𝛽1), 𝑎𝑡2(𝛼2, 𝛽2); 𝜌) = Φ2(𝑎t(𝛼, 𝛽); 𝜌), em que 𝑎t(𝛼, 𝛽) = (𝑎𝑡1(𝛼1, 𝛽1), 𝑎𝑡2(𝛼2, 𝛽2)) ⊤, com t = (𝑡 1, 𝑡2)⊤ ∈ R2+, 𝛼 = (𝛼1, 𝛼2)⊤, 𝛽 = (𝛽1, 𝛽2)⊤.

Nesse caso, a notação utilizada é T ∼ 𝐵𝑆2(𝛼, 𝛽, 𝜌). Considerando a fda dada em

(3.1.2), a fdp conjunta de T pode ser escrita como

𝑓T(t) = 𝜑2(𝑎t(𝛼, 𝛽))Π𝐴t(𝛼, 𝛽), t ∈ R2+, (3.1.3) em que 𝜑2(z; 𝜌) = 𝜑2(𝑧1, 𝑧2; 𝜌) = 1 2𝜋1 − 𝜌2 exp (︂ − 1 2(1 − 𝜌2)(𝑧 2 1 + 𝑧 2 2 −2𝜌𝑧1𝑧2) )︂ , 𝑎t(𝛼, 𝛽) é como em (3.1.2) e Π𝐴t(𝛼, 𝛽) = 𝐴𝑡1(𝛼1, 𝛽1)𝐴𝑡2(𝛼2, 𝛽2), com 𝐴𝑡𝑗(𝛼𝑗, 𝛽𝑗) = 𝑡 −3/2 𝑗 (𝑡𝑗+ 𝛽𝑗) 2𝛼𝑗𝛽 1/2 𝑗 , 𝑗 = 1, 2.

Nas Figuras 3.1-3.4, mostramos graficamente o comportamento da fdp descrita em (3.1.3). Para diferentes valores de 𝜌, apresentamos os gráficos da densidade e suas respectivas curvas de nível.

(31)

(a) 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0.0 0.5 1.0 1.5 2.0 0.0 0.5 1.0 1.5 2.0 (b) 0.05 0.1 0.15 0.2 0.25 0.3 0 1 2 3 4 5 0 1 2 3 4 5

Figura 3.1: Fdp e contorno do modelo BS bivariado quando 𝛼1 = 𝛼2 = 1, 𝛽1 = 𝛽2 = 1

e (a) 𝜌 = 0.5 (b) 𝜌 = −0.5. (a) 0.5 1 1.5 2 2.5 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 (b) 0.05 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0 1 2 3 4 5 6 0 1 2 3 4 5 6

Figura 3.2: Fdp e contorno do modelo BS bivariado quando 𝛼1 = 𝛼2 = 1, 𝛽1 = 𝛽2 = 1

(32)

(a) 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0.0 0.5 1.0 1.5 2.0 0.0 0.5 1.0 1.5 2.0 2.5 3.0 (b) 0.1 0.2 0.3 0.4 0.5 0 1 2 3 4 0 1 2 3 4

Figura 3.3: Fdp e contorno do modelo BS bivariado quando 𝛼1 = 0.5, 𝛼2 = 1, 𝛽1 =

𝛽2 = 1 e (a) 𝜌 = 0.5 (b) 𝜌 = −0.5. (a) 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2 2.2 0.0 0.5 1.0 1.5 2.0 0.0 0.5 1.0 1.5 2.0 (b) 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 0 1 2 3 4 5

Figura 3.4: Fdp e contorno do modelo BS bivariado quando 𝛼1 = 0.5, 𝛼2 = 1, 𝛽1 =

(33)

Os resultados a seguir foram apresentados por Kundu et al. (2010) e podem ser demonstrados através de mudança de variáveis, fornecendo as distribuições marginais e condicionais para a distribuição BS bivariada.

Teorema 3.1.1. Se T = (𝑇1, 𝑇2)⊤ ∼ 𝐵𝑆2(𝛼, 𝛽, 𝜌), com 𝛼 = (𝛼1, 𝛼2)⊤ e 𝛽 = (𝛽1, 𝛽2)⊤, então i) 𝑇𝑗 ∼ 𝐵𝑆(𝛼𝑗, 𝛽𝑗), 𝑗 = 1, 2; ii) T−1 = (𝑇−1 1 , 𝑇 −1 2 )⊤∼ 𝐵𝑆2(𝛼1, 𝛽1−1, 𝛼2, 𝛽2−1, 𝜌); iii) T−1 1 = (𝑇 −1 1 , 𝑇2)⊤ ∼ 𝐵𝑆2(𝛼1, 𝛽1−1, 𝛼2, 𝛽2, −𝜌); iv) 𝑇−1 2 = (𝑇1, 𝑇2−2)⊤ ∼ 𝐵𝑆2(𝛼1, 𝛽1, 𝛼2, 𝛽2−1, −𝜌);

v) 𝑇1 e 𝑇2 são independente se e somente se 𝜌 = 0;

vi) A fdp condicional de 𝑇1, dado 𝑇2 = 𝑡2, é dada por

𝑓𝑇1|𝑇2(𝑡1|𝑡2) = 𝜑(𝑎𝑡1(𝛼1𝜌, 𝛽1) − 𝜇1(𝑡2))𝐴𝑡1(𝛼1𝜌, 𝛽1), (3.1.4) em que 𝜑(·) é a fdp da distribuição 𝑁(0, 1), 𝛼1𝜌 = √ 1 − 𝜌2𝛼 1 e 𝜇1(𝑡2) = 𝜌𝑎𝑡2(𝛼2𝜌, 𝛽2) com 𝛼2𝜌 = √ 1 − 𝜌2𝛼

2. Note que a distribuição condicional de 𝑇1, dado 𝑇2 = 𝑡2,

corresponde a uma distribuição univariada não-central BS, veja Guiraud et al. (2009).

3.2

Distribuição BS Bivariada baseado na Cópula

FGM

Nesta seção discutiremos a distribuição BS bivariada obtida a partir da cópula FGM. Sejam 𝑇1 ∼ 𝐵𝑆(𝛼1, 𝛽1) e 𝑇2 ∼ 𝐵𝑆(𝛼2, 𝛽2), então a fdp conjunta de 𝑇1 e 𝑇2 via

cópula FGM pode ser escrita como

𝑓𝑇1,𝑇2(𝑡1, 𝑡2) = 𝑐𝜂(𝐹𝑇1(𝑡1), 𝐹𝑇2(𝑡2))𝑓𝑇1(𝑡1)𝑓𝑇2(𝑡2), em que 𝑐𝜂(𝐹𝑇1(𝑡1), 𝐹𝑇2(𝑡2)) = 1 + 𝜂(2𝐹𝑇1(𝑡1) − 1)(2𝐹𝑇2(𝑡2) − 1), com 𝐹𝑇𝑗(𝑡𝑗) = Φ(𝑎𝑡𝑗(𝛼𝑗, 𝛽𝑗)) e 𝑓𝑇𝑗(𝑡𝑗) = 𝜑(𝑎𝑡𝑗(𝛼𝑗, 𝛽𝑗))𝐴𝑡𝑗(𝛼𝑗, 𝛽𝑖); 𝑗 = 1, 2. Sejam Π𝜑(t; 𝛼, 𝛽) = 𝜑(𝑎𝑡1(𝛼1, 𝛽1))𝜑(𝑎𝑡2(𝛼2, 𝛽2)), Φ(𝑎(t; 𝛼, 𝛽)) = (Φ(𝑎𝑡1(𝛼1, 𝛽1)), Φ(𝑎𝑡2(𝛼2, 𝛽2))) ⊤ ,

(34)

a fdp pode então ser reescrita como

𝑓T(t) = 𝑐𝜂(Φ(𝑎(t; 𝛼, 𝛽)))Π𝜑(t; 𝛼, 𝛽)Π𝐴t(𝛼, 𝛽), (3.2.1)

em que 𝑎𝑡𝑗(𝛼𝑗, 𝛽𝑗) e 𝐴𝑡𝑗(𝛼𝑗, 𝛽𝑗) são como em (3.1.3).

A notação adotada para essa distribuição será C-BS2(𝛼, 𝛽, 𝜂). Quando 𝜂 = 0,

obtemos o caso independente, que coincide com o caso independente proposto por Kundu et al.(2010).

Visto que as marginais são BS a relação com a distribuição normal descrita no Capítulo 1 se mantém: 𝑇𝑗 = 𝛽𝑗 4 [︂ 𝛼𝑗𝑍𝑗+ √︁ (𝛼𝑗𝑍𝑗)2+ 4 ]︂2 , 𝑗 = 1, 2.

Consequentemente, temos que Z = (𝑍1, 𝑍2)⊤ tem distribuição normal bivariada

cons-truída a partir da cópula FGM, que iremos denotar por C-N2(0, ϒ), em que ϒ é a

matriz de covariâncias para Z, definida como

ϒ= (︃ 1 𝜂 𝜋 𝜂 𝜋 1 )︃ , (3.2.2)

e 𝜂 é o coeficiente de associação entre 𝑍1 e 𝑍2, especificado pela cópula FGM.

Nas Figuras 3.5-3.7, mostramos graficamente o comportamento da fdp C-BS biva-riada obtida via cópulas dado em (3.2.1). Para diferentes valores de 𝜂, apresentamos os gráficos da densidade e suas respectivas curvas de nível.

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.0 0.5 1.0 1.5 2.0 2.5 3.0 0.0 0.5 1.0 1.5 2.0 2.5 3.0

Figura 3.5: A distribuição conjunta de (𝑇1, 𝑇2) através da cópula FGM em que 𝛼1 =

(35)

(a) 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0.0 0.5 1.0 1.5 2.0 2.5 3.0 0.0 0.5 1.0 1.5 2.0 2.5 3.0 (b) 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.0 0.5 1.0 1.5 2.0 2.5 3.0 0.0 0.5 1.0 1.5 2.0 2.5 3.0

Figura 3.6: A distribuição conjunta de (𝑇1, 𝑇2) através da cópula FGM em que 𝛼1 =

𝛼2 = 0.5, 𝛽1 = 𝛽2 = 1 e (a) 𝜂 = 0.5 (b) 𝜂 = −0.5. (a) 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0.0 0.5 1.0 1.5 2.0 2.5 3.0 0.0 0.5 1.0 1.5 2.0 2.5 3.0 (b) 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.0 0.5 1.0 1.5 2.0 2.5 3.0 0.0 0.5 1.0 1.5 2.0 2.5 3.0

Figura 3.7: A distribuição conjunta de (𝑇1, 𝑇2) através da cópula FGM em que 𝛼1 =

(36)

Discutimos anteriormente que quando 𝜂 = 0, o modelo baseado na cópula FGM coincide com o caso proposto por Kundu et al.(2010). Todavia, algo interessante a ser verificado é se no caso de dependência (𝜂 ̸= 0, 𝜌 ̸= 0) o comportamento das duas distribuições é similar ou não. Nas Figuras 3.8-3.11, apresentamos as curvas de nível para os dois casos, alterando os valores de 𝜂 e 𝜌. Consideramos fixos os valores de 𝛼 e 𝛽 em 𝛼1 = 0.5,

𝛼2 = 0.5, 𝛽1 = 1 e 𝛽2 = 1.

Pode-se verificar diferença mais acentuada quando o parâmetro de dependência as-sume valor próximo de 1 ou −1, ou seja, quanto maior for a estrutura de dependência entre as duas variáveis maior será a divergência entre o uso de uma distribuição ou outra. CBS η= 0.9 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0.0 0.5 1.0 1.5 2.0 2.5 3.0 0.0 0.5 1.0 1.5 2.0 2.5 3.0 BS ρ= 0.9 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2 2.2 0.0 0.5 1.0 1.5 2.0 2.5 3.0 0.0 0.5 1.0 1.5 2.0 2.5 3.0 BS ρ= 0.7 0.2 0.4 0.6 0.8 1 1.2 0.0 0.5 1.0 1.5 2.0 2.5 3.0 0.0 0.5 1.0 1.5 2.0 2.5 3.0 BS ρ= 0.5 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0.0 0.5 1.0 1.5 2.0 2.5 3.0 0.0 0.5 1.0 1.5 2.0 2.5 3.0 BS ρ= 0.3 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0.0 0.5 1.0 1.5 2.0 2.5 3.0 0.0 0.5 1.0 1.5 2.0 2.5 3.0 BS ρ= 0.1 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.0 0.5 1.0 1.5 2.0 2.5 3.0 0.0 0.5 1.0 1.5 2.0 2.5 3.0

Figura 3.8: Curvas de nível referentes às distribuições C-BS bivariada (canto superior esquerdo, 𝜂 = 0.9) e 𝐵𝑆 bivariada para diferentes valores de 𝜌.

(37)

CBS η= −0.9 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.0 0.5 1.0 1.5 2.0 2.5 3.0 0.0 0.5 1.0 1.5 2.0 2.5 3.0 BS ρ= −0.9 0.2 0.4 0.6 0.8 1 1.2 1.4 0.0 0.5 1.0 1.5 2.0 2.5 3.0 0.0 0.5 1.0 1.5 2.0 2.5 3.0 BS ρ= −0.7 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0.0 0.5 1.0 1.5 2.0 2.5 3.0 0.0 0.5 1.0 1.5 2.0 2.5 3.0 BS ρ= −0.5 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.0 0.5 1.0 1.5 2.0 2.5 3.0 0.0 0.5 1.0 1.5 2.0 2.5 3.0 BS ρ= −0.3 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.0 0.5 1.0 1.5 2.0 2.5 3.0 0.0 0.5 1.0 1.5 2.0 2.5 3.0 BS ρ= −0.1 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.0 0.5 1.0 1.5 2.0 2.5 3.0 0.0 0.5 1.0 1.5 2.0 2.5 3.0

Figura 3.9: Curvas de nível referentes às distribuições C-BS bivariada (canto superior esquerdo, 𝜂 = −0.9) e 𝐵𝑆 bivariada para diferentes valores de 𝜌.

(38)

CBS η= 0.5 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0.0 0.5 1.0 1.5 2.0 2.5 3.0 0.0 0.5 1.0 1.5 2.0 2.5 3.0 BS ρ= 0.5 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0.0 0.5 1.0 1.5 2.0 2.5 3.0 0.0 0.5 1.0 1.5 2.0 2.5 3.0 BS ρ= 0.4 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0.0 0.5 1.0 1.5 2.0 2.5 3.0 0.0 0.5 1.0 1.5 2.0 2.5 3.0 BS ρ= 0.3 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0.0 0.5 1.0 1.5 2.0 2.5 3.0 0.0 0.5 1.0 1.5 2.0 2.5 3.0 BS ρ= 0.2 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.0 0.5 1.0 1.5 2.0 2.5 3.0 0.0 0.5 1.0 1.5 2.0 2.5 3.0 BS ρ= 0.1 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.0 0.5 1.0 1.5 2.0 2.5 3.0 0.0 0.5 1.0 1.5 2.0 2.5 3.0

Figura 3.10: Curvas de nível referentes às distribuições C-BS bivariada (canto superior esquerdo, 𝜂 = 0.5) e 𝐵𝑆 bivariada para diferentes valores de 𝜌.

(39)

CBS η= −0.5 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.0 0.5 1.0 1.5 2.0 2.5 3.0 0.0 0.5 1.0 1.5 2.0 2.5 3.0 BS ρ= −0.5 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.0 0.5 1.0 1.5 2.0 2.5 3.0 0.0 0.5 1.0 1.5 2.0 2.5 3.0 BS ρ= −0.4 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.0 0.5 1.0 1.5 2.0 2.5 3.0 0.0 0.5 1.0 1.5 2.0 2.5 3.0 BS ρ= −0.3 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.0 0.5 1.0 1.5 2.0 2.5 3.0 0.0 0.5 1.0 1.5 2.0 2.5 3.0 BS ρ= −0.2 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.0 0.5 1.0 1.5 2.0 2.5 3.0 0.0 0.5 1.0 1.5 2.0 2.5 3.0 BS ρ= −0.1 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.0 0.5 1.0 1.5 2.0 2.5 3.0 0.0 0.5 1.0 1.5 2.0 2.5 3.0

Figura 3.11: Curvas de nível referentes às distribuições C-BS bivariada (canto superior esquerdo, 𝜂 = −0.5) e 𝐵𝑆 bivariada para diferentes valores de 𝜌.

Referências

Documentos relacionados

Para Peci e Sobral (2008, p.4), em um mundo cada vez mais globalizado e competitivo, o sucesso ou insucesso das organizações depende da qualidade da sua administração. São

O padre veio para eles e abraçou-se também, subitamente perturbado por uma analogia, assim dissera o italiano, Deus ele próprio, Baltasar seu filho, Blimunda

Os elementos caracterizadores da obra são: a presença constante de componentes da tragédia clássica e o fatalismo, onde o destino acompanha todos os momentos das vidas das

Quero ir com o avô Markus buscar a Boneca-Mais-Linda-do-Mundo, quero andar de trenó, comer maçãs assadas e pão escuro com geleia (17) de framboesa (18).... – Porque é tão

Analysis of relief and toponymy of the landscape based on the interpretation of the military topographic survey: Altimetry, Hypsometry, Hydrography, Slopes, Solar orientation,

Se você vai para o mundo da fantasia e não está consciente de que está lá, você está se alienando da realidade (fugindo da realidade), você não está no aqui e

A estabilidade do corpo docente permanente permite atribuir o conceito muito bom, segundo os parâmetros da área, para o item 2.2 (pelo menos 75% dos docentes permanentes foram

O segundo Beneficiário será designado pelo Segurado na Proposta de Adesão, podendo ser substituído a qualquer tempo, mediante solicitação formal assinada pelo próprio Segurado, para