• Nenhum resultado encontrado

Vamos agora considerar uma aplicação dos métodos desenvolvidos nas seções ante- riores para o modelo de regressão C-BS bivariado. Utilizaremos o conjunto de dados reais IRIS, conforme o ajuste realizado no Capítulo 4.

5.4.1

Distâncias 𝐿𝐷

𝑖

e 𝐺𝐷

𝑖

Inicialmente calculamos a 𝐿𝐷𝑖 para 𝜃 = (𝛼, 𝛽, 𝜂), a fim de identificar observações

influentes no modelo ajustado. O resultado pode ser verificado na Figura 5.1.

0 20 40 60 80 100 0.0 0.2 0.4 0.6 0.8 1.0 1.2 1.4 Index LD 69

Figura 5.1: Afastamento pela verossimilhança: 𝐿𝐷𝑖(𝜃)

Considerando esse método de diagnóstico a observação que parece exercer mais influên- cia na estimação de 𝜃 é a #69.

Para investigar a influência em cada parâmetro separadamente optamos por calcular a GD para cada um deles. De forma a identificar se a influência ocorre em 𝜃 como um todo, ou apenas em alguma componente: 𝛼, 𝛽 ou 𝜂. Os resultados podem ser verificados na Figura 5.2. A mesma escala foi aplicada nos quatro gráficos, de tal

forma que a comparação é justa e possibilita afirmar em qual parâmetro a influência é maior. (a) 0 20 40 60 80 100 0.0 0.2 0.4 0.6 0.8 1.0 1.2 Index GD 69 (b) 0 20 40 60 80 100 0.0 0.2 0.4 0.6 0.8 1.0 1.2 Index GD( α ) 69 (c) 0 20 40 60 80 100 0.0 0.2 0.4 0.6 0.8 1.0 1.2 Index GD( β ) 69 (d) 0 20 40 60 80 100 0.0 0.2 0.4 0.6 0.8 1.0 1.2 Index GD( η ) 13 21 87

Figura 5.2: Index-Plot para: (a) 𝐺𝐷𝑖(𝜃) , (b) 𝐺𝐷𝑖(𝛼) , (c) 𝐺𝐷𝑖(𝛽) , (d) 𝐺𝐷𝑖(𝜂)

Note que o resultado verificado na Figura 5.1 se repetiu quando consideramos o mé- todo da Distância de Cook para 𝜃, isto é, a observação que se mostra mais influente no processo de estimação é a observação #69. Verificando a contribuição para cada parâmetro, temos que em termos de 𝛼 e 𝛽 ela também aparece em destaque. Como os dois gráficos estão na mesma escala é intuitivo observar que a influência dessa ob- servação é maior em 𝛽 do que em 𝛼. Quando observamos o parâmetro de associação

a #13 a de maior influência. Porém, no contexto geral, a influência dessas observações não parece ser significativa.

Podemos ser ainda mais específicos e observar a influência em 𝛼1, 𝛼2, 𝛽1 e 𝛽2,

conforme Figuras 5.4.1 e 5.3. Novamente, adotamos a mesma escala para os quatro gráficos. (a) 0 20 40 60 80 100 0.0 0.2 0.4 0.6 0.8 1.0 1.2 Index GD( α1 ) 57 92 34,35 (b) 0 20 40 60 80 100 0.0 0.2 0.4 0.6 0.8 1.0 1.2 Index GD( α2 ) 69 (c) 0 20 40 60 80 100 0.0 0.2 0.4 0.6 0.8 1.0 1.2 Index GD( β1 ) 34 57 82 92 (d) 0 20 40 60 80 100 0.0 0.2 0.4 0.6 0.8 1.0 1.2 Index GD( β2 ) 69

Figura 5.3: Distância de Cook para as componentes: (a) 𝛼1 e (b) 𝛼2, (c) 𝛽1 e (d) 𝛽2

Interessante notar que a observação #69 não demonstrou influência significativa quando olhamos para 𝛼1 ou 𝛽1 separadamente. Entretanto, continua figurando como de maior

destaque quando olhamos para a segunda componente, isto é, 𝛼2 e 𝛽2. Aparentemente

a influência dessa observação esta mais relacionada a largura da sépala (𝑌2) do que ao

Para 𝛼1 isoladamente as observações de destaque foram: #34, #35, #57 e #92.

Para 𝛽1 foram as observações: #34, #57, #82 e #92.

Em suma, temos a observação #69 que desponta como de maior atenção, a qual que se destaca na estimação de 𝜃 como um todo e também aparece como relevante a respeito dos parâmetros da segunda componente, largura da sépala, 𝛼2 e 𝛽2; com

destaque em 𝛽2. Ao mesmo tempo, temos alguns pontos influentes na estimação de 𝛼1,

𝛽1 e 𝜂, porém, só aparecem quando olhamos os parâmetros de forma isolada.

5.4.2

Avaliação de Outlier

Cabe aqui abordar três possíveis cenários. Cenário 1: 𝛾1 = 0, 𝛾2 ̸= 0

O modelo neste caso é dado por

⎧ ⎪ ⎪ ⎨ ⎪ ⎪ ⎩ 𝑌𝑖 = x𝑖 𝛽+ 𝜖𝑖, 𝑖= 1, . . . , 𝑛, 𝑖 ̸= 𝑘, 𝑌1𝑖 = x1𝑖𝛽1+ 𝜖1𝑖, 𝑌2𝑖 = x2𝑖𝛽2+ 𝛾2+ 𝜖2𝑖, 𝑖= 𝑘. Cenário 2: 𝛾1 ̸= 0, 𝛾2 = 0

Neste caso, o modelo é da seguinte forma

⎧ ⎪ ⎪ ⎨ ⎪ ⎪ ⎩ 𝑌𝑖 = x𝑖 𝛽+ 𝜖𝑖, 𝑖= 1, . . . , 𝑛, 𝑖 ̸= 𝑘, 𝑌1𝑖 = x1𝑖𝛽1+ 𝛾1+ 𝜖1𝑖, 𝑌2𝑖 = x2𝑖𝛽2+ 𝜖2𝑖, 𝑖= 𝑘. Cenário 3: 𝛾1 ̸= 0, 𝛾2 ̸= 0

Neste cenário o modelo considerado é o mais geral possível

⎧ ⎪ ⎪ ⎨ ⎪ ⎪ ⎩ 𝑌𝑖 = x𝑖 𝛽+ 𝜖𝑖, 𝑖= 1, . . . , 𝑛, 𝑖 ̸= 𝑘, 𝑌1𝑖 = x1𝑖𝛽1+ 𝛾1+ 𝜖1𝑖, 𝑌2𝑖 = x2𝑖𝛽2+ 𝛾2+ 𝜖2𝑖, 𝑖= 𝑘.

Na Figura (5.4) constam as distâncias para os cenários 1 e 2.

Como era esperado, a observação #69 situando-se como extremamente relevante na segunda componente, largura da sépala. Visto que os gráficos estão na mesma escala, temos que ela é a de maior relevância.

(a) 0 20 40 60 80 100 0 2 4 6 8 Index L Dp k( γ2 ) 69 (b) 0 20 40 60 80 100 0 2 4 6 8 Index L Dp k ( γ1 ) 35 51

Figura 5.4: Distância 𝐿𝐷𝑝𝑘: (a) Cenário 1 (b) Cenário 2

Na Figura 5.5 podemos verificar a distância 𝐿𝐷𝑝𝑘 calculada para o cenário 3.

0 20 40 60 80 100 0 2 4 6 8 Index L Dp k (γ1 , γ2 ) 35 69

Figura 5.5: Cenário 4: Distância 𝐿𝐷𝑝𝑘: Cenário 3

Confirmando resultados obtidos em análises prévias, a observação que mais se des- taca é a #69 cuja relevância maior se encontra na segunda componente.

Uma vez que essa distância é simplesmente uma adaptação do teste MSOM, não podemos inferir nada nesse momento. Os resultados aqui verificados devem ser enca- rados apenas como indícios de algo a ser analisado de um ponto de vista inferencial.

Todavia, o fato deles coincidirem com o que foi visto utilizando o Método da Exclusão de Casos traz respaldo para essa metodologia que foi sugerida, abrindo oportunidade para estudos futuros a transformarem em um teste de hipóteses.

5.4.3

Ponderação de Casos

Vamos agora desenvolver o método de influência local para o modelo C-BS bivari- ado, considerando o esquema de perturbação de ponderação de casos. Primeiramente averiguamos a disposição de h𝑚𝑎𝑥 para 𝜃. Além disso, utilizando as partições adequa-

das em 𝜃 de tal forma que 𝜃1 assume cada vez um dos três parâmetros, replicamos a

análise para cada parâmetro separadamente. A Figura 5.6 retrata esse cenário.

(a) 0 20 40 60 80 100 0.0 0.2 0.4 0.6 0.8 Index hmax( θ ) 69 (b) 0 20 40 60 80 100 0.0 0.2 0.4 0.6 0.8 Index hmax( α ) 69 (c) 0 20 40 60 80 100 0.0 0.2 0.4 0.6 0.8 Index hmax( β ) 69 (d) 0 20 40 60 80 100 0.0 0.2 0.4 0.6 0.8 Index hmax( η ) 13 21 34 87

Influência local total

Optamos também por utilizar a curvatura na direção da 𝑖-ésima observação, abor- dagem proposta por Lesaffre e Verbeke (1998). Novamente considerando 𝜃 como um todo, e também cada vez um dos três parâmetros separadamente, Figura 5.7.

(a) 0 20 40 60 80 100 0.0 0.5 1.0 1.5 2.0 Index Ci 69 (b) 0 20 40 60 80 100 0.0 0.5 1.0 1.5 2.0 Index Ci( α ) 69 (c) 0 20 40 60 80 100 0.0 0.5 1.0 1.5 2.0 Index Ci( β ) 69 (d) 0 20 40 60 80 100 0.0 0.5 1.0 1.5 2.0 Index Ci( η ) 13 21 34 87

Figura 5.7: Gráfico de: (a) 𝐶𝑖(𝜃) , (b) 𝐶𝑖(𝛼) , (c) 𝐶𝑖(𝛽) e (d) 𝐶𝑖(𝜂)

Selecionando as partições adequadas em 𝜃 e em ¨𝐿(𝜃̂︀) é possível também verificar a

influência específica em 𝛼1, 𝛼2, 𝛽1 e 𝛽2. Essas medidas foram calculadas e podem ser

0 20 40 60 80 100 0.0 0.5 1.0 1.5 2.0 Index Ci( α1 ) 51 57 92 34,35 0 20 40 60 80 100 0.0 0.5 1.0 1.5 2.0 Index Ci( α2 ) 69

Figura 5.8: Gráfico de 𝐶𝑖 para as componentes (a) 𝛼1 e (b) 𝛼2

(a) 0 20 40 60 80 100 0.0 0.5 1.0 1.5 2.0 Index Ci( β1 ) 34 57 (b) 0 20 40 60 80 100 0.0 0.5 1.0 1.5 2.0 Index Ci( β2 ) 69

Figura 5.9: Gráfico de 𝐶𝑖 para as componentes (a) 𝛽1 e (b) 𝛽2

Com base nessas medidas verificamos resultado muito similar ao que foi encontrado na aplicação do MEC, isto é, a observação #69 despontando como destaque, sendo a mais influente acerca da estimação de 𝜃, 𝛼 e 𝛽. Análogo ao que foi visto anteriormente, a influência dessa observação esta concentrada na segunda componente, largura da sépala, e apresenta maior magnitude em relação à 𝛽 do que 𝛼.

Olhando 𝜂 isoladamente, as observações #13, #21, #21 e #57 se destacam como influentes. Vale notar que três deles também apareceram no MEC. Mais uma vez, a influência é baixa quando estudamos o contexto geral dos parâmetros.

Construímos também gráficos de dispersão entre os diversos parâmetros associados ao modelo, de tal forma a melhorar a visualização, além de permitir encontrar pontos que são mutualmente influentes. Para as linhas de corte, assumimos a proposta de Zhu e Lee (2001), utilizando a média e desvio padrão: 𝐶 + 2 sd(𝐶).

Na Figura 5.10 mostramos a dispersão entre 𝐶𝑖(𝛼) e 𝐶𝑖(𝛽), o qual deixa claro que

a única observação que afeta os dois parâmetros conjuntamente é a #69.

0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.0 0.5 1.0 1.5 Ci(α) Ci( β ) 19 69 34 57 82

Figura 5.10: Gráfico de dispersão: 𝐶𝑖(𝛼) x 𝐶𝑖(𝛽)

Na Figura 5.11(a) construímos um gráfico de dispersão entre 𝐶𝑖(𝛼1) e 𝐶𝑖(𝛼2) e na

Figura 5.11(b) entre 𝐶𝑖(𝛽1) e 𝐶𝑖(𝛽2), A utilização de um ponte de corte evidenciou

mais pontos que não haviam sido percebidos anteriormente. Observação #1 para 𝛼1;

#19 para 𝛼2; #92 e #82 para 𝛽1.

Em 5.12(a) temos 𝐶𝑖(𝛼) contra 𝐶𝑖(𝜂), em que os casos #69 e #19 aparecem como

relevantes quanto a estimação de 𝛼. Enquanto que acerca de 𝜂 a única novidade foi a observação #99. Nenhum ponto em comum foi observado nesse cenário.

Já em 5.12(b) verificamos a dispersão entre 𝐶𝑖(𝛽) e 𝐶𝑖(𝜂), cuja grande novidade foi

o ponto #34 que apareceu como influente para os dois parâmetros, algo que não estava evidente até esse momento. Porém, não é algo que merece destaque, pois já vimos que essa observação não afeta o modelo de forma expressiva.

(a) 0.00 0.05 0.10 0.15 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 Ci(α1) Ci( α2 ) 34 92 35 1 51 57 19 69 (b) 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.0 0.5 1.0 1.5 Ci(β1) Ci( β2 ) 34 57 82 92 69

Figura 5.11: Gráficos de dispersão: (a) 𝐶𝑖(𝛼1) x 𝐶𝑖(𝛼2) e (b) 𝐶𝑖(𝛽1) x 𝐶𝑖(𝛽2)

(a) 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.00 0.05 0.10 0.15 0.20 Ci(α) Ci( η ) 13 21 34 87 99 69 19 (b) 0.0 0.5 1.0 1.5 0.00 0.05 0.10 0.15 0.20 Ci(β) Ci( η ) 13 21 34 87 99 57 69 82

5.4.4

Conclusões

Uma vez realizada a análise de diagnóstico, a observação #69 foi a que se mostrou mais influente. Os resultados encontrados indicaram que ela apresenta alta influência na estimação dos parâmetros do modelo. Se destacando quando olhamos para 𝜃 como um todo e também a respeito de 𝛼 e 𝛽. Outros pontos interessantes que a análise trouxe foram: a associação dessa observação com a segunda componente do modelo, no caso largura da sépala; e que ela exerce maior influência em 𝛽 do que em 𝛼.

Uma primeira possibilidade a se considerar é que essa observação seja um ponto aberrante em uma das componentes da variável resposta, comprimento da sépala ou largura da sépala, possivelmente na segunda componente. Hipótese que logo foi des- cartada quando olhamos os Boxplots na Figura 5.13, a linha tracejada representa a localização do valor que y assume na observação #69.

5.0 5.5 6.0 6.5 7.0 7.5 8.0 Y1 2.0 2.5 3.0 3.5 Y2 11 60 68,82

Figura 5.13: Boxplots para 𝑦1:Comprimento da Sépala e 𝑦2:Largura da Sépala.

Vale notar que para 𝑦2, aparentemente, existem quatro pontos atípicos. Porém,

nenhum deles apareceu como influente na análise de diagnóstico.

Outra opção descartada é que a observação #69 seja um ponto atípico a respeito da variável explicativa, Comprimento da Pétala (𝑥1), o que pode ser notado na Figura 5.14.

Todavia, é importante notar que, mesmo não constando como atípica, essa observação representa o ponto de máximo em 𝑥1, isto é, max(𝑥1) = 6.9, exatamente o ponto #69.

3 4 5 6 7 x1

Figura 5.14: Boxplot para 𝑥1: Comprimento da Pétala

Diante dessas medidas descritivas não temos indícios para acreditar que a observação #69 é um ponto atípico, seja na variável resposta ou na variável explicativa contínua. Ou seja, aparentemente a observação #69 não é aberrante a respeito das variáveis comprimento da sépala, largura da sépala ou comprimento da pétala. Faz sentido então suspeitar que ela é influente mediante a combinação dessas variáveis a partir do modelo ajustado. Considerando então o ajuste realizado através do modelo de regressão log C-BS bivariado, plotamos também os resultados de 𝜉21 e 𝜉22, Figura 5.15.

−2 −1 0 1 2 ξ21 −3 −2 −1 0 1 2 ξ22 69

Nota-se então que a observação #69 é atípica quando consideramos 𝜉22.

Esse resultado pode ser verificado também através dos gráficos de dispersão de 𝜉2 12 e 𝜉2 22, na Figura 5.16. (a) 0 20 40 60 80 100 0 2 4 6 8 10 Index ξ21 2 (b) 0 20 40 60 80 100 0 2 4 6 8 10 Index ξ22 2 69

Figura 5.16: Gráfico de dispersão para (a) 𝜉2

21 e (b) 𝜉222

Uma vez que os dois gráficos de dispersão foram construídos utilizando a mesma escala, é possível notar que a observação #69 é a que mais se destaca.

Podemos também analisar 𝜉2(y) conjuntamente através da medida 𝑑, construída

com base na distância de Mahalanobis:

𝑑= 𝜉2(y)ϒ−1𝜉2(y) (5.4.1) com ϒ sendo a matriz de covariância para 𝜉2(y), definida no Capítulo 4.

Na Figura 5.17 verificamos que a observação #69 se destaca como atípica para 𝜉2(y).

Diante desses resultados, podemos concluir que a observação #69 não é atípica individualmente na variável resposta ou na variável explicativa, mas desponta como influente quando verificamos as observações conjuntamente. Isto é, se torna uma ob- servação de destaque a partir do modelo de regressão ajustado.

Finalmente, discutiremos a influência das observações quando o parâmetro de inte- resse é 𝜂. Analisando 𝜂 isoladamente alguns pontos se mostraram relevantes quanto a influência na estimação desse parâmetro. Nenhum deles preocupa, visto que nenhuma análise indicou que a influência de qualquer um desses pontos é relevante no ajuste geral do modelo. Todavia, é interessante tentar entender o que afetou o parâmetro de associação do modelo, no caso, a estrutura de dependência entre comprimento da sépala e largura da sépala na preseça de covariáveis, comprimento da pétala e espécie, e considerando o ajuste através do modelo de regressão C-BS bivariado.

0 20 40 60 80 100 0 2 4 6 8 Index di 69

Figura 5.17: Gráfico de dispersão para 𝑑𝑖

As observações que se destacaram foram: #13, #21 e #87. Nenhuma delas se mostrou atípica, seja nas variável resposta, explicativa, ou mesmo acerca de 𝜉2(Y).

Todavia, as três possuem uma característica em comum, valores "altos" com sinais opostos, isto é, se 𝜉21 apresenta um alto valor positivo, então 𝜉22 tem um valor bem

baixo negativo. Podemos ver na Figura 5.18 que elas se situam nos Quadrantes 1 e 3. Dessa forma, sua presença acarreta em um coeficiente de correlação mais baixo, enquanto que sua retirada gera um aumento significativo. Por essa razão é que apare- ceram como influentes acerca de 𝜂.

−2 −1 0 1 2 −3 −2 −1 0 1 2 ξ21 ξ22 13 21 87 51 35 Q1 Q2 Q3 Q4

Seria razoável questionar a respeito das observações #35 e #51, porém, diferente das observações citadas anteriormente, quando olhamos o seu valor notamos um valor bem baixo negativo de 𝜉21, mas o valor de 𝜉22 não é expressivamente alto; 𝜉2(y35) =

Capítulo 6

Considerações Finais

Neste trabalho desenvolvemos uma extensão do modelo de regressão linear BS uni- variado, proposto por Rieck e Nedelman (1991), para a versão bivariada considerando a estrutura da cópula FGM, o qual denotamos por modelo C-BS bivariado. A cópula FGM tem sido utilizada com sucesso para introduzir uma estrutura de dependência para dados bivariados, como pode ser visto, por exemplo, nos trabalho de Durling (1974), Lai (1978), Chinchilli e Breen (1985), Teichmann (1986), Long e Krzyszto- fowicz (1992) e Barriga et al. (2010).

Apresentamos as distribuições C-N bivariada e C-SN bivariada, e apontamos algu- mas propriedades importantes que nos permitem definir a distribuição C-BS bivariada e o modelo de regressão C-BS bivariado. Inspirados no trabalho de Rieck e Nedel- man (1991), Kundu et al. (2010) e Vilca et al. (2016), desenvolvemos primeiramente a distribuição BS bivariada baseada na cópula FGM, e logo em seguida derivamos a distribuição do logaritmo da distribuição BS bivariada, que representa um membro particular da distribuição sinh-normal bivariada construída a partir da cópula FGM.

Para ambos os casos propusemos um tipo simples de estimador de momentos modi- ficado que, por conseguinte, foram utilizados efetivamente como valores iniciais para o cálculo iterativo, através do método de Newton–Raphson, das estimativas de máxima verossimilhança. Esses estimadores de máxima verossimilhança foram desenvolvidos seguindo a mesma ideia de Kundu et al. (2010). As propriedades assintóticas desses estimadores são consideradas para discussão de testes para algumas hipóteses de inte- resse. O desempenho do método proposto foi avaliado através de estudo simulação e aplicação em um conjunto de dados reais.

Além disso, desenvolvemos um método de diagnóstico para o modelo de regressão C-BS bivariado, baseado na metodologia de Cook (1977).

Em termos de pesquisas futuras, podemos citar:

• considerar outros conjuntos de dados reais, para complementar os resultados obtidos;

• considerar diferentes cópulas, além da FGM;

• extensão do modelo para inclusão de censuras, como no caso univariado discutido em Leiva et al. (2007);

• propor um teste de outlier, conforme visto na Seção 5.2; • estudar a distribuição de 𝑑 = Zϒ−1Z, visto em (3.2.6);

• desenvolver diferentes esquemas de perturbação na aplicação do método de in- fluência local de Cook (1986).

Bibliografia

[1] Achcar, J. A. (1993). Inference for the Birnbaum-Saunders fatigue life model using Baye- sian methods. Computational Statistics and Data Analysis, 15, 367-380.

[2] Anderson, E. (1936). The Species Problem in Iris. Annals of the Missouri Botanical

Garden, 23(3), 457-509.

[3] Atkinson, A. C. (1985). Plots, Transformations and Regression: An Introduction to Graphical Methods of Diagnostic Regression Analysis. Clarendon Press, Oxford.

[4] Azzalini, A. (2014). The Skew-Normal and Related Families. Università degli Studi di Padova, Italy.

[5] Bairamov, I. G., Kotz, S. (2000). On a new family of positive quadrant dependent bivariate distribution. Technical Report, The GeorgeWashington University,Washington,

D.C.

[6] Balakrishnan, N., Lai, C. D. (2009). Continuous Bivariate Distributions. Second Edition. Springer, New York.

[7] Barriga, G. D. C., Louzada-Neto, F., Ortega, E. M., Cancho, V. G. (2010). A bivariate regression model for matched paired survival data: local influence and residual analysis.

Statistical Methods and Applications, 19, 477-495.

[8] Barros, M., Paula, G., Leiva, V. (2008). A new class of survival regression models with heavytailed errors: robustness and diagnostics. Lifetime Data Analysis, 14, 316–332. [9] Bekrizadeh, H., Parham, G. A., Zadkarmi, M. R. (2012). The New Generalization of

Farlie–Gumbel–Morgenstern Copulas. Applied Mathematical Sciences, 6, 71, 3527 – 3533. [10] Belsley, D. A., Kuh, E., Welsch, R. E. (1980). Regression Diagnostics: Identifying Influ-

ential Data and Sources of Collinearity. Jonh Wiley and Sons, New York.

[11] Birbnaum, Z. W., Saunders, S. C. (1969a). A new family of life distributions. Journal

of Applied Probability, 6, 319–327.

[12] Birbnaum, Z. W., Saunders, S. C. (1969b). Estimation for a family of life distributions with applications to fatigue. Journal of Applied Probability, 6, 328–347.

[13] Chatterjee, S., Hadi, A. S. (1988). Sensitivity Analysis in Linear Regression. Jonh Wiley and Sons, New York.

[14] Chinchilli, V. M., Breen, T. J. (1985). Testing the independence of q binary random variables. Technical Report, Department of Biostatistics, Medical College of Virginia, Richmond. (Abstract in Biometrics, 41, 578).

[15] Choi, Y. H., Matthews, D. E. (2005). Accelerated life regression modelling of dependent bivariate time-to-event data. Canadian Journal of Statistics, 33, 449-464.

[16] Clayton, D. G.(1978). A model for association in bivariate life-tables and its application in epidemiological studies of familial tendency in chronie disease incidence. Biometrika, 65, 141-151.

[17] Conway, D. (1979). Multivariate distributions with specified marginals. Technical Report No. 145, Department of Statistics, Stanford University, Stanford, California.

[18] Cook, R. D. (1977). Detection of influential observation in linear regression. Technome-

trics 19, 15-18.

[19] Cook, R. D. (1986). Assessment of local influence. Journal of the Royal Statistical Society, B, 48, 133-169.

[20] Cook, R. D., Weisberg, S. (1982). Residuals and Influence in Regression. Chapman and Hall. London.

[21] Cordeiro, G. M., Paula, G. A. (1992). Estimation, large-sample parametric tests and diagnostics for non-exponential family nonlinear models. Communications in Statistics:

Simulation and Computation, 21, 149-172.

[22] Davison, A. C., Tsai, C. L. (1992). Regression model diagnostics. International Statistical

Review, 60, 337-353.

[23] Devroye, L. (1986). Non-Uniform Random Variate Generation. Springer, New York. [24] Díaz-García, J. A., Galea, M., Leiva, V. (2003). Influence diagnostics for elliptical mul-

tivariate linear regression models. Communications in Statistics: Theory and Methods, 32, 625-641.

[25] Dy, Jennifer G. (2004). Feature selection for unsupervised learning. Journal of Machine

Learning Research, 5, 845–889.

[26] Durling, F. C. (1974). Bivariate normit, logit, and Burrit analysis. Research Report No. 24, Department of Mathematics, University of Waikato, Hamilton, New Zealand. [27] Engelhardt, M., Bain, L. J., Wright, F. T. (1981). Inferences on the parameters of the

Birnbaum- Saunders fatigue life distribution based on maximum likelihood estimation.

Technometrics, 23, 251-255.

[28] Farlie, D. G. J. (1960). The performance of some correlation coefficients for a general Bivariate distribution, Biometrika, 47, 307–323.

[29] Fisher, R. A. (1936). The use of multiple measurements in taxonomic problems. Annals

[30] Frank, M. J. (1979). On the simultaneous associativity of 𝐹 (𝑥, 𝑦) and 𝑥 + 𝑦 − 𝐹 (𝑥, 𝑦).

Aequations Mathemacicae, 19, 194-226.

[31] Galea, M., Paula, G. A., Bolfarine, H. (1997). Local influence in elliptical regression models. The Statistician, 46, 1, 71 - 79.

[32] Galea, M., Riquelme, M., Paula, G. A. (2000). Diagnostics methods in elliptical linear regression models. Brazilian Journal of Probability and Statistics, 14, 167-184.

[33] Galea, M., Leiva, V., Paula G. A. (2004). Influence diagnostics in log-Birnbaum-Saunders regression models. Journal of Applied Statistics, 31, 1049-1064.

[34] Genest, C., MacKay, R. J. (1986). Copules archim´ediennes et familles de lois bidimen- sionnelles dont les marges sont donn´ees. Canadian Journal of Statistics, 14, 145–159. [35] Guiraud, P., Leiva, V., Fierro, R. (2009). A non-central version of the birnbaum-saunders

distribution for reliability analysis. IEEE Transactions on Reliability, 58, 152–160. [36] Gumbel, E. J. (1958). Statistics of Extremes. Columbia University Press, New York. [37] Gumbel, E.J. (1960). Bivariate exponential distributions. Journal of the American Sta-

tistical Association, 55, 698–707.

[38] Huang, J. S., Kotz, S. (1999). Modifications of the Farlie–Gumbel–Morgenstern distri- butions: A tough hill to climb. Metrika, 49, 307–323.

[39] Hofert, M., Kojadinovic, I., Maechler, M., Yan, J. (2015). copula: Multivariate Depen- dence with Copulas. R package version 0.999-16.

[40] Johnson, N. L. (1949). Systems of frequency curves generated by methods of translation.

Biometrika, 36, 149–176.

[41] Johnson M. E. (1987). Multivariate Statistical Simulation. Wiley, New York.

[42] Johnson, N. L., Kotz, S., Balakrishnan, N. (1994). Continuous Univariate Distributions, Vol. 1, Second Edition. John Wiley and Sons, New York.

[43] Johnson, N. L., Kotz, S., Balakrishnan, N. (1995). Continuous Univariate Distributions, Vol. 2, Second Edition. John Wiley and Sons, New York.

[44] Johnson, N. L., Kotz, S., Balakrishnan, N. (1997). Discrete Multivariate Distributions. John Wiley and Sons, New York.

[45] Johnson, R., Wichern, D. (1998). Applied Multivariate Statistical Analysis. Pearson, US. [46] Kim, M. G. (1998). Local influence on a test of linear hypothesis in multiple regression

model. Journal of Applied Statistics, 25, 145-152.

[47] Korkmaz, S., Goksuluk, D., Zararsiz, G. (2014). MVN: an R package for assessing mul- tivariate normality. R Journal, 6(2), 151–162.

[48] Kotz, S., Balakrishnan, N., Johnson, N. L. (2000). Continuous Multivariate Distributi-

[49] Kundu, D., K., N., Balakrishnan, N. (2008). On the hazard function of birn- baum–saunders distribution and associated inference. Computational Statistics and Data

Analysis, 52, 2692–2702.

[50] Kundu, D., Balakrishnan, N., Jamalizadeh, A. (2010). Bivariate birnbaum saunders distribution and associated inference. Journal of Multivariate Analysis, 101, 113–125. [51] Kundu, D., Balakrishnan, N., Jamalizadeh, A. (2013). Generalized multivariate Birn-

baum–Saunders distributions and related inferential issues. Journal of Multivariate

Analysis, 116, 230-244.

[52] Kundu, D. (2015). Bivariate sinh-normal distribution and a related model. Brazilian

Journal of Probability and Statistics, 29, 590-607.

[53] Lai, C. D. (1978). Morgenstern’s bivariate distibution and its application to point pro- cess. Journal of Mathematical Analysis and Applications, 65, 247–256.

[54] Leiva, V., Barros, M., Paula, G., Galea, M. (2007). Influence diagnostics in log-birnbaum saunders regression models with censored data. Computational Statistics and Data

Analysis, 51, 5694–5707.

[55] Leiva, V., Barros, M., Paula, G., Sanhueza, A. (2008). Generalized birnbaum-saunders distributions applied to air pollutant concentration. Environmetrics, 19, 235–249. [56] Leiva, V., Sanhueza, A., Angulo, J. M. (2009). A length-biased version of the Birnbaum-

Saunders distribution with application in water quality. Stoch Environ Res Risk Assess, 23, 299-307.

[57] Leiva, V., Vilca, F., Balakrishnan, N., Sanhueza, A. (2010). A skewed Sinh-Normal distri- bution and its properties and application to air pollution. Communications in Statistics-

Theory and Methods, 39, 426-443.

[58] Lemonte, A. J., Cordeiro, G. M. (2009). Improved maximum likelihood estimation in Birnbaum-Saunders nonlinear regressions. Computational Statistics and Data Analysis, 53(12), 4441-4452.

[59] Lesaffre, E., Verbeke G. (1998). Local influence in linear mixed models. Biometrics, 54, 570 - 582.

[60] Loh, W. Y., Shih, Y. S. (1997). “SPLIT SELECTION METHODS FOR CLASSIFICA- TION TREES.” Statistica Sinica, 7, 815–840.

[61] Long, D., Krzysztofowicz, R. (1992). Farlie–Gumbel–Morgenstern bivariate densities: Are they applicable in hydrology? Stochastic Hydrology and Hydraulics, 6, 47–54. [62] Lu, M., Chang, D. S. (1997). Bootstrap prediction intervals for the Birnbaum-Saunders

distribution. Microelectron Reliability, 37, 1213-1216.

[63] Mann, N. R., Schafer, R. E., Singpurwalla, N. (1974). Methods for Statistical Analysis

[64] Moolgavkar, S., Lustbader, E., Venzon, D. (1984). A geometric approach to nonlinear regression diagnostic with application to matched case-control studies. Annals of Statis-

tics, 12, 816-826.

[65] Nelsen, R. B. (2006). An Introduction to Copulas. New York: Springer.

[66] Ng, H., Kundu, D., Balakrishnan, N. (2003). Modified moment estimation for the two- parameter birnbaum saunders distribution. Computational Statistics and Data Analysis, 43, 283–298.

[67] Paula, G. A. (1993). Assessing local influence in restricted regressions models. Compu- tational Statistics and Data Analysis, 16, 63 - 79.

[68] Paula, G. A. (2004). Modelos de Regressão com Apoio Computacional. Instituto de Matemática e Estatística-USP, São Paulo-SP, Brasil.

[69] Paula, G., Leiva, V., Barros, M., Liu, S. (2012). Robust statistical modeling using the birnbaum saunders-t distribution applied to insurance. Applied Stochastic Models in

Business and Industry, 28, 16–34.

[70] Paula, G. A., Peres, C. A. (1988). Diagnostics for GLMs with linear inequality parameter constraints. Communications in Statistics: Theory and Methods, 17, 4205-4219.

[71] Poon, W. Y., Poon, Y. S. (1999). Conformal normal curvature and assessment of local influence. Journal of the Royal Statistical Society B, 61, 51 - 61.

[72] Rieck, J. R. (1989). Statistical Analysis for the Birnbaum-Saunders Fatigue Life Dis- tribution. Unpublished Ph.D. thesis, Department of Mathematical Sciences, Clemson University, South Carolina, USA.

[73] Rieck, J. R., Nedelman, J. R. (1991). A log-linear model for the Birnbaum-Saunders distribution. Technometrics, 33, 51-60.

[74] Sánchez, L. M. B., Vilca, F. (2014) Modelos Birnbaum-Saunders bivariados. Dissertação de Mestrado. UNICAMP: Programa de Pós-Graduação em Estatística, SP.

[75] Saunders, S. C. (1974). A family of random variables closed under reciprocation. Journal

of the American Statistical Association, 69, 533-539.

[76] Schucany, W. R., Parr, W. C., Boyer, J. E. (1978). Correlation structure in Far- lie–Gumbel– Morgenstern distributions. Biometrika, 65, 650–653.

[77] Souza, F. A. M. D. (1999). Influência Local e Análise de Resíduos em Modelos de Re- gressão Von Mises. Tese de Doutorado. IME/USP, São Paulo.

[78] Teichmann, T. (1986). Joint probabilities of partially coupled events. Reliability Engi-

neering, 14, 133–148.

[79] Tung, A. K. H., Xu, X., Ooi, B. C. O. (2005). CURLER: Finding and Visualizing Nonlinear Correlated Clusters. SIGMOD Conference.

[80] Verbeke, G., Molenberghs, G. (2000). Linear Mixed Models for Longitudinal Data. Sprin- ger, New York.

[81] Vilca, F., Romeiro, R. G., Balakrishnan, N., (2016). A bivariate Birnbaum-Saunders regression model. Computational Statistics and Data Analysis, 97, 169-183.

[82] Wada, C. Y., Hotta, L. K. (2000). Restricted alternatives tests in a bivariate exponential model with covariates. Communications in Statistics - Theory and Methods, 29:1, 193- 210

[83] Xie, F. C., Wei, B. C. (2007). Diagnostics analysis for log-Birnbaum-Saunders regression

Documentos relacionados