• Nenhum resultado encontrado

Análise de resíduos em modelos de tempo de falha acelerado com efeito aleatório

N/A
N/A
Protected

Academic year: 2021

Share "Análise de resíduos em modelos de tempo de falha acelerado com efeito aleatório"

Copied!
51
0
0

Texto

(1)Universidade Federal do Rio Grande do Norte Centro de Ciˆencias Exata e da Terra Programa de P´os-Gradua¸ca˜o em Matem´atica Aplicada e Estat´ıstica. Elisˆ angela da Silva Rodrigues. An´ alise de Res´ıduos em Modelos de Tempo de Falha Acelerado com Efeito Aleat´ orio. Natal, Abril de 2013.

(2) Elisˆangela da Silva Rodrigues. An´ alise de Res´ıduos em Modelos de Tempo de Falha Acelerado com Efeito Aleat´ orio. Trabalho apresentado ao Programa de P´os-Gradua¸c˜ao em Matem´atica Aplicada e Estat´ıstica da Universidade Federal do Rio Grande do Norte, em cumprimento com as exigˆencias legais para obten¸ca˜o do t´ıtulo de Mestre. ´ Area de Concentra¸ca˜o: Estat´ıstica. Orientadora:. Prof . Dr . Dione Maria Valen¸ca a. a. Co-orientador:. Prof. Dr. Julio da Motta Singer. Natal, Abril de 2013. Probabilidade e.

(3) Catalogação da Publicação na Fonte. UFRN / SISBI / Biblioteca Setorial Centro de Ciências Exatas e da Terra – CCET. .   . Rodrigues, Elisângela da Silva. Análise de resíduos em modelos de tempo de falha acelerado com efeito aleatório / Elisângela da Silva Rodrigues. -- Natal, 2013. 71 f. il.: Orientadora: Profa. Dra. Dione Maria Valença. Co-orientador: Prof. Dr. Julio da Motta Singer. Dissertação (Mestrado) – Universidade Federal do Rio Grande do Norte. Centro de Ciências Exatas e da Terra. Programa de Pós-Graduação em Matemática Aplicada e Estatística. 1. Análise de sobrevivência – Dissertação. 2. Modelo de tempo de falha acelerado – Dissertação. 3. Imputação – Dissertação. 4. Dados correlacionados – Dissertação. 5. Análise de resíduos – Dissertação. I. Valença, Dione Maria. II. Singer, Julio da Motta. III.Título. RN/UF/BSE-CCET. CDU: 519.24:61.

(4)

(5) Dedicat´ oria Aos meus pais L´ ucia de F. da S. Rodrigues e Luiz Rodrigues da Silva pela forma¸ca˜o de car´ater que eles me proporcionaram, pois sem eles n˜ao teria alcan¸cado meus objetivos pessoais e profissionais. Aos meus irm˜aos Eriverton e Elidiana, pela for¸ca, apoio e incentivo. Aos meus sobrinhos, Thawan Lucas, Leonardo e Kevin, como forma de incentivo ao longo da vida. Ao meu noivo Josemir R. de Almeida, pelo companheirismo e paciˆencia de estar ao meu lado todos esses anos. Aos meus av´os paternos, in memoriam, Jo˜ao Rodrigues da Silva e Regina Barbosa do Carmo. Aos meus av´os maternos Francisco Rodrigues da Silva (in memoriam) e Maria Barbosa Filha. Aos meus padrinhos Ma de Lourdes e Josaf´a pelas ora¸c˜oes e o apoio durante est´a jornada. ` minha amiga e cunhada Mercicleide Ramos, pelas conversas de incentivo e conA fian¸ca a mim transmitidas.. i.

(6) Agradecimentos A Deus por me conceder sa´ ude, coragem, perseveran¸ca e est´ımulo para desenvolver este trabalho. Aos meus pais, irm˜aos e sobrinhos, pelo amor, apoio e compreens˜ao a mim dedicados durante essa jornada de estudo e trabalho. Ao meu noivo, pelo companheirismo, paciˆencia, dedica¸c˜ao e contribui¸c˜ao em mais uma conquista juntos. ` professora Dione Maria Valen¸ca, pelos seus ensinamentos, orienta¸ca˜o, dedica¸c˜ao e A principalmente, por ter confiado e acreditado em mim para a realiza¸c˜ao deste trabalho. Ao professor Julio da Motta Singer, pela co-orienta¸ca˜o e contribui¸ca˜o significativa para o desenvolvimento deste trabalho. ` banca examinadora pelo aceite do convite em avaliar este trabalho de disserta¸c˜ao, A bem como pelas sugest˜oes e cr´ıticas que ser˜ao de grande valia para o aperfei¸coamento do mesmo. Aos professores do PPGMAE, especialmente aos professores, Bernardo, Carla, D´ebora, e Nir pelos seus ensinamentos e os professores Pledson e Andr´e Pinho pelo incentivo. A todos os colegas do PPGMAE, n˜ao s´o da minha turma (Alex, Aldemir, Ivanildo, Josemir, Jucimeire, M´arcio e Rafaela), mas tamb´em das turmas anteriores e das turmas atuais. Em fim, a todos que, de forma direta ou indireta torcem pelo meu sucesso profissional. ` Capes pelo apoio financeiro concedido durante todo o per´ıodo do curso. A.

(7) ”Os ensinamentos das pessoas s´abias s˜ao uma fonte de vida.” Prov´erbios 13.14.

(8) Resumo. Apresentamos t´ecnicas de an´alise de res´ıduos para avaliar o ajuste de dados de sobrevivˆencia correlacionados por meio de Modelos de Tempo de Falha Acelerado (MTFA) com efeitos aleat´orios. Propomos um procedimento de imputa¸ca˜o para as informa¸co˜es censuradas e consideramos trˆes tipos de res´ıduos para avaliar diferentes caracter´ısticas do modelo. Ilustramos as propostas com a an´alise do ajuste de um MTFA com efeito aleat´orio a um conjunto de dados reais envolvendo tempos entre falhas de equipamentos de po¸cos de petr´oleo.. Palavras-chave: Modelo de tempo de falha acelerado; Dados correlacionados; Imputa¸ca˜o de dados; An´alise de res´ıduos.. iv.

(9) Abstract. We present residual analysis techniques to assess the fit of correlated survival data by Accelerated Failure Time Models (AFTM) with random effects. We propose an imputation procedure for censored observations and consider three types of residuals to evaluate different model characteristics. We illustrate the proposal with the analysis of AFTM with random effects to a real data set involving times between failures of oil well equipment.. Keywords: Accelerated failure time Model; Correlated data; Imputation; Residuals analysis.. v.

(10) Sum´ ario 1 Introdu¸ c˜ ao. 1. 2 An´ alise de Sobrevivˆ encia 2.1 Conceitos Fundamentais . . . . . . . . . 2.2 Modelos de Regress˜ao . . . . . . . . . . . 2.2.1 MTFA para Dados Independentes 2.2.2 Dados Correlacionados . . . . . .. . . . .. 4 4 7 8 9. 3 Estima¸ c˜ ao, Predi¸ c˜ ao e Diagn´ ostico em Modelos Mistos 3.1 Modelo Linear Misto . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 Estima¸c˜ao e Predi¸ca˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3 An´alise de Res´ıduos para Modelos Mistos . . . . . . . . . . . . . . . . .. 10 10 11 14. 4 Modelo de Tempo de Falha Acelerado Weibull com Efeitos Aleat´ orios 4.1 Especifica¸c˜ao do Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Acomoda¸ca˜o de Observa¸c˜oes Censuradas . . . . . . . . . . . . . . . . . 4.2.1 Imputa¸ca˜o dos Dados Censurados . . . . . . . . . . . . . . . . . 4.3 Simula¸c˜ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 16 16 17 18 21. 5 Aplica¸ c˜ ao 5.1 Especifica¸c˜ao do Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2 An´alise de Res´ıduos para o Modelo Ajustado . . . . . . . . . . . . . . .. 30 30 31. 6 Considera¸ co ˜es finais 6.1 Conclus˜oes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2 Pesquisas Futuras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 36 36 37. A Esperan¸ ca condicional da distribui¸c˜ ao Weibull com covari´ aveis. 38. B Aspectos Computacionais. 41 vi. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . .. . . . ..

(11) Cap´ıtulo 1 Introdu¸c˜ ao A extra¸c˜ao de flu´ıdos em po¸cos de petr´oleo pode ocorrer de forma natural, por meio de po¸cos surgentes, ou artificial, utilizando m´etodos de eleva¸c˜ao como Bombeio Mecˆanico (BM) ou Bombeio por Cavidades Progressivas [ver Thomas (2001), por exemplo]. No Brasil, essas t´ecnicas s˜ao as mais empregadas na extra¸c˜ao desse tipo de o´leo e s˜ao exploradas pela Petrobras na Unidade de Neg´ocio de Explora¸ca˜o e Produ¸ca˜o do Rio Grande do Norte e Cear´a (Bacia Potiguar). Nesse contexto, consideramos um estudo retrospectivo sobre tempos entre falhas em equipamentos de sub-superf´ıcie de uma amostra de po¸cos de petr´oleo, no per´ıodo de 2000 a 2006. O principal interesse do estudo ´e identificar po¸cos que necessitem manuten¸c˜ao preventiva com base em suas caracter´ısticas (produ¸ca˜o, m´etodo de eleva¸c˜ao, profundidade da bomba, idade do po¸co, regi˜ao, etc.). Neste estudo foram registradas diversos tempos entre falhas para cada unidade amostral (po¸co-coluna). Por essa raz˜ao, espera-se uma dependˆencia entre as observa¸c˜oes referentes ao mesmo po¸co. Devido a` presen¸ca de censura nos dados, t´ecnicas usuais de an´alise de regress˜ao linear e modelos lineares mistos n˜ao podem ser utilizadas, sendo necess´ario o uso de t´ecnicas de An´alise de Sobrevivˆencia. Uma das causas de censuras ´e o fato de alguns po¸cos terem sido desativados durante o per´ıodo de estudo e por isso deixaram de ser acompanhados. Uma segunda causa ´e pelo fato de, ap´os uma manuten¸ca˜o preventiva, alguns po¸cos n˜ao voltaram a falhar at´e ao final do estudo. Alguns autores estudaram esses dados utilizando a modelagem estat´ıstica adequada para os tempos de funcionamento dos po¸cos at´e a ocorrˆencia das falhas [ver Dantas et al. (2010), Santos e Valen¸ca (2012) e Carvalho et al. (2012)]. Em particular, o Modelo de Tempo de Falha Acelerado (MTFA) com efeitos aleat´orios foi utilizado para identificar fatores que podem ser utilizados para prever o risco de falha dos po¸cos. Assim como nos modelos estat´ısticos usuais, as suposi¸c˜oes do modelo ajustado pre1.

(12) 2 cisam ser verificadas para que os resultados obtidos sejam v´alidos. Para isso, pode-se utilizar t´ecnicas de diagn´ostico, como an´alise de res´ıduos. No entanto, a an´alise de res´ıduos em modelos de tempo de falha acelerado com efeitos aleat´orios na presen¸ca de censura corresponde a uma abordagem ainda emergente na literatura. T´ecnicas gr´aficas s˜ao comumente utilizadas para verificar as suposi¸c˜oes do modelo, detectar outliers e poss´ıveis observa¸co˜es influentes. Em particular, res´ıduos podem ser utilizados com essa finalidade. Cox e Snell (1968) apresentam uma defini¸ca˜o geral para res´ıduos oriundos do ajuste de modelos com uma u ´nica fonte de varia¸ca˜o. V´arias propostas de medidas e testes para avaliar o ajuste de modelos de regress˜ao linear simples podem ser encontradas em Cook (1977) e Draper e Smith (1998). Paula (2012) apresenta um resumo de t´ecnicas de diagn´ostico utilizadas no caso de modelos lineares e modelos lineares generalizados. Nobre (2004) avalia m´etodos de diagn´ostico para modelos lineares mistos. No modelo linear misto, existe mais de uma fonte de varia¸ca˜o, e consequentemente mais de um tipo de res´ıduo; portanto, a defini¸c˜ao geral de res´ıduo n˜ao pode ser utilizada. Autores como Hilden-Minton (1995), Verbeke e Lesaffre (1996a) ou Pinheiro e Bates (2000), por exemplo, estendem tais ideias para definir trˆes tipos de res´ıduos que acomodam essa fonte adicional de variabilidade. Um resumo destes resultados pode ser encontrado em Nobre e Singer (2007). Singer et al. (2013) revisam alguns resultados sobre a an´alise de dados longitudinais ou mais geralmente de dados com medidas repetidas por meio de modelos lineares mistos e discutem tamb´em diferentes m´etodos de diagn´ostico, incluindo res´ıduos, influˆencia local e global. Diversos tipos de res´ıduos tˆem sido propostos na literatura para avaliar o ajuste dos modelos de an´alise de sobrevivˆencia param´etricos e semi-param´etricos (Regress˜ao de Cox). Para detalhes, veja por exemplo, Lawless (2003) e Collett (1994). O objetivo principal deste trabalho ´e propor t´ecnicas de an´alise de res´ıduos para avaliar o ajuste de MTFA com efeitos aleat´orios em dados de sobrevivˆencia correlacionados com censura aleat´oria, visando sua utiliza¸c˜ao pr´atica. Outro objetivo ´e aplicar as propostas de ajuste e de an´alise de res´ıduos a um conjunto de dados reais envolvendo tempos entre falhas de equipamentos de subsuperf´ıcie de po¸cos de petr´oleo. No Cap´ıtulo 2 apresentamos conceitos b´asicos de an´alise de sobrevivˆencia e modelos de regress˜ao para dados censurados. No Cap´ıtulo 3 descrevemos m´etodos utilizados na estima¸ca˜o, predi¸ca˜o e an´alise de res´ıduos em modelos mistos. No Cap´ıtulo 4 s˜ao discutidos os m´etodos apresentados no Cap´ıtulo 3 para avaliar MTFA com efeitos aleat´orios, bem como um procedimento para a imputa¸ca˜o das observa¸c˜oes censuradas. Uma aplica¸ca˜o a dados.

(13) 3 reais est´a apresentada no Cap´ıtulo 5. No Cap´ıtulo 6 est˜ao as conclus˜oes e poss´ıveis temas para pesquisas futuras..

(14) Cap´ıtulo 2 An´ alise de Sobrevivˆ encia A An´alise de Sobrevivˆencia tem como finalidade modelar o tempo at´e a ocorrˆencia de um determinado evento de interesse, chamado de tempo de vida, tempo de sobrevivˆencia ou tempo at´e a falha. Dados de sobrevivˆencia s˜ao comuns em diferentes a´reas do conhecimento, como, Sociologia, Economia, Biologia, Medicina, Engenharia, etc. Lawless (2003), Kalbfleisch e Prentice (2002) e Collett (1994) s˜ao excelentes fontes para detalhes.. 2.1. Conceitos Fundamentais. Seja T uma vari´avel aleat´oria cont´ınua e positiva com fun¸c˜ao de distribui¸c˜ao acumulada F . Na modelagem de dados de sobrevivˆencia existem duas fun¸c˜oes que est˜ao diretamente relacionadas com a distribui¸ca˜o de T , a fun¸ca˜o de sobrevivˆencia e a fun¸ca˜o de risco, sendo esta u ´ltima tamb´em conhecida como taxa de falha. A fun¸ca˜o de sobrevivˆencia representa a probabilidade de uma unidade de um item ou indiv´ıduo sobreviver a um determinado tempo t e pode ser representada por: S(t) = P (T > t) =. Z. ∞. f (t)d(t) = 1 − F (t), t > 0. t. S(t) ´e uma fun¸ca˜o mon´otona decrescente e cont´ınua com S(0) = 1 e S(∞) = limt→∞ S(t) = 0. Em alguns contextos envolvendo sistemas ou vida u ´til de itens fabricados, S(t) ´e denominada de fun¸c˜ao de confiabilidade. A fun¸ca˜o de risco especifica a taxa instantˆanea de falha no tempo t condicionada ao conhecimento de que o item n˜ao falhou antes do instante t, ou seja P (t < T ≤ t + ∆t|T > t) . ∆t→0 ∆t. h(t) = lim. 4.

(15) 2.1 Conceitos Fundamentais. 5. Se esta fun¸ca˜o for crescente, constante ou decrescente interpretemos respectivamente que a taxa de falha aumenta com o tempo (mostrando um efeito gradual do envelhecimento), n˜ao se altera com o passar do tempo ou diminui a` medida que o tempo passa, (Colosimo e Giolo, 2006). Outra fun¸ca˜o importante em an´alise de sobrevivˆencia ´e a fun¸c˜ao de risco acumulada dada por: H(t) =. Z. t. h(u)d(u). 0. Existem algumas rela¸co˜es matem´aticas importantes entre as fun¸co˜es definidas anteriormente, dadas a seguir: h(t) =. H(t) =. f (t) d = − (log S(t)), S(T ) dt. Z. t. h(u)d(u) = − log S(t), 0. S(t) = exp{−H(t)} = exp{−. Z. t. h(u)d(u)}. 0. A esperan¸ca condicional de uma vari´avel aleat´oria T pode ser expressa em termos da fun¸c˜ao de sobrevivˆencia. Para isso consideramos inicialmente a fun¸c˜ao de distribui¸ca˜o condicional expressa como: P (c < T ≤ t) = P (T ≤ t|T > c) = P (T > c). Rt c. f (u)du , S(c). t > c.. (2.1). Derivando (2.1) em rela¸ca˜o a u, obtˆem-se a densidade condicional de T dado T > c como: f (t|T > c) =. f (t) , S(c). t > c.. (2.2). A correspondente esperan¸ca condicional de T dado T > c ´e: E(T |T > c) =. Z. ∞. tf (t|T > c)dt = c. R∞ c. tf (t)dt . S(c). (2.3). Existe na literatura uma s´erie de modelos probabil´ısticos utilizados para a modelagem de dados de sobrevivˆencia. Algumas distribui¸co˜es ocupam uma posi¸ca˜o central por causa de sua utilidade em muitos problemas pr´aticos. A distribui¸ca˜o Weibull, por exemplo, ´e bastante utilizada, pois apresenta uma grande variedade de formas..

(16) 2.1 Conceitos Fundamentais. 6. Sua taxa de falha pode ser decrescente, constante ou crescente conforme o parˆametro de forma, o que faz com que se torne bastante u ´til para modelar tempos de falha de equipamentos (Ho e Silva, 2005). Nesse contexto, apresentamos suas principais caracter´ısticas. Um modelo probabil´ıstico Weibull, aqui denotado T ∼ W eibull(α, γ), com α > 0 e γ > 0, apresenta fun¸ca˜o densidade, fun¸ca˜o de sobrevivˆencia e fun¸c˜ao de risco dadas, respectivamente, por: γ f (t) = α.  γ−1   γ  t t I(0,∞) (t), exp − α α.   γ  t S(t) = exp − I(0,∞) (t), α γ h(t) = α.  γ−1 t I(0,∞) (t). α. A fun¸ca˜o de risco ´e mon´otona crescente se γ > 1, decrescente se γ < 1 e constante se γ = 1. A distribui¸ca˜o exponencial ´e um caso particular da distribui¸ca˜o Weibull quando γ = 1. A m´edia e a variˆancia da distribui¸c˜ao Weibull s˜ao, respectivamente, E(T ) = αΓ[1 + (1/γ)] e   V ar(T ) = α2 Γ[1 + (2/γ)] − Γ[1 + (1/γ)]2 .. Uma distribui¸ca˜o diretamente relacionada com a distribui¸c˜ao Weibull ´e a distribui¸ca˜o Valor Extremo, tamb´em conhecida como distribui¸ca˜o Gumbel (Colosimo e Giolo, 2006). As respectivas fun¸co˜es densidade, de sobrevivˆencia e de risco de uma vari´avel aleat´oria Y com distribui¸c˜ao Valor Extremo, denotada Y ∼ V E(µ, σ), em que Y e µ ∈ ℜ e σ > 0 s˜ao, respectivamente, 1 f (y) = exp σ. . y−µ σ . . S(y) = exp − exp 1 h(y) = exp σ. . − exp . . y−µ σ. y−µ σ. . y−µ σ. . . I(−∞,∞) (y),. I(−∞,∞) (y),. I(−∞,∞) (y)..

(17) 2.2 Modelos de Regress˜ao. 7. A m´edia e a variˆancia da distribui¸c˜ao de Y ∼ V E(µ, σ) s˜ao, respectivamente, E(Y ) = µ − υσ e V (Y ) = σ 2 π 2 /6, com υ = 0, 5772 (constante de Euler). Se µ = 0 e σ = 1 a distribui¸ca˜o de Y ´e chamada de distribui¸ca˜o Valor Extremo Padr˜ao. Al´em disso, pode se mostrar que se T ∼ W eibull(α, γ) ent˜ao Y = log T ∼ V E(µ, σ), com µ = ln α e σ = γ −1 . Em geral, dados de sobrevivˆencia envolvem a presen¸ca de censura. A ocorrˆencia de uma censura pode informar que o tempo at´e a falha foi superior ao tempo observado no estudo (censura a` direita), o tempo registrado ´e maior que o tempo de falha (censura a` esquerda) ou que o tempo de falha ocorreu em um certo intervalo de tempo (censura intervalar). Dados censurados n˜ao devem ser descartados, pois, mesmo contendo observa¸c˜oes incompletas, as censuras carregam informa¸ca˜o sobre o tempo de vida da unidade amostral considerada. Desconsiderar as censuras na an´alise pode conduzir a conclus˜oes enviesadas (Colosimo e Giolo, 2006). Observa¸co˜es incompletas ocorrem por diversas raz˜oes. A perda de acompanhamento de um paciente no decorrer de um estudo cl´ınico, a n˜ao ocorrˆencia do evento de interesse at´e o final de um experimento ou a morte de um indiv´ıduo devido a uma causa diferente da estudada s˜ao exemplos bastante comuns. As diferentes causas de dados censurados podem ser utilizadas para a proposta de diferentes mecanismos de censura [ver Lawless (2003), por exemplo]. Consideramos em nosso estudo apenas censuras que podem ser representadas por vari´aveis aleat´orias independentes do tempo de vida. Quando a distribui¸ca˜o da censura n˜ao depende de parˆametros de interesse, ela ´e denominada censura n˜ao informativa.. 2.2. Modelos de Regress˜ ao. Modelos de regress˜ao tˆem sido cada vez mais utilizados para an´alise de sobrevivˆencia devido a existˆencia, na pr´atica, de covari´aveis relacionadas aos tempos de falha. Em nosso exemplo, o tempo at´e a ocorrˆencia de falha dos po¸cos-colunas podem depender da profundidade da bomba ou do m´etodo de eleva¸ca˜o. Essas covari´aveis podem explicar parte da heterogeneidade dos tempos de falhas. Em an´alise de sobrevivˆencia existem duas classes importantes de modelos de regress˜ao propostas na literatura: os modelos semi-param´etricos e os param´etricos. Os modelos semi-param´etricos especificam a dependˆencia entre a fun¸ca˜o risco h(t) e as vari´aveis explicativas (x) parametricamente, mas deixam a distribui¸ca˜o real arbitr´aria (Lawless, 2003). O modelo de regress˜ao semi-param´etrico mais conhecido ´e o modelo de riscos proporcionais introduzido por Cox (1972a). Para detalhes e aplica¸c˜oes, veja por exemplo, [Hosmer e Lemeshow (1999), Allison (2010) e Klein e Moeschberger.

(18) 2.2 Modelos de Regress˜ao. 8. (2003)]. Neste trabalho abordamos apenas os modelos de regress˜ao param´etricos que s˜ao considerados mais eficientes, por´em menos flex´ıveis.. 2.2.1. MTFA para Dados Independentes. Quando os dados s˜ao independentes, uma classe de modelos bastante utilizada ´e a de Modelos de Tempo de Falha Acelerado, tamb´em conhecidos como modelos de posi¸ca˜o-escala. Para detalhes ver, por exemplo, Collett (1994), Klein e Moeschberger (2003) e Kalbfleisch e Prentice (2002). Sendo x = (1, x1 , . . . , xp )⊤ um vetor de covari´aveis, consideremos o modelo, log(T ) = µ(x) + σǫ, em que log(T ) se caracteriza por ter parˆametro de posi¸ca˜o µ(x), dependendo do vetor de covari´aveis x e um parˆametro de escala, σ > 0, associado a um erro aleat´orio ǫ cuja distribui¸ca˜o n˜ao depende de x e determina a forma da distribui¸c˜ao de log(T ). As distribui¸c˜oes que pertencem a essa classe de modelos tˆem fun¸c˜ao densidade de probabilidade e fun¸c˜ao de sobrevivˆencia dadas, respectivamente, por: 1 f (y; µ, σ) = g σ S(y; µ, σ) = g. . . y − µ(x) σ. y − µ(x) σ. . . , I(−∞,∞) (y),. , I(−∞,∞) (y).. Em geral, consideramos µ(x) = x⊤ β, em que β = (β0 , · · · , βp )⊤ ´e o vetor de parˆametros desconhecidos. O MTFA resultante ´e expresso na forma: log(T ) = x⊤ β + σǫ.. (2.4). ´ importante observar que esse modelo ´e log-linear relativamente a T , tendo como E caracter´ıstica um efeito multiplicativo do vetor de covari´aveis x expresso na forma T = exp(µ(x)) exp(σǫ), na sua escala original, o que justifica o termo acelerado na sua denomina¸c˜ao. A interpreta¸c˜ao desse fato ´e que as covari´aveis agem no sentido de acelerar ou desacelerar o tempo de falha. Um importante representante dessa classe de modelos ´e o modelo de regress˜ao Weibull, obtido quando supomos uma distribui¸ca˜o Valor Extremo Padr˜ao para ǫ. Nesse caso, log(T ) tem distribui¸ca˜o Valor Extremo e, consequentemente, T tem distribui¸c˜ao Weibull. As rela¸c˜oes entre os parˆametros dessas distribui¸c˜oes s˜ao α(x) = exp(µ(x)) = exp(x⊤ β) e σ = γ −1 ..

(19) 2.2 Modelos de Regress˜ao. 9. Para levar em conta o mecanismo de censura aleat´oria consideramos Ti e Ci vari´aveis independentes representando os tempos at´e a falha e at´e a censura da i-´esima unidade amostral, respectivamente. O que se observa para uma unidade amostral em estudo ´e, portanto, Ti∗ = min(Ti , Ci ). Definamos tamb´em δi = I(Ti ≤ Ci ), onde I representa a fun¸ca˜o indicadora e seja xi o vetor de covari´aveis para a i-´esima unidade amostral. Uma amostra aleat´oria de tamanho n ´e representada por (Ti∗ , δi , xi ), para i = 1, · · · , n. Lawless (2003) apresenta mais detalhes sobre essa classe de modelos.. 2.2.2. Dados Correlacionados. Trabalhos sobre a an´alise de dados de sobrevivˆencia correlacionados tˆem surgido com bastante frequˆencia na literatura. Hourgaard (2000) apresenta uma ampla discuss˜ao sobre dados multivariados considerando dependˆencia nos casos em que as unidades amostrais em estudo fazem parte de um mesmo tipo de agrupamento (natural ou artificial) ou quando o tempo de falha ´e observado mais de uma vez para a mesma unidade amostral (eventos recorrentes ou medidas repetidas). A an´alise de dados correlacionados est´a vinculada a` modelagem da estrutura de correla¸c˜ao intraunidades amostrais. Com essa finalidade, v´arios autores prop˜oem modelos que incluem um efeito aleat´orio para acomodar essa correla¸ca˜o. A inclus˜ao de um efeito aleat´orio ao modelo (2.4) ´e estudada e avaliada do ponto de vista te´orico e computacional em Bolfarine e Valen¸ca (2005), Lambert et al. (2004), Santos (2009), Carvalho (2010), Rondeau et al. (2012), por exemplo. No cap´ıtulo seguinte, faremos uma breve descri¸ca˜o de alguns m´etodos de estima¸c˜ao dos parˆametros e da predi¸ca˜o dos efeitos aleat´orios em modelos mistos, assim como, um m´etodo de diagn´ostico para avaliar as suposi¸co˜es associadas..

(20) Cap´ıtulo 3 Estima¸c˜ ao, Predi¸c˜ ao e Diagn´ ostico em Modelos Mistos 3.1. Modelo Linear Misto. O modelo linear misto pode ser expresso como: Y i = X i β + Z i b i + ei ,. (3.1). em que Y i representa um vetor (ni × 1) de respostas da i-´esima unidade amostral, i = 1, 2, ..., k, X i ´e uma matriz (ni ×p) de especifica¸ca˜o (conhecida e de posto completo) dos efeitos fixos, β = (β0 , · · · , βp−1 )⊤ ´e um vetor com dimens˜ao (p × 1) de parˆametros (efeitos fixos) desconhecidos, Z i ´e uma matriz (ni × q) de especifica¸ca˜o (conhecida e de posto completo) dos efeitos aleat´orios, bi ´e um vetor (q × 1) de vari´aveis latentes n˜ao correlacionadas, comumente denominadas efeitos aleat´orios, com m´edias zero e variˆancias iguais (σb2 ), que refletem o comportamento individual da i-´esima unidade amostral, ei ´e um vetor (ni × 1) de erros aleat´orios independentes, com m´edias zero, variˆancias iguais (σe2 ) e n˜ao correlacionados com os bi . O modelo (3.1) pode ser representado, considerando um u ´nico efeito aleat´orio, para q = 1, por: Y i = X i β + Z i bi + e i ,. (3.2). em que Z i = 1ni e bi um escalar. Em (3.2), os efeitos fixos (β) s˜ao usados para modelar o valor esperado da vari´avel resposta enquanto que os efeitos aleat´orios (bi ) s˜ao utilizados para modelar sua estrutura de covariˆancias, em que a V ar(Yij ) = σb2 + σe2 , sendo σb2 e σe2 conhecidas como 10.

(21) 3.2 Estima¸ca˜o e Predi¸ca˜o. 11. componentes de variˆancias. Este modelo tem como pressuposto a independˆencia condicional entre as observa¸co˜es da i-´esima unidade amostral dado o efeito aleat´orio bi ; ´e chamado de modelo de independˆencia condicional homoced´astico e pode ser reescrito na forma matricial como: Y = Xβ + Zb + e,. (3.3). ⊤ ⊤ em que Y = (Y ⊤ ´e um vetor (n × 1) com Yi = (Yi1 , . . . , Yini )⊤ e n = 1 ,...,Y k ) Pk ⊤ ⊤ ⊤ i=1 ni contendo as respostas das k unidades amostrais. X = (X 1 , . . . , X k ) com Xi = (xi1 , . . . , xini )⊤ ´e uma matriz (n × p) de covari´aveis, Z = ⊕ki=1 1ni uma matriz (n×k) de especifica¸ca˜o dos efeitos aleat´orios, em que 1ni , i = 1, . . . , k, denota um vetor (ni × 1) com todos os elementos iguais a 1, b = (b1 , b2 , . . . , bk )⊤ ´e um vetor (k × 1) n˜ao observ´avel de efeitos aleat´orios com E(b) = 0 e V ar(b) = σb2 Ik , em que Ik ´e a matriz identidade de ordem k, e e, um vetor (n × 1) de erros aleat´orios n˜ao correlacionado com b, com E(e) = 0, V ar(e) = σe2 In . Com base na defini¸ca˜o desse modelo, temos:. E(Y) = Xβ,. (3.4). V ar(Y) = V = σb2 ZZ⊤ + σe2 In , Cov(b, Y⊤ ) = C = σb2 Z⊤ . Mais detalhes sobre modelos lineares mistos podem ser encontrados em Searle et al. (1992) e Demidenko (2004), entre outros.. 3.2. Estima¸ c˜ ao e Predi¸ c˜ ao. Alguns m´etodos de estima¸ca˜o dos parˆametros do modelo encontram-se dispon´ıveis na literatura, dentre eles, podemos destacar, M´axima Verossimilhan¸ca (MV), M´axima Verossimilhan¸ca Restrita (MVR) e m´etodos Bayesianos [ver Robinson (1991) e Searle et al. (1992), por exemplo]. Os procedimentos mais utilizados para a obten¸c˜ao do estimador dos parˆametros de efeitos fixos e do preditor dos efeitos aleat´orios s˜ao o melhor estimador linear n˜ao enviesado - BLUE (Best Linear Unbiased Estimator ) e o melhor preditor linear n˜ao enviesado - BLUP (Best Linear Unbiased Predictor ). Os principais resultados envolvendo os estimadores e preditores BLUE e BLUP obtidos sob o modelo (3.3) ser˜ao apresentados a seguir, dada sua importˆancia para as t´ecnicas de diagn´ostico..

(22) 3.2 Estima¸ca˜o e Predi¸ca˜o. 12. O BLUE e o BLUP de β e b s˜ao denotados por βˆ e ˜ b e apresenta as seguintes propriedades: • βˆ e ˜ b s˜ao fun¸c˜oes lineares de Y; • βˆ e ˜ b s˜ao n˜ao enviesados para β e b, (E(βˆ − β) = 0 e E(˜ b − b) = 0). • βˆ e ˜ b s˜ao melhores, no sentido em que minimizam a variˆancia amostral dentro da classe dos estimadores e preditores lineares n˜ao enviesados. O BLUE para β e o BLUP para b podem ser estimados e preditos simultaneamente por meio das equa¸co˜es de Henderson, ". X ⊤ Σ−1 X X ⊤ Σ−1 Z Z ⊤ Σ−1 X Z ⊤ Σ−1 Z + D −1. #". βˆ ˜ b. #. =. ". X ⊤ Σ−1 Y Z ⊤ Σ−1 Y. #. ,. (3.5). com Σ = σe2 In e D = σb2 Ik . Podemos ainda simplificar essas equa¸co˜es, na seguinte forma: ". X ⊤X X ⊤Z Z ⊤ X Z ⊤ Z + σe2 /σb2 Ik. #". βˆ ˜ b. #. =. ". X ⊤Y Z ⊤Y. #. .. (3.6). Pode-se mostrar que, condicionado ao conhecimento de V e C, o BLUE para β e o BLUP para b s˜ao dados, respectivamente, por: ˆ = (X⊤ V −1 X)−1 X ⊤ V −1 Y β. ˜ = CV −1 (Y − X β). ˆ e b. (3.7). Para modelos lineares mistos, a obten¸ca˜o do BLUE e do BLUP, sob o enfoque cl´assico como bayesiano, propriedades e aplica¸co˜es podem ser obtidas em Henderson (1975), Robinson (1991) ou Doganaksoy e Balakrishnan (1997), por exemplo. Na pr´atica, os componentes de variˆancia σb2 e σe2 s˜ao desconhecidos. Logo, ´e razo´avel utilizar o EBLUE (melhor estimador linear n˜ao enviesado emp´ırico) e o EBLUP (melhor preditor linear n˜ ao enviesado emp´ırico), em que σb2 e σe2 s˜ao substitu´ıdos por estimativas, em (3.6). Jiang e Verbeke (1998) apresentam propriedades importantes de m´etodos de estima¸ca˜o e predi¸ca˜o considerando o EBLUE e o EBLUP. Com rela¸ca˜o a estima¸c˜ao dos componentes de variˆancia, existem v´arios m´etodos dispon´ıveis na literatura, dentre os quais podemos destacar: M´axima Verossimilhan¸ca (MV), M´axima Verossimilhan¸ca Restrita (MVR), o M´etodo da An´alise de Variˆancia, os M´etodos de Henderson, MINQUE (minimum norm quadratic unbiased estimator ) e MIVQUE (minimum variance quadratic unbiased estimator ). Para mais detalhes, ver, Searle et al. (1992), por exemplo..

(23) 3.2 Estima¸ca˜o e Predi¸ca˜o. 13. Considerando que a estima¸ca˜o dos componentes de variˆancia ´e um t´opico muito extenso e complexo faremos um breve levantamento do procedimento para a estima¸ca˜o dos componentes de variˆancias do modelo (3.3) por meio do MINQUE e MIVQUE. Rao (1971a) e Rao (1971b) descrevem m´etodos n˜ao param´etricos para estimar componentes de variˆancia como o MINQUE, que ´e derivado de modo que o estimador minimize a norma euclidiana da matriz n´ ucleo, que seja uma forma quadr´atica das observa¸c˜oes e que seja n˜ao enviesado e o MIVQUE, que tem a propriedade de ser n˜ao enviesado e de variˆancia m´ınima. O MINQUE de (σe2 , σb2 ) do modelo (3.3) ´e obtido por meio das express˜oes:. σe2 = (u0 − s10 σb2 )/s00 σb2 = (s00 u1 − s10 u0 )/(s00 s11 − s210 ). (3.8). em que s00 = SESQ(P0 ), s01 = s10 = SESQ(P0 Z), s11 = SESQ(Z ⊤ P0 Z), u0 = SESQ(P0 Y ) e u1 = SESQ(Z ⊤ P0 Y ), com SESQ representando a soma dos quadrados dos elementos das matrizes correspondentes e P0 = V0 −1 − V0 −1 X(X ⊤ V0 −1 X)−1 X ⊤ V0 −1 ,. (3.9). sendo V0 uma estimativa de V , expressa em (3.4). O processo de obten¸ca˜o do MINQUE inicia-se com uma estimativa de V 0 a priori; como exemplo, os componentes de variˆancias em V , obtendo V 0 . Em seguida adota-se um processo iterativo, que consiste em usar as estimativas MINQUE obtidas em cada itera¸c˜ao como valores a priori na etapa seguinte, at´e que a diferen¸ca entre duas solu¸c˜oes consecutivas seja menor que ǫ > 0, estipulado arbitrariamente. O valor obtido na convergˆencia ´e a solu¸c˜ao de 3.8 e ´e denominado de estimador quadr´atico n˜ao enviesado de norma m´ınima iterativo (I-MINQUE). Al´em disso, Brown (1976) mostra que sem suposi¸c˜ao de normalidade sobre a vari´avel resposta Y , as solu¸c˜oes I-MINQUE tˆem propriedades de normalidade para grandes amostras. Para mais detalhes, ver Searle et al. (1992), por exemplo..

(24) 3.3 An´alise de Res´ıduos para Modelos Mistos. 3.3. 14. An´ alise de Res´ıduos para Modelos Mistos. M´etodos de diagn´ostico compreendem t´ecnicas cujo objetivo ´e investigar a plausibilidade e robustez das suposi¸c˜oes do modelo adotado. Um dos m´etodos mais utilizados ´e a an´alise de res´ıduos que serve para avaliar as suposi¸co˜es sobre a distribui¸c˜ao dos erros e detectar a presen¸ca de observa¸co˜es discrepantes. Nesta se¸ca˜o apresentaremos algumas propostas baseadas nos tipos de res´ıduos considerados por Nobre e Singer (2007) para a avalia¸c˜ao de modelos lineares mistos. Sob o modelo (3.3) podem ser considerados trˆes tipos de res´ıduos, nomeadamente, res´ıduos marginais, condicionais e EBLUP. Res´ıduos marginais Os res´ıduos marginais, ξˆ = Y − Xβˆ s˜ao preditores dos erros marginais, ξ = Y − E(Y) = Y−Xβ = Zb+e. Este tipo de res´ıduos ´e empregado para avaliar a linearidade dos efeitos fixos e tamb´em para detectar observa¸co˜es discrepantes. Uma padroniza¸ca˜o dos res´ıduos ´e dada por: b −1/2 ξ, b ci (ξ)] ξb∗ = [V. (3.10). b ´e o i-´esimo bloco diagonal da matriz V(ξ) b = [Vb − X(X ⊤ Vb −1 X)−1 X ⊤ ] e ci (ξ) em que V Vb corresponde a` estimativa obtida a partir de (3.4) referente a`s observa¸co˜es da i-´esima unidade amostral. Com base na proposta de Lesaffre e Verbeke (1998), Singer et al. (2013) definem 2 b −1/2 ξbi , em que ξbi representa os res´ıduos b iR b⊤ b Vi = kIni − R i k , i = 1, . . . , k, com Ri = Vi marginais da i-´esima unidade amostral. Quando os termos Vi est˜ao pr´oximos de zero, a estrutura de covariˆancias dentro da unidade amostral ´e adequada e Vi pode ser utilizada como uma medida para identificar unidades para as quais a estrutura de covariˆancias P proposta ´e inadequada. Singer et al. (2013) sugerem que gr´aficos de Vi∗ = Vi / ni=1 Vi , em fun¸ca˜o dos ´ındices i das unidades amostrais sejam constru´ıdos para permitir a compara¸ca˜o entre os diferentes modelos. Res´ıduos condicionais ˜ s˜ao preditores dos erros condicionais, ˆ = Y − Xβˆ − Zb, Os res´ıduos condicionais, e e = Y−E(Y|b) = Y−Xβ−Zb e servem para avaliar a hip´otese de homoscedasticidade do erro condicional e verificar a existˆencia de observa¸co˜es discrepantes. Nobre e Singer (2007) sugerem o uso dos res´ıduos condicionais padronizados descritos a seguir:.

(25) 3.3 An´alise de Res´ıduos para Modelos Mistos. 15. p. (3.11). eˆ∗ij = eˆij /. pˆij ,. em que pˆij representa o ij-´esimo elemento da diagonal principal da matriz V(b e). −1 −1 −1 Como V(b e) = Σ[Vb − Vb X(X ⊤ Vb X)−1 X ⊤ Vb ]Σ = ΣQΣ, sendo Q = V−1 − V−1 X(X⊤ V−1 X)−1 X⊤ V−1 e Σ = σe2 In , Singer et al. (2013) sugerem uma padronizab i (b b i (b e) ´e diagonal em blocos da ¸ca˜o mais adequada dada por b e∗i = [V e)]−1/2 ebi , em que V b e) associada a i-´esima unidade amostral. matriz V(b Quando o interesse ´e verificar a suposi¸ca˜o de normalidade dos res´ıduos, a utiliza¸ca˜o dos res´ıduos condicionais n˜ao ´e aconselh´avel, pois ele ´e confundido com b; os mesmos autores sugerem a utiliza¸ca˜o dos res´ıduos com confundimento m´ınimo [ver HildenMinton (1995) e Singer et al. (2013)]. EBLUP ˜ preditores dos erros aleat´orios, Zb = E(Y|b) − E(Y) = Os efeitos aleat´orios Zb, (Y − Xβ − Zb) − (Y − Xβ) refletem a diferen¸ca entre o valor predito para i-´esima unidade observacional e o valor m´edio populacional. Nobre e Singer (2007) sugerem ˜ ⊤ {V[ ˜ i ]}−1 b ˜ i , i = 1, . . . , k, em bb usar um gr´afico da distˆancia de Mahalanobis, Mi = b i fun¸c˜ao dos ´ındices das unidades para detectar pontos discrepantes. Para permitir a compara¸ca˜o entre os diferentes modelos, esses autores sugerem P ainda o gr´afico de Mi∗ = Mi / ni=1 Mi em fun¸c˜ao dos ´ındices das unidades. Cada tipo de res´ıduos ´e u ´til para avaliar alguma pressuposi¸ca˜o do modelo (3.3) tal como resumido na Tabela 3.1, reproduzida de Singer et al. (2013). Tabela 3.1: Uso dos res´ıduos para diagn´ostico proposto. Diagn´ ostico para. Tipo de res´ıduo. Linearidade para efeitos fixos (E(y) = Xβ) Presen¸ca de observa¸c˜ oes discrepantes Matriz de covariˆ ancia intra-unidades amostrais (Vi ) Presen¸ca de observa¸c˜ oes discrepantes Homoscedasticidade dos erros condicionais (ei ) Distribui¸c˜ ao dos erros condicionais (ei ) Presen¸ca de unidades discrepantes Normalidade dos efeitos aleat´ orios (bi ). Marginal Marginal Marginal Condicional Condicional Condicional EBLUP EBLUP. Gr´ afico ∗ ξˆi vs valores ajustados ∗ ξˆi vs ´ındices de observa¸c˜oes Vi∗ vs ´ındices das unidades eˆ∗k vs ´ındices de observa¸c˜oes eˆ∗k vs valores ajustados QQ para os res´ıduos condicionais Mi∗ vs ´ındices das unidades χ2q QQ para Mi∗.

(26) Cap´ıtulo 4 Modelo de Tempo de Falha Acelerado Weibull com Efeitos Aleat´ orios 4.1. Especifica¸ c˜ ao do Modelo. Uma abordagem param´etrica para tratar dados de sobrevivˆencia correlacionados envolve um MTFA com efeitos aleat´orios, expressos como: ln Tij = bi + xij β + σǫij ,. (4.1). em que Tij representa o tempo at´e a j-´esima falha da i-´esima unidade amostral, i = 1, 2, ..., k, j = 1, 2, ..., ni , bi , s˜ao vari´aveis aleat´orias n˜ao observ´aveis independentes e identicamente distribu´ıdas (efeitos aleat´orios) com m´edia zero e variˆancia comum σb2 , xij ´e um vetor com dimens˜ao (1 × p) de covari´aveis, β um vetor (p × 1) de parˆametros fixos (desconhecidos), σ ´e um parˆametro de escala e ǫij s˜ao erros aleat´orios n˜ao observ´aveis independentes e identicamente distribu´ıdos com m´edia e variˆancia conhecidas. Al´em disso, assumimos que, i) Tij tem distribui¸ca˜o Weibull, ii) Cov(bi , ǫij ) = 0, iii) condicionalmente ao efeito aleat´orio bi , as respostas referentes `a i-´esima unidade amostral s˜ao independentes, iv) os efeitos aleat´orios bi s˜ao independentes dos tempos de censura. 16.

(27) 4.2 Acomoda¸c˜ao de Observa¸co˜es Censuradas. 17. Alguns m´etodos de estima¸ca˜o dos parˆametros do modelo (4.1) como, M´axima Verossimilhan¸ca Marginal [Lambert et al. (2004)], M´axima Verossimilhan¸ca Penalizada [Santos e Valen¸ca (2012), Kom´arek et al. (2007)], m´etodos Bayesianos [Kom´arek e Lesaffre (2004), Kom´arek et al. (2007), Kom´arek e Lesaffre (2009)], podem ser encontrados na literatura. Como consequˆencia de (ii) temos que ǫij ∼ V EP (0, 1) com V ar(ǫij ) = π 2 /6 Quando σb2 = 0, esse modelo se reduz ao modelo de tempo de falha acelerado usual [Bolfarine e Valen¸ca (2005)].. 4.2. Acomoda¸ c˜ ao de Observa¸ c˜ oes Censuradas. Na pr´atica, existe censura na amostra, e por isso, a vari´avel resposta ln Tij n˜ao ´e observada para todas as unidades amostrais. Na realidade, observa-se Yij = δij ln Tij + (1 − δij ) ln Cij ,. (4.2). sendo Cij o tempo at´e a j-´esima censura da i-´esima unidade amostral e δij = I(Tij ≤ Cij ) a fun¸ca˜o indicadora de falhas. Contudo, note que a utiliza¸c˜ao de Yij no modelo (4.1) subestima o verdadeiro tempo entre falhas quando δij = 0. Para contornar este problema de forma a permitir tratar este modelo como um modelo linear misto usual estendemos a proposta de Ageel (2002) que sugere imputar observa¸co˜es censuradas em um modelo de regress˜ao Weibull. A ideia ´e trocar Cij em (4.2) por um valor denotado por Tbij representando a estimativa de E(Tij |Tij > cij , bi , xij ), obtendo Yij∗ = δij ln Tij + (1 − δij ) ln Tbij. como vari´avel resposta, i = 1, 2, ..., k e j = 1, 2, ..., ni . Fazendo Y∗ = (Y1∗⊤ , . . . , Yk∗⊤ )⊤ , com Yi∗ = (Yi1∗ , . . . , Yin∗ i )⊤ , i = 1, . . . , k, representamos o MTFA com efeitos aleat´orios como um modelo linear misto, da forma Y∗ = Xβ + Zb + e,. (4.3). k ⊤ ⊤ ⊤ ⊤ em que X = (X⊤ 1 , . . . , Xk ) , Xi = (xi1 , xi2 , . . . , xini ) , Z = ⊕i=1 1ni , b = (b1 , . . . , bk ) , E(b) = 0, V ar(b) = σb2 Ik . Al´em disso, e = σ[ǫ − E(ǫ)] ´e um vetor n × 1 de erros aleat´orios n˜ao correlacionado com b, sendo ǫ um vetor n × 1, tendo como componentes P os erros aleat´orios ǫij do modelo (4.1), com n = ki=1 ni . Desta forma temos, E(e) = 0, 2 V ar(e) = σe2 In , sendo σe2 = σ 2 π6 . Carvalho (2010) apresenta dois enfoques na predi¸ca˜o dos efeitos aleat´orios para o.

(28) 4.2 Acomoda¸c˜ao de Observa¸co˜es Censuradas. 18. modelo (4.3), sendo o primeiro um enfoque bayesiano atrav´es do estimador de Bayes emp´ırico (EBE) e o segundo, o melhor preditor linear n˜ao enviesado emp´ırico (EBLUP). Consideramos neste trabalho o segundo enfoque, ou seja, a estima¸ca˜o dos parˆametros (β) e a predi¸ca˜o dos efeitos aleat´orios (b) dadas atrav´es das express˜oes (3.7), tendo em vista que desejamos propor aqui o uso de res´ıduos originalmente desenvolvidos para modelos lineares mistos, conforme descritos na Se¸c˜ao 3.3. A estima¸ca˜o dos componentes de variˆancia (σe2 , σb2 ) do modelo (4.3) ´e realizada por meio dos m´etodos MINQUE e IMINQUE descritos em (3.8).. 4.2.1. Imputa¸ c˜ ao dos Dados Censurados. Ageel (2002) prop˜oe um m´etodo para imputar as observa¸co˜es censuradas em um modelo com censura aleat´oria `a direita em modelos envolvendo distribui¸co˜es Weibull com 2 parˆametros com dados independentes. Generalizamos este procedimento para dados correlacionados e com covari´aveis. O valor estimado para o tempo de falha da observa¸c˜ao censurada pode ent˜ao ser usado para substituir Cij . As fun¸c˜oes densidade e de sobrevivˆencia da distribui¸c˜ao condicional de Tij dado bi s˜ao, respectivamente:. γ f (tij |bi , φ, xij ) = exp(bi + β ⊤ xij ). . tij exp(bi + β ⊤ xij ). γ−1.   exp −. tij exp(bi + β ⊤ xij ). γ . e   S(tij |bi , φ, xij ) = exp −. tij exp(bi + β ⊤ xij ). γ . I(0,∞) (tij ),. sendo o vetor de parˆametros φ = (β ⊤ , σ 2 , σb2 )⊤ e o vetor de covari´aveis xij com γ = 1/σ > 0 denotando o parˆametro de forma e exp(bi + β ⊤ x) > 0, o parˆametro de escala. A fun¸c˜ao densidade e o valor esperado relativos a` distribui¸c˜ao condicional de Tij dado Tij > cij , e o vetor de efeitos aleat´orios bi , s˜ao obtidos por meio de (2.2) e (2.3) [ver detalhes no apˆendice A]. Como resultados temos:. I(0,∞) (tij ).

(29) 4.2 Acomoda¸c˜ao de Observa¸co˜es Censuradas. 19. γ/[exp(bi + β ⊤ xij )] tij /[exp(bi + β ⊤ xij )] f (tij |bi , xij ) h f (tij |Tij > cij ; bi , φ, xij ) = = γ i S(cij |bi , xij ) exp − cij / exp(bi + β ⊤ xij ) h γ i exp − tij /[exp(bi + β ⊤ xij )] h × γ i , tij > cij exp − cij / exp(bi + β ⊤ xij ). γ−1. e.  γ  exp(bi + β ⊤ xij )Γ 1 + 1/γ, cij / exp(bi + β ⊤ xij ) h E(Tij |Tij > cij ; bi , φ, xij ) = , γ i ⊤ exp − cij / exp(bi + β xij ) (4.4) em que cij representa o tempo em que ocorreu a j-´esima censura para a i-´esima unidade  γ amostral e Γ 1 + 1/γ, cij / exp(bi + β ⊤ x) denota a fun¸c˜ao gama incompleta (Olver et al. (2010)) definida como, Γ(a, x) =. Z. ∞. ta−1 exp(−t)dt. x. Para obter a estimativa de E(Tij |Tij > cij ; bi , φ, xij ) consideramos inicialmente as estimativas do vetor dos parˆametros φ e os preditores de bi a partir da verossimilhan¸ca penalizada. Verossimilhan¸ ca Penalizada O m´etodo de M´axima Verossimilhan¸ca Penalizada ´e um processo de estima¸ca˜o em que a verossimilhan¸ca ´e aumentada por uma fun¸ca˜o de parˆametros desconhecidos (fun¸ca˜o de penaliza¸ca˜o). Pinto (2009) apresenta um estudo de m´etodos alternativos para a sele¸ca˜o de covari´aveis em modelos de sobrevivˆencia usando verossimilhan¸ca penalizada. Santos e Valen¸ca (2012) apresentam um estudo de simula¸ca˜o para para investigar a performance do m´etodo implementado no software R baseado na verossimilhan¸ca penalizada para estimar os parˆametros do MTFA com efeitos aleat´orios. Nesse contexto, considerando o modelo (4.1) e o vetor de parˆametros desconhecidos φ, a verossimilhan¸ca condicional para toda a amostra dado o efeito aleat´orio para cada unidade amostral ´e dada por:.

(30) 4.2 Acomoda¸c˜ao de Observa¸co˜es Censuradas. L(φ|b) =. ni k Y Y. 20. f (tij |bi , xij )δij S(tij |bi , xij )1−δij .. i=1 j=1. O logaritmo da fun¸ca˜o verossimilhan¸ca condicional para toda a amostra ´e da forma: l(φ|b) =. ni k X X. log f (tij |bi , xij )δij S(tij |bi , xij )1−δij .. (4.5). i=1 j=1. Na abordagem de verossimilhan¸ca penalizada, ´e necess´ario subtrair de (4.5) a fun¸c˜ao de penaliza¸ca˜o. Assim, a log-verossimilhan¸ca penalizada ´e dado por lpen (φ|b) =. ni k X X. log f (tij |bi , xij )δij S(tij |bi , xij )1−δij − h(b; σb2 ),. (4.6). i=1 j=1. em que h(b; σb2 ) representa a fun¸c˜ao de penaliza¸c˜ao. Therneau et al. (2003), sugerem a fun¸c˜ao de penaliza¸c˜ao h(b; σb2 ) =. k 1 X 2 b, 2σb2 i=1 i. (4.7). quando a distribui¸ca˜o dos efeitos aleat´orios ´e normal. Maximizando (4.6) obtemos o b∗ e estimador de m´axima verossimilhan¸ca penalizada (EMVP) de φ denotado por φ preditores para bi denotado por ˜b∗i , i = 1, . . . , k. Detalhes sobre este m´etodo podem ser encontrados em Therneau et al. (2003), por exemplo. Procedimentos para a Imputa¸c˜ ao i) Consideramos o modelo (4.1). ii) Inicialmente assumimos a distribui¸ca˜o normal para os efeitos aleat´orios (bi ). b∗ e os preditores ˜b∗ com base em (4.6) e (4.7). O software iii) Obtemos o EMVP φ i R (R Development Core Team, 2013) fornece procedimentos para a obten¸ca˜o deste resultado [ver Santos e Valen¸ca (2012)]. iv) Selecionamos as covari´aveis significativas por meio de testes da Raz˜ao de Verossimilhan¸cas. v) Estimamos E(Tij |Tij > cij , bi , φ, xij ) por meio de b∗ , xij ) Tbij = E(Tij |Tij > cij , ˜b∗i , φ.

(31) 4.3 Simula¸ca˜o. 21. b∗ e ˜b∗ s˜ao obtidos na etapa anterior. em que φ i. vi) Calculamos. Yij∗ = δij ln Tij + (1 − δij ) ln Tbij. para i = 1, . . . , k e j = 1, . . . , ni , em que os valores censurados (δij = 0) s˜ao substitu´ıdos pelas estimativas Tbij .. vii) Ap´os a imputa¸c˜ao das observa¸co˜es censuradas, tratamos o vetor Y∗ = (Y1∗⊤ , . . . , Yk∗⊤ )⊤ como o vetor de respostas, assumimos o modelo (4.3), consideramos os m´etodos n˜ao param´etricos para estima¸ca˜o dos parˆametros (EBLUE) e predi¸ca˜o dos efeitos aleat´orios (EBLUP), em que n˜ao assumimos distribui¸c˜ao para os efeitos aleat´orios. viii) Por fim, avaliamos o modelo atrav´es da an´alise de res´ıduos descrita na Se¸ca˜o 3.3.. 4.3. Simula¸ c˜ ao. Com o objetivo de verificar a efic´acia da an´alise de res´ıduos considerando o procedimento de imputa¸ca˜o das observa¸c˜oes censuradas, realizou-se um breve estudo de simula¸ca˜o considerando um MTFA com efeitos aleat´orios. Para este estudo buscamos obter simula¸co˜es semelhantes aos dados reais estudados no Cap´ıtulo 5. Consideramos k = 200 grupos, o n´ umero de indiv´ıduos de cada grupo, ni , foi gerado a partir de uma distribui¸c˜ao P oisson(6) (desconsiderando grupos de tamanho zero), i = 1, · · · , k. O tamanho da amostra obtido foi de 1.238. Consideramos uma u ´nica covari´avel x cujos valores foram gerados a partir de uma distribui¸ca˜o Normal padr˜ao e um vetor de efeitos aleat´orios com distribui¸ca˜o Normal com m´edia zero e variˆancia σb2 = 0.35 (estimativa obtida a partir do ajuste dos dados reais). Os erros aleat´orios foram gerados a partir de uma distribui¸ca˜o Valor Extremo padr˜ao, o que resulta na distribui¸ca˜o Weibull para os tempos de falha. As observa¸c˜oes censuradas foram geradas a partir de uma distribui¸ca˜o Uniforme (0, u), em que u varia de acordo com o percentual de censura requerido na amostra. Neste estudo, consideramos 0%, 20%, 30% e 50% de censura na amostra. Al´em disso, os valores dos parˆametros tomados como referˆencia foram β0 = 7.5, β1 = 0.85 e σ = 1.15, obtidos a partir do ajuste dos dados reais..

(32) 4.3 Simula¸ca˜o. 22. Uma vez geradas as censuras, os tempos observados foram obtidos tomando yij = min(tij , cij ). Associado a cada tempo observado temos um indicador de falhas, δij = 1, se tij ≤ cij e δij = 0, se tij > cij . Ap´os estas etapas, os dados gerados foram armazenados para a imputa¸ca˜o dos tempos de falhas correspondentes `as observa¸c˜oes censuradas conforme descrito na Se¸ca˜o 4.2. Para verificar a eficiˆencia do procedimento de imputa¸c˜ao comparamos os verdadeiros valores dos parˆametros com as estimativas obtidas a partir do EBLUE, considerando os tempos observados e os tempos com imputa¸ca˜o e usamos a an´alise gr´afica de res´ıduos. Todas as simula¸c˜oes e as an´alises de res´ıduos foram realizadas utilizando o software estat´ıstico R. Os resultados das an´alises s˜ao discutidos logo abaixo. O estudo de simula¸c˜ao mostrou que as estimativas dos parˆametros (β0 , β1 ) obtidas a partir do EBLUE s˜ao mais pr´oximas dos parˆametros de referˆencia para todos os percentuais de censura quando o procedimento de imputa¸c˜ao das observa¸co˜es censuradas ´e aplicado, o que sugere uma maior eficiˆencia nas an´alises (ver Tabela 4.1). Tabela 4.1: Estimativas dos parˆametros para os tempos observados com β0 = 7.5 e β1 = 0.85. Censura. Parˆametros. 20%. β0 β1 β0 β1 β0 β1. 30% 50%. M´etodo de Estima¸c˜ao EBLUE sem imputa¸c˜ao EBLUE com imputa¸c˜ao 6.58 6.83 0.65 0.86 6.47 6.85 0.62 0.88 6.09 6.92 0.43 0.88. Com rela¸c˜ao a an´alise de res´ıduos para esse conjunto de dados apresentada nos gr´aficos correspondentes as Figuras 4.1- 4.7 ´e poss´ıvel obter uma avalia¸c˜ao adequada do ajuste do modelo considerando um percentual de censura inferior a 50%, ficando limitado o uso dessas t´ecnicas para amostras censuradas acima desse percentual..

(33) 23. 1038 1050 567. 1117. 659 694 708 613. 1147 182. 669. 2 0 −2. Resíduos marginais padronizados ξij. 18. 0. Resíduos marginais padronizados ξij. 5. 4. 6. 4.3 Simula¸ca˜o. 1038 1050 1117. −4. −5. 567. 659 694 708 613. 1147 182. −6. 669. 5. 6. 7. 8. 9. 10. 5. 6. 7. Valores preditos yi. 8. 9. 10. Valores preditos yi. (b) p = 20%. 1038 1050 1117. −4. 567. 659 694 708 613. 2 0 −2. Resíduos marginais padronizados ξij. 2 0 −2. 182 669. 464. 911. 1050 1038. 1147. 1117. 567. −4. Resíduos marginais padronizados ξij. 4. 4. (a) p = 0%. 659 694 708 613. 1147 182. 669. 5. 6. 7. 8. Valores preditos yi. (c) p = 30%. 9. 10. 5. 6. 7. 8. 9. 10. Valores preditos yi. (d) p = 50%. ∗ Figura 4.1: Gr´afico dos res´ıduos marginais padronizados (ξˆi ) vs valores preditos..

(34) 24. 0.3. Densidade. 0.0. 0.0. 0.1. 0.2. 0.2 0.1. Densidade. 0.3. 0.4. 0.4. 0.5. 4.3 Simula¸ca˜o. −6. −4. −2 0 Resíduos marginais padronizados ξij. 2. 4. −6. −4. 2. 4. 2. 4. (b) p = 20%. 0.4. Densidade. 0.3. 0.2. 0.2. 0.0. 0.1 0.0. Densidade. 0.4. 0.6. 0.5. (a) p = 0%. −2 0 Resíduos marginais padronizados ξij. −6. −4. −2 0 Resíduos marginais padronizados ξij. (c) p = 30%. 2. 4. −6. −4. −2 0 Resíduos marginais padronizados ξij. (d) p = 50%. ∗ Figura 4.2: Histograma dos res´ıduos marginais padronizados (ξˆi )..

(35) 25. 0.04. 169 109 104. 184. 111. 22. 0.02. 171 40 42. 91 97. 181. 163. 0.12 0.10 0.08 0.06. 109 104. 0. 171. 111. 22 68. 40. 8891. 50. 100. 150. 200. 0. 50. 181. 97 163. 100. Unidades. 150. 200. Unidades. (b) p = 20%. 29 169 109 104 111. 17 22 91. 40 42. 97. 163. 171. 184 181. 0.12 0.10 0.08 0.06. 17. 169. 109 104 22 40. 91. 68 76. 97. 184. 111 163 171. 181. 86. 0.00. 0.00. 76. 105. 29. 0.04. 0.05. 105. 0.02. 0.10. Medida de Lesaffre and Verbeke's padronizada ν*i. 0.15. 0.14. (a) p = 0%. Medida de Lesaffre and Verbeke's padronizada νi*. 184. 17. 0.00. 68 66. 169. 29. 0.04. 29. 17. 105. 0.02. Medida de Lesaffre and Verbeke's padronizada ν*i. 0.12 0.10 0.08 0.06. 105. 0.00. Medida de Lesaffre and Verbeke's padronizada νi*. 0.14. 4.3 Simula¸ca˜o. 0. 50. 100 Unidades. (c) p = 30%. 150. 200. 0. 50. 100. 150. 200. Unidades. (d) p = 50%. Figura 4.3: Gr´afico da medida de Lesaffre and Verbeke’s padronizada (Vi∗ ) indexando as unidades..

(36) 26. 1 0 −3. −3. −2. −1. Resíduos condicionais padronizados eij. 2 1 0 −1 −2. Resíduos condicionais padronizados eij. 2. 3. 3. 4.3 Simula¸ca˜o. 4. 5. 6. 7 Valores preditos yij. 8. 9. 10. 4. 5. 7 Valores preditos yij. 8. 9. 10. (b) p = 20%. 1 0. −3. −2. −1. Resíduos condicionais padronizados eij. 1 0 −1 −2. Resíduos condicionais padronizados eij. 2. 2. 3. (a) p = 0%. 6. 4. 5. 6. 7 Valores preditos yij. 8. (c) p = 30%. 9. 10. 4. 5. 6. 7 Valores preditos yij. 8. 9. 10. (d) p = 50%. Figura 4.4: Gr´afico dos res´ıduos condicionais padronizados (ˆ e∗k ) vs valores preditos..

(37) 27. 1 0 −3. −3. −2. −1. Resíduos condicionais padronizados eij. 2 1 0 −1 −2. Resíduos condicionais padronizados eij. 2. 3. 3. 4.3 Simula¸ca˜o. 0. 200. 400. 600. 800. 1000. 1200. 0. 200. 400. Indíces das observações. 600. 800. 1000. 1200. 1000. 1200. Indíces das observações. (b) p = 20%. 1 0. −3. −2. −1. Resíduos condicionais padronizados eij. 1 0 −1 −2. Resíduos condicionais padronizados eij. 2. 2. 3. (a) p = 0%. 0. 200. 400. 600. 800. Indíces das observações. (c) p = 30%. 1000. 1200. 0. 200. 400. 600. 800. Indíces das observações. (d) p = 50%. Figura 4.5: Gr´afico dos res´ıduos condicionais padronizados (ˆ e∗k ) indexando as observa¸co˜es..

(38) 28. 0 −2. Resíduos Condicionais (eij). −6. −4. 0 −2 −4 −6. Resíduos Condicionais (eij). 2. 2. 4. 4.3 Simula¸ca˜o. −8. −6. −4. −2. 0. 2. −8. −6. Quantis teóricos Valor Extremo Pardão. −4. −2. 0. 2. 0. 2. Quantis teóricos Valor Extremo Pardão. (b) p = 20%. −2 −6. −4. Resíduos Condicionais (eij). 0 −2 −4 −6. Resíduos Condicionais (eij). 0. 2. 2. (a) p = 0%. −8. −6. −4. −2. 0. 2. −8. −6. −4. −2. Quantis teóricos Valor Extremo Pardão. Quantis teóricos Valor Extremo Pardão. (c) p = 30%. (d) p = 50%. Figura 4.6: QQ para os res´ıduos condicionais (ˆ eij )..

(39) 29. 0.04 0.03 0.00. 0.00. 0.01. 0.02. Distância de Mahalanobis's Μi. 0.03 0.02 0.01. Distância de Mahalanobis's Μi. 0.04. 4.3 Simula¸ca˜o. 0. 2. 4. 6. 8. 0. 2. Quantis teóricos Qui−quadrado (1). 6. 8. (b) p = 20%. 0.00. 0.04 0.03 0.02 0.00. 0.01. 0.01. 0.02. 0.03. Distância de Mahalanobis's Μi. 0.04. 0.05. 0.05. (a) p = 0%. Distância de Mahalanobis's Μi. 4. Quantis teóricos Qui−quadrado (1). 0. 2. 4. 6. Quantis teóricos Qui−quadrado (1). (c) p = 30%. 8. 0. 2. 4. 6. Quantis teóricos Qui−quadrado (1). (d) p = 50%. Figura 4.7: QQ para distˆancia de Mahalanobis’s (Mi ).. 8.

(40) Cap´ıtulo 5 Aplica¸c˜ ao 5.1. Especifica¸ c˜ ao do Modelo. Aplicamos a metodologia desenvolvida nos cap´ıtulos anteriores aos dados do estudo descrito no Cap´ıtulo 1. Em particular, consideramos 2374 observa¸co˜es envolvendo 1811 tempos de falha e 563 censuras obtidos de 616 po¸cos de petr´oleo. As falhas s˜ao definidas como alguma anormalidade relacionada a equipamentos de subsuperf´ıcie que tenham ocasionado uma parada total de produ¸c˜ao ou provocaram deficiˆencia no funcionamento do po¸co-coluna. A n˜ao ocorrˆencia do evento de interesse (falha) implica uma observa¸ca˜o censurada. Al´em dos tempos entre falhas, foram registradas diversas informa¸c˜oes para cada po¸co-coluna, nomeadamente, i) Produ¸ca˜o (PROD) em m3 /dia; ii) M´etodo de Eleva¸c˜ao: Bombeio Mecˆanico (BM) ou Cavidade Progressiva (CP); iii) Idade do Po¸co (ID) em anos iv) Regi˜ao: ARG, CAM, ET e RFQ; v) Profundidade da bomba de ´oleo (PROF) em m. Ap´os a sele¸c˜ao das covari´aveis atrav´es do TRV considerando a log-verosimilhan¸ca penalizada (4.6) decidimos adotar o modelo:. 30.

(41) 5.2 An´alise de Res´ıduos para o Modelo Ajustado. 31. ln Tij = bi + βprod P RODij + βbm BM + βid IDij + βcam CAM + βet ET + βrf q RF Q+ + βprof P ROFi + βprod∗cam P RODij ∗ CAM + βprod∗et P RODij ∗ ET + + βprod∗rf q P RODij ∗ RF Q + βprof ∗cam P ROFi ∗ CAM + + βprof ∗et P ROFi ∗ ET + βprof ∗rf q P ROFi ∗ RF Q + σǫij , (5.1) em que a forma da distribui¸ca˜o dos efeitos aleat´orios (bi ) n˜ao foi especificada e assumiuse a distribui¸c˜ao condicional Weibull para Tij condicionalmente aos efeitos aleat´orios bi , i = 1, · · · , 616 e j = 1, · · · , ni . Ap´os a imputa¸c˜ao das observa¸co˜es censuradas, o EBLUE dos parˆametros e o EBLUP dos efeitos aleat´orios foram obtidos a partir de (3.7) com os componentes de variˆancia estimados atrav´es do m´etodo MINQUE (3.8) que podem ser observados na Tabela 5.1: Tabela 5.1: Estimativas (EBLUE e EBLUP) e Erros Padr˜oes do Modelo 5.1 Parˆametros Estimativas β0 6.479 βprod -0.041 βbm 0.646 βid 0.092 βcam 1.455 βet 1.177 βrf q 1.950 βprof 0.002 βprod∗cam 0.041 βprod∗et 0.003 βprod∗rf q -0.027 βprof ∗cam -0.002 βprof ∗et -0.003 βprof ∗rf q -0.003 σ 1.078 2 σb 0.908. 5.2. EP 0.302 0.012 0.152 0.008 0.371 0.277 0.394 0.000 0.019 0.019 0.024 0.001 0.001 0.001 -. An´ alise de Res´ıduos para o Modelo Ajustado. Aplicamos as propostas de an´alise de res´ıduos discutidas no Cap´ıtulo 3 ao modelo (4.3)..

(42) 5.2 An´alise de Res´ıduos para o Modelo Ajustado. 32. Os res´ıduos obtidos a partir do modelo (5.1) est˜ao representados nas Figuras 5.15.7 e sugerem que: • A hip´otese de linearidade dos efeitos fixos parece satisfat´oria (Figura 5.1) e a distribui¸ca˜o dos res´ıduos marginais apresenta uma assimetria a` esquerda (Figura 5.2). • A estrutura da matriz de covariˆancias intraunidades proposta n˜ao ´e adequada para algumas unidades amostrais (Figura 5.3). • N˜ao h´a evidˆencias de observa¸c˜oes discrepantes (Figura 5.4). • H´a evidˆencias de viola¸c˜ao da suposi¸c˜ao de homoscedasticidade dos erros condicionais (Figura 5.5). • N˜ao h´a evidˆencias contr´arias a` suposi¸c˜ao de que os res´ıduos condicionais seguem uma distribui¸c˜ao Valor Extremo Padr˜ao (Figura 5.6). • H´a evidˆencias de viola¸ca˜o da suposi¸ca˜o de normalidade para os efeitos aleat´orios (Figura 5.7).. 2 0 −2. 1771 1766 1784. −4. Resíduos marginais padronizados ξij. 4. 6. As Figuras 5.6 e 5.7 sugerem que a ado¸c˜ao do modelo Weibull para os erros condicionais ´e justific´avel mas que n˜ao h´a evidˆencias para adotar uma distribui¸ca˜o Normal para os efeitos aleat´orios.. 672 9721824183 31 843 1497 1445 1653 1648 1536 486 183 169 1690 875403 1443 1698 2120 1138 2093 387 461 455 418 15821600 120 303 956 126 739 734 2230 2340 1361 1282. −6. 2206 2084. 5. 6. 7. 8. 9. 10. Valores preditos yi. ∗ Figura 5.1: Gr´afico dos res´ıduos marginais padronizados (ξˆi ) vs valores preditos..

(43) 33. Densidade. 0.0. 0.1. 0.2. 0.3. 0.4. 5.2 An´alise de Res´ıduos para o Modelo Ajustado. −6. −4. −2 0 Resíduos marginais padronizados ξij. 2. 4. 3000 2500 2000 1500. 68. 580. 500. 1000. 99 102 100 322. 15 6 41 23 21 39 4. 90 91 92 81 73. 149. 238 245 257 240 186 185 216 226 247. 547. 343. 423 462 492 424 463481 482 407425 426 450 415 404 451 448 447 418 417. 386 378 288. 366. 586 548. 612 611. 568 593. 0. Medida de Lesaffre and Verbeke's padronizada ν*i. 3500. ∗ Figura 5.2: Histograma dos res´ıduos marginais padronizados (ξˆi ).. 0. 100. 200. 300. 400. 500. 600. Unidades. Figura 5.3: Gr´afico da medida de Lesaffre and Verbeke’s padronizada (Vi∗ ) indexando as unidades..

(44) 34. 2 1 0 −1 −2 −3. Resíduos condicionais padronizados eij. 3. 5.2 An´alise de Res´ıduos para o Modelo Ajustado. 0. 500. 1000. 1500. 2000. Indíces das observações. 2 1 0 −1 −2 −3. Resíduos condicionais padronizados eij. 3. Figura 5.4: Gr´afico dos res´ıduos condicionais padronizados (ˆ e∗k ) indexando as observa¸co˜es.. 5. 6. 7. 8 Valores preditos yij. 9. 10. 11. Figura 5.5: Gr´afico dos res´ıduos condicionais padronizados (ˆ e∗k ) vs valores preditos..

(45) 35. 0 −2 −4 −6. Resíduos Condicionais (eij). 2. 5.2 An´alise de Res´ıduos para o Modelo Ajustado. −8. −6. −4. −2. 0. 2. Quantis teóricos Valor Extremo Pardão. 0.015 0.010 0.005 0.000. Distância de Mahalanobis's Μi. 0.020. Figura 5.6: QQ para os res´ıduos condicionais padronizados (ˆ e∗k ).. 0. 2. 4. 6. 8. 10. Quantis teóricos Qui−quadrado (1). Figura 5.7: QQ para distˆancia de Mahalanobis’s (Mi )..

(46) Cap´ıtulo 6 Considera¸co ˜es finais 6.1. Conclus˜ oes. Neste trabalho, consideramos o uso de t´ecnicas de an´alise de res´ıduos originalmente desenvolvidas para modelos mistos em modelos de tempo de falha acelerado Weibull com efeitos aleat´orios admitindo a ocorrˆencia de censuras, sem suposi¸ca˜o sobre a forma da distribui¸ca˜o dos efeitos aleat´orios. Propomos um procedimento de imputa¸c˜ao para tratar das observa¸co˜es censuradas da amostra. Realizamos um breve estudo de simula¸ca˜o no qual verificamos que a proposta da an´alise de res´ıduos ´e aceit´avel quando os dados n˜ao apresentarem um percentual de censura muito elevado (menor que 50%). Utilizamos essas t´ecnicas para avaliar o ajuste de tempos entre falhas de po¸cos de petr´oleo, possivelmente correlacionados e na presen¸ca de censuras. Quando avaliamos a hip´otese de linearidade nesses dados, atrav´es dos res´ıduos marginais padronizados, identificamos que algumas observa¸co˜es ultrapassaram os limites estabelecidos. Estas ocorrˆencias podem estar associadas a caracter´ısticas especiais de alguns po¸cos-coluna. Percebemos tamb´em que a estrutura da matriz de covariˆancias intraunidades amostrais proposta n˜ao foi adequada para algumas unidades amostrais, sendo necess´ario uma modifica¸c˜ao nessa estrutura, o que deixamos como proposta futura. Por meio dos res´ıduos condicionais identificamos que n˜ao h´a evidˆencia contra `a suposi¸ca˜o de que os erros seguem uma distribui¸ca˜o Valor Extremo Padr˜ao. A falta de homogeneidade na distribui¸ca˜o dos res´ıduos condicionais mostra maior dispers˜ao para os menores valores preditos. Isto sugere que a variˆancia ´e maior para os tempos entre falhas menores. Com base na distˆancia de Mahalanobis observamos que a suposi¸ca˜o de normalidade para os efeitos aleat´orios parecem ser inadequada.. 36.

(47) 6.2 Pesquisas Futuras. 6.2. 37. Pesquisas Futuras. Para pesquisas futuras, existem alguns t´opicos para serem explorados, como: • Avaliar a an´alise de res´ıduos considerando outras distribui¸co˜es para o efeito aleat´orio e para os tempos de falha. • Incorporar covari´aveis no parˆametro de escala num MTFA com efeito aleat´orio e estudar o ajuste e diagn´ostico de um modelo heteroced´astico. • Estudar a extens˜ao dos res´ıduos Martingale e de Cox-Snell para a avalia¸ca˜o de MTFA com efeito aleat´orio. • Realizar um estudo de simula¸c˜ao extensivo para verificar a validade dos procedimentos..

(48) Referˆ encias Bibliogr´ aficas Ageel, M. I., 2002. A novel means of estimating quantiles for 2-parameter weibull distribution under the right random censoring model. Journal of Computational and Applied Mathematics, 149, 373–380. Allison, P. D., 2010. Survival Analysis Using SAS: A Practical Guide, 2nd Edition. NC: SAS Institute Inc, Cary, USA. Bolfarine, H., Valen¸ca, D. M., 2005. Testing homogeneity in weibull-regression models. Biometrical Journal, 47, 707–720. Brown, K. G., 1976. Asymptotic behavior of minque-type estimators of variance components. The Annals of Statistics, 4, 746–754. Carvalho, J. B., 2010. Predi¸c˜ ao em Modelos de Tempo de Falha Acelerado com Efeito Aleat´ orio para Avalia¸c˜ ao de Riscos de Falha em Po¸cos Petrol´ıferos. Disserta¸c˜ao de mestrado, PPGMAE, UFRN. Carvalho, J. B., Valen¸ca, D. M., Singer, J., 2012. Prediction of failure probability of oil wells. Brazilian Journal of Probability and Statistics (a ser publicado). Collett, D., 1994. Modelling survival data in medical research. Chapman and Hall, New York. Colosimo, E. A., Giolo, S. R., 2006. An´alise de sobrevivˆencia aplicada. Edgard Bluncher, S˜ao Paulo. Cook, R. D., 1977. Detection of influential observations in linear regression. Technometrics, 19, 15–18. Cox, D. R., 1972a. Regression models and life tables (with discussion). Journal Royal Statistical Society B 34, 187–220.. 59.

Referências

Documentos relacionados

Local de realização da avaliação: Centro de Aperfeiçoamento dos Profissionais da Educação - EAPE , endereço : SGAS 907 - Brasília/DF. Estamos à disposição

forficata recém-colhidas foram tratadas com escarificação mecânica, imersão em ácido sulfúrico concentrado durante 5 e 10 minutos, sementes armazenadas na geladeira (3 ± 1

Com o intuito de aperfeic¸oar a realizac¸˜ao da pesquisa O/D, o objetivo do presente trabalho ´e criar um aplicativo para que os usu´arios do transporte p´ublico informem sua origem

Resultados: Os parâmetros LMS permitiram que se fizesse uma análise bastante detalhada a respeito da distribuição da gordura subcutânea e permitiu a construção de

Neste capítulo, será apresentada a Gestão Pública no município de Telêmaco Borba e a Instituição Privada de Ensino, onde será descrito como ocorre à relação entre

2. Identifica as personagens do texto.. Indica o tempo da história. Indica o espaço da história. Classifica as palavras quanto ao número de sílabas. Copia do texto três

Em janeiro, o hemisfério sul recebe a radiação solar com menor inclinação e tem dias maiores que as noites, encontrando-se, assim, mais aquecido do que o hemisfério norte.. Em julho,

Se você vai para o mundo da fantasia e não está consciente de que está lá, você está se alienando da realidade (fugindo da realidade), você não está no aqui e