Corre¸c˜ ao De Vi´ es Do Modelo De Gumbel Com Censura Tipo I E Tipo II

(1)

UNIVERSIDADE FEDERAL DA PARA´IBA CENTRO DE INFORM ´ ATICA

PROGRAMA DE P ´ OS-GRADUAC ¸ ˜ AO EM

MODELAGEM MATEM ´ ATICA E COMPUTACIONAL

Corre¸c˜ ao De Vi´ es Do Modelo De Gumbel Com Censura Tipo I E Tipo II

por

Suelena Rocha

Disserta¸c˜ ao submetida como requisito parcial para a obten¸c˜ ao do grau de

Mestre em Modelagem Matem´ atica e Computacional

Prof. Dr. Alexandre Simas Orientador

Jo˜ ao Pessoa, Mar¸co de 2016.

(2)

Suelena de Souza Rocha

Correção De Viés Do Modelo De

Gumbel Com Censura Tipo I E Tipo II

Dissertação submetida ao Programa de Pós-Graduãção em Modelagem Matemática e Computacional do Centro de Informática da Universidade Federal da Paraíba, como requisito parcial para a obtenção do grau de Mestre em Modelagem Matemática e Computacional.

Orientador: Prof. Dr. Alexandre B. Simas.

João Pessoa – PB

Março de 2016

(3)

R672c Rocha, Suelana de Souza.

Correção de viés do modelo de Gumbel com censura tipo I e tipo II / Suelana de Souza Rocha.- João Pessoa, 2016.

80f.

Orientador: Alexandre Simas Dissertação (Mestrado) - UFPB/CI

1. Matemática computacional - modelagem. 2. Modelo de Gumbel. 3. Censura tipo I. 4. Censura tipo II.

UFPB/BC CDU: 519.6(043)

(4)

(5)

AGRADECIMENTOS

Agrade¸co primeiramente a Deus que est´ a sempre comigo e a Nossa Senhora.

A minha fam´ılia, em especial, aos meus pais, que sempre me incen- ` tivaram a estudar e a lutar pelos meus sonhos e a minha irm˜ a Suelen de Souza Rocha.

Ao professor, Alexandre Bustamante Simas, meu orientador, pelos conhecimentos transmitidos, compreens˜ ao, aten¸c˜ ao, incentivo e pela conﬁan¸ca deposi- tada em mim e ` a professora Andrea Vanessa Rocha.

Aos professores da P´ os-Gradua¸c˜ ao em Modelagem Matem´ atica Com- putacional.

A banca examinadora: Prof. Dr. Alberto Masayoshi Faria Ohashi. e ` Prof. Dr. Wagner Barreto de Souza, por aceitarem participar da avalia¸c˜ ao deste trabalho.

Aos meus amigos que estiveram ao meu lado durante o mestrado, com-

partilhando felicidades e diﬁculdades, em especial ` a Josenildo Silva de Lima, Maria

Aparecida Silva de Andrade, Ricardo Pinheiro da Costa, Thiago Luis de Oliveira do

Rˆ ego e Victor Jos´ e Araujo de Carvalho.

(6)

Sum´ ario

AGRADECIMENTOS . . . . v

RESUMO . . . . viii

ABSTRACT . . . . ix

1 INTRODUC ¸ ˜ AO . . . . 1

2 CONHECIMENTOS PRELIMINARES . . . . 4

3 CORREC ¸ ˜ AO DO VI´ ES DO MODELO DE GUMBEL COM CEN- SURA TIPO I . . . . 7

3.1 Corre¸c˜ ao Do Vi´ es De Um EMVs . . . . 10

3.2 Corre¸c˜ ao do vi´ es dos MLEs para o modelo de Gumbel com censura tipo I . . . . 11

3.3 Corre¸c˜ ao Do Vi´ es De Um MLEs De μ e φ . . . . 13

4 CORREC ¸ ˜ AO DO VI´ ES DO MODELO DE GUMBEL COM CEN- SURA TIPO II . . . . 15

4.1 Corre¸c˜ ao Do Vi´ es De Um EMVs . . . . 19

4.2 Corre¸c˜ ao do vi´ es dos MLEs para o modelo de Gumbel com censura tipo I . . . . 20

4.3 Corre¸c˜ ao Do Vi´ es De Um MLEs De μ e φ . . . . 22

5 ANALISE NUM´ ERICA . . . . 24

5.1 Simula¸c˜ ao . . . . 24

5.2 Aplica¸c˜ ao . . . . 25

APˆ ENDICE A . . . . 29

APˆ ENDICE B . . . . 32

(7)

APˆ ENDICE C . . . . 50

(8)

RESUMO

Nesta disserta¸c˜ ao, usamos o modelo de Gumbel; Inicialmente obtivermos a matriz de informa¸c˜ ao de Fisher e a escrevermos na sua forma matricial, depois calculamos os cumulantes de segunda e terceira ordem, posteriormente derivamos os cumulantes de segunda ordem com respeito aos parˆ ametros. Em seguida, subtra´ımos das derivadas dos cumulantes de segunda ordem os cumulantes de terceira ordem e substitu´ımos estes valores na express˜ ao de Cox e Snell para obten¸c˜ ao da corre¸c˜ ao do Vi´ es. Utili- zamos a f´ ormula encontrada em Cox and Snell (1968), pois a partir de tal resultado, podemos deﬁnir um estimador corrigido ˜ θ

_a

= ˆ θ

_a

− B ˆ (ˆ θ

_a

), onde ˆ B(ˆ θ

_a

) ´ e o vi´ es es- timado de ˆ θ

_a

, onde ˜ θ

_a

tem vi´ es de ordem O(n

⁻²

). Logo ` a medida que o tamanho amostral n aumenta, esperamos que o vi´ es de ˜ θ

_a

aproxime-se mais rapidamente de zero que o vi´ es de ˆ θ

_a

. Faremos a corre¸c˜ ao do vi´ es para o modelo de Gumbel com censura tipo I e tipo II.

Palavras Chave: Gumbel, censura tipo I, censura tipo II.

(9)

ABSTRACT

In this thesis, we use the model of Gumbel; Initially we had the Fisher information matrix and we write in a matrix form, then calculated the second- and third-order cumulants later derive the second order cumulants with respect to the parameters.

Then we subtract the derivatives of the second order cumulants the third order cumulants and replace these values in the expression of Cox and Snell to obtain the correction of bias.We use the formula found in Cox and Snell (1968), because from what outcome we can deﬁne a corrected estimator ˜ θ

_a

= ˆ θ

_a

− B ˆ (ˆ θ

_a

), where ˆ B(ˆ θ

_a

) it is the estimated bias ˆ θ

_a

, where ˜ θ

_a

has order bias O(n

⁻²

). As soon as the sample size n increases, we expect the bias ˜ θ

_a

approaches zero faster than the bias ˆ θ

_a

. We will correct the bias for the model with censorship Gumbel type I and type II.

Palavras Chave: Gumbel, censorship type I, censorship type II.

(10)

1 INTRODUC ¸ ˜ AO

A distribui¸c˜ ao de valor extremo, assim denominado por Emil Julius Gumbel (1891-1966), ´ e conhecida como distribui¸c˜ ao de Gumbel e distribui¸c˜ ao log- Weibull. Os primeiros problemas envolvendo o valor extremo surgiu das inunda¸c˜ oes;

sua importˆ ancia econˆ omica foi not´ avel desde o surgimento da economia agr´ aria, es- sencialmente nos que se baseava no ﬂuxo de ´ agua e hidrovias, pois este era o prin- cipal sistema de comunica¸c˜ ao da ´ epoca. Sua importˆ ancia se destacou ainda mais na economia industrial com a constru¸c˜ ao de usinas hidroel´ etricas e reservat´ orios para irriga¸c˜ ao e luta contra eros˜ ao. O que incentivou o estudo deste tema, foi a im- portˆ ancia social do controle do ﬂuxo de ´ agua. A natureza estat´ıstica desde problema fez com que os procedimentos emp´ıricos usados inicialmente fossem substitu´ıdos por m´ etodos derivados da teoria dos valores extremos.

Esta teoria tem atra´ıdo cientista das mais diversas ´ areas, como por exemplos as engenharias (naval, e´ olica, civil), meteorologia, geologia, estat´ıstica populacional e outras. Em Kotz and Nadarajah (2000) podemos encontrar algumas aplica¸c˜ oes, como por exemplo, terremotos, corridas de cavalo, tempestade, ﬁlas de supermercados, correntes mar´ıtimas, velocidade do tempo. Os recentes desastres naturais, por exemplo o fura¸c˜ ao Katrina, o terremoto do Jap˜ ao, os deslizamento de terra e as inunda¸c˜ oes devidas as fortes chuvas ocorridas na Austr´ alia, paquist˜ ao e Brasil, al´ em das crises ﬁnanceiras e vazamentos de ´ oleos demonstram a necessidade de um estudo nas previs˜ oes destes fenˆ omenos mais complexos.

Nesta disserta¸c˜ ao, apresentamos um modelo geral de regress˜ ao de valor

extremo, e f´ ormulas para o vieses de segunda ordem das estimativas de m´ axima

verossimilhan¸ca (EMVs) dos parˆ ametros do nosso modelo. Quando o tamanho da

amostra ´ e grande, os vieses da EMVs s˜ ao desprez´ıveis, uma vez que em geral, sua

ordem ´ e O(n

⁻¹

), enquanto os erros padr˜ ao assint´ oticos s˜ ao de O(n

⁻¹²

). Como sem-

(11)

pre, por´ em, a corre¸c˜ ao do vi´ es ´ e importante enquanto o tamanho da amostra ´ e pequeno. Na literatura, muitos autores tem obtido express˜ ao para os vieses de segunda ordem das EMVs em uma variedade de modelo de regress˜ ao. Box (1971) obt´ em uma express˜ ao geral para o vi´ es n

⁻¹

em modelos n˜ ao-lineares multivariados com matrizes de covariˆ ancia conhecidos. Young and Bakir (1987) mostra a utili- dade da corre¸c˜ ao do vi´ es para o modelo de regress˜ ao log-gama generalizado, que tem como caso particular o modelo linear de regress˜ ao do valor extremo. Cordeiro and McCullagh (1991) obt´ em uma f´ ormula geral matricial para a corre¸c˜ ao do vi´ es nos Modelos lineares Generalizados (MLGs). Cordeiro and Vasconcellos (1997) for- necem f´ ormulas matriciais para o vi´ es em modelos n˜ ao-lineares multivariados com erros seguindo distribui¸c˜ ao normal. Este resultado ´ e estendido por Vasconcellos and Gauss (1997) para cobrir modelos heterosced´ asticos, enquanto Cordeiro et al. (1998) calcularam o vi´ es de segunda para o modelo n˜ ao-linear de regress˜ ao t-Student uni- variado. Vasconcellos and Cordeiro (2000) obtiveram uma express˜ ao para o vi´ es de segunda ordem para o modelo de regress˜ ao n˜ ao-linear multivariado t-Student Cor- deiro and Botter (2001) obtiveram f´ ormulas gerais para o vi´ es de segunda ordem das EMVs em MLGs e Modelos N˜ ao Lineares Generalizados (MNLGs) com covari´ aveis de dispers˜ ao, respectivamente. Ospina et al. (2006) calcularam o vi´ es de segunda ordem das EMVs para o modelo de regress˜ ao linear beta. Recentemente, Simas et al. (2010) obtiveram os vieses de segunda ordem para o modelo geral de regress˜ ao beta.

Ao realizar inferˆ encia estat´ıstica a partir de dados obtidos em testes de conﬁabilidade, muitas vezes nos deparamos com amostras onde nem todos os tempos de falha desejados s˜ ao observados. Esses casos s˜ ao denominados censuras, isto ´ e, s˜ ao observa¸c˜ oes parciais em um estudo interrompido por alguma raz˜ ao, n˜ ao permitindo que as observa¸c˜ oes completas do tempo de falha sejam obtidas. Censuras s˜ ao recorrentes em processos de an´ alise de sobrevivˆ encia, onde o tempo e o custo de tais experimentos s˜ ao limitados, ou por diversos outros motivos alheios ao estudo e

`

as condi¸c˜ oes impostas sobre o objeto de estudo.

(12)

Faremos nosso estudo baseado no artigo de Barreto-Souza and Vascon- cellos (2011), onde encontramos a corre¸c˜ ao do vi´ es da distribui¸c˜ ao de Gumbel sem censura.

O Cap´ıtulo 1, iniciamos usando o modelo de Gumbel, calculamos a fun¸c˜ ao geradora de momentos, a esperan¸ca, variˆ ancia e temos a constru¸c˜ ao da verossimilhan¸ca com censura tipo I e tipo II.

O cap´ıtulo 2, est´ a organizado em se¸c˜ oes, primeiramente, usando o modelo de Gumbel com censura tipo I, obtemos a fun¸c˜ ao log-verossimilhan¸ca, a fun¸c˜ ao Escore e a matriz informa¸c˜ ao de Fisher; Na Se¸c˜ ao 1, ﬁzermos a corre¸c˜ ao do vi´ es com censura tipo I de um EMVs, utilizando a f´ ormula de Cox and Snell (1968), na Se¸c˜ ao 2, estudamos a corre¸c˜ ao do vi´ es com censura tipo I de um EMVs de μ e φ.

O cap´ıtulo 3, est´ a organizado da mesma forma que o cap´ıtulo 2, s´ o

trocamos a censura tipo I pela censura tipo II.

(13)

2 CONHECIMENTOS PRELIMINARES

Seja Y uma vari´ avel aleat´ oria com distribui¸c˜ ao de Gumbel, que possui fun¸c˜ ao de densidade de probabilidade dada por

g(y; μ, φ) = 1 φ exp

y − μ φ

exp

− exp

y − μ φ

; y ∈ R . (2.1) onde Y ∼ EV (μ, φ), com μ ∈ R e φ > 0 s˜ ao parˆ ametros de localiza¸c˜ ao e escala, respectivamente.

A fun¸c˜ ao geradora de momentos de Y ´ e dada por

E(exp (tY )) = exp (tμ) Γ(1 + φt), com t > − φ

⁻¹

. (2.2)

Assim, temos a esperan¸ca e a variˆ ancia de Y dada por

E(Y ) = μ − γφ, (2.3)

V (Y ) = π

²

6 φ

²

, (2.4)

respectivamente, onde γ ´ e a constante de Euler, γ = lim

_n→∞

_n

i=1 1

k

− log n

≈ 0, 5772, podemos veriﬁcar os fatos (2.2), (2.3) e (2.4) no Apˆ endice(A).

Deﬁni¸c˜ ao 2.1 ( Constru¸c˜ ao Da Verossimilhan¸ca Com Censura Tipo I). Su- ponhamos que temos uma amostra X

₁

, . . . , X

_n

aleat´ oria simples da vari´ avel aleat´ oria X; Denotaremos a fun¸c˜ ao de densidade de probabilidade por f (x) e a fun¸c˜ ao de distribui¸c˜ ao acumulada por F (x). Representamos a censura tipo I, pelo par (y

_i

, δ

_i

) com y

_i

= min(x

_i

, T

_i

),

δ

_i

=

⎧ ⎨

⎩

0; x

_i

> T

_i

1; x

_i

≤ T

_i

, para i = 1, ..., n. (2.5)

onde δ

_i

´ e a vari´ avel indicadora da censura e T

_i

´ e o tempo de censura relacionado a

observa¸c˜ ao. Denotaremos o vetor de parˆ ametros desconhecidos por ϑ = (ϑ

₁

, ..., ϑ

_p

).

(14)

Assim, a express˜ ao da verossimilhan¸ca ´ e:

L(X | ϑ) =

n i=1

f (x

_i

).

Denotaremos, a parte observada sem censura de X = (x

₁

, ..., x

_n

) por W = (w

₁

, ..., w

_m

) e com censura por Z = (z

_m₊₁

, ..., z

_n

) com z

_i

> T

_i

. Integrando L(X | ϑ) com respeito a Z, obtemos

L(W ; ϑ) =

L(W, Z ; ϑ) dZ =

L(W ; ϑ)L(Z; ϑ) dZ

= L(W ; ϑ)

L(Z ; ϑ) dZ

=

m i=1

f (w

_i

)

zj>Tj

n j=m+1

f(z

_j

)dz

_j

=

m i=1

f (w

_i

)

n j=m+1

zj>Tj

f(z

_j

)dz

_j

,

=

m i=1

f (w

_i

)

n j=m+1

1 −

zj<Tj

f (z

_j

)dz

_j

=

m i=1

f (w

_i

)

n j=m+1

[1 − F (T

_j

)] ,

usando a nota¸c˜ ao (y

_i

, δ

_i

) com y

_i

= min(x

_i

, T

_i

) e a express˜ ao (2.5), temos a seguinte forma para a verossimilhan¸ca com dados censurados (censura tipo I)

L(y, δ; ϑ) =

n i=1

[f (y

_i

)]

^δⁱ

[1 − F (y

_i

)]

¹^−δⁱ

. (2.6)

Para maiores informa¸c˜ oes veja a referˆ encia Park and Lee (2012).

Deﬁni¸c˜ ao 2.2 ( Censura tipo II). Sejam T

₁

, ..., T

_n

vari´ aveis aleat´ orias indepen-

dente e identicamente distribu´ıdas que caracterizam tempos de falhas, com fun¸c˜ ao

densidade de probabilidade e fun¸c˜ ao acumulada dadas por f ( · ; ϑ) e F ( · ; ϑ), respecti-

vamente, onde ϑ ´ e um parˆ ametro. Seja m < n o n´ umero pr´ e-ﬁxado de falhas obser-

vadas. Uma amostra sob esquema de censura do tipo II ´ e uma amostra X

₍₁₎

, ..., X

₍_n₎

(15)

tal que X

₍₁₎

, ..., X

₍_n₎

s˜ ao estat´ısticas de ordem deﬁnidas por

X

₍_i₎

=

⎧ ⎨

⎩

T

₍_i₎

, se T

₍_i₎

≤ T

₍_m₎

T

₍_m₎

, se T

₍_i₎

> T

₍_m₎

, onde T

₍_m₎

´ e o tempo de vida aleat´ orio da m-´ esima falha.

Obtemos agora a fun¸c˜ ao de verossimilhan¸ca para o parˆ ametro ϑ. Con- siderando x

₍₁₎

, ..., x

₍_n₎

os valores observados de X

₍₁₎

, ..., X

₍_n₎

, a fun¸c˜ ao de verossimilhan¸ca para este modelo com m falhas observadas ´ e dada por

L(ϑ) = n!

(n − m)!

m i=1

f(x

₍_i₎

; ϑ)

ⁿ

i=m+1

1 − F (x

₍_m₎

)

, (2.7)

onde x

₍₁₎

≤ x

₍₂₎

≤ · · · ≤ x

₍_m₎

e x

₍_m₊₁₎

= · · · = x

₍_n₎

= x

₍_m₎

.

Para maiores informa¸c˜ oes veja a referˆ encia Park and Lee (2012).

(16)

3 CORREC ¸ ˜ AO DO VI´ ES DO MODELO DE GUMBEL COM CENSURA TIPO I

Seja Y

₁

, ..., Y

_n

uma amostra aleat´ oria, onde cada Y

_i

seja independente com fun¸c˜ ao de densidade de probabilidade dada por (2.1), com parˆ ametro de localiza¸c˜ ao μ

_i

e parˆ ametro de escala φ

_i

, para i = 1, 2, ..., n. Suponha que as componentes de ambos os vetores param´ etricos μ = (μ

₁

, ..., μ

_n

)

^T

e φ = (φ

₁

, ..., φ

_n

)

^T

variam de acordo com as observa¸c˜ oes atrav´ es do modelo de regress˜ ao n˜ ao-linear.

O modelo de Gumbel com covariadas para a localiza¸c˜ ao e escala ´ e de- ﬁnido por (2.1) e por dois componentes sistem´ aticos dados por

g

₁

(μ) = η

₁

= f

₁

(X; β), g

₂

(φ) = η

₂

= f

₂

(Z ; θ), (3.1) onde β = (β

₁

, ..., βp)

^T

e θ = (θ

₁

, ..., θ

_q

)

^T

s˜ ao vetores de parˆ ametros de regress˜ ao desconhecidos a serem estimados (β ∈ R

^p

e θ ∈ R

^q

). Aqui, f

₁

(X; β) e f

₂

(Z ; θ) s˜ ao fun¸c˜ oes de classe C

³

(possivelmente n˜ ao lineares). Finalmente, g

₁

( · ) e g

₂

( · ) s˜ ao fun¸c˜ oes de liga¸c˜ ao conhecidas mon´ otonas e trˆ es vezes diferenci´ aveis com dom´ınios R e R

⁺

, respectivamente. Sejam X e Z matrizes n × p e n × q com posto(X) = p e posto(Z) = q, respectivamente; X e Z n˜ ao s˜ ao necessariamente diferentes.

Sabemos que a fun¸c˜ ao acumulada de (2.1), ´ e G(y) = 1 − exp

− exp

y − μ φ

, (3.2)

isto ´ e veriﬁcado no Apˆ endice(A).

Considere ϑ = (β, θ) na express˜ ao (2.6), ´ e usando as express˜ oes (2.1) e (3.2) na express˜ ao (2.6), obtemos a seguinte express˜ ao para a verossimilhan¸ca

L(y, δ; β, φ) =

n i=1

1 φ

_i

exp

y

_i

− μ

_i

φ

_i

exp

−exp

y

_i

− μ

_i

φ

_i

_δ_i

· exp

−exp

y

_i

− μ

_i

φ

_i

_1−δ_i

(17)

=

n i=1

1 φ

_i

_δ_i

exp

y

_i

− μ

_i

φ

_i

− exp

y

_i

− μ

_i

φ

_i

_δ_i

· exp

−(1 − δ

_i

) exp

y

_i

− μ

_i

φ

_i

=

n i=1

1 φ

^δ_iⁱ

exp

δ

_i

y

_i

− μ

_i

φ

_i

− exp

y

_i

− μ

_i

φ

_i

· exp

−(1 − δ

_i

) exp

y

_i

− μ

_i

φ

_i

.

Agora, calcularemos a fun¸c˜ ao log-verossimilhan¸ca, basta aplicarmos a fun¸c˜ ao logaritmo na express˜ ao acima, assim

l = log(L(y, δ; β, φ))

= log

_n

i=1

1 φ

^δ_iⁱ

exp

δ

_i

y

_i

− μ

_i

φ

_i

− exp

y

_i

− μ

_i

φ

_i

· exp

− (1 − δ

_i

) exp

y

_i

− μ

_i

φ

_i

=

n

i=1

log

1 φ

^δ_iⁱ

+

n i=1

δ

_i

y

_i

− μ

_i

φ

_i

− exp

y

_i

− μ

_i

φ

_i

−

n i=1

(1 − δ

_i

)exp

y

_i

− μ

_i

φ

_i

= −

n i=1

log(φ

^δ_iⁱ

) +

n i=1

δ

_i

y

_i

− μ

_i

φ

_i

− exp

y

_i

− μ

_i

φ

_i

−

n i=1

(1 − δ

_i

)exp

y

_i

− μ

_i

φ

_i

= −

n i=1

δ

_i

· log(φ

_i

) +

n i=1

δ

_i

y

_i

− μ

_i

φ

_i

− exp

y

_i

− μ

_i

φ

_i

−

n i=1

(1 − δ

_i

)exp

y

_i

− μ

_i

φ

_i

= δ

_i

−

n

i=1

log(φ

_i

) +

n i=1

y

_i

− μ

_i

φ

_i

−

n i=1

exp

y

_i

− μ

_i

φ

_i

+

n i=1

exp

y

_i

− μ

_i

φ

_i

−

n i=1

exp

y

_i

− μ

_i

φ

_i

= −

n i=1

δ

_i

log(φ

_i

) +

n

i=1

δ

_i

y

_i

− μ

_i

φ

_i

−

n i=1

exp

y

_i

− μ

_i

φ

_i

,

com μ

_i

e φ

_i

deﬁnida por (3.1).

A fun¸c˜ ao escore ´ e deﬁnida por U = U (β, θ) = (∂l/∂β

^T

, ∂l/∂θ

^T

)

^T

. Seja y

_i^◦

= exp(y

_i

/φ

_i

), μ

^◦_i

= exp(μ

_i

/φ

_i

) e v

_i

= δ

_i

( − 1 − (y

_i

− μ

_i

)/φ

_i

) + exp((y

_i

− μ

_i

)/φ

_i

)(y

_i

− μ

_i

)/φ

_i

, para i = 1, ..., n. Temos que

U

_j

(β, θ) = ∂l

∂β

_j

= ∂l

∂μ

_i

dμ

_i

dη

₁_i

∂η

₁_i

∂β

_j

, j = 1, ..., p.

U

_J

(β, θ) = ∂l

∂θ

_J

= ∂l

∂φ

_i

dφ

_i

dη

₂_i

∂η

₂_i

∂θ

_J

, J = 1, ..., q.

Logo,

U

_j

(β, θ) = ∂l

∂β

_j

=

n

i=1

1 μ

^◦_i

φ

_i

(y

_i^◦

− δ

_i

μ

^◦_i

) dμ

_i

dη

₁_i

∂η

₁_i

∂β

_j

, j = 1, ..., p, U

_J

(β, θ) = ∂l

∂θ

_J

=

n

i=1

v

_i

1 φ

_i

dφ

_i

dη

₂_i

∂η

₂_i

∂θ

_J

, J = 1, ..., q,

(18)

para mais detalhes ver o Apˆ endice(B).

Em nota¸c˜ ao matricial, temos que U

_j

(β, θ) = ∂l

∂β

_j

= X

^T

Ω

⁻¹

M

₁

u

₁

, e

U

_J

(β, θ) = ∂l

∂β

_J

= S

^T

Ω

⁻¹

M

₂

v

₁

, onde os vetores de ordem n × 1, u

₁

=

− δ

₁

+ exp

y1−μ1

φ1

, ..., − δ

_n

+ exp

yn−μn

φn

_T

, v

₁

= (v

₁

, v

₂

, ..., v

_n

) e as matrizes X =

∂η1i

∂βj

i,j

de ordem n × p, S =

∂η2i

∂βJ

i,J

de ordem n × q, e as matrizes de ordem n × n, Ω = diag(φ

_i

), M

₁

= diag

dμi

dη1i

e M

₂

= diag

dφi

dη2i

.

Os estimadores de m´ axima verossimilhan¸ca para os parˆ ametros β e θ s˜ ao obtidos resolvendo o sistema n˜ ao linear U = 0 e n˜ ao h´ a uma forma fechada para tal solu¸c˜ ao; Portanto, utilizamos um algoritmo de optimiza¸c˜ ao n˜ ao linear, como o algoritmo de Newton ou quase-Newton, para encontrar estimadores de m´ axima verossimilhan¸ca.

A matriz informa¸c˜ ao de Fisher ´ e dada por K

= K

(β, θ) =

⎛

⎝ K

_ββ¹

K

_βθ¹

K

_θβ¹

K

_θθ¹

⎞

⎠ =

⎛

⎝ X

^T

W

_ββ¹

X X

^T

W

_βθ¹

S S

^T

W

_θβ¹

X S

^T

W

_θθ¹

S

⎞

⎠ .

onde, usamos as seguintes matrizes diagonais para obtermos a matriz de Fisher, W

_ββ¹

= diag

h

₂_i

φ

²_i

dμi

dη1i

2

,

W

_θθ¹

= diag

( − h

₁_i

− 2h

₃_i

+ h

₅_i

+ 2h

₄_i

) φ

²_i

dφi

dη2i

2

e

W

_βθ¹

= diag

(h

₄_i

) φ

²_i

dμi

dη1i

dφi

dη2i

.

(19)

A inversa da matriz de Fisher ´ e dada por (K

)

⁻¹

= (K

)

⁻¹

(β, θ) =

⎛

⎝ K

_ββ¹

K

_βθ¹

K

_θβ¹

K

_θθ¹

⎞

⎠

−1

.

Deﬁnimos as matrizes X e W

₁

com dimens˜ oes 2n × (p + q) e 2n × 2n respectivamente, com

X =

⎛

⎝ X 0 0 S

⎞

⎠ e W

₁

=

⎛

⎝ W

_ββ¹

W

_βθ¹

W

_θβ¹

W

_θθ¹

⎞

⎠ .

Ent˜ ao podemos escrever a matriz de Fisher como K

= X

^T

W

₁

X .

3.1 Corre¸c˜ ao Do Vi´ es De Um EMVs

Nesta se¸c˜ ao, obtemos uma express˜ ao para os vieses de segunda ordem dos EMVs dos parˆ ametros do modelo geral de regress˜ ao do valor extremo usando Cox e Snell (1968). As derivadas parciais da log-verossimilhan¸ca com respeito as componentes dos vetores desconhecidos β e θ s˜ ao indicados pelos indices { j, l, ... } e { J, L, ... } , respectivamente. Assim, deﬁnimos U

_j

= ∂l/∂β

_j

, U

_J

= ∂l/∂θ

_J

, U

_jL

=

∂

²

l/∂β

_j

∂θ

_L

, U

_jlM

= ∂

³

l/∂β

_j

∂β

_l

∂θ

_M

e etc. Para denotar os cumulantes das derivadas parciais acima, usamos a nota¸c˜ ao introduzida por Lawley (1956): k

_jl

= E(U

_jl

), k

_j,l

= E(U

_j

U

_l

), k

_jl,M

= E(U

_jl

U

_M

) e etc, em geral k’s s˜ ao da ordem de O(n). As derivadas destes cumulantes s˜ ao denotadas da seguinte forma k

_jl⁽^m⁾

= ∂k

_jl

/∂β

_m

, k

⁽_jl^M⁾

= ∂k

_jl

/∂θ

_M

e etc. Nem todos os k’s s˜ ao necessariamente independentes. Seja k

^j,l

= − k

^jl

e k

^J,L

= − k

^JL

os elementos de seus respectivos inversos K

_ββ

e K

_θθ

que s˜ ao O(n

⁻¹

).

A f´ ormula de Cox e Snell (1968) pode ser usada para obter o vi´ es

segunda ordem do EMV para a a-´ esima componente do vetor param´ etrico τ =

(20)

( τ

₁

, ..., τ

_p₊_q

) = ( β

^T

, θ

^T

), a qual ´ e dada por B( τ

_a

) =

j,l,m

k

^aj

k

^lm

k

⁽_jl^m⁾

−

¹₂

k

_jlm

+

J,l,m

k

^aJ

k

^lm

k

_Jl⁽^m⁾

−

¹₂

k

_Jlm

+

j,L,m

k

^aj

k

^Lm

k

_jL⁽^m⁾

−

¹₂

k

_jLm

+

j,l,M

k

^aj

k

^lM

k

_jl⁽^M⁾

−

¹₂

k

_jlM

+

J,L,m

k

^aJ

k

^Lm

k

⁽_JL^m⁾

−

¹₂

k

_JLm

+

J,l,M

k

^aJ

k

^lM

k

⁽_Jl^M⁾

−

¹₂

k

_JlM

+

j,L,M

k

^aj

k

^LM

k

_jL⁽^M⁾

−

¹₂

k

_jLM

+

J,L,M

k

^aJ

k

^LM

k

_JL⁽^M⁾

−

¹₂

k

_JLM

(3.3)

Os parˆ ametros β e θ n˜ ao s˜ ao ortogonais. Assim as entradas da matriz W

_βθ

n˜ ao s˜ ao todas nulas. Por isso, todos os termos em (4.2) devem ser considerados.

3.2 Corre¸c˜ ao do vi´ es dos MLEs para o modelo de Gumbel com censura tipo I

Usando a express˜ ao (4.2) e utilizando algumas manipula¸c˜ oes alg´ ebricas, que pode ser encontrada no Apˆ endice (B), podemos obter uma express˜ ao para o vi´ es de segunda ordem de β e θ na forma matricial:

B

₁

( β) = K

₁^ββ

X

^T

W

₁

Z

_βd

+ W

₂

D

_β

+ (W

₃

+ W

₅

)Z

_βθd

+ W

₄

D

_θ

+ W

₇

Z

_θd

1

_n×₁

+ K

₁^βθ

S

^T

W

₃

Z

_βd

+ W

₄

D

_β

+ (W

₆

+ W

₇

)Z

_βθd

+ W

₈

Z

_θd

+ W

₉

D

_θ

1

_n×₁

, (3.4) e

B

₁

( θ) = K

₁^θβ

X

^T

W

₁

Z

_βd

+ W

₂

D

_β

+ (W

₃

+ W

₅

)Z

_βθd

+ W

₄

D

_θ

+ W

₇

Z

_θd

1

_n×₁

+ K

₁^θθ

S

^T

W

₃

Z

_βd

+ W

₄

D

_β

+ (W

₆

+ W

₇

)Z

_βθd

+ W

₈

Z

_θd

+ W

₉

D

_θ

1

_n×₁

, (3.5)

onde W

_k

= diag { w

_k₁

, ..., w

_kn

} para i = 1, ..., n e k = 1, ..., 9, 1

_n×₁

denota um

vetor com n entradas igual a 1, Z

_βd

= diag( XK

₁^ββ

X

^T

), Z

_βθd

= diag( XK

₁^ββ

S

^T

),

(21)

Z

_θd

= diag( SK

₁^θθ

S

^T

), D

_β

= diag(d

₁_β

, ..., d

_nβ

) e D

_θ

= diag(d

₁_θ

, ..., d

_nθ

) com d

_iβ

= tr( XK

₁^ββ

), d

_iθ

= tr( SK

₁^θθ

), X

_i

= (∂

²

η

₁

i/∂β

_j

β

_l

)

_j,l

e S

_i

= (∂

²

η

₂

i/∂θ

_J

θ

_L

)

_j,l

para i = 1, ..., n.

Considere os vetores de ordem (2n × 1), δ

₁

e δ

₂

como δ

₁

=

⎛

⎝ [W

₁

Z

_βd

+ (W

₃

+ W

₅

)Z

_βθd

+ W

₇

Z

_θd

]1

_n×₁

[W

₃

Z

_βd

+ (W

₆

+ W

₇

)Z

_βθd

+ W

₈

Z

_θd

]1

_n×₁

⎞

⎠ (3.6)

e

δ

₂

=

⎛

⎝ [W

₂

D

_β

+ W

₄

D

_θ

]1

_n×₁

[W

₄

D

_β

+ W

₉

D

_θ

]1

_n×₁

⎞

⎠ (3.7)

os blocos inferiores de ordem p × (p + q) e superior de ordem q × (p + q) da matriz K

₁

(τ )

⁻¹

por K

₁^β∗

= (k

₁^ββ

k

₁^βθ

) e K

₁^θ∗

= (k

₁^θβ

k

^θθ₁

), respectivamente. Com estas express˜ oes, podemos escrever o vi´ es de segunda ordem de β e θ como

B

₁

( β) = K

₁^β∗

X

^T

(δ

₁

+ δ

₂

) e B

₁

( θ) = K

₁^θ∗

X

^T

(δ

₁

+ δ

₂

), (3.8) respectivamente. Ent˜ ao, por (3.8) conclu´ımos que o vi´ es de segunda ordem do EMV do vetor conjunto τ = ( β

^T

, θ

^T

) possui a forma

B

₁

( τ) = K

₁⁻¹

X

^T

(δ

₁

+ δ

₂

) = ( X

^T

W

₁

X )

⁻¹

X

^T

(δ

₁

+ δ

₂

).

Deﬁnindo ξ

₁

= W

₁⁻¹

δ

₁

e ξ

₂

= W

₁⁻¹

δ

₂

, assim

B

₁

( τ) = ( X

^T

W

₁

X )

⁻¹

X

^T

W

₁

(ξ

₁

+ ξ

₂

). (3.9)

A f´ ormula (4.8) mostra que o vi´ es de segunda ordem de τ e facilmente obtida com os vetores dos coeﬁcientes de regress˜ ao na forma de regress˜ ao linear de ξ

₁

e ξ

₂

nas colunas de X com W

₁

sendo a matriz peso. Podemos expressar (4.8) como

B

₁

( τ ) = B

₁

( τ ) + B

₂

( τ),

(22)

com B

₁

( τ) = ( X

^T

W

₁

X )

⁻¹

X

^T

W

₁

ξ

₁

e B

₂

( τ ) = ( X

^T

W

₁

X )

⁻¹

X

^T

W

₁

ξ

₂

.

Se ξ

₂

= 0, a f´ ormula (4.8) d´ a o vi´ es de segunda ordem para Modelos Lineares de Valores Extremo de Regress˜ ao com covariav´ eis de dispers˜ ao linear. Por- tanto, B

₁

( τ) e B

₂

( τ) podem ser considerados respectivamente, como a linearidade e n˜ ao-linearidade em termos do vi´ es total.

3.3 Corre¸c˜ ao Do Vi´ es De Um MLEs De μ e φ

Primeiramente, expandimos as fun¸c˜ oes η

₁_i

= f

₁

(x

^T_i

, β) e η

₂_i

= f

₂

(x

^T_i

, θ) dado em (3.1) em s´ erie de Taylor at´ e a segunda ordem em torno dos pontos β e θ, respectivamente, obtemos

η

₁_i

− η

₁_i

= X

_i^T

( β − β) + 1

2 ( β − β)

^T

X

_i

( β − β) + o

_p

( ( β − β)

²

) e

η

₂_i

− η

₂_i

= S

_i^T

( θ − θ) + 1

2 ( θ − θ)

^T

S

_i

( θ − θ) + o

_p

( ( θ − θ)

²

)

onde X

_i

e S

_i

s˜ ao a i-´ esima linha das matrizes X e S respectivamente. Assim, os vieses de segunda ordem de η

₁_i

e η

₂_i

na nota¸c˜ ao matricial s˜ ao dados por

B( η

₁_i

) = XB( β) + 1

2 D

_β

1

_n×₁

e B( η

₂_i

) = SB( θ) + 1

2 D

_θ

1

_n×₁

Vamos agora expandir as fun¸c˜ oes μ

₁_i

= g

₁⁻¹

( η

₁_i

) e φ

₁_i

= g

₂⁻¹

( η

₂_i

) em s´ eries de taylor at´ e a segunda ordem, em torno dos pontos η

₁_i

e η

₂_i

respectivamente.

Com isto, segue que

μ

_i

− μ

_i

= dμ

_i

dη

₁_i

( η

₁_i

− η

₁_i

) + 1 2

d

²

μ

_i

dη

²₁_i

( η

₁_i

− η

₁_i

)

²

+ o

_p

(( η

₁_i

− η

₁_i

)

²

) e

φ

_i

− φ

_i

= dφ

_i

dη

₂_i

( η

₂_i

− η

₂_i

) + 1 2

d

²

φ

_i

dη

²₂_i

( η

₂_i

− η

₂_i

)

²

+ o

_p

(( η

₂_i

− η

₂_i

)

²

)

(23)

Assim, obtemos os vieses de segunda ordem de μ

_i

e φ

_i

B( μ

_i

) = B( η

₁_i

) dμ

_i

dη

₁_i

+ 1

2 V ar( η

₁_i

) d

²

μ

_i

dη

₁²_i

e B( φ

_i

) = B( η

₂_i

) dφ

_i

dη

₂_i

+ 1

2 V ar( η

₂_i

) d

²

φ

_i

dη

₂²_i

(3.10) A f´ ormula anterior ir´ a nos fornecer uma express˜ ao para os vies de segunda ordem do EMVs de μ e φ, em nota¸c˜ ao matricial, ﬁca como segue

B

₁

( μ

_i

) = 1 2

M

₁

[2 XB

₁

( β) + D

_β

1

_n×₁

] + Z

_βd

T

₁

1

_n×₁

e

B

₁

( φ

_i

) = 1 2

M

₂

[2 SB

₁

( θ) + D

_θ

1

_n×₁

] + Z

_θd

T

₂

1

_n×₁

Para o modelo de regress˜ ao dos valores extremos, usando (3.8) temos, B

₁

( μ

_i

) = 1

2 M

₁

[2 XK

₁^β∗

X

^T

(δ

₁

+ δ

₂

) + D

_β

1

_n×₁

] + Z

_βd

T

₁

1

_n×₁

e

B

₁

( φ

_i

) = 1 2

M

₂

[2 SK

₁^θ∗

X

^T

(δ

₁

+ δ

₂

) + D

_θ

1

_n×₁

] + Z

_θd

T

₂

1

_n×₁

Deﬁnimos as matrizes diagonais T

₁

= diag { d

²

μ

_i

/dη

²₁_i

} e T

₂

= diag { d

²

φ

_i

/dη

₂²_i

} de ordem n.

Os estimadores corrigidos μ = μ − B

₁

( μ) e φ = φ − B

₁

( φ) de μ e φ

respectivamente, tem vi´ eses de ordem O(n

⁻²

), onde B

₁

( · ) denota o EMV de B

₁

( · ),

isto ´ e, os parˆ ametros desconhecidos s˜ ao substitu´ıdos por seus EMVs.

(24)

4 CORREC ¸ ˜ AO DO VI´ ES DO MODELO DE GUMBEL COM CENSURA TIPO II

Seja Y

₁

, Y

₂

, ..., Y

_k

uma amostra aleat´ oria, onde cada Y

_i

tem a fun¸c˜ ao de densidade de probabilidade dada por (2.1), com parˆ ametro de localiza¸c˜ ao μ

_i

e parˆ ametro de escala φ

_i

, para i = 1, 2, ..., k. Suponha que os componentes de ambos os vetores param´ etricos μ = (μ

₁

, ..., μ

_n

)

^T

e φ = (φ

₁

, ..., φ

_n

)

^T

variam de acordo com as observa¸c˜ oes atrav´ es do modelo de regress˜ ao n˜ ao-linear.

O modelo de Gumbel com covariadas para a localiza¸c˜ ao e a dispers˜ ao

´ e deﬁnido por (2.1), seja X e Z as matrizes de dados, onde X

_i

= (X

_i₁

, ..., X

_ip

) denota a i-´ esima linha de X e

Z

_i

= (Z

_i₁

, ..., Z

_ip

) denota a i-´ esima linha de Z.

Deﬁnimos

g

₁

(μ

_i

) = η

₁_i

= f

₁

(X

_i

; β) e g

₂

(φ

_i

) = η

₂_i

= f

₂

(Z

_i

; θ), (4.1) onde β = (β

₁

, ..., βp)

^T

e θ = (θ

₁

, ..., θ

_q

)

^T

s˜ ao vetores de parˆ ametros de regress˜ ao desconhecidos a serem estimados (β ∈ R

^p

e θ ∈ R

^q

). Aqui, f

₁

(X

_i

; β) e f

₂

(Z

_i

; θ) s˜ ao fun¸c˜ oes de classe C

³

(possivelmente n˜ ao lineares). Finalmente, g

₁

( · ) e g

₂

( · ) s˜ ao fun¸c˜ oes de liga¸c˜ ao conhecidas mon´ otonas e trˆ es vezes diferenci´ aveis com dom´ınios R e R

⁺

, respectivamente. Sejam X e Z matrizes n × p e n × q com posto(X) = p e posto(Z) = q, respectivamente; X e Z n˜ ao s˜ ao necessariamente diferentes.

Obtemos Y

₁_,i

, Y

₂_,i

, ..., Y

_n_i_,i

observa¸c˜ oes independentes e identicamente distribu´ıdas. A censura tipo II ´ e feita em cima de cada coluna da ”matriz” Y = { Y

_si

} com s = 1, 2, ..., n

_i

e i = 1, 2, ..., k. Observe que Y como deﬁnido anteriormente n˜ ao

´ e matriz, pois o n´ umero de elementos das linhas variam com a coluna.

(25)

Assim ordenamos,

Y

₍₁_,n_i₎

≤ Y

₍₂_,n_i₎

≤ ... ≤ Y

₍_r,n_i₎

≤ ... ≤ Y

₍_r,n_i₎

.

Como Y

₍₁_,n

i)

, Y

₍₂_,n

i)

, ..., Y

₍_r,n

i)

, ..., Y

₍_r,n

i)

est˜ ao sob censura do tipo II, a fun¸c˜ ao de verossiminhan¸ca de Gumbel com censura tipo II, ´ e abtida tomando ϑ = (β, θ) na express˜ ao (2.7) ´ e usando (2.1) e (3.2) na express˜ ao (2.7), obtemos

L

_i

(β, θ) = n

_i

! (n

_i

− r)

r s=1

f(Y

₍_s,n_i₎

; β, θ)

ni

s=r+1

(1 − F (Y

₍_r,n_i₎

; β, θ))

= n

_i

! (n

_i

− r)

r s=1

f(Y

₍_s,n_i₎

; β, θ)

1 − F (Y

₍_r,n_i₎

; β, θ)

_n_i_−r

.

Como os Y

₁

, Y

₂

, ..., Y

_k

s˜ ao independentes, temos L(β, θ) =

k i=1

L

_i

(β, θ).

Aplicando a fun¸c˜ ao logaritmo na express˜ ao anterior, iremos obter a fun¸c˜ ao log-verossimilhan¸ca, dada por

l = log(L(β, θ)) =

k

i=1

l

_i

(β, θ),

onde, l

_i

(β, θ) = log

ni!

(ni−r)!

+

r s=1

log(f (Y

₍_s,n_i₎

; β, θ) + (n

_i

− r) log(1 − F (Y

₍_r,n_i₎

; β, θ)).

Dessa forma, temos l = log(L(β, θ)) =

k i=1

l

_i

(β, θ)

=

k i=1

log

n

_i

! (n

_i

− r)!

+

r s=1

log 1

φ

_i

exp

y

₍_s,n_i₎

− μ

_i

φ

_i

exp

− exp

y

₍_s,n_i₎

− μ

_i

φ

_i

+(n

_i

− r) log

exp

− exp

y

₍_r,n_i₎

− μ

_i

φ

_i

=

k i=1

log

n

_i

! (n

_i

− r)!

+

r s=1

log 1

φ

_i

+

r s=1

y

₍_s,n_i₎

− μ

_i

φ

_i

−

r s=1

exp

y

₍_s,n_i₎

− μ

_i

φ

_i

− (n

_i

− r) exp

y

₍_r,n_i₎

− μ

_i

φ

_i