UNIVERSIDADE FEDERAL DA PARA´IBA CENTRO DE INFORM ´ ATICA
PROGRAMA DE P ´ OS-GRADUAC ¸ ˜ AO EM
MODELAGEM MATEM ´ ATICA E COMPUTACIONAL
Corre¸c˜ ao De Vi´ es Do Modelo De Gumbel Com Censura Tipo I E Tipo II
por
Suelena Rocha
Disserta¸c˜ ao submetida como requisito parcial para a obten¸c˜ ao do grau de
Mestre em Modelagem Matem´ atica e Computacional
Prof. Dr. Alexandre Simas Orientador
Jo˜ ao Pessoa, Mar¸co de 2016.
Suelena de Souza Rocha
Correção De Viés Do Modelo De
Gumbel Com Censura Tipo I E Tipo II
Dissertação submetida ao Programa de Pós-Graduãção em Modelagem Matemática e Computacional do Centro de Informática da Universidade Federal da Paraíba, como requisito parcial para a obtenção do grau de Mestre em Modelagem Matemática e Computacional.
Orientador: Prof. Dr. Alexandre B. Simas.
João Pessoa – PB
Março de 2016
R672c Rocha, Suelana de Souza.
Correção de viés do modelo de Gumbel com censura tipo I e tipo II / Suelana de Souza Rocha.- João Pessoa, 2016.
80f.
Orientador: Alexandre Simas Dissertação (Mestrado) - UFPB/CI
1. Matemática computacional - modelagem. 2. Modelo de Gumbel. 3. Censura tipo I. 4. Censura tipo II.
UFPB/BC CDU: 519.6(043)
AGRADECIMENTOS
Agrade¸co primeiramente a Deus que est´ a sempre comigo e a Nossa Senhora.
A minha fam´ılia, em especial, aos meus pais, que sempre me incen- ` tivaram a estudar e a lutar pelos meus sonhos e a minha irm˜ a Suelen de Souza Rocha.
Ao professor, Alexandre Bustamante Simas, meu orientador, pelos co- nhecimentos transmitidos, compreens˜ ao, aten¸c˜ ao, incentivo e pela confian¸ca deposi- tada em mim e ` a professora Andrea Vanessa Rocha.
Aos professores da P´ os-Gradua¸c˜ ao em Modelagem Matem´ atica Com- putacional.
A banca examinadora: Prof. Dr. Alberto Masayoshi Faria Ohashi. e ` Prof. Dr. Wagner Barreto de Souza, por aceitarem participar da avalia¸c˜ ao deste trabalho.
Aos meus amigos que estiveram ao meu lado durante o mestrado, com-
partilhando felicidades e dificuldades, em especial ` a Josenildo Silva de Lima, Maria
Aparecida Silva de Andrade, Ricardo Pinheiro da Costa, Thiago Luis de Oliveira do
Rˆ ego e Victor Jos´ e Araujo de Carvalho.
Sum´ ario
AGRADECIMENTOS . . . . v
RESUMO . . . . viii
ABSTRACT . . . . ix
1 INTRODUC ¸ ˜ AO . . . . 1
2 CONHECIMENTOS PRELIMINARES . . . . 4
3 CORREC ¸ ˜ AO DO VI´ ES DO MODELO DE GUMBEL COM CEN- SURA TIPO I . . . . 7
3.1 Corre¸c˜ ao Do Vi´ es De Um EMVs . . . . 10
3.2 Corre¸c˜ ao do vi´ es dos MLEs para o modelo de Gumbel com censura tipo I . . . . 11
3.3 Corre¸c˜ ao Do Vi´ es De Um MLEs De μ e φ . . . . 13
4 CORREC ¸ ˜ AO DO VI´ ES DO MODELO DE GUMBEL COM CEN- SURA TIPO II . . . . 15
4.1 Corre¸c˜ ao Do Vi´ es De Um EMVs . . . . 19
4.2 Corre¸c˜ ao do vi´ es dos MLEs para o modelo de Gumbel com censura tipo I . . . . 20
4.3 Corre¸c˜ ao Do Vi´ es De Um MLEs De μ e φ . . . . 22
5 ANALISE NUM´ ERICA . . . . 24
5.1 Simula¸c˜ ao . . . . 24
5.2 Aplica¸c˜ ao . . . . 25
APˆ ENDICE A . . . . 29
APˆ ENDICE B . . . . 32
APˆ ENDICE C . . . . 50
RESUMO
Nesta disserta¸c˜ ao, usamos o modelo de Gumbel; Inicialmente obtivermos a matriz de informa¸c˜ ao de Fisher e a escrevermos na sua forma matricial, depois calculamos os cumulantes de segunda e terceira ordem, posteriormente derivamos os cumulantes de segunda ordem com respeito aos parˆ ametros. Em seguida, subtra´ımos das derivadas dos cumulantes de segunda ordem os cumulantes de terceira ordem e substitu´ımos estes valores na express˜ ao de Cox e Snell para obten¸c˜ ao da corre¸c˜ ao do Vi´ es. Utili- zamos a f´ ormula encontrada em Cox and Snell (1968), pois a partir de tal resultado, podemos definir um estimador corrigido ˜ θ
a= ˆ θ
a− B ˆ (ˆ θ
a), onde ˆ B(ˆ θ
a) ´ e o vi´ es es- timado de ˆ θ
a, onde ˜ θ
atem vi´ es de ordem O(n
−2). Logo ` a medida que o tamanho amostral n aumenta, esperamos que o vi´ es de ˜ θ
aaproxime-se mais rapidamente de zero que o vi´ es de ˆ θ
a. Faremos a corre¸c˜ ao do vi´ es para o modelo de Gumbel com censura tipo I e tipo II.
Palavras Chave: Gumbel, censura tipo I, censura tipo II.
ABSTRACT
In this thesis, we use the model of Gumbel; Initially we had the Fisher information matrix and we write in a matrix form, then calculated the second- and third-order cumulants later derive the second order cumulants with respect to the parameters.
Then we subtract the derivatives of the second order cumulants the third order cumulants and replace these values in the expression of Cox and Snell to obtain the correction of bias.We use the formula found in Cox and Snell (1968), because from what outcome we can define a corrected estimator ˜ θ
a= ˆ θ
a− B ˆ (ˆ θ
a), where ˆ B(ˆ θ
a) it is the estimated bias ˆ θ
a, where ˜ θ
ahas order bias O(n
−2). As soon as the sample size n increases, we expect the bias ˜ θ
aapproaches zero faster than the bias ˆ θ
a. We will correct the bias for the model with censorship Gumbel type I and type II.
Palavras Chave: Gumbel, censorship type I, censorship type II.
1 INTRODUC ¸ ˜ AO
A distribui¸c˜ ao de valor extremo, assim denominado por Emil Julius Gumbel (1891-1966), ´ e conhecida como distribui¸c˜ ao de Gumbel e distribui¸c˜ ao log- Weibull. Os primeiros problemas envolvendo o valor extremo surgiu das inunda¸c˜ oes;
sua importˆ ancia econˆ omica foi not´ avel desde o surgimento da economia agr´ aria, es- sencialmente nos que se baseava no fluxo de ´ agua e hidrovias, pois este era o prin- cipal sistema de comunica¸c˜ ao da ´ epoca. Sua importˆ ancia se destacou ainda mais na economia industrial com a constru¸c˜ ao de usinas hidroel´ etricas e reservat´ orios para irriga¸c˜ ao e luta contra eros˜ ao. O que incentivou o estudo deste tema, foi a im- portˆ ancia social do controle do fluxo de ´ agua. A natureza estat´ıstica desde problema fez com que os procedimentos emp´ıricos usados inicialmente fossem substitu´ıdos por m´ etodos derivados da teoria dos valores extremos.
Esta teoria tem atra´ıdo cientista das mais diversas ´ areas, como por exemplos as engenharias (naval, e´ olica, civil), meteorologia, geologia, estat´ıstica populacional e outras. Em Kotz and Nadarajah (2000) podemos encontrar algumas aplica¸c˜ oes, como por exemplo, terremotos, corridas de cavalo, tempestade, filas de supermercados, correntes mar´ıtimas, velocidade do tempo. Os recentes desastres naturais, por exemplo o fura¸c˜ ao Katrina, o terremoto do Jap˜ ao, os deslizamento de terra e as inunda¸c˜ oes devidas as fortes chuvas ocorridas na Austr´ alia, paquist˜ ao e Brasil, al´ em das crises financeiras e vazamentos de ´ oleos demonstram a necessidade de um estudo nas previs˜ oes destes fenˆ omenos mais complexos.
Nesta disserta¸c˜ ao, apresentamos um modelo geral de regress˜ ao de valor
extremo, e f´ ormulas para o vieses de segunda ordem das estimativas de m´ axima
verossimilhan¸ca (EMVs) dos parˆ ametros do nosso modelo. Quando o tamanho da
amostra ´ e grande, os vieses da EMVs s˜ ao desprez´ıveis, uma vez que em geral, sua
ordem ´ e O(n
−1), enquanto os erros padr˜ ao assint´ oticos s˜ ao de O(n
−12). Como sem-
pre, por´ em, a corre¸c˜ ao do vi´ es ´ e importante enquanto o tamanho da amostra ´ e pequeno. Na literatura, muitos autores tem obtido express˜ ao para os vieses de se- gunda ordem das EMVs em uma variedade de modelo de regress˜ ao. Box (1971) obt´ em uma express˜ ao geral para o vi´ es n
−1em modelos n˜ ao-lineares multivariados com matrizes de covariˆ ancia conhecidos. Young and Bakir (1987) mostra a utili- dade da corre¸c˜ ao do vi´ es para o modelo de regress˜ ao log-gama generalizado, que tem como caso particular o modelo linear de regress˜ ao do valor extremo. Cordeiro and McCullagh (1991) obt´ em uma f´ ormula geral matricial para a corre¸c˜ ao do vi´ es nos Modelos lineares Generalizados (MLGs). Cordeiro and Vasconcellos (1997) for- necem f´ ormulas matriciais para o vi´ es em modelos n˜ ao-lineares multivariados com erros seguindo distribui¸c˜ ao normal. Este resultado ´ e estendido por Vasconcellos and Gauss (1997) para cobrir modelos heterosced´ asticos, enquanto Cordeiro et al. (1998) calcularam o vi´ es de segunda para o modelo n˜ ao-linear de regress˜ ao t-Student uni- variado. Vasconcellos and Cordeiro (2000) obtiveram uma express˜ ao para o vi´ es de segunda ordem para o modelo de regress˜ ao n˜ ao-linear multivariado t-Student Cor- deiro and Botter (2001) obtiveram f´ ormulas gerais para o vi´ es de segunda ordem das EMVs em MLGs e Modelos N˜ ao Lineares Generalizados (MNLGs) com covari´ aveis de dispers˜ ao, respectivamente. Ospina et al. (2006) calcularam o vi´ es de segunda ordem das EMVs para o modelo de regress˜ ao linear beta. Recentemente, Simas et al. (2010) obtiveram os vieses de segunda ordem para o modelo geral de regress˜ ao beta.
Ao realizar inferˆ encia estat´ıstica a partir de dados obtidos em testes de confiabilidade, muitas vezes nos deparamos com amostras onde nem todos os tempos de falha desejados s˜ ao observados. Esses casos s˜ ao denominados censuras, isto ´ e, s˜ ao observa¸c˜ oes parciais em um estudo interrompido por alguma raz˜ ao, n˜ ao permitindo que as observa¸c˜ oes completas do tempo de falha sejam obtidas. Censuras s˜ ao recorrentes em processos de an´ alise de sobrevivˆ encia, onde o tempo e o custo de tais experimentos s˜ ao limitados, ou por diversos outros motivos alheios ao estudo e
`
as condi¸c˜ oes impostas sobre o objeto de estudo.
Faremos nosso estudo baseado no artigo de Barreto-Souza and Vascon- cellos (2011), onde encontramos a corre¸c˜ ao do vi´ es da distribui¸c˜ ao de Gumbel sem censura.
O Cap´ıtulo 1, iniciamos usando o modelo de Gumbel, calculamos a fun¸c˜ ao geradora de momentos, a esperan¸ca, variˆ ancia e temos a constru¸c˜ ao da ve- rossimilhan¸ca com censura tipo I e tipo II.
O cap´ıtulo 2, est´ a organizado em se¸c˜ oes, primeiramente, usando o mo- delo de Gumbel com censura tipo I, obtemos a fun¸c˜ ao log-verossimilhan¸ca, a fun¸c˜ ao Escore e a matriz informa¸c˜ ao de Fisher; Na Se¸c˜ ao 1, fizermos a corre¸c˜ ao do vi´ es com censura tipo I de um EMVs, utilizando a f´ ormula de Cox and Snell (1968), na Se¸c˜ ao 2, estudamos a corre¸c˜ ao do vi´ es com censura tipo I de um EMVs de μ e φ.
O cap´ıtulo 3, est´ a organizado da mesma forma que o cap´ıtulo 2, s´ o
trocamos a censura tipo I pela censura tipo II.
2 CONHECIMENTOS PRELIMINARES
Seja Y uma vari´ avel aleat´ oria com distribui¸c˜ ao de Gumbel, que possui fun¸c˜ ao de densidade de probabilidade dada por
g(y; μ, φ) = 1 φ exp
y − μ φ
exp
− exp
y − μ φ
; y ∈ R . (2.1) onde Y ∼ EV (μ, φ), com μ ∈ R e φ > 0 s˜ ao parˆ ametros de localiza¸c˜ ao e escala, respectivamente.
A fun¸c˜ ao geradora de momentos de Y ´ e dada por
E(exp (tY )) = exp (tμ) Γ(1 + φt), com t > − φ
−1. (2.2)
Assim, temos a esperan¸ca e a variˆ ancia de Y dada por
E(Y ) = μ − γφ, (2.3)
V (Y ) = π
26 φ
2, (2.4)
respectivamente, onde γ ´ e a constante de Euler, γ = lim
n→∞ni=1 1
k
− log n
≈ 0, 5772, podemos verificar os fatos (2.2), (2.3) e (2.4) no Apˆ endice(A).
Defini¸c˜ ao 2.1 ( Constru¸c˜ ao Da Verossimilhan¸ca Com Censura Tipo I). Su- ponhamos que temos uma amostra X
1, . . . , X
naleat´ oria simples da vari´ avel aleat´ oria X; Denotaremos a fun¸c˜ ao de densidade de probabilidade por f (x) e a fun¸c˜ ao de dis- tribui¸c˜ ao acumulada por F (x). Representamos a censura tipo I, pelo par (y
i, δ
i) com y
i= min(x
i, T
i),
δ
i=
⎧ ⎨
⎩
0; x
i> T
i1; x
i≤ T
i, para i = 1, ..., n. (2.5)
onde δ
i´ e a vari´ avel indicadora da censura e T
i´ e o tempo de censura relacionado a
observa¸c˜ ao. Denotaremos o vetor de parˆ ametros desconhecidos por ϑ = (ϑ
1, ..., ϑ
p).
Assim, a express˜ ao da verossimilhan¸ca ´ e:
L(X | ϑ) =
n i=1f (x
i).
Denotaremos, a parte observada sem censura de X = (x
1, ..., x
n) por W = (w
1, ..., w
m) e com censura por Z = (z
m+1, ..., z
n) com z
i> T
i. Integrando L(X | ϑ) com respeito a Z, obtemos
L(W ; ϑ) =
L(W, Z ; ϑ) dZ =
L(W ; ϑ)L(Z; ϑ) dZ
= L(W ; ϑ)
L(Z ; ϑ) dZ
=
m i=1f (w
i)
zj>Tj
n j=m+1f(z
j)dz
j=
m i=1f (w
i)
n j=m+1zj>Tj
f(z
j)dz
j,
=
m i=1f (w
i)
n j=m+11 −
zj<Tj
f (z
j)dz
j=
m i=1f (w
i)
n j=m+1[1 − F (T
j)] ,
usando a nota¸c˜ ao (y
i, δ
i) com y
i= min(x
i, T
i) e a express˜ ao (2.5), temos a seguinte forma para a verossimilhan¸ca com dados censurados (censura tipo I)
L(y, δ; ϑ) =
n i=1[f (y
i)]
δi[1 − F (y
i)]
1−δi. (2.6)
Para maiores informa¸c˜ oes veja a referˆ encia Park and Lee (2012).
Defini¸c˜ ao 2.2 ( Censura tipo II). Sejam T
1, ..., T
nvari´ aveis aleat´ orias indepen-
dente e identicamente distribu´ıdas que caracterizam tempos de falhas, com fun¸c˜ ao
densidade de probabilidade e fun¸c˜ ao acumulada dadas por f ( · ; ϑ) e F ( · ; ϑ), respecti-
vamente, onde ϑ ´ e um parˆ ametro. Seja m < n o n´ umero pr´ e-fixado de falhas obser-
vadas. Uma amostra sob esquema de censura do tipo II ´ e uma amostra X
(1), ..., X
(n)tal que X
(1), ..., X
(n)s˜ ao estat´ısticas de ordem definidas por
X
(i)=
⎧ ⎨
⎩
T
(i), se T
(i)≤ T
(m)T
(m), se T
(i)> T
(m), onde T
(m)´ e o tempo de vida aleat´ orio da m-´ esima falha.
Obtemos agora a fun¸c˜ ao de verossimilhan¸ca para o parˆ ametro ϑ. Con- siderando x
(1), ..., x
(n)os valores observados de X
(1), ..., X
(n), a fun¸c˜ ao de verossimi- lhan¸ca para este modelo com m falhas observadas ´ e dada por
L(ϑ) = n!
(n − m)!
m i=1f(x
(i); ϑ)
ni=m+1
1 − F (x
(m))
, (2.7)
onde x
(1)≤ x
(2)≤ · · · ≤ x
(m)e x
(m+1)= · · · = x
(n)= x
(m).
Para maiores informa¸c˜ oes veja a referˆ encia Park and Lee (2012).
3 CORREC ¸ ˜ AO DO VI´ ES DO MODELO DE GUMBEL COM CENSURA TIPO I
Seja Y
1, ..., Y
numa amostra aleat´ oria, onde cada Y
iseja independente com fun¸c˜ ao de densidade de probabilidade dada por (2.1), com parˆ ametro de loca- liza¸c˜ ao μ
ie parˆ ametro de escala φ
i, para i = 1, 2, ..., n. Suponha que as componentes de ambos os vetores param´ etricos μ = (μ
1, ..., μ
n)
Te φ = (φ
1, ..., φ
n)
Tvariam de acordo com as observa¸c˜ oes atrav´ es do modelo de regress˜ ao n˜ ao-linear.
O modelo de Gumbel com covariadas para a localiza¸c˜ ao e escala ´ e de- finido por (2.1) e por dois componentes sistem´ aticos dados por
g
1(μ) = η
1= f
1(X; β), g
2(φ) = η
2= f
2(Z ; θ), (3.1) onde β = (β
1, ..., βp)
Te θ = (θ
1, ..., θ
q)
Ts˜ ao vetores de parˆ ametros de regress˜ ao desconhecidos a serem estimados (β ∈ R
pe θ ∈ R
q). Aqui, f
1(X; β) e f
2(Z ; θ) s˜ ao fun¸c˜ oes de classe C
3(possivelmente n˜ ao lineares). Finalmente, g
1( · ) e g
2( · ) s˜ ao fun¸c˜ oes de liga¸c˜ ao conhecidas mon´ otonas e trˆ es vezes diferenci´ aveis com dom´ınios R e R
+, respectivamente. Sejam X e Z matrizes n × p e n × q com posto(X) = p e posto(Z) = q, respectivamente; X e Z n˜ ao s˜ ao necessariamente diferentes.
Sabemos que a fun¸c˜ ao acumulada de (2.1), ´ e G(y) = 1 − exp
− exp
y − μ φ
, (3.2)
isto ´ e verificado no Apˆ endice(A).
Considere ϑ = (β, θ) na express˜ ao (2.6), ´ e usando as express˜ oes (2.1) e (3.2) na express˜ ao (2.6), obtemos a seguinte express˜ ao para a verossimilhan¸ca
L(y, δ; β, φ) =
n i=11 φ
iexp
y
i− μ
iφ
iexp
−exp
y
i− μ
iφ
i δi·
exp
−exp
y
i− μ
iφ
i 1−δi=
n i=11 φ
i δiexp
y
i− μ
iφ
i− exp
y
i− μ
iφ
i δi·
exp
−(1 − δ
i) exp
y
i− μ
iφ
i=
n i=11 φ
δiiexp
δ
iy
i− μ
iφ
i− exp
y
i− μ
iφ
i·
exp
−(1 − δ
i) exp
y
i− μ
iφ
i.
Agora, calcularemos a fun¸c˜ ao log-verossimilhan¸ca, basta aplicarmos a fun¸c˜ ao logaritmo na express˜ ao acima, assim
l = log(L(y, δ; β, φ))
= log
ni=1
1 φ
δiiexp
δ
iy
i− μ
iφ
i− exp
y
i− μ
iφ
i·
exp
− (1 − δ
i) exp
y
i− μ
iφ
i=
ni=1
log
1 φ
δii+
n i=1δ
iy
i− μ
iφ
i− exp
y
i− μ
iφ
i−
n i=1(1 − δ
i)exp
y
i− μ
iφ
i= −
n i=1log(φ
δii) +
n i=1δ
iy
i− μ
iφ
i− exp
y
i− μ
iφ
i−
n i=1(1 − δ
i)exp
y
i− μ
iφ
i= −
n i=1δ
i· log(φ
i) +
n i=1δ
iy
i− μ
iφ
i− exp
y
i− μ
iφ
i−
n i=1(1 − δ
i)exp
y
i− μ
iφ
i= δ
i−
ni=1
log(φ
i) +
n i=1y
i− μ
iφ
i−
n i=1exp
y
i− μ
iφ
i+
n i=1exp
y
i− μ
iφ
i−
n i=1exp
y
i− μ
iφ
i= −
n i=1δ
ilog(φ
i) +
ni=1
δ
iy
i− μ
iφ
i−
n i=1exp
y
i− μ
iφ
i,
com μ
ie φ
idefinida por (3.1).
A fun¸c˜ ao escore ´ e definida por U = U (β, θ) = (∂l/∂β
T, ∂l/∂θ
T)
T. Seja y
i◦= exp(y
i/φ
i), μ
◦i= exp(μ
i/φ
i) e v
i= δ
i( − 1 − (y
i− μ
i)/φ
i) + exp((y
i− μ
i)/φ
i)(y
i− μ
i)/φ
i, para i = 1, ..., n. Temos que
U
j(β, θ) = ∂l
∂β
j= ∂l
∂μ
idμ
idη
1i∂η
1i∂β
j, j = 1, ..., p.
U
J(β, θ) = ∂l
∂θ
J= ∂l
∂φ
idφ
idη
2i∂η
2i∂θ
J, J = 1, ..., q.
Logo,
U
j(β, θ) = ∂l
∂β
j=
ni=1
1
μ
◦iφ
i(y
i◦− δ
iμ
◦i) dμ
idη
1i∂η
1i∂β
j, j = 1, ..., p, U
J(β, θ) = ∂l
∂θ
J=
ni=1
v
i1 φ
idφ
idη
2i∂η
2i∂θ
J, J = 1, ..., q,
para mais detalhes ver o Apˆ endice(B).
Em nota¸c˜ ao matricial, temos que U
j(β, θ) = ∂l
∂β
j= X
TΩ
−1M
1u
1, e
U
J(β, θ) = ∂l
∂β
J= S
TΩ
−1M
2v
1, onde os vetores de ordem n × 1, u
1=
− δ
1+ exp
y1−μ1φ1
, ..., − δ
n+ exp
yn−μnφn
T, v
1= (v
1, v
2, ..., v
n) e as matrizes X =
∂η1i∂βj
i,j
de ordem n × p, S =
∂η2i∂βJ
i,J
de ordem n × q, e as matrizes de ordem n × n, Ω = diag(φ
i), M
1= diag
dμidη1i
e M
2= diag
dφidη2i
.
Os estimadores de m´ axima verossimilhan¸ca para os parˆ ametros β e θ s˜ ao obtidos resolvendo o sistema n˜ ao linear U = 0 e n˜ ao h´ a uma forma fechada para tal solu¸c˜ ao; Portanto, utilizamos um algoritmo de optimiza¸c˜ ao n˜ ao linear, como o algoritmo de Newton ou quase-Newton, para encontrar estimadores de m´ axima verossimilhan¸ca.
A matriz informa¸c˜ ao de Fisher ´ e dada por K
= K
(β, θ) =
⎛
⎝ K
ββ1K
βθ1K
θβ1K
θθ1⎞
⎠ =
⎛
⎝ X
TW
ββ1X X
TW
βθ1S S
TW
θβ1X S
TW
θθ1S
⎞
⎠ .
onde, usamos as seguintes matrizes diagonais para obtermos a matriz de Fisher, W
ββ1= diag
h
2iφ
2i dμidη1i
2,
W
θθ1= diag
( − h
1i− 2h
3i+ h
5i+ 2h
4i) φ
2i dφidη2i
2e
W
βθ1= diag
(h
4i) φ
2idμi
dη1i
dφi
dη2i
.
A inversa da matriz de Fisher ´ e dada por (K
)
−1= (K
)
−1(β, θ) =
⎛
⎝ K
ββ1K
βθ1K
θβ1K
θθ1⎞
⎠
−1
.
Definimos as matrizes X e W
1com dimens˜ oes 2n × (p + q) e 2n × 2n respectivamente, com
X =
⎛
⎝ X 0 0 S
⎞
⎠ e W
1=
⎛
⎝ W
ββ1W
βθ1W
θβ1W
θθ1⎞
⎠ .
Ent˜ ao podemos escrever a matriz de Fisher como K
= X
TW
1X .
3.1 Corre¸c˜ ao Do Vi´ es De Um EMVs
Nesta se¸c˜ ao, obtemos uma express˜ ao para os vieses de segunda ordem dos EMVs dos parˆ ametros do modelo geral de regress˜ ao do valor extremo usando Cox e Snell (1968). As derivadas parciais da log-verossimilhan¸ca com respeito as componentes dos vetores desconhecidos β e θ s˜ ao indicados pelos indices { j, l, ... } e { J, L, ... } , respectivamente. Assim, definimos U
j= ∂l/∂β
j, U
J= ∂l/∂θ
J, U
jL=
∂
2l/∂β
j∂θ
L, U
jlM= ∂
3l/∂β
j∂β
l∂θ
Me etc. Para denotar os cumulantes das derivadas parciais acima, usamos a nota¸c˜ ao introduzida por Lawley (1956): k
jl= E(U
jl), k
j,l= E(U
jU
l), k
jl,M= E(U
jlU
M) e etc, em geral k’s s˜ ao da ordem de O(n). As derivadas destes cumulantes s˜ ao denotadas da seguinte forma k
jl(m)= ∂k
jl/∂β
m, k
(jlM)= ∂k
jl/∂θ
Me etc. Nem todos os k’s s˜ ao necessariamente independentes. Seja k
j,l= − k
jle k
J,L= − k
JLos elementos de seus respectivos inversos K
ββe K
θθque s˜ ao O(n
−1).
A f´ ormula de Cox e Snell (1968) pode ser usada para obter o vi´ es
segunda ordem do EMV para a a-´ esima componente do vetor param´ etrico τ =
( τ
1, ..., τ
p+q) = ( β
T, θ
T), a qual ´ e dada por B( τ
a) =
j,l,m
k
ajk
lmk
(jlm)−
12k
jlm+
J,l,m
k
aJk
lmk
Jl(m)−
12k
Jlm+
j,L,m
k
ajk
Lmk
jL(m)−
12k
jLm+
j,l,M
k
ajk
lMk
jl(M)−
12k
jlM+
J,L,m
k
aJk
Lmk
(JLm)−
12k
JLm+
J,l,M
k
aJk
lMk
(JlM)−
12k
JlM+
j,L,M
k
ajk
LMk
jL(M)−
12k
jLM+
J,L,M
k
aJk
LMk
JL(M)−
12k
JLM(3.3)
Os parˆ ametros β e θ n˜ ao s˜ ao ortogonais. Assim as entradas da matriz W
βθn˜ ao s˜ ao todas nulas. Por isso, todos os termos em (4.2) devem ser considerados.
3.2 Corre¸c˜ ao do vi´ es dos MLEs para o modelo de Gumbel com censura tipo I
Usando a express˜ ao (4.2) e utilizando algumas manipula¸c˜ oes alg´ ebricas, que pode ser encontrada no Apˆ endice (B), podemos obter uma express˜ ao para o vi´ es de segunda ordem de β e θ na forma matricial:
B
1( β) = K
1ββX
TW
1Z
βd+ W
2D
β+ (W
3+ W
5)Z
βθd+ W
4D
θ+ W
7Z
θd1
n×1+ K
1βθS
TW
3Z
βd+ W
4D
β+ (W
6+ W
7)Z
βθd+ W
8Z
θd+ W
9D
θ1
n×1, (3.4) e
B
1( θ) = K
1θβX
TW
1Z
βd+ W
2D
β+ (W
3+ W
5)Z
βθd+ W
4D
θ+ W
7Z
θd1
n×1+ K
1θθS
TW
3Z
βd+ W
4D
β+ (W
6+ W
7)Z
βθd+ W
8Z
θd+ W
9D
θ1
n×1, (3.5)
onde W
k= diag { w
k1, ..., w
kn} para i = 1, ..., n e k = 1, ..., 9, 1
n×1denota um
vetor com n entradas igual a 1, Z
βd= diag( XK
1ββX
T), Z
βθd= diag( XK
1ββS
T),
Z
θd= diag( SK
1θθS
T), D
β= diag(d
1β, ..., d
nβ) e D
θ= diag(d
1θ, ..., d
nθ) com d
iβ= tr( XK
1ββ), d
iθ= tr( SK
1θθ), X
i= (∂
2η
1i/∂β
jβ
l)
j,le S
i= (∂
2η
2i/∂θ
Jθ
L)
j,lpara i = 1, ..., n.
Considere os vetores de ordem (2n × 1), δ
1e δ
2como δ
1=
⎛
⎝ [W
1Z
βd+ (W
3+ W
5)Z
βθd+ W
7Z
θd]1
n×1[W
3Z
βd+ (W
6+ W
7)Z
βθd+ W
8Z
θd]1
n×1⎞
⎠ (3.6)
e
δ
2=
⎛
⎝ [W
2D
β+ W
4D
θ]1
n×1[W
4D
β+ W
9D
θ]1
n×1⎞
⎠ (3.7)
os blocos inferiores de ordem p × (p + q) e superior de ordem q × (p + q) da ma- triz K
1(τ )
−1por K
1β∗= (k
1ββk
1βθ) e K
1θ∗= (k
1θβk
θθ1), respectivamente. Com estas express˜ oes, podemos escrever o vi´ es de segunda ordem de β e θ como
B
1( β) = K
1β∗X
T(δ
1+ δ
2) e B
1( θ) = K
1θ∗X
T(δ
1+ δ
2), (3.8) respectivamente. Ent˜ ao, por (3.8) conclu´ımos que o vi´ es de segunda ordem do EMV do vetor conjunto τ = ( β
T, θ
T) possui a forma
B
1( τ) = K
1−1X
T(δ
1+ δ
2) = ( X
TW
1X )
−1X
T(δ
1+ δ
2).
Definindo ξ
1= W
1−1δ
1e ξ
2= W
1−1δ
2, assim
B
1( τ) = ( X
TW
1X )
−1X
TW
1(ξ
1+ ξ
2). (3.9)
A f´ ormula (4.8) mostra que o vi´ es de segunda ordem de τ e facilmente obtida com os vetores dos coeficientes de regress˜ ao na forma de regress˜ ao linear de ξ
1e ξ
2nas colunas de X com W
1sendo a matriz peso. Podemos expressar (4.8) como
B
1( τ ) = B
1( τ ) + B
2( τ),
com B
1( τ) = ( X
TW
1X )
−1X
TW
1ξ
1e B
2( τ ) = ( X
TW
1X )
−1X
TW
1ξ
2.
Se ξ
2= 0, a f´ ormula (4.8) d´ a o vi´ es de segunda ordem para Modelos Lineares de Valores Extremo de Regress˜ ao com covariav´ eis de dispers˜ ao linear. Por- tanto, B
1( τ) e B
2( τ) podem ser considerados respectivamente, como a linearidade e n˜ ao-linearidade em termos do vi´ es total.
3.3 Corre¸c˜ ao Do Vi´ es De Um MLEs De μ e φ
Primeiramente, expandimos as fun¸c˜ oes η
1i= f
1(x
Ti, β) e η
2i= f
2(x
Ti, θ) dado em (3.1) em s´ erie de Taylor at´ e a segunda ordem em torno dos pontos β e θ, respectivamente, obtemos
η
1i− η
1i= X
iT( β − β) + 1
2 ( β − β)
TX
i( β − β) + o
p( ( β − β)
2) e
η
2i− η
2i= S
iT( θ − θ) + 1
2 ( θ − θ)
TS
i( θ − θ) + o
p( ( θ − θ)
2)
onde X
ie S
is˜ ao a i-´ esima linha das matrizes X e S respectivamente. Assim, os vieses de segunda ordem de η
1ie η
2ina nota¸c˜ ao matricial s˜ ao dados por
B( η
1i) = XB( β) + 1
2 D
β1
n×1e B( η
2i) = SB( θ) + 1
2 D
θ1
n×1Vamos agora expandir as fun¸c˜ oes μ
1i= g
1−1( η
1i) e φ
1i= g
2−1( η
2i) em s´ eries de taylor at´ e a segunda ordem, em torno dos pontos η
1ie η
2irespectivamente.
Com isto, segue que
μ
i− μ
i= dμ
idη
1i( η
1i− η
1i) + 1 2
d
2μ
idη
21i( η
1i− η
1i)
2+ o
p(( η
1i− η
1i)
2) e
φ
i− φ
i= dφ
idη
2i( η
2i− η
2i) + 1 2
d
2φ
idη
22i( η
2i− η
2i)
2+ o
p(( η
2i− η
2i)
2)
Assim, obtemos os vieses de segunda ordem de μ
ie φ
iB( μ
i) = B( η
1i) dμ
idη
1i+ 1
2 V ar( η
1i) d
2μ
idη
12ie B( φ
i) = B( η
2i) dφ
idη
2i+ 1
2 V ar( η
2i) d
2φ
idη
22i(3.10) A f´ ormula anterior ir´ a nos fornecer uma express˜ ao para os vies de se- gunda ordem do EMVs de μ e φ, em nota¸c˜ ao matricial, fica como segue
B
1( μ
i) = 1 2
M
1[2 XB
1( β) + D
β1
n×1] + Z
βdT
11
n×1e
B
1( φ
i) = 1 2
M
2[2 SB
1( θ) + D
θ1
n×1] + Z
θdT
21
n×1Para o modelo de regress˜ ao dos valores extremos, usando (3.8) temos, B
1( μ
i) = 1
2
M
1[2 XK
1β∗X
T(δ
1+ δ
2) + D
β1
n×1] + Z
βdT
11
n×1e
B
1( φ
i) = 1 2
M
2[2 SK
1θ∗X
T(δ
1+ δ
2) + D
θ1
n×1] + Z
θdT
21
n×1Definimos as matrizes diagonais T
1= diag { d
2μ
i/dη
21i} e T
2= diag { d
2φ
i/dη
22i} de ordem n.
Os estimadores corrigidos μ = μ − B
1( μ) e φ = φ − B
1( φ) de μ e φ
respectivamente, tem vi´ eses de ordem O(n
−2), onde B
1( · ) denota o EMV de B
1( · ),
isto ´ e, os parˆ ametros desconhecidos s˜ ao substitu´ıdos por seus EMVs.
4 CORREC ¸ ˜ AO DO VI´ ES DO MODELO DE GUMBEL COM CENSURA TIPO II
Seja Y
1, Y
2, ..., Y
kuma amostra aleat´ oria, onde cada Y
item a fun¸c˜ ao de densidade de probabilidade dada por (2.1), com parˆ ametro de localiza¸c˜ ao μ
ie parˆ ametro de escala φ
i, para i = 1, 2, ..., k. Suponha que os componentes de ambos os vetores param´ etricos μ = (μ
1, ..., μ
n)
Te φ = (φ
1, ..., φ
n)
Tvariam de acordo com as observa¸c˜ oes atrav´ es do modelo de regress˜ ao n˜ ao-linear.
O modelo de Gumbel com covariadas para a localiza¸c˜ ao e a dispers˜ ao
´ e definido por (2.1), seja X e Z as matrizes de dados, onde X
i= (X
i1, ..., X
ip) denota a i-´ esima linha de X e
Z
i= (Z
i1, ..., Z
ip) denota a i-´ esima linha de Z.
Definimos
g
1(μ
i) = η
1i= f
1(X
i; β) e g
2(φ
i) = η
2i= f
2(Z
i; θ), (4.1) onde β = (β
1, ..., βp)
Te θ = (θ
1, ..., θ
q)
Ts˜ ao vetores de parˆ ametros de regress˜ ao desconhecidos a serem estimados (β ∈ R
pe θ ∈ R
q). Aqui, f
1(X
i; β) e f
2(Z
i; θ) s˜ ao fun¸c˜ oes de classe C
3(possivelmente n˜ ao lineares). Finalmente, g
1( · ) e g
2( · ) s˜ ao fun¸c˜ oes de liga¸c˜ ao conhecidas mon´ otonas e trˆ es vezes diferenci´ aveis com dom´ınios R e R
+, respectivamente. Sejam X e Z matrizes n × p e n × q com posto(X) = p e posto(Z) = q, respectivamente; X e Z n˜ ao s˜ ao necessariamente diferentes.
Obtemos Y
1,i, Y
2,i, ..., Y
ni,iobserva¸c˜ oes independentes e identicamente distribu´ıdas. A censura tipo II ´ e feita em cima de cada coluna da ”matriz” Y = { Y
si} com s = 1, 2, ..., n
ie i = 1, 2, ..., k. Observe que Y como definido anteriormente n˜ ao
´ e matriz, pois o n´ umero de elementos das linhas variam com a coluna.
Assim ordenamos,
Y
(1,ni)≤ Y
(2,ni)≤ ... ≤ Y
(r,ni)≤ ... ≤ Y
(r,ni).
Como Y
(1,ni)
, Y
(2,ni)
, ..., Y
(r,ni)
, ..., Y
(r,ni)
est˜ ao sob censura do tipo II, a fun¸c˜ ao de verossiminhan¸ca de Gumbel com censura tipo II, ´ e abtida tomando ϑ = (β, θ) na express˜ ao (2.7) ´ e usando (2.1) e (3.2) na express˜ ao (2.7), obtemos
L
i(β, θ) = n
i! (n
i− r)
r s=1f(Y
(s,ni); β, θ)
ni
s=r+1
(1 − F (Y
(r,ni); β, θ))
= n
i! (n
i− r)
r s=1f(Y
(s,ni); β, θ)
1 − F (Y
(r,ni); β, θ)
ni−r.
Como os Y
1, Y
2, ..., Y
ks˜ ao independentes, temos L(β, θ) =
k i=1L
i(β, θ).
Aplicando a fun¸c˜ ao logaritmo na express˜ ao anterior, iremos obter a fun¸c˜ ao log-verossimilhan¸ca, dada por
l = log(L(β, θ)) =
ki=1
l
i(β, θ),
onde, l
i(β, θ) = log
ni!(ni−r)!