Faculdade de Ciˆencias
Departamento de Estat´ıstica
e Investiga¸c˜
ao Operacional
Metodologia Jackknife na Estima¸
c˜
ao
Param´
etrica em Modelos Extremais:
Programa¸
c˜
ao em R
Pedro de Antas Guimar˜
aes Marques Martins
Disserta¸c˜
ao orientada
pela Prof. Doutora Maria Ivette Leal de Carvalho Gomes
Mestrado em Estat´ıstica
2012
Resumo
O objectivo fundamental deste trabalho ´e o estudo da metodologia de Jackknife em modelos de extremos, particularmente na distribui¸c˜ao Fr´echet. Fazemos uma breve abordagem da Teoria dos Valores Extremos, estudamos as distribui¸c˜oes assint´oticas de m´aximos e de m´ınimos e procedemos a algumas ilustra¸c˜oes dos resultados utilizando m´etodos computacionais. Abordamos ainda a metodologia de Jackknife e definimos estimadores de jackknife puro e de jackknife generalizado com o objectivo de reduzir o vi´es do estimador que lhe serve de base. No caso particular do modelo Fr´echet apenas estudamos o comportamento do estimador de jackknife puro uma vez que n˜ao temos informa¸c˜ao sobre o vi´es assint´otico do estimador de m´axima verosimilhan¸ca do parˆametro de forma do modelo Fr´echet, necess´aria para a obten¸c˜ao do estimador de jackknife generalizado.
Palavras chave: Distribui¸c˜ao assint´otica do m´aximo, distribui¸c˜ao assint´ o-tica do m´ınimo, estimador de jackknife puro, estimador de jackknife generalizado.
Abstract
The main objective of this thesis is the study of the Jackknife methodology in extremal models, like the Fr´echet parent. After a brief introduction to Extreme Value Theory, we describe the possible non-degenerate limiting distributions for maxima and for minima. We further illustrate those results through the use of computational methods developed with the R software. We next proceed with the description of the Jackknife methodology, defining the pure jackknife and the generalized jackknife, as suitable procedures for the reduction of bias of any estimator. In the particular case of Fr´echet underlying parents, we study only the pure jackknife. This is due to the fact that we have not been able to get the adequate information on the asymptotic bias of maximum likelihood estimators of the unknown parameters for such models.
Keywords: Asymptotic distributions for maxima, Asymptotic distributions for minima, pure and generalized jackknife estimators.
Agradecimentos
Agrade¸co `a minha orientadora, Prof. Doutora Maria Ivette Leal de Carvalho Gomes, a direc¸c˜ao, apoio, compreens˜ao e disponibilidade com que sempre me atendeu e orientou a minha tese de mestrado; `a minha fam´ılia que me motivou e encorajou em todos os momentos para a realiza¸c˜ao desta tese; aos meus amigos que me acompanharam e entusiasmaram para a realiza¸c˜ao e conclus˜ao deste trabalho.
Conte´
udo
1 Introdu¸c˜ao 3
2 Referˆencia `a Teoria de Valores Extremos 5
2.1 A Sucess˜ao de M´aximos Parciais . . . 7
2.1.1 Comportamento Limite n˜ao Degenerado do M´aximo . . . 7
2.1.2 Caracteriza¸c˜ao dos Dom´ınios de Atrac¸c˜ao para M´aximos . . . 8
2.1.3 Escolha das Constantes de Atrac¸c˜ao . . . 9
2.1.4 Alguns Exemplos . . . 10
2.1.5 Condi¸c˜oes Suficientes de von Mis`es . . . 12
2.2 Sucess˜ao de M´ınimos Parciais . . . 14
2.2.1 Comportamento Limite do M´ınimo . . . 14
2.2.2 Caracteriza¸c˜ao dos Dom´ınios de Atrac¸c˜ao para M´ınimos . . . 15
2.2.3 Escolha das Constantes de Atrac¸c˜ao . . . 15
2.2.4 Exemplos . . . 16
2.2.5 Dom´ınio de Atrac¸c˜ao para M´ınimos dos Modelos Limite de M´aximos . . . 17
2.3 Comportamento Limite dos Excessos . . . 18
2.4 Uma Abordagem Computacional . . . 20
3 Estimadores de Jackknife 31 3.1 Estimador de Jackknife Puro . . . 33
3.2 Estimador de Jackknife Generalizado . . . 36
3.3 Algumas Propriedades do Jackknife . . . 40
3.3.1 Consistˆencia da M´edia da Amostra Jackknife . . . 40
3.3.2 Centralidade dos Estimadores de Jackknife . . . 40
3.3.3 A Metodologia Jackknife na Estima¸c˜ao do Vi´es de um Estimador 41 3.3.4 Igualdade entre Estimadores de Jackknife Puro e Generalizado 42 3.4 Distribui¸c˜ao Pareto . . . 43
Cap´ıtulo 1
Introdu¸
c˜
ao
A presente tese incide sobre a metodologia de Jackknife e o seu comportamento na redu¸c˜ao do vi´es de estimadores de parˆametros desconhecidos, em modelos directamente relacionados com a Teoria de Valores Extremos (TVE). Baseando-se simplesmente na divis˜ao da amostra em duas sub-amostras, a metodologia Jackk-nife foi utilizada inicialmente por Quenouille (1949) para redu¸c˜ao do vi´es de um estimador da correla¸c˜ao serial. Em 1956, Quenouille (veja-se Quenouille, 1956) generalizou esta ideia, dividindo a amostra em g grupos de tamanho h, n = g × h, e explorou a sua aplicabilidade gen´erica. Restringir-nos-emos aqui ao caso g = n, h = 1, que ´e sem d´uvida o caso mais atraente, por eliminar a arbitrariedade dos subgrupos, sendo muito frequentemente a melhor forma de utiliza¸c˜ao da t´ecnica Jackknife.
No Cap´ıtulo 2, fazemos uma breve introdu¸c˜ao a resultados limites fulcrais em TVE, referindo brevemente, na Sec¸c˜ao 2.1, os poss´ıveis comportamentos limite n˜ao degenerados da sucess˜ao de m´aximos parciais {Xn:n:= max(X1, X2, . . . , Xn)}n≥1,
onde (X1, X2, . . . Xn) ´e uma amostra aleat´oria de vari´aveis independentes e
iden-ticamente distribu´ıdas (i.i.d.), provenientes de uma distribui¸c˜ao desconhecida, F . Essa distribui¸c˜ao limite n˜ao-degenerada ´e, ent˜ao, do tipo da chamada distribui¸c˜ao de Valores Extremos, com a forma funcional
Gγ(x) =
(
exp(−(1 + γx)−1/γ), 1 + γx > 0 se γ 6= 0
exp(− exp(−x)), x ∈ R se γ = 0, (1.1) onde γ (∈ R) ´e o chamado ´ındice de valores extremos (para m´aximos).
A Sec¸c˜ao 2.2 ´e semelhante `a Sec¸c˜ao 2.1, mas para a sucess˜ao de m´ınimos parciais, {X1:n:= min(X1, X2, . . . , Xn)}n≥1. As poss´ıveis distribui¸c˜oes limite s˜ao ent˜ao do
tipo, G∗γ(x) = 1−Gγ(−x), com Gγ(x) definido em (1.1), isto ´e, tˆem a forma funcional
G∗γ(x) = (
1 − exp(−(1 − γx)−1/γ), 1 − γx > 0, se γ 6= 0
1 − exp(− exp(x)), x ∈ R se γ = 0. (1.2) Na Sec¸c˜ao 2.3 referimos brevemente o comportamento limite dos excessos acima de um n´ıvel elevado u, quando u = un → +∞, quando n → ∞. Obtˆem-se ent˜ao
distribui¸c˜oes do tipo da Pareto generalizada, com a forma funcional, Pγ(x) = 1 + ln Gγ(x)
= (
1 − (1 + γx)−1/γ, 1 + γx > 0, x > 0 se γ 6= 0
1 − exp(−x), x > 0 se γ = 0. (1.3) Finalmente, na Sec¸c˜ao 2.4, apresentam-se programas elaborados e execut´aveis no software R-project que nos permitem fazer algumas ilustra¸c˜oes de resultados da Sec¸c˜ao 2.1 relativos `a distribui¸c˜ao assint´otica do m´aximo.
No Cap´ıtulo 3, come¸camos por introduzir, na Sec¸c˜ao 3.1, o conceito de estimador de jackknife puro e, na Sec¸c˜ao 3.2, o conceito de estimador de jackknife generali-zado. Na Sec¸c˜ao 3.3 referimos algumas propriedades dos estimadores de jackknife, tais como a consistˆencia da m´edia da amostra jackknife, a centralidade dos estimado-res de jackknife puro e generalizado, a importˆancia desta metodologia na estima¸c˜ao do vi´es de um estimador arbitr´ario de qualquer parˆametro desconhecido, e situa¸c˜oes de coincidˆencia dos estimadores de jackknife puro e generalizado. Na Sec¸c˜ao 3.4, e numa primeira abordagem meramente anal´ıtica, estudamos o comportamento dos estimadores de jackknife associados aos estimadores de m´axima verosimilhan¸ca do parˆametro desconhecido em distribui¸c˜ao Pareto, um caso particular da distribui¸c˜ao definida em (1.3). Na Sec¸c˜ao 3.5, consideramos uma segunda abordagem, de ´ındole computacional, e avan¸camos com o estudo do comportamento dos estimadores de Jackknife associados aos estimadores de m´axima verosimilhan¸ca de parˆametros des-conhecidos em distribui¸c˜ao Fr´echet, um caso particular da distribui¸c˜ao definida em (1.1). Estudamos ainda o comportamento dos estimadores de jackknife para estimar os parˆametros das distribui¸c˜oes Exponencial e Pareto.
Cap´ıtulo 2
Breve Referˆ
encia `
a Teoria de
Valores Extremos
Neste cap´ıtulo apresentamos um conjunto de defini¸c˜oes que permitem estu-dar a distribui¸c˜ao assint´otica do m´aximo e do m´ınimo de uma amostra aleat´oria (X1, X2, . . . , Xn). Dada uma amostra aleat´oria proveniente de uma popula¸c˜ao
quan-titativa, constitu´ıda por vari´aveis aleat´orias (v.a’s) i.i.d. com fun¸c˜ao de distribui¸c˜ao (f.d.) F , ´e sempre poss´ıvel orden´a-la por ordem n˜ao decrescente.
Defini¸c˜ao 1. Seja (X1, X2, . . . , Xn) uma amostra aleat´oria. A amostra ordenada
associada a (X1, X2, . . . , Xn) ´e denotada por (X1:n, X2:n, . . . , Xn:n) e tem-se X1:n≤
X2:n≤ ... ≤ Xn−1:n ≤ Xn:n.
Da Defini¸c˜ao 1 facilmente se conclui que o m´ınimo da amostra ´e denotado por X1:n e o que o m´aximo da amostra ´e denotado por Xn:n.
Seguidamente procedemos, nas Sec¸c˜oes 2.1 e 2.2, ao estudo da convergˆencia em distribui¸c˜ao das v.a.’s Xn:n e X1:n, respectivamente. Come¸camos por enunciar
te-oremas de tipos extremais, de acordo com os quais tanto a distribui¸c˜ao limite da sucess˜ao de m´ınimos parciais, X1:n como da sucess˜ao de m´aximos parciais, Xn:n,
convenientemente normalizadas, se existirem, apenas podem ser de um de trˆes ti-pos, quando n tende para infinito, sendo o conceito de tipo introduzido na seguinte defini¸c˜ao:
Defini¸c˜ao 2. As fun¸c˜oes de distribui¸c˜ao F e G s˜ao do mesmo tipo se e s´o se existirem constantes λ ∈ R e δ > 0 tais que G(x) = F (λ + δx), ∀x ∈ R.
Nessas mesmas sec¸c˜oes, ap´os a defini¸c˜ao de dom´ınio de atrac¸c˜ao, procedemos `
suficientes de convergˆencia para cada um dos tipos, damos indica¸c˜ao sobre poss´ıveis escolhas das constantes de atrac¸c˜ao, e ap´os alguns exemplos, apresentamos condi¸c˜oes suficientes de atrac¸c˜ao para cada um dos tipos extremais.
Na Sec¸c˜ao 2.3 abordamos de forma ligeira o comportamento limite dos excessos acima de um n´ıvel elevado, e finalmente, na Sec¸c˜ao 2.4, procedemos a uma aborda-gem computacional de identifica¸c˜ao da lei limite extremal.
2.1. A SUCESS ˜AO DE M ´AXIMOS PARCIAIS 7
2.1
A Sucess˜
ao de M´
aximos Parciais
Seja (X1, X2, . . . Xn) uma amostra de v.a.’s i.i.d. com f.d. F (x) e seja Xn:n =
max(X1, X2, . . . , Xn). ´E ent˜ao imediato verificar que
P Xn:n ≤ x = P X1 ≤ x, X2 ≤ x. . . . , Xn≤ x = Fn(x). Consequentemente, P(Xn:n ≤ x) → n→∞ ( 0 se F (x) < 1 1 se F (x) = 1,
i.e., temos um comportamento limite degenerado para a sucess˜ao de m´aximos par-ciais, Xn:n, ou seja Xn:n p −→ n→∞ x ∗ := sup{x : F (x) < 1},
o limite superior do suporte de F . N˜ao ´e pois poss´ıvel obter um comportamento n˜ao degenerado da sucess˜ao de m´aximos parciais sem primeiro efectuarmos uma normaliza¸c˜ao conveniente.
2.1.1
Comportamento Limite n˜
ao Degenerado do M´
aximo
Face ao comportamento limite de Xn:n referido anteriormente, colocam-se ent˜ao,
entre outras, as quest˜oes seguintes:
• Existem sucess˜oes de constantes {an} e {bn}, an∈ R, bn > 0, tais que
P
Xn:n− an bn
≤ x= Fn(an+ bnx) −→
n→∞ G(x),
em que G(x) ´e uma f.d. n˜ao degenerada?
• Caso a resposta `a quest˜ao anterior seja afirmativa, quais as poss´ıveis formas de G(x)?
Em 1943 Gnedenko mostrou de forma completa, atrav´es do usualmente chamado Teorema de Tipos Extremais, quais as formas poss´ıveis para G(x). Note-se no entanto a existˆencia de respostas parciais em artigos anteriores, de entre os quais destacamos Fr´echet (1927), Fisher & Tippett (1928) e von Mis`es (1936).
Teorema 1 (Leis limite do m´aximo normalizado, Gnedenko, 1943). Seja (X1, X2, . . . , Xn) uma amostra aleat´oria proveniente de uma popula¸c˜ao com
distri-bui¸c˜ao F. Quando n tende para infinito, se existirem sucess˜oes an ∈ R e bn > 0,
tais que (Xn:n − an)/bn tem comportamento limite n˜ao degenerado, esse limite ´e
necessariamente de um dos trˆes seguintes tipos: 1. F1(x) = ( 0 se x ≤ 0 e−x−α se x > 0 (α > 0), (2.1) 2. F2(x) = ( e−(−x)α se x < 0 1 se x ≥ 0 (α > 0), (2.2) 3. F3(x) = e−e −x , x ∈ R. (2.3)
Defini¸c˜ao 3. Seja X1, X2, . . . , Xn uma amostra aleat´oria proveniente de uma
popu-la¸c˜ao com distribui¸c˜ao F. Quando n → ∞ e ∀i ∈ 1, 2, 3, dizemos que F pertence ao dom´ınio de atrac¸c˜ao de Fi e denotamos por F ∈ DM(Fi), se a fun¸c˜ao distribui¸c˜ao
limite de (Xn:n− an)/bn for Fi.
Note-se que os trˆes tipos, em (2.1), (2.2) e (2.3), se podem escrever de acordo com a express˜ao uniparam´etrica em (1.1), que reproduzimos,
Gγ(x) =
(
exp(−(1 + γx)−1/γ), 1 + γx > 0 se γ 6= 0 exp(− exp(−x)), x ∈ R se γ = 0.
Note-se tamb´em que o ramo γ = 0 resulta como limite, quando γ → 0, do ramo para γ 6= 0. Note-se ainda que
Gγ(x) = Φ1/γ(1 + γx) se γ > 0 Ψ−1/γ(−(1 + γx)) se γ < 0 Λ(x) se γ = 0.
2.1.2
Caracteriza¸
c˜
ao dos Dom´ınios de Atrac¸
c˜
ao para M´
axi-mos
Quando se tem uma amostra aleat´oria proveniente de uma popula¸c˜ao com dis-tribui¸c˜ao F , existem condi¸c˜oes necess´arias e suficientes para que F ∈ DM(Fi),
2.1. A SUCESS ˜AO DE M ´AXIMOS PARCIAIS 9 i = 1, 2, 3. O Teorema seguinte ´e outro dos resultados cl´assicos em TVE e constitui uma base da Teoria Assint´otica de Extremos. As condi¸c˜oes necess´arias e suficientes apresentadas s˜ao equivalentes `as condi¸c˜oes iniciais dadas por Gnedenko (1943), para o dom´ınio de atrac¸c˜ao de F1 e F2, e por de Haan (1970), para o dom´ınio de atrac¸c˜ao
de F3.
Teorema 2. Seja (X1, X2, . . . , Xn) uma amostra aleat´oria proveniente de uma
po-pula¸c˜ao com distribui¸c˜ao F.
1. F ∈ DM(F1) se e s´o se F−1(1) = +∞ e existir uma constante α > 0 tal que:
lim t→+∞ 1 − F (tx) 1 − F (t) = x −α , ∀x > 0. (2.4) 2. F ∈ DM(F2) se e s´o se F−1(1) < +∞ (f inito) e existir uma constante α > 0
tal que: lim δ→0+ 1 − F (F−1(1) − δx) 1 − F (F−1(1) − δ) = x α, ∀x > 0. (2.5)
3. F ∈ DM(F3) se e s´o se E(X|X > c) ´e finito para algum c < F−1(1), onde E
denota o operador de valor m´edio, e para ∀x ∈ R se tiver: lim t→F−1(1) 1 − F (t + x E(X − t|X > t)) 1 − F (t) = e −x . (2.6)
2.1.3
Escolha das Constantes de Atrac¸
c˜
ao
Teorema 3 (Constantes de normaliza¸c˜ao). Seja (X1, X2, . . . , Xn) uma amostra
ale-at´oria proveniente de uma popula¸c˜ao com distribui¸c˜ao F. As constantes de norma-liza¸c˜ao ou atrac¸c˜ao, an> 0 e bn> 0, tais que
lim
n→+∞FXn:n−anbn (x) = Fi(x), i = 1, 2, 3,
podem ser escolhidas da seguinte forma:
1. Se i = 1, ent˜ao as constantes de normaliza¸c˜ao s˜ao an= 0 e bn = F−1 1 − 1 n . 2. Se i = 2, ent˜ao as constantes de normaliza¸c˜ao s˜ao
an = F−1(1) e bn= F−1(1) − F−1 1 − 1 n . 3. Se i = 3, ent˜ao as constantes de normaliza¸c˜ao s˜ao
an = F−1 1 − 1 n e bn= F−1 1 − 1 ne − F−11 − 1 n . Pode-se equivalentemente escolher bn = E(X − an| X > an).
2.1.4
Alguns Exemplos
Exemplo 1. Seja (X1, X2, . . . , Xn) uma amostra aleat´oria proveniente de uma
po-pula¸c˜ao com distribui¸c˜ao Exponencial de valor m´edio δ, isto ´e, FX(x) = ( 0 se x < 0 1 − e−xδ se x ≥ 0. Temos: y = F (x) ⇐⇒ y = 1 − e−xδ ⇐⇒ e− x δ = 1 − y ⇐⇒ −x δ = ln(1 − y) ⇐⇒ x = −δ ln(1 − y). Logo F−1(y) = −δ ln(1 − y) e F−1(1) = +∞.
Vamos em seguida verificar a poss´ıvel validade da condi¸c˜ao (2.4) do Teorema 2: lim t→+∞ 1 − F (tx) 1 − F (t) = limt→+∞ e−txδ e−δt = lim t→+∞e (1−x)t δ = 0 se x > 1 1 se x = 1 +∞ se 0 ≤ x < 1. Logo o limite em (2.4) ´e diferente de xα, isto ´e, a condi¸c˜ao (2.4) n˜ao ´e satisfeita. Vamos em seguida verificar se a condi¸c˜ao (2.6) do Teorema 2 ´e v´alida. Comecemos por estudar a distribui¸c˜ao condicional de X|X > t para um t ∈ R. Tem-se:
P(X ≤ x|X > t) = P(X ≤ x, X > t) P(X > t) = ( 0 se x ≤ t P(t≤X≤x) P (X > t) se x > t = ( 0 se x ≤ t FX(x)−FX(t) 1−FX(t) se x > t = 0 se x ≤ t e− tδ(1−e− x−tδ ) e− tδ se x > t = ( 0 se x ≤ t 1 − e−(x−t)δ se x > t.
De onde se conclu´ımos que Z := X|X > t ´e uma vari´avel aleat´oria Exponencial com parˆametros de localiza¸c˜ao e escala t e δ, respectivamente. Logo E(X|X > t) = δ + t, de onde se conclui que E(X − t|X > t) = δ. Temos:
lim t→F−1(1) 1 − F (t + xE(X − t|X > t)) 1 − F (t) = lim t→+∞ 1 − F (t + xδ) 1 − F (t) = limt→+∞ e−t+xδδ e−tδ = e−x.
2.1. A SUCESS ˜AO DE M ´AXIMOS PARCIAIS 11 Logo, a condi¸c˜ao (2.6) do Teorema 2 ´e v´alida. Consequentemente, F ∈ DM(F3),
e nestas condi¸c˜oes a aplica¸c˜ao do Teorema 3 leva-nos a uma poss´ıvel escolha de constantes:
• an= F−1(1 − 1n) = −δ ln(n1) = δ ln n;
• bn= E(X − an|X > an) = δ.
Exemplo 2. Seja (X1, X2, . . . , Xn) uma amostra aleat´oria proveniente de uma
po-pula¸c˜ao com distribui¸c˜ao Pareto de parˆametro α. Temos: FX(x) =
(
0 se x ≤ 1 1 − x−α se x > 1. Logo F−1(1) = +∞.
Verifiquemos se nestas condi¸c˜oes, a condi¸c˜ao (2.4) do Teorema 2 ´e v´alida: lim t→+∞ 1 − F (tx) 1 − F (t) = limt→+∞ (tx)−α t−α = limt→+∞ t−αx−α t−α = x −α .
De onde conclu´ımos que F ∈ DM(F1), com parˆametro α, uma vez que a condi¸c˜ao
(2.4) do Teorema 2 ´e v´alida. Temos ainda: • an= 0;
• bn= F−1(1 −n1) = n
1 α.
Exemplo 3. Seja (X1, X2, . . . , Xn) uma amostra aleat´oria proveniente de uma
popula¸c˜ao com distribui¸c˜ao Power de parˆametro θ. Temos:
FX(x) = 0 se x < 0 xθ se 0 ≤ x ≤ 1 1 se x > 1, ou seja F−1(1) = 1.
Uma vez que F−1(1) = 1 (´e finito) vamos verificar a possivel validade da condi¸c˜ao (2.5) do Teorema 2: lim t→0+ 1 − F (F−1(1) − tx) 1 − F (F−1(1) − t) = limt→0+ 1 − F (1 − tx) 1 − F (1 − t) = lim t→0+ 1 − (1 − tx)θ 1 − (1 − t)θ = limt→0+ θx(1 − tx)θ−1 θ(1 − t)θ−1 = θx θ = x.
Logo, a condi¸c˜ao (2.5) do Teorema 2 ´e v´alida, de onde conclu´ımos que F ∈ DM(F2),
• an= F−1(1) = 1;
• bn= F1(1) − F−1(1 −n1) = 1 − (1 −n1)
1 θ.
2.1.5
Condi¸
c˜
oes Suficientes de von Mis`
es
As condi¸c˜oes do Teorema 2 nem sempre s˜ao f´aceis de verificar. No caso de F ser uma fun¸c˜ao distribui¸c˜ao absolutamente cont´ınua pode verificar-se a validade para F de condi¸c˜oes suficientes do tipo das obtidas por von Mis`es (1936), apresentadas no Teorema seguinte:
Teorema 4 (Condi¸c˜oes suficientes de von Mis`es para a distribui¸c˜ao do m´aximo). Seja (X1, X2, . . . , Xn) uma amostra aleat´oria proveniente de uma popula¸c˜ao com
distribui¸c˜ao absolutamente cont´ınua F (·) e com fun¸c˜ao densidade de probabilidade f (·). Seja h(x) = f (x)/(1 − F (x)) a taxa de mortalidade instˆantanea.Temos:
1. Se h(x) > 0 para valores elevados de x e para α > 0, lim
x→+∞xh(x) = α, (2.7)
ent˜ao F ∈ DM(F1), com parˆametro α.
2. Se F−1(1) < ∞ e para α > 0 lim
x→F−1(1)(F
−1
(1) − x)h(x) = α, (2.8) ent˜ao F ∈ DM(F2), com parˆametro α.
3. Se h(x) n˜ao tem ra´ızes, ´e diferenci´avel numa vizinhan¸ca de F−1(1), e lim x→F−1(1) d dx 1 h(x) = 0, (2.9) ent˜ao F ∈ DM(F3).
Exemplo 4. Seja (X1, X2, . . . , Xn) uma amostra aleat´oria proveniente de uma
po-pula¸c˜ao com distribui¸c˜ao Rayleigh de parˆametro θ. Temos FX(x) = ( 0 se x < 0 1 − e−(xθ) 2 se x ≥ 0 fX(x) = d dxFX(x) = ( 0 se x < 0 2x θ2e −(xθ)2 se x ≥ 0.
2.1. A SUCESS ˜AO DE M ´AXIMOS PARCIAIS 13 De onde conclu´ımos que:
h(x) = fX(x) 1 − FX(x) = 0 se x < 0 2x θ2 e−( xθ)2 1−1+e−( xθ)2 se x ≥ 0 = ( 0 se x < 0 2x θ2 se x ≥ 0. Logo, lim x→F−1(1) d dx 1 h(x) = limx→+∞− θ2 2x2 = 0.
Uma vez que a condi¸c˜ao (2.9) do Teorema 4 ´e verificada, conclu´ımos que F ∈ DM(F3) e, nestas condi¸c˜oes podemos escolher:
• an= F−1(1 − 1n) = θ ln1−(1−1 1 n) = θ ln(11 n ) = θ ln n; • bn= F−1(1 −ne1 ) − F−1(1 −n1) = θ ln( 11 ne ) − θ ln n = θ ln ne − θ ln n = θ(ln n + ln e) − θ ln n = θ.
2.2
Sucess˜
ao de M´ınimos Parciais
Seja (X1, X2, . . . Xn) uma amostra de v.a.’s i.i.d. com f.d. F (x) e seja X1:n =
min(X1, X2, . . . , Xn). ´E ent˜ao imediato verificar que
P X1:n ≤ x = 1 − P X1:n≥ x = 1 − P X1 ≥ x, X2 ≥ x. . . . , Xn≥ x = 1 − (1 − F (x))n. Consequentemente, P(X1:n≤ x) → n→∞ ( 0 se F (x) = 0 1 se F (x) > 0,
i.e., temos um comportamento limite degenerado para a sucess˜ao de m´ınimos parci-ais, X1:n, ou seja X1:n p −→ n→∞ x ∗ := inf{x : F (x) > 0},
o limite inferior do suporte de F . N˜ao ´e pois poss´ıvel obter um comportamento n˜ao degenerado da sucess˜ao de m´ınimos parciais sem primeiro efectuarmos uma normaliza¸c˜ao conveniente.
2.2.1
Comportamento Limite n˜
ao Degenerado do M´ınimo
Como j´a se referiu, `a semelhan¸ca do m´aximo, se existe distribui¸c˜ao limite para a vari´avel aleat´oria X1:n quando convenientemente normalizada, esta distribui¸c˜ao s´o
pode ser de trˆes tipos como se apresenta no teorema seguinte.
Teorema 5 (Leis limite do m´ınimo). Seja (X1, X2, . . . , Xn) uma amostra aleat´oria
proveniente de uma popula¸c˜ao com distribui¸c˜ao F. Quando n tende para infinito, se existirem sucess˜oes a∗n e b∗n, tais que (X1:n− a∗n)/b
∗
n tem comportamento limite n˜ao
degenerado, esse limite ´e necessariamente de um dos seguintes tipos: 1. F1∗(x) = 1 − F1(−x) = ( 1 − e−(−x)−α se x ≤ 0 1 se x > 0(α > 0), (2.10) 2. F2∗(x) = 1 − F2(−x) = ( 0 se x < 0 1 − e−xα se x ≥ 0(α > 0), (2.11) 3. F3∗(x) = 1 − F3(−x) = 1 − e−e x , x ∈ R. (2.12)
2.2. SUCESS ˜AO DE M´INIMOS PARCIAIS 15
2.2.2
Caracteriza¸
c˜
ao dos Dom´ınios de Atrac¸
c˜
ao para
M´ıni-mos
Tamb´em para o m´ınimo existem condi¸c˜oes necess´arias e suficientes para uma dada distribui¸c˜ao pertencer ao Dom´ınio de Atrac¸c˜ao de Fi∗ para i=1,2,3.
Teorema 6. Seja (X1, X2, . . . , Xn) uma amostra aleat´oria proveniente de uma
po-pula¸c˜ao com distribui¸c˜ao F . Temos:
1. F ∈ Dm(F1∗) se e s´o se F−1(0) = −∞ e: lim t→−∞ F (tx) F (t) = x −α , ∀x > 0. (2.13)
2. F ∈ Dm(F2∗) se e s´o se F−1(0) > −∞ (f inito) e existir uma constante α > 0
tal que: lim δ→0+ F (F−1(0) + δx) F (F−1(0) + δ) = x α, ∀x > 0. (2.14)
3. F ∈ Dm(F3∗) se e s´o se E(X|X ≤ c) ´e finito para algum c > F
−1(0), e para ∀x ∈ R se tiver: lim t→F−1(0) F (t + x E(X − t|X ≤ t)) F (t) = e x. (2.15)
2.2.3
Escolha das Constantes de Atrac¸
c˜
ao
Teorema 7 (Constantes de normaliza¸c˜ao). Seja (X1, X2, . . . , Xn) uma amostra
ale-at´oria proveniente de uma popula¸c˜ao com distribui¸c˜ao F. As constantes a∗n > 0 e b∗n> 0 tais que limn→+∞FX1:n−a∗n
b∗n
(t) = Fi∗(t) podem ser escolhidas da seguinte forma: 1. Se i = 1 ent˜ao as constantes de normaliza¸c˜ao s˜ao a∗n= 0 e b∗n= |F−1(n1)|. 2. Se i = 2 ent˜ao as constantes de normaliza¸c˜ao s˜ao a∗n = F−1(0) e
b∗n= F−1(n1) − F−1(0).
3. Se i = 3 ent˜ao as constantes de normaliza¸c˜ao s˜ao a∗n = F−1(1n) e b∗n= E(a∗n− X|X ≤ a∗
2.2.4
Exemplos
Exemplo 5. Seja (X1, X2, . . . , Xn) uma amostra aleat´oria proveniente de uma
po-pula¸c˜ao com distribui¸c˜ao Exponencial de valor m´edio δ. Tem-se F−1(0) = 0, finito, e lim β→0+ F (F−1(0) + βx) F (F−1(0) + β) = limβ→0+ 1 − e−βxδ 1 − e−βδ = lim β→0+x e−βxδ e−βδ = x1. Logo, F ∈ Dm(F2∗) de parˆametro 1 e nestas condi¸c˜oes, temos:
• a∗ n= F −1(0) = 0, • b∗ n= F −1(1 − 1 n) − F −1(0) = −δ ln 1 − (1 − 1 n) − 0 = δ ln n.
Exemplo 6. Seja (X1, X2, . . . , Xn) uma amostra aleat´oria proveniente de uma
popu-la¸c˜ao com distribui¸c˜ao Power de parˆametro θ. Tem-se F−1(0) = 0, finito. Vejamos ent˜ao se a condi¸c˜ao (2.14) do Teorema 6 ´e v´alida:
lim δ→0+ F (F−1(0) + δx) F (F−1(0) + δ) = limδ→0+ F (0 + δx) F (0 + δ) = limδ→0+ (xδ)θ δθ = x θ.
Logo, F ∈ Dm(F2∗) com parˆametro α = θ e, nestas condi¸c˜oes temos:
• a∗ n= F −1(0) = 0, • b∗ n= F −1(1 − 1 n) − F −1(0) = −θ ln(1 − (1 − 1 n)) − 0 = θ ln n.
Exemplo 7. Seja (X1, X2, . . . , Xn) uma amostra aleat´oria proveniente de uma
po-pula¸c˜ao com distribui¸c˜ao Pareto de parˆametro α. Tem-se F−1(0) = 1, finito, e lim δ→0+ F (F−1(0) + δx) F (F−1(0) + δ) = limδ→0+ F (1 + δx) F (1 + δ) = lim δ→0+ 1 − (1 + δx)−α 1 − (1 + δ)−α = limδ→0+ αx(1 + δx)−α−1 α(1 + δ)−α−1 = x.
Logo, F ∈ Dm(F2∗), com parˆametro α = 1 e, nestas condi¸c˜oes:
• a∗ n= F −1(0) = 1, • b∗ n= F −1(1 n) − F −1(0) = ( n n−1) 1 n − 1.
2.2. SUCESS ˜AO DE M´INIMOS PARCIAIS 17
2.2.5
Dom´ınio de Atrac¸
c˜
ao para M´ınimos dos Modelos
Li-mite de M´
aximos
Proposi¸c˜ao 1. Seja A = {1, 2, 3}. Seja j ∈ A e Xj uma vari´avel aleat´oria com
distribui¸c˜ao Fj. Ent˜ao, ∀j ∈ A, a vari´avel aleat´oria −Xj tem distribui¸c˜ao Fj∗.
Demonstra¸c˜ao. Seja j ∈ A. Tem-se: F−Xj(x) = P (−Xj ≤ x) = P (Xj ≥ −x)
= 1 − P (Xj ≤ −x) = 1 − Fj(−x) = Fj∗(x).
Proposi¸c˜ao 2. Seja A = {1, 2, 3}. Ent˜ao,
∀i ∈ A, Fi ∈ Dm(F3∗).
Demonstra¸c˜ao. Para se provar a validade da Proposi¸c˜ao 2 utilizaremos a igualdade X1:n = −(−X)n:n (o m´ınimo de uma amostra ´e igual ao sim´etrico do m´aximo dos
sim´etricos da amostra).
Seja i = 1 e (X1, X2, . . . , Xn) uma amostra aleat´oria proveniente de uma popula¸c˜ao
com distribui¸c˜ao F1. Temos:
F−X(x) = P (−X ≤ x) = P (X ≥ −x) = ( 1 − e−(−x)−α se x ≤ 0 1 se x > 0 (α > 0), e f−X(x) = d dxF−X(x) = e −(−x)−α d dx − (−x) −α = α(−x)−α−1e−(−x)−α. Logo, h(x) = f−X(x) 1 − F−X(x) = α(−x) −α−1e−(−x)−α e−(−x)−α = α(−x) −α−1 , e, lim x→F−1(1) d dx 1 h(x) = limx→0 d dx (−x)α+1 α = limx→0− (α + 1)(−x)α+2 α = 0.
Logo verifica-se a condi¸c˜ao suficiente (2.9), de onde se conclui que (−X)n:n ∈ DM(F3)
e pela Proposi¸c˜ao 1 conclui-se que −(−X)n:n = X1:n∈ Dm(F3∗).
2.3
Comportamento Limite dos Excessos acima
de um N´ıvel Elevado
Comecemos por ver qual a distribui¸c˜ao exacta dos excessos acima de um n´ıvel u. Seja Fu(x) = P (X ≤ x|X > u). Temos:
Fu(x) = P (X ≤ x|X > u) = ( 0 se x ≤ u P (X≤x,X>u) P (X>u) se x > u = ( 0 se x ≤ u FX(x)−FX(u) 1−FX(u) se x > u. (2.16) Vamos agora ver quais s˜ao os poss´ıveis modelos para a distribui¸c˜ao assint´otica, caso exista, de Fu(x), convenientemente normalizada, quando u = un → +∞, `a
medida que n → ∞.
Comecemos por falar das fun¸c˜oes do tipo Pareto Generalizada, Pi(x), i = 1, 2, 3,
que se obtˆem f´acilmente atrav´es das fun¸c˜oes de distribui¸c˜ao de Valores Extremos, Fi(x), i = 1, 2 e 3, em (2.1), (2.2) e (2.3), respectivamente, dada a existˆencia da
seguinte rela¸c˜ao:
Pi(x) = 1 + ln Fi(x) i ∈ {1, 2, 3} .
Desta rela¸c˜ao chegamos r´apidamente `as seguintes conclus˜oes:
• P1(x) corresponde `a fun¸c˜ao de distribui¸c˜ao Pareto de parˆametro α.
• P2(x) corresponde `a fun¸c˜ao de distribui¸c˜ao Beta de parˆametro α.
• P3(x) corresponde `a fun¸c˜ao de distribui¸c˜ao Exponencial de valor m´edio 1.
Note-se que os trˆes tipos, Pi(x), i = 1, 2, 3, se podem escrever de acordo com a
express˜ao uniparam´etrica em (1.3), que reproduzimos, GPγ(x) = 1 + ln Gγ(x) =
(
1 − (1 + γx)−1/γ, 1 + γx > 0, x > 0 se γ 6= 0 1 − exp(−x), x > 0 se γ = 0. Note-se novamente que o ramo γ = 0 resulta como limite, quando γ → 0, do ramo para γ 6= 0.
Limitamo-nos a enunciar um outro resultado seminal em TVE, devido a Balkema & de Haan (1974) e a Pickands (1975), que, independentemente demonstraram o teorema seguinte:
2.3. COMPORTAMENTO LIMITE DOS EXCESSOS 19 Teorema 8 (Balkema-de Haan-Pickands). Se F ∈ DM(Gγ), com Gγ(x) definida em
(1.1), ent˜ao existe σu > 0 tal que
lim u→x∗ Fu σux − GPγ(x) = 0,
com GPγ(x) definida em (1.3) e sendo x∗ o limite superior do suporte de F (x).
Para mais detalhes, vejam-se os artigos atr´as referidos ou Embrechts, Kl¨ uppel-berg & Mikosch, 1997, Sec¸c˜ao 3.4, ou ainda Reiss & Thomas (2007), Sec¸c˜ao 1.4. Veja-se ainda de Haan & Ferreira (2006).
2.4
Uma Abordagem Computacional
Nesta sec¸c˜ao apresentamos programas elaborados e execut´aveis no software R-project que nos permitem ver a distribui¸c˜ao do m´aximo de uma distribui¸c˜ao F quando essa distribui¸c˜ao limite existe.
Para atingirmos este objectivo utilizamos a t´ecnica do papel de probabilidade e os estimadores de m´ınimos quadrados para estimarmos os parˆametros de localiza¸c˜ao e de escala. Quando os pontos do gr´afico obtido se aproximam de uma recta fazemos uma compara¸c˜ao entre os valores reais dos parˆametros de localiza¸c˜ao e de escala e os valores das estimativas obtidas por este mesmo processo.
´
E de salientar que n˜ao foi poss´ıvel fazer uma fun¸c˜ao para a utiliza¸c˜ao da t´ecnica do papel de probabilidade que se adeque a todos os modelos de extremos pelo que poder´a haver diferen¸cas pontuais na utiliza¸c˜ao desta t´ecnica nas ilustra¸c˜oes que se seguem.
Ilustramos um exemplo para cada um dos trˆes tipos de distribui¸c˜ao assint´otica pos-s´ıveis para o m´aximo.
As ilustra¸c˜oes para a distribui¸c˜ao assint´otica do m´ınimo s˜ao muito semelhantes `as apresentadas para o m´aximo, motivo pelo qual n˜ao v˜ao ser apresentadas nesta sec-¸c˜ao. No exemplo 8 explicamos a utiliza¸c˜ao dos procedimentos que ser´a an´aloga para os exemplos seguintes. Nos trˆes exemplos temos um valor n ∈ N que ser´a a dimens˜ao da amostra de que os m´aximos s˜ao provenientes e m ∈ N que ser´a a dimens˜ao da amostra de m´aximos. Esses inteiros m e n tˆem respectivamente os valores 100 e 10000.
Exemplo 8. Seja (X1, X2, . . . , Xn) uma amostra aleat´oria proveniente de uma
po-pula¸c˜ao com distribui¸c˜ao Exponencial de valor m´edio 6. Observe-se o procedimento efectuado de forma a construir uma amostra de dimens˜ao m, de m´aximos proveni-entes de amostras de dimens˜ao n. Temos:
> #Obten¸c~ao da amostra de m´aximos de exponenciais de valor m´edio par > extremomax<-function(m,n,dist,par){ + y<-0 + extrem1<-function(n,dist,par){ + x<-runif(n) + y<-dist(x,par) + max(y) + }
2.4. UMA ABORDAGEM COMPUTACIONAL 21 + z<-0
+ z<-replicate(m,extrem1(n,dist,par)) + }
Para que a fun¸c˜ao extremomax seja executada com correc¸c˜ao deve-se ter em conta o tipo de parˆametros da mesma, isto ´e os parˆametros devem satisfazer as seguintes condi¸c˜oes:
1. m, n ∈ N.
2. “par” ´e o vector cujas componentes s˜ao os parˆametros da fun¸c˜ao distribui¸c˜ao F .
3. “dist” ´e a fun¸c˜ao inversa de F .
A t´ıtulo ilustrativo, vejamos a utiliza¸c˜ao da fun¸c˜ao extremomax na gera¸c˜ao de uma amostra de dimens˜ao 100, de m´aximos de amostras de dimens˜ao 10000 provenientes da distribui¸c˜ao exponencial de valor m´edio 6.
> #Obten¸c~ao de uma Exponencial de valor medio par > #a partir de uma Uniforme(0,1)
> exponencial<-function(x,par){ + par*log(1/(1-x)) + } > m1<-100 > n1<-10000 > parametro<-6 > z<-extremomax(m1,n1,exponencial,parametro) > z [1] 67.21373 47.12294 56.52070 62.67702 51.48837 53.84476 [7] 65.67080 52.17646 53.09716 51.40910 61.22423 57.34997 [13] 62.26535 60.27245 55.09829 74.16362 51.27774 49.41016 [19] 54.15416 62.01183 68.41515 51.70100 68.75510 56.10750 [25] 56.83427 48.58036 61.27615 50.93293 52.50847 49.97146 [31] 69.99936 51.98497 52.39974 53.54173 50.62724 54.17785 [37] 50.27979 53.83714 49.11112 52.25373 71.52127 53.66765 [43] 61.81322 61.47702 60.17139 53.19815 51.26566 51.19285 [49] 78.44772 51.84042 54.19564 65.48456 60.04473 49.49713
[55] 55.71623 51.63060 58.20802 50.48114 63.98562 53.05978 [61] 83.50736 55.84482 69.83404 75.31035 67.39555 60.38737 [67] 61.30492 61.08064 69.98131 64.78053 60.68629 57.84654 [73] 72.11111 53.25547 55.01544 59.36166 54.94875 57.54881 [79] 61.19843 66.06562 79.00707 52.71881 74.32256 61.86276 [85] 66.89159 51.85668 60.66652 54.48186 55.57102 50.75044 [91] 62.40742 53.33739 51.85827 49.34887 55.87403 59.89838 [97] 64.38895 52.19861 62.72267 57.52701
Vejamos agora uma pequena ilustra¸c˜ao do resultado obtido no Exemplo 1 relativo `a distribui¸c˜ao assint´otica do m´aximo de exponenciais utilizando a t´ecnica do papel de probabilidade:
> #Obten¸c~ao de uma Gumbel a partir de uma Uniforme(0,1) > > gumbel<-function(x){ + -log (log(1/x)) + } > distextrema<-function(x,dist){ + n<-length(x) + x<-0 + y<-0 + + for(j in 1:n){ + y[j]<-dist(j/(n+1)) + } + y + } > w<-sort(z) > a<-distextrema(w,gumbel)
A fun¸c˜ao distextrema n˜ao ´e mais do que a fun¸c˜ao que permite obter o vector neces-s´ario `a utiliza¸c˜ao da t´ecnica do papel de probabilidade em que neste caso a i-´esima componente corresponde ao valor gumbel( i
m+1) (n˜ao devemos esquecer que estamos
a trabalhar com a amostra de m m´aximos e que a fun¸c˜ao gumbel ´e a fun¸c˜ao inversa da distribui¸c˜ao Gumbel). Utilizando a t´ecnica do papel de probabilidade obtemos ainda o seguinte gr´afico:
2.4. UMA ABORDAGEM COMPUTACIONAL 23 > plot(a~w,
+main="Ilustra¸c~ao da Distribui¸c~ao limite de m´aximos de exponenciais")
● ●● ● ●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●● ●●●●●●●●●●●●●●●●● ●●●● ●● ●●● ● ● ●●● ●● ● ●● ● ● ● 50 60 70 80 −1 0 1 2 3 4
Ilustração da Distribuição limite de máximos de exponenciais
w
a
Pela observa¸c˜ao do gr´afico constatamos que os pontos se aproximam de uma recta. Podemos pois concluir que existem constantes l e e tais que a distribui¸c˜ao assint´otica de Xn:n−l
e ´e do tipo Gumbel. Fa¸camos l = an e e = bn tal como definimos
no Teorema 3 e comparemos estes valores com as estimativas de localiza¸c˜ao e escala do papel de probabilidade. Temos:
> estimadordebn<-function(x,y){ + sum((x-mean(x))*(y-mean(y))) /sum((x-mean(x))^2) + } > estimadordean<-function(x,y,z){ + mean(y)-z*mean(x) + } > estimativadebn<-estimadordebn(a,w) > estimativadean<-estimadordean(a,w,estimativadebn) > an<-exponencial(1-1/n1,parametro) > bn<-parametro > comparacao<-cbind(c(an,bn),c(estimativadean,estimativadebn)) > comparacao [,1] [,2] [1,] 55.26204 54.991355 [2,] 6.00000 6.333009
Ao utilizarmos a fun¸c˜ao cbind estamos a organizar os vectores (an,bn) e (estima-tivadean, estimativadebn) em coluna, pelo que os valores que se lˆeem na primeira linha correspondem respectivamente a an e estimativadean e os valores que se lˆeem
na segunda linha correspondem respectivamente a bn e estimativadebn.
Comparando os valores exactos com as estimativas verificamos que os valores exactos de bn e an est˜ao muito pr´oximos dos valores das respectivas estimativas.
Vejamos agora a ilustra¸c˜ao da distribui¸c˜ao assint´otica para o m´aximo de uma amostra Pareto de parˆametro α.
Exemplo 9. Seja (X1, X2, . . . , Xn) uma amostra aleat´oria proveniente de uma
po-pula¸c˜ao com distribui¸c˜ao Pareto de parˆametro 6. Temos: > #Gera¸c~ao de uma pareto de par^ametro alfa > #a partir de uma Uniforme(0,1)
> pareto<-function(x,al){ + (1/(1-x))^(1/al)
+ }
> #Constru¸c~ao da amostra de m´aximos > n1<-10000 > m1<-100 > z<-extremomax(m1,n1,pareto,6) > z [1] 4.456159 5.235100 4.065041 5.195902 4.731950 [6] 5.018189 3.843722 5.533062 3.889854 4.098597 [11] 5.537566 4.482940 7.538761 6.304208 3.903317 [16] 5.298111 4.655522 6.772547 5.268453 4.846668 [21] 4.744563 4.996730 10.716236 14.732793 4.859723 [26] 6.385087 5.283368 4.491173 4.187012 4.265781 [31] 3.582270 4.573686 5.364194 5.096113 4.083648 [36] 5.656624 5.143858 6.265951 5.545155 4.359939 [41] 4.610858 4.493429 5.498073 4.274236 5.282041 [46] 5.643139 4.533423 4.995078 4.430263 4.489981 [51] 4.365265 4.764319 4.197914 5.407910 6.188680 [56] 5.984947 3.514874 6.002470 4.479636 3.943828 [61] 4.807792 3.875587 4.152526 4.091426 3.923353 [66] 6.201399 5.108884 3.852442 4.968771 6.226146
2.4. UMA ABORDAGEM COMPUTACIONAL 25 [71] 3.766136 5.635278 4.093503 4.864849 6.240432 [76] 6.154981 4.190904 4.481243 4.257785 4.020022 [81] 5.025531 4.264917 4.972156 8.613058 4.855387 [86] 4.362341 4.976472 6.292233 3.815711 7.130785 [91] 5.530522 4.053997 6.244374 3.928327 5.117041 [96] 5.547662 4.330245 7.389719 5.031595 5.254077 > #Simula¸c~ao de uma Fr´echet de par^ametro al
> #a partir de uma Uniforme(0,1) > frechet<-function(x,al){ + (log(1/x))^(-1/al) + } > distextrema<-function(x,dist,al){ + n<-length(x) + x<-0 + y<-0 + for(j in 1:n){ + y[j]<-dist(j/(n+1),al)} + y} > w<-sort(z) > a<-distextrema(z,frechet,6) > plot(a~w,
+main="Ilustra¸c~ao da Distribui¸c~ao limite de m´aximos de Paretos")
●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●● ●●●●●● ● ● ●● ● ● ● ● 4 6 8 10 12 14 0.8 1.2 1.6 2.0
Ilustração da Distribuição limite de máximos de Paretos
w
Pela observa¸c˜ao do gr´afico constatamos que os pontos se aproximam de uma recta de onde podemos concluir pela t´ecnica do papel de probabilidade que existem constantes l e e tais que a distribui¸c˜ao assint´otica de Xn:n−l
e ´e do tipo Fr´echet de
parˆametro 6. Temos ainda:
> estimadordebn<-function(x,y){ + sum((x-mean(x))*(y-mean(y)))/sum((y-mean(y))^2) + } > estimadordean<-function(a,b,c){ + mean(a)-c*mean(b) + } > estimativadebn<-estimadordebn(w,a) > estimativadean<-estimadordean(w,a,estimativadebn) > an<-0 > bn<-pareto(1-1/n1,6) > comparacao<-cbind(c(an,bn),c(estimativadean,estimativadebn)) > comparacao [,1] [,2] [1,] 0.000000 -1.072291 [2,] 4.641589 5.536670
Pelos valores obtidos na matriz de compara¸c˜ao verificamos que os valores exac-tos dos parˆametros an e bn s˜ao muito aproximados das respectivas estimativas
estimativadean e estimativadebn.
Por ´ultimo e para finalizarmos a ilustra¸c˜ao de resultados da distribui¸c˜ao assin-t´otica de m´aximos, vamos executar estes procedimentos para verificarmos qual a distribui¸c˜ao assint´otica de m´aximos de Uniformes Standard.
Exemplo 10. Seja (X1, X2, . . . , Xn) uma amostra aleat´oria proveniente de uma
popula¸c˜ao com distribui¸c˜ao Uniforme de parˆametros 0 e 1. Temos: > #F´ormula da Distribui¸c~ao Uniforme(a,b)
> uniforme<-function(x,a,b){ + (b-a)*x+a
+ }
> extremomax<-function(m,n,dist,par1,par2){ + extrem1<-function(n,dist,par1,par2){
2.4. UMA ABORDAGEM COMPUTACIONAL 27 + x<-runif(n) + y<-dist(x,par1,par2) + max(y) + } + z<-0 + z<-replicate(m,extrem1(n,dist,par1,par2)) + z + }
> #Constru¸c~ao da amostra de m´aximos > n<-10000 > z<-extremomax(100,n,uniforme,0,1) > z [1] 0.9999770 0.9998667 0.9998971 0.9999698 0.9999478 [6] 0.9995811 0.9999438 0.9999874 0.9999992 0.9999997 [11] 0.9993330 0.9999837 0.9999793 0.9998487 0.9997550 [16] 0.9999914 0.9998035 0.9999169 0.9997778 0.9997038 [21] 0.9999756 0.9998950 0.9998947 0.9998668 0.9999316 [26] 0.9999066 0.9999076 0.9999284 0.9999753 0.9998571 [31] 0.9999991 0.9997927 0.9999006 0.9999517 0.9999575 [36] 0.9998497 0.9999469 0.9998470 0.9999178 0.9999458 [41] 0.9998866 0.9998353 0.9999925 0.9996535 0.9999978 [46] 0.9999966 0.9999450 0.9999656 0.9994640 0.9997102 [51] 0.9997915 0.9998278 0.9998477 0.9998325 0.9998906 [56] 0.9999780 0.9998199 0.9998865 0.9999386 0.9998407 [61] 0.9999912 0.9999475 0.9998342 0.9999132 0.9997969 [66] 0.9999041 0.9999324 0.9999531 0.9995430 0.9999296 [71] 0.9998360 0.9999794 0.9999250 0.9998069 0.9996838 [76] 0.9998668 0.9998359 0.9999641 0.9999809 0.9999122 [81] 0.9999223 0.9999648 0.9999885 0.9998960 0.9999871 [86] 0.9999322 0.9997446 0.9998313 0.9999363 0.9999632 [91] 0.9998483 0.9997873 0.9999534 0.9999038 0.9999040 [96] 0.9999968 0.9999801 0.9999390 0.9999884 0.9995931 > #Simula¸c~ao de uma Weibull de par^ametro al
> #a partir de uma Uniforme(0,1) > weibull<-function(x,al){
+ (-1)*(log(1/x)^(1/al))} > distextrema<-function(x,dist,al){ + n<-length(x) + x<-0 + y<-0 + for(j in 1:n){ + y[j]<-dist(j/(n+1),al)} + y} > w<-sort(z) > b<-distextrema(w,weibull,1) > plot(b~w,
+main="Ilustra¸c~ao da Distribui¸c~ao limite de m´aximos de Uniformes")
● ● ● ●● ● ● ●● ●● ●●●● ●●●●● ●●●●●●●●●●●●●● ● ● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● 0.9994 0.9995 0.9996 0.9997 0.9998 0.9999 1.0000 −4 −3 −2 −1 0
Ilustração da Distribuição limite de máximos de Uniformes
w
b
Pela observa¸c˜ao do gr´afico constatamos que os pontos se aproximam de uma recta de onde podemos concluir que existem constantes l e e tais que a distribui¸c˜ao assint´otica de Xn:n−l
e ´e do tipo Weibull de parˆametro 1. Comparemos agora os valores
exactos dos parˆametros de localiza¸c˜ao e de escala com as respectivas estimativas: > estimadordebn<-function(x,y){
+ sum((x-mean(x))*(y-mean(y)))/sum((y-mean(y))^2) + }
> estimadordean<-function(a,b,c){ + mean(a)-c*mean(b)
2.4. UMA ABORDAGEM COMPUTACIONAL 29 + } > estimativadebn<-estimadordebn(w,b) > estimativadean<-estimadordean(w,b,estimativadebn) > an<-uniforme(1,0,1) > bn<-uniforme(1,0,1)-uniforme(1-1/n,0,1) > comparacao<-cbind(c(an,bn),c(estimativadean,estimativadebn)) > comparacao [,1] [,2] [1,] 1e+00 1.0000060612 [2,] 1e-04 0.0001268064 >
Pelos valores obtidos na matriz compara¸c˜ao verificamos que os valores exac-tos dos parˆametros an e bn s˜ao muito aproximados das respectivas estimativas
Cap´ıtulo 3
Estimadores de Jackknife
Os estimadores de Jackknife s˜ao estimadores que surgiram com o objectivo de reduzir o vi´es dos estimadores que lhes servem de base, como se ver´a nas sec¸c˜oes que se seguem. Tal como referido anteriormente, a metodologia Jackknife foi uti-lizada inicialmente por Quenouille (1949) para redu¸c˜ao do vi´es de um estimador de correla¸c˜ao serial, com base na divis˜ao da amostra em duas sub-amostras. Em 1956, Quenouille generalizou esta ideia, dividindo a amostra em g grupos de tama-nho h, n = g × h, e explorou a sua aplicabilidade gen´erica. Restringir-nos-emos aqui essencialmente ao caso g = n, h = 1, que ´e sem d´uvida o caso mais atraente, por eliminar a arbitrariedade dos subgrupos, sendo muito frequentemente a melhor forma de utiliza¸c˜ao da t´ecnica Jackknife.
Come¸caremos por introduzir, na Sec¸c˜ao 3.1, o conceito de estimador de jackknife puro de um parˆametro desconhecido θ, que permite eliminar completamente um vi´es do tipo b(θ)/n (embora nalguns casos coincida com o estimador que lhe serve de base, caso esse vi´es n˜ao exista), enquanto que o estimador de jackknife generalizado, a ser introduzido na Sec¸c˜ao 3.2, serve para eliminar totalmente um vi´es da forma b(θ)/f (n), ∀f (n), e s´o pode ser calculado se se tiver informa¸c˜ao sobre o vi´es, ou a componente dominante do vi´es do estimador de base. Algumas das propriedades fundamentais destes estimadores de Jackknife ser˜ao estudadas na Sec¸c˜ao 3.3.
Na Sec¸c˜ao 3.4, estudaremos em particular estes estimadores para as distribui-¸c˜oes Pareto, situa¸c˜ao em que os estimadores de Jackknife s˜ao analiticamente simples. Uma aplica¸c˜ao da metodologia de Jackknife em modelos Fr´echet ser´a feita ap´os refe-rˆencia `a abordagem computacional, a apresentar na Sec¸c˜ao 3.5. Na realidade, uma vez que as estimativas de m´axima verosimilhan¸ca para o parˆametro da Fr´echet s˜ao apenas pass´ıveis de ser obtidas atrav´es de m´etodos num´ericos, n˜ao se tem informa¸c˜ao
sobre o vi´es do estimador de m´axima verosimilhan¸ca, n˜ao se podendo pois construir o Estimador de Jackknife Generalizado. A obten¸c˜ao de estimativas de Jackknife para parˆametros de um modelo Fr´echet tem pois de ser de ´ındole computacional.
3.1. ESTIMADOR DE JACKKNIFE PURO 33
3.1
Estimador de Jackknife Puro
Defini¸c˜ao 4. Seja (X1, X2, . . . , Xn) uma amostra aleat´oria proveniente de uma
po-pula¸c˜ao com distribui¸c˜ao F (x) = F (x; θ), com θ o parˆametro de interesse. Seja Tn : D ⊆ Rn → R um estimador de θ. Designamos por Tn,i o estimador com a
mesma forma funcional de Tn, mas baseado na amostra de dimens˜ao n − 1 que
se obt´em a partir de (X1, X2, . . . , Xn), ap´os lhe retirarmos a i-´esima observa¸c˜ao,
1 ≤ i ≤ n. A nova amostra (Tn,i, 1 ≤ i ≤ n) ´e a chamada amostra jackknife
associada a Tn e a (X1, X2, . . . , Xn).
Teorema 9. Sejam T1 e T2 estimadores consistentes de um parˆametro θ. Seja
R 6= 1. A estat´ıstica
T3 = (T1− R T2)/(1 − R)
´e um estimador consistente para θ.
Demonstra¸c˜ao. Suponhamos que T1 e T2 s˜ao estimadores consistentes para θ. Logo
por defini¸c˜ao de estimador consistente conclu´ımos que T1, T2 p → θ, e temos T1, T2 p → θ =⇒ T1− RT2 p → (1 − R)θ =⇒ T1− RT2 1 − R p → θ. Logo T3 ´e consistente para θ.
Defini¸c˜ao 5. Seja (X1, X2, . . . , Xn) uma amostra aleat´oria proveniente de uma
po-pula¸c˜ao com distribui¸c˜ao F (x) = F (x; θ), com θ parˆametro de interesse e desconhe-cido. Seja Tn um estimador de θ. Designamos por estimador de jackknife puro, e
denotamos por TnJ, o novo estimador
TnJ = nTn− (n − 1)Tn,i,
onde Tn,i´e a m´edia da amostra Jackknife, (Tn,i, 1 ≤ i ≤ n), introduzida na Defini¸c˜ao
4.
Seguidamente ver-se-`a um exemplo de aplica¸c˜ao da metodologia atr´as referida, quando aplicada a uma amostra proveniente de uma distribui¸c˜ao Exponencial de valor m´edio δ. Em primeiro lugar encontrar-se-`a o estimador de jackknife puro associado ao estimador de m´axima verosimilhan¸ca de δ. Em seguida, aplicar-se-`a o estimador encontrado a uma amostra simulada de dimens˜ao 10.
Exemplo 11. Seja (X1, X2, . . . , Xn) uma amostra aleat´oria proveniente de uma
popula¸c˜ao com distribui¸c˜ao Exponencial de valor m´edio δ. Seja Tn o estimador de
m´axima verosimilhan¸ca de δ isto ´e Tn= X. Para i ∈ {1, 2, . . . , n}, tem-se
Tn,i = 1 n − 1 X j6=i Xj, e consequentemente, Tn,i= 1 n n X i=1 Tn,i= 1 n n X i=1 1 n − 1 X j6=i Xj = 1 n 1 n − 1 n X i=1 X j6=i Xj = 1 n 1 n − 1(n − 1) n X i=1 Xi = 1 n n X i=1 Xi = X.
De onde conclu´ımos que o estimador de jackknife com base no estimador de m´ a-xima verosimilhan¸ca para uma amostra proveniente de uma popula¸c˜ao com distribui-¸
c˜ao Exponencial de valor m´edio δ ´e o pr´oprio estimador de m´axima verosimilhan¸ca. Consideremos em seguida a seguinte amostra de dimens˜ao 10 proveniente de uma popula¸c˜ao com distribui¸c˜ao Exponencial de valor m´edio 6:
(0.3228126, 2.7680145, 3.5033378, 3.7742301,
1.3497052, 0.4737520, 11.5756315, 9.1868669,
1.2150921, 2.7223887). Tem-se T10= X = 3.081979. Retirando o primeiro elemento da amostra, a amostra
resultante ´e (2.7680145, 3.5033378, 3.7742301, 1.3497052, 0.4737520, 11.5756315, 9.1868669, 1.2150921, 2.7223887), e T10,1 = 19 P10
j=2Xj = 4.063224. Retirando o segundo elemento da amostra, a
amostra resultante ´e
(0.3228126, 3.5033378, 3.7742301,
1.3497052, 0.4737520, 11.5756315, 9.1868669,
3.1. ESTIMADOR DE JACKKNIFE PURO 35 e T10,2= 19(0.7296771 +
P10
j=3Xj) = 3.791535.
Analogamente obtˆem-se as seguintes estimativas: • T10,3= 3.709833, T10,4= 3.679733
• T10,5= 3.949125, T10,6= 4.046453
• T10,7= 2.812911, T10,8= 3.078329
• T10,9= 3.964082, T10,10 = 3.796605
Obtendo-se desta forma
Tn,i= 1 10 10 X i=1 Tn,i= 3.689183 = X. De onde resulta, T10J = 10T10− 9T10,i= 3.689183 = T10.
Observa¸c˜ao 1. Note-se que o resultado anterior ´e geralmente v´alido, quando se parte da m´edia da amostra Tn = Xn =
Pn
i=1Xi/n, estimador (centrado) do valor
m´edio µ = E(X) da popula¸c˜ao X subjacente `a amostra (X1, . . . , Xn), e aplicamos a
3.2
Estimador de Jackknife Generalizado
Defini¸c˜ao 6. Seja (X1, X2, . . . , Xn) um amostra aleat´oria proveniente de uma
popu-la¸c˜ao com distribui¸c˜ao F (x) = F (x; θ), com θ parˆametro de interesse e desconhecido. Seja Tn um estimador de θ e f e b fun¸c˜oes tais que E(Tn) = θ + f (n)b(θ)
. Chamamos estimador de jackknife generalizado e denotamos por TnG `a estat´ıstica, TnG = (Tn− αTn,i)/(1 − α),
em que α = f (n)/f (n − 1), e onde, tal como referido anteriormente, Tn,i ´e a m´edia
da amostra Jackknife, (Tn,i, 1 ≤ i ≤ n), introduzida na Defini¸c˜ao 4.
Seguidamente ver-se-`a um exemplo em que se ilustrar´a que para uma amostra aleat´oria (X1, X2, . . . , Xn) o estimador S02 = (Pni=1(Xi − X)2)/n ´e um estimador
enviesado para a variˆancia σ2 e encontrar-se-˜ao os estimadores de jackknife puro e
generalizado com base em S02.
Exemplo 12. Seja (X1, X2, . . . , Xn) uma amostra aleat´oria proveniente de uma
popula¸c˜ao com distribui¸c˜ao F . Seja Tn = S02 = (Pni=1(Xi − X)2)/n. Sejam µ e σ
tais que E(X) = µ e Var(X) = σ2. Temos:
E(X) = µ, Var(X) = σ 2 n , e consequentemente E(X2) = E2(X) + Var(X) = µ2 + σ2 n . Por outro lado,
E Xn i=1 Xi2= n X i=1 E(Xi2) = nE(X 2) = n(µ2+ σ2), e E Xn i=1 (Xi− X)2 = E n X i=1 Xi2− nX2 = n X i=1 E(Xi2) − nE(X 2 ) = n(E(X2) − E(X2)) = n(σ2+ µ2−σ 2 n − µ 2) = (n − 1)σ2.
3.2. ESTIMADOR DE JACKKNIFE GENERALIZADO 37 Logo E(S02) = E Xn i=1 (Xi− X)2/n = n − 1 n σ 2 = σ2− 1 nσ 2 =⇒ α = −1 n/ − 1 n − 1 = n − 1 n . Veja-se agora qual a express˜ao do estimador Tn,i:
Tn,i= 1 n − 1 X j6=i (Xj− ( nX − Xi n − 1 )) 2 =⇒ n X i=1 Tn,i = n X i=1 1 n − 1 X j6=i (Xj − ( nX − Xi n − 1 )) 2 = 1 n − 1 n X i=1 (X j6=i Xj2− (n − 1)(nX − Xi n − 1 ) 2 ) = 1 n − 1( n X i=1 X j6=i Xj2− 1 n − 1 n X i=1 (nX − Xi)2). Temos: n X i=1 X j6=i Xj2 = (n − 1) n X i=1 Xi2 e consequentemente, n X i=1 (nX − Xi)2 = n X i=1 (Xi2 − 2nXXi+ n2X 2 ) = n X i=1 Xi2− 2nX n X i=1 Xi+ n X i=1 n2X2 = n X i=1 Xi2− 2n2X2+ n3X2.
Logo: n X i=1 X j6=i Xj2− 1 n − 1 n X i=1 (nX − Xi)2 = 1 n − 1((n − 1) 2 n X i=1 Xi2− ( n X i=1 Xi2− 2n2X2 + n3X2)) = 1 n − 1((n 2− 2n) n X i=1 Xi2+ 2n2X2 − n3X2) = n n − 1((n − 2) n X i=1 Xi2+ 2nX2− n2X2) e consequentemente, n X i=1 Tn,i = n (n − 1)2 (n − 2) n X i=1 Xi2 + 2nX2 − n2X2 , ou seja, Tn,i= 1 (n − 1)2 (n − 2) n X i=1 Xi2+ 2nX2− n2X2 e (n − 1)Tn,i = 1 n − 1 (n − 2) n X i=1 Xi2+ 2nX2− n2X2 .
Assim sendo obtˆem-se os estimadores de Jackknife puro e generalizado, que neste caso s˜ao iguais devido `a forma do valor m´edio de S02. Temos:
TnJ = nTn− (n − 1)Tn,i = n X i=1 Xi2− nX2− 1 n − 1((n − 2) n X i=1 Xi2+ 2nX2− n2X2) = 1 n − 1((n − 1 − (n − 2)) n X i=1 Xi2− (n2− n + 2n − n2)X2) = 1 n − 1( n X i=1 Xi2− nX2) = 1 n − 1 n X i=1 (Xi− X)2 = S2, e TnG = 1 1 − α(Tn− αTn,i) = 1 (1 −n−1n )(Tn− n − 1 n Tn,i) = n(Tn− n − 1 n Tn,i) = nTn− (n − 1)Tn,i = T J n = S 2.
3.2. ESTIMADOR DE JACKKNIFE GENERALIZADO 39 Consideremos agora a amostra aleat´oria de dimens˜ao 10,
(5.496176, 6.905640, 5.304241, 5.496462,
2.313852, 6.916982, 4.957533, 5.547900
5.907614, 8.544794), proveniente de uma popula¸c˜ao com distribui¸c˜ao Normal de valor m´edio 5 e de variˆancia 2. Tal como no Exemplo 11 vamos come¸car por calcular para ∀i ∈ {1, 2, . . . , 10} T10,i.Tem-se:
• T10,1= 2.585519, T10,2= 2.424810,
• T10,3= 2.569458, T10,4= 2.585536,
• T10,5= 1.144354, T10,6= 2.421527,
• T10,7= 2.517389, T10,8= 2.588292,
• T10,9= 2.589301, T10,10= 1.620978.
De onde resulta Tn,i = 2.304716 e TnJ = nTn− (n − 1)Tn,i = 2.592806.
Calculando S2 = 1 n−1
Pn
i=1(Xi− X)2, obt´em-se o valor 2.592806, que j´a era esperado
uma vez que se provou que o estimador de jackknife puro, TJ
n, associado a S
3.3
Algumas Propriedades dos Estimadores de
Jackknife
Nesta sec¸c˜ao iremos ver quatro propriedades dos estimadores de jackknife, entre elas uma que nos permite garantir que o estimador de jackknife generalizado, quando existe, ´e um estimador centrado e tamb´em um outro caso em que os estimadores de jackknife puro e generalizado coincidem.
3.3.1
Consistˆ
encia da M´
edia da Amostra Jackknife
Teorema 10. Seja (X1, X2, . . . , Xn) um amostra aleat´oria proveniente de uma
po-pula¸c˜ao com distribui¸c˜ao F (x) = F (x; θ), com θ parˆametro de interesse e desconhe-cido. Seja Tn um estimador de θ. Se Tn ´e um estimador consistente para θ ent˜ao
Tn,i ´e um estimador consistente para θ.
Demonstra¸c˜ao. Suponhamos que Tn ´e um estimador consistente para θ. Temos:
Tn p → θ =⇒ Tn,i p → θ =⇒ n X i=1 Tn,i p → nθ, e consequentemente, Tn,i= Pn i=1Tn,i n p → θ. Note-se que para um parˆametro θ o estimador TG
n s´o existe se o estimador Tnfor um
estimador enviesado. Atendendo aos Teoremas 9 e 10 facilmente se conclui que se Tn
´e um estimador consistente para θ, os estimadores TJ
n e TnG s˜ao tamb´em consistentes
para θ.
3.3.2
Centralidade dos Estimadores de Jackknife
Teorema 11. Seja (X1, X2, . . . , Xn) uma amostra aleat´oria proveniente de uma
popula¸c˜ao com distribui¸c˜ao F (x) = F (x; θ), com θ parˆametro de interesse e desco-nhecido. Seja Tn um estimador para θ. Se Tn ´e um estimador centrado ent˜ao o
estimador TnJ com base em Tn ´e um estimador centrado para θ.
Demonstra¸c˜ao. Suponhamos que Tn ´e um estimador centrado para θ. Temos:
E(Tn,i) = θ =⇒ E(Tn,i) = E
Xn i=1 Tn,i/n = 1 n n X i=1 E(Tn,i) = θ.
3.3. ALGUMAS PROPRIEDADES DO JACKKNIFE 41 Logo:
E(TnJ) = nE(Tn) − (n − 1)E(Tn,i) = nθ − (n − 1)θ = (n − n + 1)θ = θ.
Teorema 12. Seja (X1, X2, . . . , Xn) uma amostra aleat´oria proveniente de uma
popula¸c˜ao com distribui¸c˜ao F (x) = F (x; θ), com θ parˆametro de interesse e desco-nhecido, e seja Tn um estimador enviesado para θ tal que E(Tn) = θ + f (n)b(θ) . O
estimador TnG ´e um estimador centrado para θ. Demonstra¸c˜ao. Tem-se E(Tn) = θ + f (n)b(θ), e
E(Tn,i) = θ + f (n − 1)b(θ) =⇒ E(Tn,i) =
1 n n X i=1 E(Tn,i) = θ + f (n − 1)b(θ).
Seja α = f (n)/f (n − 1). Ent˜ao, E(TnJ) = E
Tn− αTn,i 1 − α
= E(Tn) − αE(Tn,i) 1 − α = θ + f (n)b(θ) − f (n) f /n−1(θ − f (n − 1)b(θ)) 1 − α = (1 − α)θ + f (n)b(θ) − f (n)b(θ) 1 − α = θ.
3.3.3
A Metodologia Jackknife na Estima¸
c˜
ao do Vi´
es de um
Estimador
Como corol´ario do Teorema 12, temos o resultado a seguir apresentado, funda-mental para a estima¸c˜ao do vi´es de uma estat´ıstica Tn.
Corol´ario 1. Seja (X1, X2, . . . , Xn) uma amostra aleat´oria proveniente de uma
po-pula¸c˜ao com distribui¸c˜ao F (x) = F (x; θ), com θ parˆametro de interesse e desconhe-cido, e seja Tn um estimador para θ tal que E(Tn) = θ + f (n)b(θ). A estat´ıstica
Vn:= Tn− TnG ´e um estimador centrado para vies ≡ vies(Tn) := E(Tn− θ).
Demonstra¸c˜ao. Pelo teorema anterior sabemos que TnG ´e um estimador centrado para θ. Temos:
Teorema 13. Seja (X1, X2, . . . , Xn) uma amostra aleat´oria proveniente de uma
po-pula¸c˜ao com distribui¸c˜ao F (x) = F (x; θ), com θ parˆametro de interesse e desconhe-cido, e seja Tnum estimador para θ tal que E(Tn) = θ+f (n)b(θ) e α = f (n)f (n − 1).
Seja dvies =Tn− TnG o estimador do vi´es de Tn. Nestas condi¸c˜oes, tem-se
d
vies = α
(1 − α)(Tn,i− Tn)/. Demonstra¸c˜ao. Temos:
d vies = Tn− TnG = Tn− 1 1 − α(Tn− αTn,i) = 1 1 − α((1 − α)Tn− Tn+ αTn,i) = α 1 − α(Tn,i− Tn).
3.3.4
Igualdade entre Estimadores de Jackknife Puro e
Ge-neralizado
Teorema 14. Seja (X1, X2, . . . , Xn) uma amostra aleat´oria proveniente de uma
popula¸c˜ao com distribui¸c˜ao F (x) = F (x; θ), com θ parˆametro de interesse e desco-nhecido, e seja Tn um estimador enviesado para θ tal que E(Tn) = θ + f (n)b(θ). Se
|f (n)| = 1
n ent˜ao T J
n = TnG.
Demonstra¸c˜ao. Suponhamos que |f (n)| = n1. Sabemos que α = −
1 n − 1 n−1 = n−1n e α0 = 1 n 1 n−1
= n−1n , pelo que α = α0. Temos, TnJ = nTn− (n − 1)Tn,i= n(Tn− n − 1 n Tn,i) = 11 n (Tn− αTn,i) = 1 n−n+1 n (Tn− αTn,i) = 1 1 − n−1n (Tn− αTn,i) = 1 1 − α(Tn− αTn,i) = 1 1 − α0(Tn− α 0 Tn,i) = TnG.
3.4. DISTRIBUI ¸C ˜AO PARETO 43
3.4
O Estimador de Jackknife para a Distribui¸
c˜
ao
Pareto
Vejamos agora o exemplo dos estimadores de jackknife puro e jackknife genera-lizado para uma amostra aleat´oria proveniente de uma popula¸c˜ao com distribui¸c˜ao Pareto com parˆametro de interesse α. Vamos utilizar como estimador de base o estimador de m´axima verosimilhan¸ca. Come¸camos por encontrar o estimador de m´axima verosimilhan¸ca para α e mostrar que ´e um estimador enviesado.
Exemplo 13. Seja (X1, X2, . . . , Xn) um amostra aleat´oria proveniente de uma
po-pula¸c˜ao com distribui¸c˜ao Pareto de parˆametro δ. Temos fX1,X2,...,Xn(x1, x2, . . . , xn) = n Y i=1 fXi(xi) = n Y i=1 δ(xi)(−δ+1) = δn n Y i=1 xi !−(δ+1) , e consequentemente, ln fX1,X2,...,Xn(x1, x2, . . . , xn) = n ln δ − (δ + 1) n X i=1 ln xi. Ent˜ao, ∂ ln fX1,X2,...,Xn(x1, x2, . . . , xn) ∂δ = 0 ⇐⇒ n δ − n X i=1 ln xi = 0 ⇐⇒ δ = n Pn i=1ln xi . Como ∂2ln fX1,X2,...,Xn(x1,x2,...,xn) ∂δ2 = − n δ2 < 0, temos ˆ δ = Pn n i=1ln xi . Vejamos qual a distribui¸c˜ao de ˆδ. Temos
P (ln X ≤ x) = P (X ≤ ex) = ( 0, se ex < 1 1 − (ex)−δ se ex ≥ 1 = ( 0, se x ≤ 0 1 − e−δx se x ≥ 0. Logo, ln X tem distribui¸c˜ao Exponencial de valor m´edio (1/δ), concluindo-se pois quePn
Seja Y :=Pn
i=1ln Xi. Nestas condi¸c˜oes tem-se para n > 2
E 1 Y = Z +∞ 0 1 y δn Γ(n)y n−1 e−δydy = δ n Γ(n) Z +∞ 0 y(n−1)−1e−δydy = δ n δn−1 Γ(n − 1) Γ(n) = δ (n − 2)! (n − 1)! = δ n − 1. Logo o valor m´edio de Tn= (Pn n
i=1ln Xi) ´e E(Tn) = E n Y = n n − 1δ = δ + 1 n − 1δ, i.e., f (n) = 1/(n − 1). Consequentemente, α = f (n) f (n − 1) = 1 n − 1 / 1 n − 2 = n − 2 n − 1, e 1 − α = 1 − n − 2 n − 1 = 1 n − 1. Por outro lado,
Tn,i= n − 1 P j6=iln Xj =⇒ Tn,i= 1 n n X i=1 n − 1 P j6=iln Xj = n − 1 n n X i=1 1 P j6=iln Xj , de onde se obtˆem os estimadores de jackknife puro e generalizado, dados por
TnJ = nTn− (n − 1)Tn,i= n2 Pn i=1ln Xi − (n − 1) 2 n n X i=1 1 P j6=iln Xj , e TnG = 1 1 − α(Tn− αTn,i) = 11 n−1 (Pn n i=1ln Xi −n − 2 n − 1 n − 1 n n X i=1 1 P j6=iln Xj ) = (n − 1)(Pn n i=1ln Xi − n − 2 n n X i=1 1 P j6=iln Xj ), respectivamente. Seja 1.4473453, 2.9146631, 1.3192541, 1.0496366, 1.0815746, 1.2357974, 2.1035691, 1.4460795, 1.1795218, 2.2215765, 1.3699815, 1.0930229, 2.3423185, 1.0118812, 1.0756544
3.4. DISTRIBUI ¸C ˜AO PARETO 45
uma amostra aleat´oria de dimens˜ao 15, gerada a partir de uma popula¸c˜ao com dis-tribui¸c˜ao Pareto de parˆametro 3. Chegamos ent˜ao `a amostra Jackknife,
T15,1, T15,2, T15,3, T15,4, T15,5, T15,6, T15,7, T15,8, T15,9, T15,10, T15,11, T15,12, T15,13, T15,14, T15,15 = 2.74464441, 3.181226, 2.695673, 2.582011, 2.596364, 2.662175, 2.961748, 2.744174, 2.638789, 2.996346, 2.775401, 2.601444, 3.03675, 2.564684, 2.593724 Tem-se T15 = 2.74194264, T15,i = 2.7539385, α = 1314, de onde se obtˆem as
estimativas TJ
3.5
Uma Abordagem Computacional
Nesta Sec¸c˜ao apresentamos um programa elaborado no software R-Project que para um dado estimador Tncalcula os valores observados dos estimadores Tn, TnJ, TnG,
a estimativa dvies e ainda uma estimativa para a variˆancia do estimador Tn. Nos
ca-sos em que o estimador Tn ´e um estimador centrado, o programa n˜ao calcular´a os
valores das estimativas dvies de Tn e de TnG. Na realidade, embora tenhamos visto
anteriormente alguns exemplos simples em que a solu¸c˜ao anal´ıtica ´e poss´ıvel, na maior parte das situa¸c˜oes a abordagem ter´a de ser computacional, sendo usual utili-zar o estimador de jackknife puro, uma vez que geralmente n˜ao se possui informa¸c˜ao adicional sobre o vi´es. O algoritmo ´e de implementa¸c˜ao simples e ser´a inicialmente apresentado em pseudo-c´odigo:
• Calcule-se a estimativa eθn = φ(x), do parˆametro desconhecido θ.
• Para i desde 1 at´e n,
– Considere-se a amostra xi, obtida de (x1, x2, . . . , xn) por extrac¸c˜ao do
i-´esimo elemento xi.
– Calcule-se eθi = φ(xi).
• Calcule-se θn, a m´edia dos valores eθi, 1 ≤ i ≤ n.
• Obtenha-se a estimativa θJ
n = neθn− (n − 1)θn.
Exemplo 14. Seja (X1, X2, . . . , Xn) uma amostra aleat´oria proveniente de uma
po-pula¸c˜ao com distribui¸c˜ao exponencial com o valor m´edio 7. Comecemos por simular uma amostra de dimens˜ao 100 utilizando a Transforma¸c˜ao Uniformizante.
> gerexp<-function(n,alfa){ + x<-runif(n) + y<-(-alfa)*log(1-x) + } > z<-gerexp(100,7) > z [1] 3.37802714 1.63401135 6.00336211 0.57069977 [5] 16.19151482 3.48573782 0.37367477 8.40183099 [9] 8.37749142 0.49662577 1.62230087 2.80822597
3.5. UMA ABORDAGEM COMPUTACIONAL 47 [13] 5.66924671 1.83793488 0.02733397 5.12885666 [17] 0.49331967 1.17816341 3.88654754 4.50613858 [21] 17.31977923 15.01836026 8.98323323 12.41726805 [25] 3.64653017 10.43087594 0.42595783 18.45791157 [29] 2.02738632 9.00971531 4.73821804 10.48540589 [33] 2.61008667 1.23815531 0.20200083 12.58798280 [37] 8.02316044 1.12746694 7.45297916 4.53820030 [41] 3.04323949 19.06438875 13.91682218 2.61833892 [45] 5.12628411 0.88552012 1.95136044 2.09934477 [49] 7.46505497 2.08838049 4.02309546 11.77348339 [53] 1.96511531 6.68718432 7.79776304 4.08299021 [57] 0.57077713 2.50242185 18.61214684 4.57737052 [61] 6.33259732 3.60516658 4.90760676 2.23702190 [65] 11.56744114 2.08676847 1.76756419 4.31840877 [69] 9.21897152 16.50745337 9.14062628 3.76622935 [73] 2.01483566 1.86863224 9.47274030 14.33974155 [77] 3.79010427 7.64094289 10.37676079 13.80375502 [81] 16.05472515 6.71719905 18.37445742 6.85652750 [85] 6.71252630 2.76371515 3.19929764 3.96594686 [89] 4.75263767 2.88909980 14.98031922 9.25608705 [93] 18.68273496 6.52938499 2.59430103 11.15879805 [97] 5.60987717 13.46311519 16.79960242 9.08380706
Ap´os a execu¸c˜ao do procedimento apresentado obtemos o vector z que ser´a a nossa amostra simulada. Fa¸camos agora a constru¸c˜ao das n subamostras necess´arias para a constru¸c˜ao do estimador de jackknife. Para obtermos a primeira subamostra que resulta da elimina¸c˜ao do primeiro elemento do vector z, basta executarmos os se-guintes comandos:
> #para a primeira subamostra: > auxiliar<-0 > auxiliar1<-0 > for(i in 2:length(z)){ + auxiliar[i-1]<-z[i] + } > auxiliar1<-auxiliar
i-´esimo elemento ao vector z basta executarmos trˆes procedimentos. Para obtermos da segunda subamostra at´e `a (n − 1)-´esima amostra devemos executar o seguinte procedimento:
> #do 2ˇz vector at´e ao pen´ultimo > for(i in 2:(length(z)-1)){ + for(j in 1:(i-1)){ + auxiliar[j]<-z[j] + } + for(j in (i+1):(length(z))){ + auxiliar[j-1]<-z[j] + } + auxiliar1<-cbind(auxiliar1,auxiliar) + + } >
Para finalizarmos a obten¸c˜ao das subamostras, obtemos a n-´esima subamostra executando o seguinte conjunto de instru¸c˜oes:
> #para o ultimo vector > for(i in 1:(length(z)-1)){ + auxiliar[i]<-z[i]
+ }
> auxiliar1<-cbind(auxiliar1,auxiliar)
Desta forma a matriz “auxiliar1” ser´a a matriz em que a i-´esima coluna corres-ponde `a i-´esima subamostra de z.
Ap´os a explica¸c˜ao do procedimento com vista a obter as subamostras que excluem a i-´esima observa¸c˜ao vamos apresentar uma fun¸c˜ao (que cont´em o referido procedi-mento) que calcula as estimativas de m´axima verosimilhan¸ca, jackknife puro, jackk-nife generalizado, da variˆancia e do vi´es do estimador de m´axima verosimilhan¸ca. O estimador de m´axima verosimilhan¸ca ser´a o estimador de base dos estimadores de jackknife:
> funcaoc<-function(n){ + 0
3.5. UMA ABORDAGEM COMPUTACIONAL 49 > gerexp<-function(x,alfa){ + y<-(-alfa)*log(1-x) + } > estimativaJackknife<-function(m,n,dist,al,estimador,f){ + + estimativaJackknife1<-function(n,dist,al,estimador,f){ + + y<-runif(n) + x<-dist(y,al) +
+ #para o primeiro vector: + auxiliar<-0 + auxiliar1<-0 + j<-1 + for(i in 2:length(x)){ + auxiliar[j]<-x[i] + j<-j+1 + } + estimativas<-0 + estimativas[1]<-estimador(auxiliar) + + auxiliar1<-auxiliar
+ #do 2ˇz vector at´e ao pen´ultimo + for(i in 2:(length(x)-1)){ + for(j in 1:(i-1)){ + auxiliar[j]<-x[j] + } + for(j in (i+1):(length(x))){ + auxiliar[j-1]<-x[j] + } + auxiliar1<-cbind(auxiliar1,auxiliar) + estimativas[i]<-estimador(auxiliar) + } + +