Metodologia Jackknife na estimação paramétrica em modelos extremais: programação em R

(1)

Faculdade de Ciˆencias

Departamento de Estat´ıstica

e Investiga¸c˜

ao Operacional

Metodologia Jackknife na Estima¸

c˜

ao

Param´

etrica em Modelos Extremais:

Programa¸

c˜

ao em R

Pedro de Antas Guimar˜

aes Marques Martins

Disserta¸c˜

ao orientada

pela Prof. Doutora Maria Ivette Leal de Carvalho Gomes

Mestrado em Estat´ıstica

2012

(2)

(3)

Resumo

O objectivo fundamental deste trabalho é o estudo da metodologia de Jackknife em modelos de extremos, particularmente na distribui¸cão Fréchet. Fazemos uma breve abordagem da Teoria dos Valores Extremos, estudamos as distribui¸cões assintóticas de máximos e de m´ınimos e procedemos a algumas ilustra¸cões dos resultados utilizando métodos computacionais. Abordamos ainda a metodologia de Jackknife e definimos estimadores de jackknife puro e de jackknife generalizado com o objectivo de reduzir o viés do estimador que lhe serve de base. No caso particular do modelo Fréchet apenas estudamos o comportamento do estimador de jackknife puro uma vez que não temos informa¸cão sobre o viés assintótico do estimador de máxima verosimilhan¸ca do parâmetro de forma do modelo Fréchet, necessária para a obten¸cão do estimador de jackknife generalizado.

Palavras chave: Distribui¸cão assintótica do máximo, distribui¸cão assint´ o-tica do m´ınimo, estimador de jackknife puro, estimador de jackknife generalizado.

(4)

(5)

Abstract

The main objective of this thesis is the study of the Jackknife methodology in extremal models, like the Fr´echet parent. After a brief introduction to Extreme Value Theory, we describe the possible non-degenerate limiting distributions for maxima and for minima. We further illustrate those results through the use of computational methods developed with the R software. We next proceed with the description of the Jackknife methodology, defining the pure jackknife and the generalized jackknife, as suitable procedures for the reduction of bias of any estimator. In the particular case of Fr´echet underlying parents, we study only the pure jackknife. This is due to the fact that we have not been able to get the adequate information on the asymptotic bias of maximum likelihood estimators of the unknown parameters for such models.

Keywords: Asymptotic distributions for maxima, Asymptotic distributions for minima, pure and generalized jackknife estimators.

(6)

(7)

Agradecimentos

Agrade¸co à minha orientadora, Prof. Doutora Maria Ivette Leal de Carvalho Gomes, a direçcão, apoio, compreensão e disponibilidade com que sempre me atendeu e orientou a minha tese de mestrado; à minha fam´ılia que me motivou e encorajou em todos os momentos para a realiza¸cão desta tese; aos meus amigos que me acompanharam e entusiasmaram para a realiza¸cão e conclusão deste trabalho.

(8)

Conte´

udo

1 Introdu¸c˜ao 3

2 Referˆencia `a Teoria de Valores Extremos 5

2.1 A Sucess˜ao de M´aximos Parciais . . . 7

2.1.1 Comportamento Limite n˜ao Degenerado do M´aximo . . . 7

2.1.2 Caracteriza¸cão dos Dom´ınios de Atraçcão para Máximos . . . 8

2.1.3 Escolha das Constantes de Atrac¸c˜ao . . . 9

2.1.4 Alguns Exemplos . . . 10

2.1.5 Condi¸c˜oes Suficientes de von Mis`es . . . 12

2.2 Sucess˜ao de M´ınimos Parciais . . . 14

2.2.1 Comportamento Limite do M´ınimo . . . 14

2.2.2 Caracteriza¸cão dos Dom´ınios de Atraçcão para M´ınimos . . . 15

2.2.3 Escolha das Constantes de Atrac¸c˜ao . . . 15

2.2.4 Exemplos . . . 16

2.2.5 Dom´ınio de Atraçcão para M´ınimos dos Modelos Limite de Máximos . . . 17

2.3 Comportamento Limite dos Excessos . . . 18

2.4 Uma Abordagem Computacional . . . 20

3 Estimadores de Jackknife 31 3.1 Estimador de Jackknife Puro . . . 33

3.2 Estimador de Jackknife Generalizado . . . 36

3.3 Algumas Propriedades do Jackknife . . . 40

3.3.1 Consistˆencia da M´edia da Amostra Jackknife . . . 40

3.3.2 Centralidade dos Estimadores de Jackknife . . . 40

3.3.3 A Metodologia Jackknife na Estima¸cão do Viés de um Estimador 41 3.3.4 Igualdade entre Estimadores de Jackknife Puro e Generalizado 42 3.4 Distribui¸cão Pareto . . . 43

(9)

(10)

Cap´ıtulo 1

Introdu¸

c˜

ao

A presente tese incide sobre a metodologia de Jackknife e o seu comportamento na redu¸cão do viés de estimadores de parâmetros desconhecidos, em modelos directamente relacionados com a Teoria de Valores Extremos (TVE). Baseando-se simplesmente na divisão da amostra em duas sub-amostras, a metodologia Jackk-nife foi utilizada inicialmente por Quenouille (1949) para redu¸cão do viés de um estimador da correla¸cão serial. Em 1956, Quenouille (veja-se Quenouille, 1956) generalizou esta ideia, dividindo a amostra em g grupos de tamanho h, n = g × h, e explorou a sua aplicabilidade genérica. Restringir-nos-emos aqui ao caso g = n, h = 1, que é sem dúvida o caso mais atraente, por eliminar a arbitrariedade dos subgrupos, sendo muito frequentemente a melhor forma de utiliza¸cão da técnica Jackknife.

No Cap´ıtulo 2, fazemos uma breve introdu¸cão a resultados limites fulcrais em TVE, referindo brevemente, na Seçcão 2.1, os poss´ıveis comportamentos limite não degenerados da sucessão de máximos parciais {Xn:n:= max(X1, X2, . . . , Xn)}n≥1,

onde (X1, X2, . . . Xn) é uma amostra aleatória de variáveis independentes e

iden-ticamente distribu´ıdas (i.i.d.), provenientes de uma distribui¸cão desconhecida, F . Essa distribui¸cão limite não-degenerada é, então, do tipo da chamada distribui¸cão de Valores Extremos, com a forma funcional

Gγ(x) =

(

exp(−(1 + γx)−1/γ), 1 + γx > 0 se γ 6= 0

exp(− exp(−x)), x ∈ R se γ = 0, (1.1) onde γ (∈ R) ´e o chamado ´ındice de valores extremos (para m´aximos).

A Seçcão 2.2 é semelhante à Seçcão 2.1, mas para a sucessão de m´ınimos parciais, {X1:n:= min(X1, X2, . . . , Xn)}_n≥1. As poss´ıveis distribui¸cões limite são então do

(11)

tipo, G∗_γ(x) = 1−Gγ(−x), com Gγ(x) definido em (1.1), isto ´e, tˆem a forma funcional

G∗_γ(x) = (

1 − exp(−(1 − γx)−1/γ), 1 − γx > 0, se γ 6= 0

1 − exp(− exp(x)), x ∈ R se γ = 0. (1.2) Na Seçcão 2.3 referimos brevemente o comportamento limite dos excessos acima de um n´ıvel elevado u, quando u = un → +∞, quando n → ∞. Obtêm-se então

distribui¸c˜oes do tipo da Pareto generalizada, com a forma funcional, Pγ(x) = 1 + ln Gγ(x)

= (

1 − (1 + γx)−1/γ, 1 + γx > 0, x > 0 se γ 6= 0

1 − exp(−x), x > 0 se γ = 0. (1.3) Finalmente, na Seçcão 2.4, apresentam-se programas elaborados e executáveis no software R-project que nos permitem fazer algumas ilustra¸cões de resultados da Seçcão 2.1 relativos à distribui¸cão assintótica do máximo.

No Cap´ıtulo 3, come¸camos por introduzir, na Seçcão 3.1, o conceito de estimador de jackknife puro e, na Seçcão 3.2, o conceito de estimador de jackknife generali-zado. Na Seçcão 3.3 referimos algumas propriedades dos estimadores de jackknife, tais como a consistência da média da amostra jackknife, a centralidade dos estimado-res de jackknife puro e generalizado, a importância desta metodologia na estima¸cão do viés de um estimador arbitrário de qualquer parâmetro desconhecido, e situa¸cões de coincidência dos estimadores de jackknife puro e generalizado. Na Seçcão 3.4, e numa primeira abordagem meramente anal´ıtica, estudamos o comportamento dos estimadores de jackknife associados aos estimadores de máxima verosimilhan¸ca do parâmetro desconhecido em distribui¸cão Pareto, um caso particular da distribui¸cão definida em (1.3). Na Seçcão 3.5, consideramos uma segunda abordagem, de ´ındole computacional, e avan¸camos com o estudo do comportamento dos estimadores de Jackknife associados aos estimadores de máxima verosimilhan¸ca de parâmetros des-conhecidos em distribui¸cão Fréchet, um caso particular da distribui¸cão definida em (1.1). Estudamos ainda o comportamento dos estimadores de jackknife para estimar os parâmetros das distribui¸cões Exponencial e Pareto.

(12)

Cap´ıtulo 2

Breve Referˆ

encia `

a Teoria de

Valores Extremos

Neste cap´ıtulo apresentamos um conjunto de defini¸cões que permitem estu-dar a distribui¸cão assintótica do máximo e do m´ınimo de uma amostra aleatória (X1, X2, . . . , Xn). Dada uma amostra aleatória proveniente de uma popula¸cão

quan-titativa, constitu´ıda por variáveis aleatórias (v.a’s) i.i.d. com fun¸cão de distribui¸cão (f.d.) F , é sempre poss´ıvel ordená-la por ordem não decrescente.

Defini¸c˜ao 1. Seja (X1, X2, . . . , Xn) uma amostra aleat´oria. A amostra ordenada

associada a (X1, X2, . . . , Xn) ´e denotada por (X1:n, X2:n, . . . , Xn:n) e tem-se X1:n≤

X2:n≤ ... ≤ Xn−1:n ≤ Xn:n.

Da Defini¸cão 1 facilmente se conclui que o m´ınimo da amostra é denotado por X1:n e o que o máximo da amostra é denotado por Xn:n.

Seguidamente procedemos, nas Seçcões 2.1 e 2.2, ao estudo da convergência em distribui¸cão das v.a.’s Xn:n e X1:n, respectivamente. Come¸camos por enunciar

te-oremas de tipos extremais, de acordo com os quais tanto a distribui¸cão limite da sucessão de m´ınimos parciais, X1:n como da sucessão de máximos parciais, Xn:n,

convenientemente normalizadas, se existirem, apenas podem ser de um de trˆes ti-pos, quando n tende para infinito, sendo o conceito de tipo introduzido na seguinte defini¸c˜ao:

Defini¸cão 2. As fun¸cões de distribui¸cão F e G são do mesmo tipo se e só se existirem constantes λ ∈ R e δ > 0 tais que G(x) = F (λ + δx), ∀x ∈ R.

Nessas mesmas seçcões, após a defini¸cão de dom´ınio de atraçcão, procedemos `

(13)

suficientes de convergência para cada um dos tipos, damos indica¸cão sobre poss´ıveis escolhas das constantes de atraçcão, e após alguns exemplos, apresentamos condi¸cões suficientes de atraçcão para cada um dos tipos extremais.

Na Seçcão 2.3 abordamos de forma ligeira o comportamento limite dos excessos acima de um n´ıvel elevado, e finalmente, na Seçcão 2.4, procedemos a uma aborda-gem computacional de identifica¸cão da lei limite extremal.

(14)

2.1. A SUCESS ˜AO DE M ´AXIMOS PARCIAIS 7

2.1 A Sucess˜

ao de M´

aximos Parciais

Seja (X1, X2, . . . Xn) uma amostra de v.a.’s i.i.d. com f.d. F (x) e seja Xn:n =

max(X1, X2, . . . , Xn). ´E ent˜ao imediato verificar que

P Xn:n ≤ x = P X1 ≤ x, X2 ≤ x. . . . , Xn≤ x = Fn(x). Consequentemente, P(Xn:n ≤ x) → n→∞ ( 0 se F (x) < 1 1 se F (x) = 1,

i.e., temos um comportamento limite degenerado para a sucess˜ao de m´aximos par-ciais, Xn:n, ou seja Xn:n p −→ n→∞ x ∗ := sup{x : F (x) < 1},

o limite superior do suporte de F . Não é pois poss´ıvel obter um comportamento não degenerado da sucessão de máximos parciais sem primeiro efectuarmos uma normaliza¸cão conveniente.

2.1.1 Comportamento Limite n˜

ao Degenerado do M´

aximo

Face ao comportamento limite de Xn:n referido anteriormente, colocam-se ent˜ao,

entre outras, as quest˜oes seguintes:

• Existem sucess˜oes de constantes {an} e {bn}, an∈ R, bn > 0, tais que

P

X_n:n− a_n bn

≤ x= Fn(an+ bnx) −→

n→∞ G(x),

em que G(x) ´e uma f.d. n˜ao degenerada?

• Caso a resposta `a quest˜ao anterior seja afirmativa, quais as poss´ıveis formas de G(x)?

Em 1943 Gnedenko mostrou de forma completa, através do usualmente chamado Teorema de Tipos Extremais, quais as formas poss´ıveis para G(x). Note-se no entanto a existência de respostas parciais em artigos anteriores, de entre os quais destacamos Fréchet (1927), Fisher & Tippett (1928) e von Misès (1936).

(15)

Teorema 1 (Leis limite do máximo normalizado, Gnedenko, 1943). Seja (X1, X2, . . . , Xn) uma amostra aleatória proveniente de uma popula¸cão com

distri-bui¸c˜ao F. Quando n tende para infinito, se existirem sucess˜oes an ∈ R e bn > 0,

tais que (Xn:n − an)/bn tem comportamento limite n˜ao degenerado, esse limite ´e

necessariamente de um dos trˆes seguintes tipos: 1. F1(x) = ( 0 se x ≤ 0 e−x−α se x > 0 (α > 0), (2.1) 2. F2(x) = ( e−(−x)α se x < 0 1 se x ≥ 0 (α > 0), (2.2) 3. F3(x) = e−e −x , _{x ∈ R.} (2.3)

Defini¸c˜ao 3. Seja X1, X2, . . . , Xn uma amostra aleat´oria proveniente de uma

popu-la¸cão com distribui¸cão F. Quando n → ∞ e ∀i ∈ 1, 2, 3, dizemos que F pertence ao dom´ınio de atraçcão de Fi e denotamos por F ∈ DM(Fi), se a fun¸cão distribui¸cão

limite de (Xn:n− an)/bn for Fi.

Note-se que os três tipos, em (2.1), (2.2) e (2.3), se podem escrever de acordo com a expressão uniparamétrica em (1.1), que reproduzimos,

Gγ(x) =

(

exp(−(1 + γx)−1/γ), 1 + γx > 0 se γ 6= 0 exp(− exp(−x)), x ∈ R se γ = 0.

Note-se tamb´em que o ramo γ = 0 resulta como limite, quando γ → 0, do ramo para γ 6= 0. Note-se ainda que

Gγ(x) =      Φ1/γ(1 + γx) se γ > 0 Ψ−1/γ(−(1 + γx)) se γ < 0 Λ(x) se γ = 0.

2.1.2 Caracteriza¸

c˜

ao dos Dom´ınios de Atrac¸

c˜

ao para M´

axi-mos

Quando se tem uma amostra aleatória proveniente de uma popula¸cão com dis-tribui¸cão F , existem condi¸cões necessárias e suficientes para que F ∈ DM(Fi),

(16)

2.1. A SUCESS ÃO DE M ÁXIMOS PARCIAIS 9 i = 1, 2, 3. O Teorema seguinte é outro dos resultados clássicos em TVE e constitui uma base da Teoria Assintótica de Extremos. As condi¸cões necessárias e suficientes apresentadas são equivalentes às condi¸cões iniciais dadas por Gnedenko (1943), para o dom´ınio de atraçcão de F1 e F2, e por de Haan (1970), para o dom´ınio de atraçcão

de F3.

Teorema 2. Seja (X1, X2, . . . , Xn) uma amostra aleat´oria proveniente de uma

po-pula¸c˜ao com distribui¸c˜ao F.

1. F ∈ DM(F1) se e s´o se F−1(1) = +∞ e existir uma constante α > 0 tal que:

lim t→+∞ 1 − F (tx) 1 − F (t) = x −α , ∀x > 0. (2.4) 2. F ∈ DM(F2) se e s´o se F−1(1) < +∞ (f inito) e existir uma constante α > 0

tal que: lim δ→0+ 1 − F (F−1(1) − δx) 1 − F (F−1_{(1) − δ)} = x α_, _{∀x > 0.} _(2.5)

3. F ∈ DM(F3) se e s´o se E(X|X > c) ´e finito para algum c < F−1(1), onde E

denota o operador de valor m´_{edio, e para ∀x ∈ R se tiver:} lim t→F−1₍₁₎ 1 − F (t + x E(X − t|X > t)) 1 − F (t) = e −x . (2.6)

2.1.3 Escolha das Constantes de Atrac¸

c˜

ao

Teorema 3 (Constantes de normaliza¸c˜ao). Seja (X1, X2, . . . , Xn) uma amostra

ale-atória proveniente de uma popula¸cão com distribui¸cão F. As constantes de norma-liza¸cão ou atraçcão, an> 0 e bn> 0, tais que

lim

n→+∞FXn:n−anbn (x) = Fi(x), i = 1, 2, 3,

podem ser escolhidas da seguinte forma:

1. Se i = 1, então as constantes de normaliza¸cão são an= 0 e bn = F−1 1 − 1 n . 2. Se i = 2, então as constantes de normaliza¸cão são

an = F−1(1) e bn= F−1(1) − F−1 1 − 1 n . 3. Se i = 3, então as constantes de normaliza¸cão são

an = F−1 1 − 1 n e bn= F−1 1 − 1 ne − F−11 − 1 n . Pode-se equivalentemente escolher bn = E(X − an| X > an).

(17)

2.1.4 Alguns Exemplos

Exemplo 1. Seja (X1, X2, . . . , Xn) uma amostra aleat´oria proveniente de uma

po-pula¸cão com distribui¸cão Exponencial de valor médio δ, isto é, FX(x) = ( 0 se x < 0 1 − e−xδ se x ≥ 0. Temos: y = F (x) ⇐⇒ y = 1 − e−xδ ⇐⇒ e− x δ = 1 − y ⇐⇒ −x δ = ln(1 − y) ⇐⇒ x = −δ ln(1 − y). Logo F−1(y) = −δ ln(1 − y) e F−1(1) = +∞.

Vamos em seguida verificar a poss´ıvel validade da condi¸cão (2.4) do Teorema 2: lim t→+∞ 1 − F (tx) 1 − F (t) = limt→+∞ e−txδ e−δt = lim t→+∞e (1−x)t δ =      0 se x > 1 1 se x = 1 +∞ se 0 ≤ x < 1. Logo o limite em (2.4) é diferente de xα, isto é, a condi¸cão (2.4) não é satisfeita. Vamos em seguida verificar se a condi¸cão (2.6) do Teorema 2 é válida. Comecemos por estudar a distribui¸c˜_{ao condicional de X|X > t para um t ∈ R. Tem-se:}

P(X ≤ x|X > t) = P(X ≤ x, X > t) P(X > t) = ( 0 se x ≤ t P(t≤X≤x) P (X > t) se x > t = ( 0 se x ≤ t FX(x)−FX(t) 1−FX(t) se x > t =    0 se x ≤ t e− tδ(1−e− x−tδ ) e− tδ se x > t = ( 0 se x ≤ t 1 − e−(x−t)δ se x > t.

De onde se conclu´ımos que Z := X|X > t é uma variável aleatória Exponencial com parâmetros de localiza¸c˜_{ao e escala t e δ, respectivamente. Logo E(X|X > t) = δ + t,} de onde se conclui que E(X − t|X > t) = δ. Temos:

lim t→F−1₍₁₎ 1 − F (t + xE(X − t|X > t)) 1 − F (t) = lim t→+∞ 1 − F (t + xδ) 1 − F (t) = limt→+∞ e−t+xδδ e−tδ = e−x.

(18)

2.1. A SUCESS ÃO DE M ÁXIMOS PARCIAIS 11 Logo, a condi¸cão (2.6) do Teorema 2 é válida. Consequentemente, F ∈ DM(F3),

e nestas condi¸c˜oes a aplica¸c˜ao do Teorema 3 leva-nos a uma poss´ıvel escolha de constantes:

• an= F−1(1 − 1_n) = −δ ln(_n1) = δ ln n;

• bn= E(X − an|X > an) = δ.

po-pula¸cão com distribui¸cão Pareto de parâmetro α. Temos: FX(x) =

(

0 se x ≤ 1 1 − x−α se x > 1. Logo F−1(1) = +∞.

Verifiquemos se nestas condi¸cões, a condi¸cão (2.4) do Teorema 2 é válida: lim t→+∞ 1 − F (tx) 1 − F (t) = limt→+∞ (tx)−α t−α = lim_t→+∞ t−αx−α t−α = x −α .

De onde conclu´ımos que F ∈ DM(F1), com parˆametro α, uma vez que a condi¸c˜ao

(2.4) do Teorema 2 ´e v´alida. Temos ainda: • an= 0;

• bn= F−1(1 −_n1) = n

1 α.

popula¸cão com distribui¸cão Power de parâmetro θ. Temos:

FX(x) =      0 se x < 0 xθ se 0 ≤ x ≤ 1 1 se x > 1, ou seja F−1(1) = 1.

Uma vez que F−1(1) = 1 (´e finito) vamos verificar a possivel validade da condi¸c˜ao (2.5) do Teorema 2: lim t→0+ 1 − F (F−1(1) − tx) 1 − F (F−1_{(1) − t)} = lim_t→0+ 1 − F (1 − tx) 1 − F (1 − t) = lim t→0+ 1 − (1 − tx)θ 1 − (1 − t)θ = lim_t→0+ θx(1 − tx)θ−1 θ(1 − t)θ−1 = θx θ = x.

Logo, a condi¸cão (2.5) do Teorema 2 é válida, de onde conclu´ımos que F ∈ DM(F2),

(19)

• an= F−1(1) = 1;

• bn= F1(1) − F−1(1 −_n1) = 1 − (1 −_n1)

1 θ.

2.1.5 Condi¸

c˜

oes Suficientes de von Mis`

es

As condi¸cões do Teorema 2 nem sempre são fáceis de verificar. No caso de F ser uma fun¸cão distribui¸cão absolutamente cont´ınua pode verificar-se a validade para F de condi¸cões suficientes do tipo das obtidas por von Misès (1936), apresentadas no Teorema seguinte:

Teorema 4 (Condi¸cões suficientes de von Misès para a distribui¸cão do máximo). Seja (X1, X2, . . . , Xn) uma amostra aleatória proveniente de uma popula¸cão com

distribui¸cão absolutamente cont´ınua F (·) e com fun¸cão densidade de probabilidade f (·). Seja h(x) = f (x)/(1 − F (x)) a taxa de mortalidade instântanea.Temos:

1. Se h(x) > 0 para valores elevados de x e para α > 0, lim

x→+∞xh(x) = α, (2.7)

ent˜ao F ∈ DM(F1), com parˆametro α.

2. Se F−1(1) < ∞ e para α > 0 lim

x→F−1₍₁₎(F

−1

(1) − x)h(x) = α, (2.8) ent˜ao F ∈ DM(F2), com parˆametro α.

3. Se h(x) não tem ra´ızes, é diferenciável numa vizinhan¸ca de F−1(1), e lim x→F−1₍₁₎ d dx 1 h(x) = 0, (2.9) então F ∈ DM(F3).

po-pula¸cão com distribui¸cão Rayleigh de parâmetro θ. Temos FX(x) = ( 0 se x < 0 1 − e−(xθ) 2 se x ≥ 0 fX(x) = d dxFX(x) = ( 0 se x < 0 2x θ2e −(x_θ)2 se x ≥ 0.

(20)

2.1. A SUCESS ˜AO DE M ´AXIMOS PARCIAIS 13 De onde conclu´ımos que:

h(x) = fX(x) 1 − FX(x) =    0 se x < 0 2x θ2 e−( xθ)2 1−1+e−( xθ)2 se x ≥ 0 = ( 0 se x < 0 2x θ2 se x ≥ 0. Logo, lim x→F−1₍₁₎ d dx 1 h(x) = limx→+∞− θ2 2x2 = 0.

Uma vez que a condi¸cão (2.9) do Teorema 4 é verificada, conclu´ımos que F ∈ DM(F3) e, nestas condi¸cões podemos escolher:

• an= F−1(1 − 1_n) = θ ln₁₋₍₁₋1 1 n) = θ ln(11 n ) = θ ln n; • bn= F−1(1 −_ne1 ) − F−1(1 −_n1) = θ ln( 11 ne ) − θ ln n = θ ln ne − θ ln n = θ(ln n + ln e) − θ ln n = θ.

(21)

2.2 Sucess˜

ao de M´ınimos Parciais

Seja (X1, X2, . . . Xn) uma amostra de v.a.’s i.i.d. com f.d. F (x) e seja X1:n =

min(X1, X2, . . . , Xn). ´E ent˜ao imediato verificar que

P X1:n ≤ x = 1 − P X1:n≥ x = 1 − P X1 ≥ x, X2 ≥ x. . . . , Xn≥ x = 1 − (1 − F (x))n. Consequentemente, P(X1:n≤ x) → n→∞ ( 0 se F (x) = 0 1 se F (x) > 0,

i.e., temos um comportamento limite degenerado para a sucess˜ao de m´ınimos parci-ais, X1:n, ou seja X1:n p −→ n→∞ x ∗ := inf{x : F (x) > 0},

o limite inferior do suporte de F . Não é pois poss´ıvel obter um comportamento não degenerado da sucessão de m´ınimos parciais sem primeiro efectuarmos uma normaliza¸cão conveniente.

2.2.1 Comportamento Limite n˜

ao Degenerado do M´ınimo

Como já se referiu, à semelhan¸ca do máximo, se existe distribui¸cão limite para a variável aleatória X1:n quando convenientemente normalizada, esta distribui¸cão só

pode ser de trˆes tipos como se apresenta no teorema seguinte.

Teorema 5 (Leis limite do m´ınimo). Seja (X1, X2, . . . , Xn) uma amostra aleat´oria

proveniente de uma popula¸cão com distribui¸cão F. Quando n tende para infinito, se existirem sucessões a∗_n e b∗_n, tais que (X1:n− a∗n)/b

∗

n tem comportamento limite n˜ao

degenerado, esse limite ´e necessariamente de um dos seguintes tipos: 1. F₁∗(x) = 1 − F1(−x) = ( 1 − e−(−x)−α se x ≤ 0 1 se x > 0(α > 0), (2.10) 2. F₂∗(x) = 1 − F2(−x) = ( 0 se x < 0 1 − e−xα se x ≥ 0(α > 0), (2.11) 3. F₃∗(x) = 1 − F3(−x) = 1 − e−e x , _{x ∈ R.} (2.12)

(22)

2.2. SUCESS ˜AO DE M´INIMOS PARCIAIS 15

2.2.2 Caracteriza¸

c˜

ao dos Dom´ınios de Atrac¸

c˜

ao para

M´ıni-mos

Também para o m´ınimo existem condi¸cões necessárias e suficientes para uma dada distribui¸cão pertencer ao Dom´ınio de Atraçcão de F_i∗ para i=1,2,3.

po-pula¸c˜ao com distribui¸c˜ao F . Temos:

1. F ∈ Dm(F1∗) se e s´o se F−1(0) = −∞ e: lim t→−∞ F (tx) F (t) = x −α , ∀x > 0. (2.13)

2. F ∈ Dm(F2∗) se e s´o se F−1(0) > −∞ (f inito) e existir uma constante α > 0

tal que: lim δ→0+ F (F−1(0) + δx) F (F−1_{(0) + δ)} = x α_{, ∀x > 0.} _(2.14)

3. F ∈ Dm(F3∗) se e s´o se E(X|X ≤ c) ´e finito para algum c > F

−1_{(0), e para} ∀x ∈ R se tiver: lim t→F−1₍₀₎ F (t + x E(X − t|X ≤ t)) F (t) = e x_. _(2.15)

2.2.3 Escolha das Constantes de Atrac¸

c˜

ao

Teorema 7 (Constantes de normaliza¸c˜ao). Seja (X1, X2, . . . , Xn) uma amostra

ale-atória proveniente de uma popula¸cão com distribui¸cão F. As constantes a∗_n > 0 e b∗_n> 0 tais que limn→+∞FX1:n−a∗n

b∗_n

(t) = F_i∗(t) podem ser escolhidas da seguinte forma: 1. Se i = 1 então as constantes de normaliza¸cão são a∗_n= 0 e b∗_n= |F−1(_n1)|. 2. Se i = 2 então as constantes de normaliza¸cão são a∗_n = F−1(0) e

b∗_n= F−1(_n1) − F−1(0).

3. Se i = 3 então as constantes de normaliza¸cão são a∗_n = F−1(1_n) e b∗_n_{= E(a}∗_n− X|X ≤ a∗

(23)

2.2.4 Exemplos

po-pula¸cão com distribui¸cão Exponencial de valor médio δ. Tem-se F−1(0) = 0, finito, e lim β→0+ F (F−1(0) + βx) F (F−1_{(0) + β)} = lim_β→0+ 1 − e−βxδ 1 − e−βδ = lim β→0+x e−βxδ e−βδ = x1. Logo, F ∈ Dm(F2∗) de parâmetro 1 e nestas condi¸cões, temos:

• a∗ n= F −1_{(0) = 0,} • b∗ n= F −1_{(1 −} 1 n) − F −1_{(0) = −δ ln 1 − (1 −} 1 n) − 0 = δ ln n.

popu-la¸cão com distribui¸cão Power de parâmetro θ. Tem-se F−1(0) = 0, finito. Vejamos então se a condi¸cão (2.14) do Teorema 6 é válida:

lim δ→0+ F (F−1(0) + δx) F (F−1_{(0) + δ)} = lim_δ→0+ F (0 + δx) F (0 + δ) = limδ→0+ (xδ)θ δθ = x θ_.

Logo, F ∈ Dm(F2∗) com parˆametro α = θ e, nestas condi¸c˜oes temos:

• a∗ n= F −1_{(0) = 0,} • b∗ n= F −1_{(1 −} 1 n) − F −1_{(0) = −θ ln(1 − (1 −} 1 n)) − 0 = θ ln n.

po-pula¸cão com distribui¸cão Pareto de parâmetro α. Tem-se F−1(0) = 1, finito, e lim δ→0+ F (F−1(0) + δx) F (F−1_{(0) + δ)} = lim_δ→0+ F (1 + δx) F (1 + δ) = lim δ→0+ 1 − (1 + δx)−α 1 − (1 + δ)−α = lim_δ→0+ αx(1 + δx)−α−1 α(1 + δ)−α−1 = x.

Logo, F ∈ Dm(F2∗), com parˆametro α = 1 e, nestas condi¸c˜oes:

• a∗ n= F −1_{(0) = 1,} • b∗ n= F −1₍1 n) − F −1_{(0) = (} n n−1) 1 n − 1.

(24)

2.2. SUCESS ˜AO DE M´INIMOS PARCIAIS 17

2.2.5 Dom´ınio de Atrac¸

c˜

ao para M´ınimos dos Modelos

Li-mite de M´

aximos

Proposi¸cão 1. Seja A = {1, 2, 3}. Seja j ∈ A e Xj uma variável aleatória com

distribui¸cão Fj. Então, ∀j ∈ A, a variável aleatória −Xj tem distribui¸cão Fj∗.

Demonstra¸c˜ao. Seja j ∈ A. Tem-se: F−Xj(x) = P (−Xj ≤ x) = P (Xj ≥ −x)

= 1 − P (Xj ≤ −x) = 1 − Fj(−x) = Fj∗(x).

Proposi¸c˜ao 2. Seja A = {1, 2, 3}. Ent˜ao,

∀i ∈ A, Fi ∈ Dm(F3∗).

Demonstra¸cão. Para se provar a validade da Proposi¸cão 2 utilizaremos a igualdade X1:n = −(−X)n:n (o m´ınimo de uma amostra é igual ao simétrico do máximo dos

sim´etricos da amostra).

Seja i = 1 e (X1, X2, . . . , Xn) uma amostra aleat´oria proveniente de uma popula¸c˜ao

com distribui¸c˜ao F1. Temos:

F−X(x) = P (−X ≤ x) = P (X ≥ −x) = ( 1 − e−(−x)−α se x ≤ 0 1 se x > 0 (α > 0), e f−X(x) = d dxF−X(x) = e −(−x)−α d dx − (−x) −α = α(−x)−α−1e−(−x)−α. Logo, h(x) = f−X(x) 1 − F−X(x) = α(−x) −α−1_e−(−x)−α e−(−x)−α = α(−x) −α−1 , e, lim x→F−1₍₁₎ d dx 1 h(x) = limx→0 d dx (−x)α+1 α = limx→0− (α + 1)(−x)α+2 α = 0.

Logo verifica-se a condi¸c˜ao suficiente (2.9), de onde se conclui que (−X)n:n ∈ DM(F3)

e pela Proposi¸c˜ao 1 conclui-se que −(−X)n:n = X1:n∈ Dm(F3∗).

(25)

2.3 Comportamento Limite dos Excessos acima

de um N´ıvel Elevado

Comecemos por ver qual a distribui¸c˜ao exacta dos excessos acima de um n´ıvel u. Seja Fu(x) = P (X ≤ x|X > u). Temos:

Fu(x) = P (X ≤ x|X > u) = ( 0 se x ≤ u P (X≤x,X>u) P (X>u) se x > u = ( 0 se x ≤ u FX(x)−FX(u) 1−FX(u) se x > u. (2.16) Vamos agora ver quais são os poss´ıveis modelos para a distribui¸cão assintótica, caso exista, de Fu(x), convenientemente normalizada, quando u = un → +∞, à

medida que n → ∞.

Comecemos por falar das fun¸c˜oes do tipo Pareto Generalizada, Pi(x), i = 1, 2, 3,

que se obtêm fácilmente através das fun¸cões de distribui¸cão de Valores Extremos, Fi(x), i = 1, 2 e 3, em (2.1), (2.2) e (2.3), respectivamente, dada a existência da

seguinte rela¸c˜ao:

Pi(x) = 1 + ln Fi(x) i ∈ {1, 2, 3} .

Desta rela¸cão chegamos rápidamente às seguintes conclusões:

• P1(x) corresponde à fun¸cão de distribui¸cão Pareto de parâmetro α.

• P2(x) corresponde à fun¸cão de distribui¸cão Beta de parâmetro α.

• P3(x) corresponde à fun¸cão de distribui¸cão Exponencial de valor médio 1.

Note-se que os trˆes tipos, Pi(x), i = 1, 2, 3, se podem escrever de acordo com a

express˜ao uniparam´etrica em (1.3), que reproduzimos, GPγ(x) = 1 + ln Gγ(x) =

(

1 − (1 + γx)−1/γ, 1 + γx > 0, x > 0 se γ 6= 0 1 − exp(−x), x > 0 se γ = 0. Note-se novamente que o ramo γ = 0 resulta como limite, quando γ → 0, do ramo para γ 6= 0.

Limitamo-nos a enunciar um outro resultado seminal em TVE, devido a Balkema & de Haan (1974) e a Pickands (1975), que, independentemente demonstraram o teorema seguinte:

(26)

2.3. COMPORTAMENTO LIMITE DOS EXCESSOS 19 Teorema 8 (Balkema-de Haan-Pickands). Se F ∈ DM(Gγ), com Gγ(x) definida em

(1.1), ent˜ao existe σu > 0 tal que

lim u→x∗ Fu σux − GPγ(x) = 0,

com GPγ(x) definida em (1.3) e sendo x∗ o limite superior do suporte de F (x).

Para mais detalhes, vejam-se os artigos atrás referidos ou Embrechts, Kl¨ uppel-berg & Mikosch, 1997, Seçcão 3.4, ou ainda Reiss & Thomas (2007), Seçcão 1.4. Veja-se ainda de Haan & Ferreira (2006).

(27)

2.4 Uma Abordagem Computacional

Nesta seçcão apresentamos programas elaborados e executáveis no software R-project que nos permitem ver a distribui¸cão do máximo de uma distribui¸cão F quando essa distribui¸cão limite existe.

Para atingirmos este objectivo utilizamos a técnica do papel de probabilidade e os estimadores de m´ınimos quadrados para estimarmos os parâmetros de localiza¸cão e de escala. Quando os pontos do gráfico obtido se aproximam de uma recta fazemos uma compara¸cão entre os valores reais dos parâmetros de localiza¸cão e de escala e os valores das estimativas obtidas por este mesmo processo.

´

E de salientar que não foi poss´ıvel fazer uma fun¸cão para a utiliza¸cão da técnica do papel de probabilidade que se adeque a todos os modelos de extremos pelo que poderá haver diferen¸cas pontuais na utiliza¸cão desta técnica nas ilustra¸cões que se seguem.

Ilustramos um exemplo para cada um dos três tipos de distribui¸cão assintótica pos-s´ıveis para o máximo.

As ilustra¸cões para a distribui¸cão assintótica do m´ınimo são muito semelhantes às apresentadas para o máximo, motivo pelo qual não vão ser apresentadas nesta sec-¸cão. No exemplo 8 explicamos a utiliza¸cão dos procedimentos que será análoga para os exemplos seguintes. Nos trˆ_{es exemplos temos um valor n ∈ N que será a dimensão} da amostra de que os máximos s˜_{ao provenientes e m ∈ N que será a dimensão da} amostra de máximos. Esses inteiros m e n têm respectivamente os valores 100 e 10000.

po-pula¸cão com distribui¸cão Exponencial de valor médio 6. Observe-se o procedimento efectuado de forma a construir uma amostra de dimensão m, de máximos proveni-entes de amostras de dimensão n. Temos:

> #Obten¸c~ao da amostra de m´aximos de exponenciais de valor m´edio par > extremomax<-function(m,n,dist,par){ + y<-0 + extrem1<-function(n,dist,par){ + x<-runif(n) + y<-dist(x,par) + max(y) + }

(28)

2.4. UMA ABORDAGEM COMPUTACIONAL 21 + z<-0

+ z<-replicate(m,extrem1(n,dist,par)) + }

Para que a fun¸cão extremomax seja executada com correçcão deve-se ter em conta o tipo de parâmetros da mesma, isto é os parâmetros devem satisfazer as seguintes condi¸cões:

1. m, n ∈ N.

2. “par” é o vector cujas componentes são os parâmetros da fun¸cão distribui¸cão F .

3. “dist” ´e a fun¸c˜ao inversa de F .

A t´ıtulo ilustrativo, vejamos a utiliza¸cão da fun¸cão extremomax na gera¸cão de uma amostra de dimensão 100, de máximos de amostras de dimensão 10000 provenientes da distribui¸cão exponencial de valor médio 6.

> #Obten¸c~ao de uma Exponencial de valor medio par > #a partir de uma Uniforme(0,1)

> exponencial<-function(x,par){ + par*log(1/(1-x)) + } > m1<-100 > n1<-10000 > parametro<-6 > z<-extremomax(m1,n1,exponencial,parametro) > z [1] 67.21373 47.12294 56.52070 62.67702 51.48837 53.84476 [7] 65.67080 52.17646 53.09716 51.40910 61.22423 57.34997 [13] 62.26535 60.27245 55.09829 74.16362 51.27774 49.41016 [19] 54.15416 62.01183 68.41515 51.70100 68.75510 56.10750 [25] 56.83427 48.58036 61.27615 50.93293 52.50847 49.97146 [31] 69.99936 51.98497 52.39974 53.54173 50.62724 54.17785 [37] 50.27979 53.83714 49.11112 52.25373 71.52127 53.66765 [43] 61.81322 61.47702 60.17139 53.19815 51.26566 51.19285 [49] 78.44772 51.84042 54.19564 65.48456 60.04473 49.49713

(29)

[55] 55.71623 51.63060 58.20802 50.48114 63.98562 53.05978 [61] 83.50736 55.84482 69.83404 75.31035 67.39555 60.38737 [67] 61.30492 61.08064 69.98131 64.78053 60.68629 57.84654 [73] 72.11111 53.25547 55.01544 59.36166 54.94875 57.54881 [79] 61.19843 66.06562 79.00707 52.71881 74.32256 61.86276 [85] 66.89159 51.85668 60.66652 54.48186 55.57102 50.75044 [91] 62.40742 53.33739 51.85827 49.34887 55.87403 59.89838 [97] 64.38895 52.19861 62.72267 57.52701

Vejamos agora uma pequena ilustra¸cão do resultado obtido no Exemplo 1 relativo à distribui¸cão assintótica do máximo de exponenciais utilizando a técnica do papel de probabilidade:

> #Obten¸c~ao de uma Gumbel a partir de uma Uniforme(0,1) > > gumbel<-function(x){ + -log (log(1/x)) + } > distextrema<-function(x,dist){ + n<-length(x) + x<-0 + y<-0 + + for(j in 1:n){ + y[j]<-dist(j/(n+1)) + } + y + } > w<-sort(z) > a<-distextrema(w,gumbel)

A fun¸cão distextrema não é mais do que a fun¸cão que permite obter o vector neces-sário à utiliza¸cão da técnica do papel de probabilidade em que neste caso a i-ésima componente corresponde ao valor gumbel( i

m+1) (n˜ao devemos esquecer que estamos

a trabalhar com a amostra de m máximos e que a fun¸cão gumbel é a fun¸cão inversa da distribui¸cão Gumbel). Utilizando a técnica do papel de probabilidade obtemos ainda o seguinte gráfico:

(30)

2.4. UMA ABORDAGEM COMPUTACIONAL 23 > plot(a~w,

+main="Ilustra¸c~ao da Distribui¸c~ao limite de m´aximos de exponenciais")

● ●● ● ●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●● ●●●●●●●●●●●●●●●●● ●●●● ●● ●●● ● ● ●●● ●● ● ●● ● ● ● 50 60 70 80 −1 0 1 2 3 4

Ilustração da Distribuição limite de máximos de exponenciais

w

a

Pela observa¸cão do gráfico constatamos que os pontos se aproximam de uma recta. Podemos pois concluir que existem constantes l e e tais que a distribui¸cão assintótica de Xn:n−l

e ´e do tipo Gumbel. Fa¸camos l = an e e = bn tal como definimos

no Teorema 3 e comparemos estes valores com as estimativas de localiza¸c˜ao e escala do papel de probabilidade. Temos:

> estimadordebn<-function(x,y){ + sum((x-mean(x))*(y-mean(y))) /sum((x-mean(x))^2) + } > estimadordean<-function(x,y,z){ + mean(y)-z*mean(x) + } > estimativadebn<-estimadordebn(a,w) > estimativadean<-estimadordean(a,w,estimativadebn) > an<-exponencial(1-1/n1,parametro) > bn<-parametro > comparacao<-cbind(c(an,bn),c(estimativadean,estimativadebn)) > comparacao [,1] [,2] [1,] 55.26204 54.991355 [2,] 6.00000 6.333009

(31)

Ao utilizarmos a fun¸cão cbind estamos a organizar os vectores (an,bn) e (estima-tivadean, estimativadebn) em coluna, pelo que os valores que se lêem na primeira linha correspondem respectivamente a an e estimativadean e os valores que se lêem

na segunda linha correspondem respectivamente a bn e estimativadebn.

Comparando os valores exactos com as estimativas verificamos que os valores exactos de bn e an est˜ao muito pr´oximos dos valores das respectivas estimativas.

Vejamos agora a ilustra¸cão da distribui¸cão assintótica para o máximo de uma amostra Pareto de parâmetro α.

po-pula¸cão com distribui¸cão Pareto de parâmetro 6. Temos: > #Gera¸c~ao de uma pareto de parâmetro alfa > #a partir de uma Uniforme(0,1)

> pareto<-function(x,al){ + (1/(1-x))^(1/al)

+ }

> #Constru¸c~ao da amostra de m´aximos > n1<-10000 > m1<-100 > z<-extremomax(m1,n1,pareto,6) > z [1] 4.456159 5.235100 4.065041 5.195902 4.731950 [6] 5.018189 3.843722 5.533062 3.889854 4.098597 [11] 5.537566 4.482940 7.538761 6.304208 3.903317 [16] 5.298111 4.655522 6.772547 5.268453 4.846668 [21] 4.744563 4.996730 10.716236 14.732793 4.859723 [26] 6.385087 5.283368 4.491173 4.187012 4.265781 [31] 3.582270 4.573686 5.364194 5.096113 4.083648 [36] 5.656624 5.143858 6.265951 5.545155 4.359939 [41] 4.610858 4.493429 5.498073 4.274236 5.282041 [46] 5.643139 4.533423 4.995078 4.430263 4.489981 [51] 4.365265 4.764319 4.197914 5.407910 6.188680 [56] 5.984947 3.514874 6.002470 4.479636 3.943828 [61] 4.807792 3.875587 4.152526 4.091426 3.923353 [66] 6.201399 5.108884 3.852442 4.968771 6.226146

(32)

2.4. UMA ABORDAGEM COMPUTACIONAL 25 [71] 3.766136 5.635278 4.093503 4.864849 6.240432 [76] 6.154981 4.190904 4.481243 4.257785 4.020022 [81] 5.025531 4.264917 4.972156 8.613058 4.855387 [86] 4.362341 4.976472 6.292233 3.815711 7.130785 [91] 5.530522 4.053997 6.244374 3.928327 5.117041 [96] 5.547662 4.330245 7.389719 5.031595 5.254077 > #Simula¸c~ao de uma Fr´echet de par^ametro al

> #a partir de uma Uniforme(0,1) > frechet<-function(x,al){ + (log(1/x))^(-1/al) + } > distextrema<-function(x,dist,al){ + n<-length(x) + x<-0 + y<-0 + for(j in 1:n){ + y[j]<-dist(j/(n+1),al)} + y} > w<-sort(z) > a<-distextrema(z,frechet,6) > plot(a~w,

+main="Ilustra¸c~ao da Distribui¸c~ao limite de m´aximos de Paretos")

●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●● ●●●●●● ● ● ●● ● ● ● ● 4 6 8 10 12 14 0.8 1.2 1.6 2.0

Ilustração da Distribuição limite de máximos de Paretos

w

(33)

Pela observa¸cão do gráfico constatamos que os pontos se aproximam de uma recta de onde podemos concluir pela técnica do papel de probabilidade que existem constantes l e e tais que a distribui¸cão assintótica de Xn:n−l

e ´e do tipo Fr´echet de

parˆametro 6. Temos ainda:

> estimadordebn<-function(x,y){ + sum((x-mean(x))*(y-mean(y)))/sum((y-mean(y))^2) + } > estimadordean<-function(a,b,c){ + mean(a)-c*mean(b) + } > estimativadebn<-estimadordebn(w,a) > estimativadean<-estimadordean(w,a,estimativadebn) > an<-0 > bn<-pareto(1-1/n1,6) > comparacao<-cbind(c(an,bn),c(estimativadean,estimativadebn)) > comparacao [,1] [,2] [1,] 0.000000 -1.072291 [2,] 4.641589 5.536670

Pelos valores obtidos na matriz de compara¸cão verificamos que os valores exac-tos dos parâmetros an e bn são muito aproximados das respectivas estimativas

estimativadean e estimativadebn.

Por último e para finalizarmos a ilustra¸cão de resultados da distribui¸cão assin-tótica de máximos, vamos executar estes procedimentos para verificarmos qual a distribui¸cão assintótica de máximos de Uniformes Standard.

popula¸cão com distribui¸cão Uniforme de parâmetros 0 e 1. Temos: > #Fórmula da Distribui¸c~ao Uniforme(a,b)

> uniforme<-function(x,a,b){ + (b-a)*x+a

+ }

> extremomax<-function(m,n,dist,par1,par2){ + extrem1<-function(n,dist,par1,par2){

(34)

2.4. UMA ABORDAGEM COMPUTACIONAL 27 + x<-runif(n) + y<-dist(x,par1,par2) + max(y) + } + z<-0 + z<-replicate(m,extrem1(n,dist,par1,par2)) + z + }

> #Constru¸c~ao da amostra de m´aximos > n<-10000 > z<-extremomax(100,n,uniforme,0,1) > z [1] 0.9999770 0.9998667 0.9998971 0.9999698 0.9999478 [6] 0.9995811 0.9999438 0.9999874 0.9999992 0.9999997 [11] 0.9993330 0.9999837 0.9999793 0.9998487 0.9997550 [16] 0.9999914 0.9998035 0.9999169 0.9997778 0.9997038 [21] 0.9999756 0.9998950 0.9998947 0.9998668 0.9999316 [26] 0.9999066 0.9999076 0.9999284 0.9999753 0.9998571 [31] 0.9999991 0.9997927 0.9999006 0.9999517 0.9999575 [36] 0.9998497 0.9999469 0.9998470 0.9999178 0.9999458 [41] 0.9998866 0.9998353 0.9999925 0.9996535 0.9999978 [46] 0.9999966 0.9999450 0.9999656 0.9994640 0.9997102 [51] 0.9997915 0.9998278 0.9998477 0.9998325 0.9998906 [56] 0.9999780 0.9998199 0.9998865 0.9999386 0.9998407 [61] 0.9999912 0.9999475 0.9998342 0.9999132 0.9997969 [66] 0.9999041 0.9999324 0.9999531 0.9995430 0.9999296 [71] 0.9998360 0.9999794 0.9999250 0.9998069 0.9996838 [76] 0.9998668 0.9998359 0.9999641 0.9999809 0.9999122 [81] 0.9999223 0.9999648 0.9999885 0.9998960 0.9999871 [86] 0.9999322 0.9997446 0.9998313 0.9999363 0.9999632 [91] 0.9998483 0.9997873 0.9999534 0.9999038 0.9999040 [96] 0.9999968 0.9999801 0.9999390 0.9999884 0.9995931 > #Simula¸c~ao de uma Weibull de par^ametro al

> #a partir de uma Uniforme(0,1) > weibull<-function(x,al){

(35)

+ (-1)*(log(1/x)^(1/al))} > distextrema<-function(x,dist,al){ + n<-length(x) + x<-0 + y<-0 + for(j in 1:n){ + y[j]<-dist(j/(n+1),al)} + y} > w<-sort(z) > b<-distextrema(w,weibull,1) > plot(b~w,

+main="Ilustra¸c~ao da Distribui¸c~ao limite de m´aximos de Uniformes")

● ● ● ●● ● ● ●● ●● ●●●● ●●●●● ●●●●●●●●●●●●●● ● ● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● 0.9994 0.9995 0.9996 0.9997 0.9998 0.9999 1.0000 −4 −3 −2 −1 0

Ilustração da Distribuição limite de máximos de Uniformes

w

b

Pela observa¸cão do gráfico constatamos que os pontos se aproximam de uma recta de onde podemos concluir que existem constantes l e e tais que a distribui¸cão assintótica de Xn:n−l

e ´e do tipo Weibull de parˆametro 1. Comparemos agora os valores

exactos dos parˆametros de localiza¸c˜ao e de escala com as respectivas estimativas: > estimadordebn<-function(x,y){

+ sum((x-mean(x))*(y-mean(y)))/sum((y-mean(y))^2) + }

> estimadordean<-function(a,b,c){ + mean(a)-c*mean(b)

(36)

2.4. UMA ABORDAGEM COMPUTACIONAL 29 + } > estimativadebn<-estimadordebn(w,b) > estimativadean<-estimadordean(w,b,estimativadebn) > an<-uniforme(1,0,1) > bn<-uniforme(1,0,1)-uniforme(1-1/n,0,1) > comparacao<-cbind(c(an,bn),c(estimativadean,estimativadebn)) > comparacao [,1] [,2] [1,] 1e+00 1.0000060612 [2,] 1e-04 0.0001268064 >

Pelos valores obtidos na matriz compara¸cão verificamos que os valores exac-tos dos parâmetros an e bn são muito aproximados das respectivas estimativas

(37)

(38)

Cap´ıtulo 3

Estimadores de Jackknife

Os estimadores de Jackknife são estimadores que surgiram com o objectivo de reduzir o viés dos estimadores que lhes servem de base, como se verá nas seçcões que se seguem. Tal como referido anteriormente, a metodologia Jackknife foi uti-lizada inicialmente por Quenouille (1949) para redu¸cão do viés de um estimador de correla¸cão serial, com base na divisão da amostra em duas sub-amostras. Em 1956, Quenouille generalizou esta ideia, dividindo a amostra em g grupos de tama-nho h, n = g × h, e explorou a sua aplicabilidade genérica. Restringir-nos-emos aqui essencialmente ao caso g = n, h = 1, que é sem dúvida o caso mais atraente, por eliminar a arbitrariedade dos subgrupos, sendo muito frequentemente a melhor forma de utiliza¸cão da técnica Jackknife.

Come¸caremos por introduzir, na Seçcão 3.1, o conceito de estimador de jackknife puro de um parâmetro desconhecido θ, que permite eliminar completamente um viés do tipo b(θ)/n (embora nalguns casos coincida com o estimador que lhe serve de base, caso esse viés não exista), enquanto que o estimador de jackknife generalizado, a ser introduzido na Seçcão 3.2, serve para eliminar totalmente um viés da forma b(θ)/f (n), ∀f (n), e só pode ser calculado se se tiver informa¸cão sobre o viés, ou a componente dominante do viés do estimador de base. Algumas das propriedades fundamentais destes estimadores de Jackknife serão estudadas na Seçcão 3.3.

Na Seçcão 3.4, estudaremos em particular estes estimadores para as distribui-¸cões Pareto, situa¸cão em que os estimadores de Jackknife são analiticamente simples. Uma aplica¸cão da metodologia de Jackknife em modelos Fréchet será feita após refe-rência à abordagem computacional, a apresentar na Seçcão 3.5. Na realidade, uma vez que as estimativas de máxima verosimilhan¸ca para o parâmetro da Fréchet são apenas pass´ıveis de ser obtidas através de métodos numéricos, não se tem informa¸cão

(39)

sobre o viés do estimador de máxima verosimilhan¸ca, não se podendo pois construir o Estimador de Jackknife Generalizado. A obten¸cão de estimativas de Jackknife para parâmetros de um modelo Fréchet tem pois de ser de ´ındole computacional.

(40)

3.1. ESTIMADOR DE JACKKNIFE PURO 33

3.1 Estimador de Jackknife Puro

Defini¸c˜ao 4. Seja (X1, X2, . . . , Xn) uma amostra aleat´oria proveniente de uma

po-pula¸cão com distribui¸cão F (x) = F (x; θ), com θ o parâmetro de interesse. Seja Tn : D ⊆ Rn → R um estimador de θ. Designamos por Tn,i o estimador com a

mesma forma funcional de Tn, mas baseado na amostra de dimens˜ao n − 1 que

se obtém a partir de (X1, X2, . . . , Xn), após lhe retirarmos a i-ésima observa¸cão,

1 ≤ i ≤ n. A nova amostra (Tn,i, 1 ≤ i ≤ n) ´e a chamada amostra jackknife

associada a Tn e a (X1, X2, . . . , Xn).

Teorema 9. Sejam T1 e T2 estimadores consistentes de um parˆametro θ. Seja

R 6= 1. A estat´ıstica

T3 = (T1− R T2)/(1 − R)

´e um estimador consistente para θ.

Demonstra¸c˜ao. Suponhamos que T1 e T2 s˜ao estimadores consistentes para θ. Logo

por defini¸c˜ao de estimador consistente conclu´ımos que T1, T2 p → θ, e temos T1, T2 p → θ =⇒ T1− RT2 p → (1 − R)θ =⇒ T1− RT2 1 − R p → θ. Logo T3 ´e consistente para θ.

Defini¸c˜ao 5. Seja (X1, X2, . . . , Xn) uma amostra aleat´oria proveniente de uma

po-pula¸cão com distribui¸cão F (x) = F (x; θ), com θ parâmetro de interesse e desconhe-cido. Seja Tn um estimador de θ. Designamos por estimador de jackknife puro, e

denotamos por T_nJ, o novo estimador

T_nJ = nTn− (n − 1)Tn,i,

onde Tn,ié a média da amostra Jackknife, (Tn,i, 1 ≤ i ≤ n), introduzida na Defini¸cão

4.

Seguidamente ver-se-à um exemplo de aplica¸cão da metodologia atrás referida, quando aplicada a uma amostra proveniente de uma distribui¸cão Exponencial de valor médio δ. Em primeiro lugar encontrar-se-à o estimador de jackknife puro associado ao estimador de máxima verosimilhan¸ca de δ. Em seguida, aplicar-se-à o estimador encontrado a uma amostra simulada de dimensão 10.

(41)

popula¸cão com distribui¸cão Exponencial de valor médio δ. Seja Tn o estimador de

m´axima verosimilhan¸ca de δ isto ´e Tn= X. Para i ∈ {1, 2, . . . , n}, tem-se

Tn,i = 1 n − 1 X j6=i Xj, e consequentemente, Tn,i= 1 n n X i=₁ Tn,i= 1 n n X i=₁ 1 n − 1 X j6=i Xj = 1 n 1 n − 1 n X i=₁ X j6=i Xj = 1 n 1 n − 1(n − 1) n X i=₁ Xi = 1 n n X i=₁ Xi = X.

De onde conclu´ımos que o estimador de jackknife com base no estimador de m´ a-xima verosimilhan¸ca para uma amostra proveniente de uma popula¸c˜ao com distribui-¸

cão Exponencial de valor médio δ é o próprio estimador de máxima verosimilhan¸ca. Consideremos em seguida a seguinte amostra de dimensão 10 proveniente de uma popula¸cão com distribui¸cão Exponencial de valor médio 6:

(0.3228126, 2.7680145, 3.5033378, 3.7742301,

1.3497052, 0.4737520, 11.5756315, 9.1868669,

1.2150921, 2.7223887). Tem-se T10= X = 3.081979. Retirando o primeiro elemento da amostra, a amostra

resultante ´e (2.7680145, 3.5033378, 3.7742301, 1.3497052, 0.4737520, 11.5756315, 9.1868669, 1.2150921, 2.7223887), e T10,1 = 1₉ P10

j=2Xj = 4.063224. Retirando o segundo elemento da amostra, a

amostra resultante ´e

(0.3228126, 3.5033378, 3.7742301,

1.3497052, 0.4737520, 11.5756315, 9.1868669,

(42)

3.1. ESTIMADOR DE JACKKNIFE PURO 35 e T10,2= 1₉(0.7296771 +

P10

j=3Xj) = 3.791535.

Analogamente obtˆem-se as seguintes estimativas: • T10,3= 3.709833, T10,4= 3.679733

• T10,5= 3.949125, T10,6= 4.046453

• T10,7= 2.812911, T10,8= 3.078329

• T10,9= 3.964082, T10,10 = 3.796605

Obtendo-se desta forma

Tn,i= 1 10 10 X i=1 Tn,i= 3.689183 = X. De onde resulta, T₁₀J = 10T10− 9T10,i= 3.689183 = T10.

Observa¸cão 1. Note-se que o resultado anterior é geralmente válido, quando se parte da média da amostra Tn = Xn =

Pn

i=1Xi/n, estimador (centrado) do valor

m´_{edio µ = E(X) da popula¸c˜ao X subjacente `a amostra (X}1, . . . , Xn), e aplicamos a

(43)

3.2 Estimador de Jackknife Generalizado

Defini¸c˜ao 6. Seja (X1, X2, . . . , Xn) um amostra aleat´oria proveniente de uma

popu-la¸cão com distribui¸cão F (x) = F (x; θ), com θ parâmetro de interesse e desconhecido. Seja Tn um estimador de θ e f e b fun¸cões tais que E(Tn) = θ + f (n)b(θ)

. Chamamos estimador de jackknife generalizado e denotamos por T_nG `a estat´ıstica, T_nG = (Tn− αTn,i)/(1 − α),

em que α = f (n)/f (n − 1), e onde, tal como referido anteriormente, Tn,i ´e a m´edia

da amostra Jackknife, (Tn,i, 1 ≤ i ≤ n), introduzida na Defini¸c˜ao 4.

Seguidamente ver-se-à um exemplo em que se ilustrará que para uma amostra aleatória (X1, X2, . . . , Xn) o estimador S02 = (Pn_i=1(Xi − X)2)/n é um estimador

enviesado para a variˆancia σ2 _{e encontrar-se-˜}_{ao os estimadores de jackknife puro e}

generalizado com base em S02.

popula¸c˜ao com distribui¸c˜ao F . Seja Tn = S02 = (Pn_i=1(Xi − X)2)/n. Sejam µ e σ

tais que E(X) = µ e Var(X) = σ2. Temos:

E(X) = µ, Var(X) = σ 2 n , e consequentemente E(X2) = E2(X) + Var(X) = µ2 + σ2 n . Por outro lado,

E _Xn i=1 X_i2= n X i=1 E(Xi2) = nE(X 2_{) = n(µ}2_{+ σ}2_), e E _Xn i=1 (Xi− X)2 = E n X i=1 X_i2− nX2 = n X i=1 E(Xi2) − nE(X 2 ) = n(E(X2) − E(X2)) = n(σ2+ µ2−σ 2 n − µ 2_{) = (n − 1)σ}2_.

(44)

3.2. ESTIMADOR DE JACKKNIFE GENERALIZADO 37 Logo E(S02) = E _Xn i=1 (Xi− X)2/n = n − 1 n σ 2 = σ2− 1 nσ 2 _=⇒ _{α = −}1 n/ − 1 n − 1 = n − 1 n . Veja-se agora qual a express˜ao do estimador Tn,i:

Tn,i= 1 n − 1 X j6=i (Xj− ( nX − Xi n − 1 )) 2 =⇒ n X i=1 Tn,i = n X i=1 1 n − 1 X j6=i (Xj − ( nX − Xi n − 1 )) 2 = 1 n − 1 n X i=1 (X j6=i X_j2− (n − 1)(nX − Xi n − 1 ) 2 ) = 1 n − 1( n X i=1 X j6=i X_j2− 1 n − 1 n X i=1 (nX − Xi)2). Temos: n X i=1 X j6=i X_j2 = (n − 1) n X i=1 X_i2 e consequentemente, n X i=1 (nX − Xi)2 = n X i=1 (X_i2 − 2nXXi+ n2X 2 ) = n X i=1 X_i2− 2nX n X i=1 Xi+ n X i=1 n2X2 = n X i=1 X_i2− 2n2_X2_{+ n}3_X2_.

(45)

Logo: n X i=1 X j6=i X_j2− 1 n − 1 n X i=1 (nX − Xi)2 = 1 n − 1((n − 1) 2 n X i=1 X_i2− ( n X i=1 X_i2− 2n2_X2 _{+ n}3_X2₎₎ = 1 n − 1((n 2_{− 2n)} n X i=1 X_i2+ 2n2X2 − n3_X2₎ = n n − 1((n − 2) n X i=1 X_i2+ 2nX2− n2_X2₎ e consequentemente, n X i=1 Tn,i = n (n − 1)2 (n − 2) n X i=1 X_i2 + 2nX2 − n2X2 , ou seja, Tn,i= 1 (n − 1)2 (n − 2) n X i=1 X_i2+ 2nX2− n2X2 e (n − 1)Tn,i = 1 n − 1 (n − 2) n X i=1 X_i2+ 2nX2− n2X2 .

Assim sendo obtêm-se os estimadores de Jackknife puro e generalizado, que neste caso são iguais devido à forma do valor médio de S02. Temos:

T_nJ = nTn− (n − 1)Tn,i = n X i=1 X_i2− nX2− 1 n − 1((n − 2) n X i=1 X_i2+ 2nX2− n2_X2₎ = 1 n − 1((n − 1 − (n − 2)) n X i=1 X_i2− (n2− n + 2n − n2)X2) = 1 n − 1( n X i=1 X_i2− nX2) = 1 n − 1 n X i=1 (Xi− X)2 = S2, e T_nG = 1 1 − α(Tn− αTn,i) = 1 (1 −n−1_n )(Tn− n − 1 n Tn,i) = n(Tn− n − 1 n Tn,i) = nTn− (n − 1)Tn,i = T J n = S 2_.

(46)

3.2. ESTIMADOR DE JACKKNIFE GENERALIZADO 39 Consideremos agora a amostra aleat´oria de dimens˜ao 10,

(5.496176, 6.905640, 5.304241, 5.496462,

2.313852, 6.916982, 4.957533, 5.547900

5.907614, 8.544794), proveniente de uma popula¸cão com distribui¸cão Normal de valor médio 5 e de variância 2. Tal como no Exemplo 11 vamos come¸car por calcular para ∀i ∈ {1, 2, . . . , 10} T10,i.Tem-se:

• T10,1= 2.585519, T10,2= 2.424810,

• T10,3= 2.569458, T10,4= 2.585536,

• T10,5= 1.144354, T10,6= 2.421527,

• T10,7= 2.517389, T10,8= 2.588292,

• T10,9= 2.589301, T10,10= 1.620978.

De onde resulta Tn,i = 2.304716 e TnJ = nTn− (n − 1)Tn,i = 2.592806.

Calculando S2 ₌ 1 n−1

Pn

i=1(Xi− X)2, obt´em-se o valor 2.592806, que j´a era esperado

uma vez que se provou que o estimador de jackknife puro, TJ

n, associado a S

(47)

3.3 Algumas Propriedades dos Estimadores de

Jackknife

Nesta seçcão iremos ver quatro propriedades dos estimadores de jackknife, entre elas uma que nos permite garantir que o estimador de jackknife generalizado, quando existe, é um estimador centrado e também um outro caso em que os estimadores de jackknife puro e generalizado coincidem.

3.3.1 Consistˆ

encia da M´

edia da Amostra Jackknife

Teorema 10. Seja (X1, X2, . . . , Xn) um amostra aleat´oria proveniente de uma

po-pula¸cão com distribui¸cão F (x) = F (x; θ), com θ parâmetro de interesse e desconhe-cido. Seja Tn um estimador de θ. Se Tn é um estimador consistente para θ então

Tn,i ´e um estimador consistente para θ.

Demonstra¸c˜ao. Suponhamos que Tn ´e um estimador consistente para θ. Temos:

Tn p → θ =⇒ Tn,i p → θ =⇒ n X i=1 Tn,i p → nθ, e consequentemente, Tn,i= Pn i=1Tn,i n p → θ. Note-se que para um parˆametro θ o estimador TG

n s´o existe se o estimador Tnfor um

estimador enviesado. Atendendo aos Teoremas 9 e 10 facilmente se conclui que se Tn

´e um estimador consistente para θ, os estimadores TJ

n e TnG s˜ao tamb´em consistentes

para θ.

3.3.2 Centralidade dos Estimadores de Jackknife

popula¸cão com distribui¸cão F (x) = F (x; θ), com θ parâmetro de interesse e desco-nhecido. Seja Tn um estimador para θ. Se Tn é um estimador centrado então o

estimador T_nJ com base em Tn ´e um estimador centrado para θ.

Demonstra¸c˜ao. Suponhamos que Tn ´e um estimador centrado para θ. Temos:

E(Tn,i) = θ =⇒ E(Tn,i) = E

_Xn i=1 Tn,i/n = 1 n n X i=1 E(Tn,i) = θ.

(48)

3.3. ALGUMAS PROPRIEDADES DO JACKKNIFE 41 Logo:

E(TnJ) = nE(Tn) − (n − 1)E(Tn,i) = nθ − (n − 1)θ = (n − n + 1)θ = θ.

popula¸cão com distribui¸cão F (x) = F (x; θ), com θ parâmetro de interesse e desco-nhecido, e seja Tn um estimador enviesado para θ tal que E(Tn) = θ + f (n)b(θ) . O

estimador T_nG ´e um estimador centrado para θ. Demonstra¸c˜_{ao. Tem-se E(T}n) = θ + f (n)b(θ), e

E(Tn,i) = θ + f (n − 1)b(θ) =⇒ E(Tn,i) =

1 n n X i=1 E(Tn,i) = θ + f (n − 1)b(θ).

Seja α = f (n)/f (n − 1). Ent˜ao, E(TnJ) = E

T_n− αT_n,i 1 − α

= E(Tn) − αE(Tn,i) 1 − α = θ + f (n)b(θ) − f (n) f /n−1(θ − f (n − 1)b(θ)) 1 − α = (1 − α)θ + f (n)b(θ) − f (n)b(θ) 1 − α = θ.

3.3.3 A Metodologia Jackknife na Estima¸

c˜

ao do Vi´

es de um

Estimador

Como corolário do Teorema 12, temos o resultado a seguir apresentado, funda-mental para a estima¸cão do viés de uma estat´ıstica Tn.

Corol´ario 1. Seja (X1, X2, . . . , Xn) uma amostra aleat´oria proveniente de uma

po-pula¸cão com distribui¸cão F (x) = F (x; θ), com θ parâmetro de interesse e desconhe-cido, e seja Tn um estimador para θ tal que E(Tn) = θ + f (n)b(θ). A estat´ıstica

Vn:= Tn− TnG ´e um estimador centrado para vies ≡ vies(Tn) := E(Tn− θ).

Demonstra¸c˜ao. Pelo teorema anterior sabemos que T_nG ´e um estimador centrado para θ. Temos:

(49)

po-pula¸cão com distribui¸cão F (x) = F (x; θ), com θ parâmetro de interesse e desconhe-cido, e seja Tnum estimador para θ tal que E(Tn) = θ+f (n)b(θ) e α = f (n)f (n − 1).

Seja dvies =Tn− TnG o estimador do vi´es de Tn. Nestas condi¸c˜oes, tem-se

d

vies = α

(1 − α)(Tn,i− Tn)/. Demonstra¸c˜ao. Temos:

d vies = Tn− TnG = Tn− 1 1 − α(Tn− αTn,i) = 1 1 − α((1 − α)Tn− Tn+ αTn,i) = α 1 − α(Tn,i− Tn).

3.3.4 Igualdade entre Estimadores de Jackknife Puro e

Ge-neralizado

popula¸cão com distribui¸cão F (x) = F (x; θ), com θ parâmetro de interesse e desco-nhecido, e seja Tn um estimador enviesado para θ tal que E(Tn) = θ + f (n)b(θ). Se

|f (n)| = 1

n ent˜ao T J

n = TnG.

Demonstra¸c˜ao. Suponhamos que |f (n)| = _n1. Sabemos que α = −

1 n − 1 n−1 = n−1_n e α0 = 1 n 1 n−1

= n−1_n , pelo que α = α0. Temos, T_nJ = nTn− (n − 1)Tn,i= n(Tn− n − 1 n Tn,i) = 1₁ n (Tn− αTn,i) = 1 n−n+1 n (Tn− αTn,i) = 1 1 − n−1_n (Tn− αTn,i) = 1 1 − α(Tn− αTn,i) = 1 1 − α0(Tn− α 0 Tn,i) = TnG.

(50)

3.4. DISTRIBUI ¸C ˜AO PARETO 43

3.4 O Estimador de Jackknife para a Distribui¸

c˜

ao

Pareto

Vejamos agora o exemplo dos estimadores de jackknife puro e jackknife genera-lizado para uma amostra aleatória proveniente de uma popula¸cão com distribui¸cão Pareto com parâmetro de interesse α. Vamos utilizar como estimador de base o estimador de máxima verosimilhan¸ca. Come¸camos por encontrar o estimador de máxima verosimilhan¸ca para α e mostrar que é um estimador enviesado.

Exemplo 13. Seja (X1, X2, . . . , Xn) um amostra aleat´oria proveniente de uma

po-pula¸cão com distribui¸cão Pareto de parâmetro δ. Temos fX1,X2,...,Xn(x1, x2, . . . , xn) = n Y i=1 fXi(xi) = n Y i=1 δ(xi)(−δ+1) = δn n Y i=1 xi !−(δ+1) , e consequentemente, ln fX1,X2,...,Xn(x1, x2, . . . , xn) = n ln δ − (δ + 1) n X i=1 ln xi. Então, ∂ ln fX1,X2,...,Xn(x1, x2, . . . , xn) ∂δ = 0 ⇐⇒ n δ − n X i=1 ln xi = 0 ⇐⇒ δ = n Pn i=1ln xi . Como ∂2ln fX1,X2,...,Xn(x1,x2,...,xn) ∂δ2 = − n δ2 < 0, temos ˆ δ = Pn n i=1ln xi . Vejamos qual a distribui¸cão de ˆδ. Temos

P (ln X ≤ x) = P (X ≤ ex) = ( 0, se ex _{< 1} 1 − (ex₎−δ _{se e}x _{≥ 1} = ( 0, se x ≤ 0 1 − e−δx se x ≥ 0. Logo, ln X tem distribui¸c˜ao Exponencial de valor m´edio (1/δ), concluindo-se pois quePn

(51)

Seja Y :=Pn

i=1ln Xi. Nestas condi¸c˜oes tem-se para n > 2

E 1 Y = Z +∞ 0 1 y δn Γ(n)y n−1 e−δydy = δ n Γ(n) Z +∞ 0 y(n−1)−1e−δydy = δ n δn−1 Γ(n − 1) Γ(n) = δ (n − 2)! (n − 1)! = δ n − 1. Logo o valor m´edio de Tn= ₍Pn n

i=1ln Xi) ´e E(Tn) = E n Y = n n − 1δ = δ + 1 n − 1δ, i.e., f (n) = 1/(n − 1). Consequentemente, α = f (n) f (n − 1) = 1 n − 1 / 1 n − 2 = n − 2 n − 1, e 1 − α = 1 − n − 2 n − 1 = 1 n − 1. Por outro lado,

Tn,i= n − 1 P j6=iln Xj =⇒ Tn,i= 1 n n X i=1 n − 1 P j6=iln Xj = n − 1 n n X i=1 1 P j6=iln Xj , de onde se obtˆem os estimadores de jackknife puro e generalizado, dados por

T_nJ = nTn− (n − 1)Tn,i= n2 Pn i=1ln Xi − (n − 1) 2 n n X i=1 1 P j6=iln Xj , e T_nG = 1 1 − α(Tn− αTn,i) = 1₁ n−1 (_P_n n i=1ln Xi −n − 2 n − 1 n − 1 n n X i=1 1 P j6=iln Xj ) = (n − 1)(Pn n i=1ln Xi − n − 2 n n X i=1 1 P j6=iln Xj ), respectivamente. Seja 1.4473453, 2.9146631, 1.3192541, 1.0496366, 1.0815746, 1.2357974, 2.1035691, 1.4460795, 1.1795218, 2.2215765, 1.3699815, 1.0930229, 2.3423185, 1.0118812, 1.0756544

(52)

3.4. DISTRIBUI ¸C ˜AO PARETO 45

uma amostra aleatória de dimensão 15, gerada a partir de uma popula¸cão com dis-tribui¸cão Pareto de parâmetro 3. Chegamos então à amostra Jackknife,

T15,1, T15,2, T15,3, T15,4, T15,5, T15,6, T15,7, T15,8, T15,9, T15,10, T15,11, T15,12, T15,13, T15,14, T15,15 = 2.74464441, 3.181226, 2.695673, 2.582011, 2.596364, 2.662175, 2.961748, 2.744174, 2.638789, 2.996346, 2.775401, 2.601444, 3.03675, 2.564684, 2.593724 Tem-se T15 = 2.74194264, T15,i = 2.7539385, α = 13₁₄, de onde se obtˆem as

estimativas TJ

(53)

3.5 Uma Abordagem Computacional

Nesta Sec¸c˜ao apresentamos um programa elaborado no software R-Project que para um dado estimador Tncalcula os valores observados dos estimadores Tn, TnJ, TnG,

a estimativa dvies e ainda uma estimativa para a variˆancia do estimador Tn. Nos

ca-sos em que o estimador Tn é um estimador centrado, o programa não calculará os

valores das estimativas dvies de Tn e de TnG. Na realidade, embora tenhamos visto

anteriormente alguns exemplos simples em que a solu¸cão anal´ıtica é poss´ıvel, na maior parte das situa¸cões a abordagem terá de ser computacional, sendo usual utili-zar o estimador de jackknife puro, uma vez que geralmente não se possui informa¸cão adicional sobre o viés. O algoritmo é de implementa¸cão simples e será inicialmente apresentado em pseudo-código:

• Calcule-se a estimativa eθn = φ(x), do parˆametro desconhecido θ.

• Para i desde 1 at´e n,

– Considere-se a amostra x_i, obtida de (x1, x2, . . . , xn) por extrac¸c˜ao do

i-´esimo elemento xi.

– Calcule-se eθi = φ(xi).

• Calcule-se θn, a m´edia dos valores eθi, 1 ≤ i ≤ n.

• Obtenha-se a estimativa θJ

n = neθn− (n − 1)θn.

po-pula¸cão com distribui¸cão exponencial com o valor médio 7. Comecemos por simular uma amostra de dimensão 100 utilizando a Transforma¸cão Uniformizante.

> gerexp<-function(n,alfa){ + x<-runif(n) + y<-(-alfa)*log(1-x) + } > z<-gerexp(100,7) > z [1] 3.37802714 1.63401135 6.00336211 0.57069977 [5] 16.19151482 3.48573782 0.37367477 8.40183099 [9] 8.37749142 0.49662577 1.62230087 2.80822597

(54)

3.5. UMA ABORDAGEM COMPUTACIONAL 47 [13] 5.66924671 1.83793488 0.02733397 5.12885666 [17] 0.49331967 1.17816341 3.88654754 4.50613858 [21] 17.31977923 15.01836026 8.98323323 12.41726805 [25] 3.64653017 10.43087594 0.42595783 18.45791157 [29] 2.02738632 9.00971531 4.73821804 10.48540589 [33] 2.61008667 1.23815531 0.20200083 12.58798280 [37] 8.02316044 1.12746694 7.45297916 4.53820030 [41] 3.04323949 19.06438875 13.91682218 2.61833892 [45] 5.12628411 0.88552012 1.95136044 2.09934477 [49] 7.46505497 2.08838049 4.02309546 11.77348339 [53] 1.96511531 6.68718432 7.79776304 4.08299021 [57] 0.57077713 2.50242185 18.61214684 4.57737052 [61] 6.33259732 3.60516658 4.90760676 2.23702190 [65] 11.56744114 2.08676847 1.76756419 4.31840877 [69] 9.21897152 16.50745337 9.14062628 3.76622935 [73] 2.01483566 1.86863224 9.47274030 14.33974155 [77] 3.79010427 7.64094289 10.37676079 13.80375502 [81] 16.05472515 6.71719905 18.37445742 6.85652750 [85] 6.71252630 2.76371515 3.19929764 3.96594686 [89] 4.75263767 2.88909980 14.98031922 9.25608705 [93] 18.68273496 6.52938499 2.59430103 11.15879805 [97] 5.60987717 13.46311519 16.79960242 9.08380706

Após a execu¸cão do procedimento apresentado obtemos o vector z que será a nossa amostra simulada. Fa¸camos agora a constru¸cão das n subamostras necessárias para a constru¸cão do estimador de jackknife. Para obtermos a primeira subamostra que resulta da elimina¸cão do primeiro elemento do vector z, basta executarmos os se-guintes comandos:

> #para a primeira subamostra: > auxiliar<-0 > auxiliar1<-0 > for(i in 2:length(z)){ + auxiliar[i-1]<-z[i] + } > auxiliar1<-auxiliar

(55)

i-ésimo elemento ao vector z basta executarmos três procedimentos. Para obtermos da segunda subamostra até à (n − 1)-ésima amostra devemos executar o seguinte procedimento:

> #do 2ˇz vector at´e ao pen´ultimo > for(i in 2:(length(z)-1)){ + for(j in 1:(i-1)){ + auxiliar[j]<-z[j] + } + for(j in (i+1):(length(z))){ + auxiliar[j-1]<-z[j] + } + auxiliar1<-cbind(auxiliar1,auxiliar) + + } >

Para finalizarmos a obten¸cão das subamostras, obtemos a n-ésima subamostra executando o seguinte conjunto de instru¸cões:

> #para o ultimo vector > for(i in 1:(length(z)-1)){ + auxiliar[i]<-z[i]

+ }

> auxiliar1<-cbind(auxiliar1,auxiliar)

Desta forma a matriz “auxiliar1” será a matriz em que a i-ésima coluna corres-ponde à i-ésima subamostra de z.

Após a explica¸cão do procedimento com vista a obter as subamostras que excluem a i-ésima observa¸cão vamos apresentar uma fun¸cão (que contém o referido procedi-mento) que calcula as estimativas de máxima verosimilhan¸ca, jackknife puro, jackk-nife generalizado, da variância e do viés do estimador de máxima verosimilhan¸ca. O estimador de máxima verosimilhan¸ca será o estimador de base dos estimadores de jackknife:

> funcaoc<-function(n){ + 0

(56)

3.5. UMA ABORDAGEM COMPUTACIONAL 49 > gerexp<-function(x,alfa){ + y<-(-alfa)*log(1-x) + } > estimativaJackknife<-function(m,n,dist,al,estimador,f){ + + estimativaJackknife1<-function(n,dist,al,estimador,f){ + + y<-runif(n) + x<-dist(y,al) +

+ #para o primeiro vector: + auxiliar<-0 + auxiliar1<-0 + j<-1 + for(i in 2:length(x)){ + auxiliar[j]<-x[i] + j<-j+1 + } + estimativas<-0 + estimativas[1]<-estimador(auxiliar) + + auxiliar1<-auxiliar

+ #do 2ˇz vector at´e ao pen´ultimo + for(i in 2:(length(x)-1)){ + for(j in 1:(i-1)){ + auxiliar[j]<-x[j] + } + for(j in (i+1):(length(x))){ + auxiliar[j-1]<-x[j] + } + auxiliar1<-cbind(auxiliar1,auxiliar) + estimativas[i]<-estimador(auxiliar) + } + +