Intervalos de confiança bootstrap 9 - Cálculo de intervalos de confiança para os parâmetros , e

Capítulo 3: Inferência clássica com bootstrap para o modelo de Richards

3.3 Cálculo de intervalos de confiança para os parâmetros , e 5

3.4.2 Intervalos de confiança bootstrap 9

Através do uso dobootstrap, podemos obter intervalos precisos sem usar a suposição de normalidade assintótica. Vários métodos têm sido propostos para calcular o intervalo de confiança com o método bootstrap. Uma revisão pode ser encontrada em Efron e Tibshirani, (1993) e outra revisão, mais recente, pode se encontrada em Wehrens et al, (2000).

Entre as técnicas conhecidas, as mais precisas são: 1) Percentil bootstrap 2) Percentil bootstrap corrigido RS3 (Bias-Corrected and accelerated) e 3) T RS

(ApproximateBootstrapConfidence intervals).

Método dos percentisbootstrap:

O intervalo de confiança baseado na distribuiçãobootstrapparte da suposição de que a distribuição de E é aproximada pela distribuição de EQ . Isso significa

que também os percentis da distribuição de E são aproximados pelos percentis da distribuição bootstrap de EQ . Assim, os percentis : #! e : #! da distribuição de

E _{que são usados no intervalo de confiança clássico dado por:}

E _: _#!₁ ₁ E _: _#!

são substituídos pelos percentis da aproximaçãobootstrap :Q e :Q , e o

R #! R #!

intervalo de confiança é dado por:

E _:Q ₁ ₁ E _:Q

R #! R #! (3.19)

Podemos reescrever o intervalo de confiança (3.19) considerando os quantis da distribuição de EQem lugar da versão centrada EQ E . Assim, se Qe _:Q são respectivamente os -ésimos percentis das distribuições deEQe EQ E , então:

: E

Q Q _(3.20)

pela simples razão de as duas distribuições diferirem somente por um deslocamento .E

Substituindo a relação (3.20) na equação (3.19), temos o intervalo de confiança baseado na distribuiçãobootstrap, dado por:

!E Q_R _#! 1 1 !E Q_R _#! (3.21)

Uma propriedade importante do intervalo baseado nos percentis é que ele respeita transformações nos parâmetros da distribuição. Supondo que adotamos uma transformação E E que normaliza a distribuição de , ou seja, queE E tem distribuição gaussiana com média e variância ! então o intervalo baseado em percentis para é:

I 1 1 I

E E _(3.22)

Essa propriedade é importante principalmente quando a distribuição de E é claramente assimétrica, e o intervalo normal padrão só é correto quando adotamos uma transformação que normaliza essa distribuição. O método baseado nos percentis já faz essa transformação automaticamente. A grande vantagem desse método, portanto, é não exigir o conhecimento explícito da transformação que normaliza a distribuição de .E

Entretanto, para que o método do percentil bootstrap tenha boa precisão, é necessário que essa transformação exista, mas isso nem sempre ocorre. Para tais situações, uma correção no método dos percentis foi proposto por Efron e Tibshirane (1993). O método

corrigido é denominado de RS3 bias-corrected and accelerated). O método RS3

melhora o método dos percentis em ambos os sentidos, teoria e prática. No entanto, ele exige maior esforço conputacional. Para contornar essa dificuldade, foi proposto, também por Efron e Tibshirane, o método T RS (Approximate Bootstrap Confidence intervals), que não abordamos nesta tese.

Método :

A construção do intervalo por este método é mais complicada que a construção dos intervalos percentis, mas seu uso é mais fácil. Seja EQ o -ésimo percentil da distribuição dosRestimadoresbootstrapdenotados porEQ & EQ R

O intervalo de confiança calculado pelo métodoRS3 também usa os percentis da distribuição bootstrap, mas não necessariamente os mesmos percentis do método anterior. Os percentis usados agora dependem de dois números 3 e I , chamados de aceleração e correção de vício. Então o intervaloRS3com % de confiança é dado por: E_CD E_:60 EQ EQ ! (3.23) com ! I I E EI I E EI I 3 I I 3 I I E E e E E (3.24)

Nas equações em (3.24), representa a função distribuição acumulada normal padrão, eI é o ésimo percentil da distribuição normal padrão. Note-se que, se

I e são iguais a zero, então o intervalo de confiança3 RS3 coincide com o intervalo de

confiança normal padrão. O valor da correção do vício I é calculado diretamente da proporção entre o número de estimativasbootstrapmenores que a estimativa original ,E

ou seja: I E E E R Q # (3.25)

onde representa a função distribuição acumulada normal padrão. Rigorosamente falando, I mede o vício mediano deEQ em relação aE em unidade normal. Obtemos

Existem várias formas para calcular a aceleração . A mais simples é dada em3

termos do estimador jackknife da estatísticaE _{: /} . Seja_/ a amostra original com o i-ésimo ponto retirado e a estatística E _{: /} . Defina E _!CE _#C. Uma expressão para a aceleração é dada por:

3 E E E U E E ! ! C % C ! %#! (3.26)

A estimativa E3 é chamada de aceleração porque se refere à taxa de variação do erro padrão de com relação ao valor verdadeiro do parâmetro . A aproximação normalE

padrãoE_L _.0! assume que o erro padrão de é o mesmo para todo estimadorE

No entanto, isso frequentemente não é realista, e a aceleração corrige essa distorção. O método R S3tem duas vantagens teóricas importantes. Primeiro, ele preserva tranformações nos parâmetros, como no método dos percentis. Isso significa que os pontos extremos do intervalo R S3 são transformados corretamente, se o parâmetro de interesse é trocado por uma função de . Por exemplo, o intervalo R S3 para " é obtido tomando-se a raiz quadrada dos pontos extremos do intervaloR S3para .

A segunda vantagem é quanto à sua precisão. Um intervalo com ! de confiança tem probabilidade de não conter o verdadeiro valor do parâmetro.

E_inf E_sup _(3.27)

Os intervalos de confiança aproximados são classificados de acordo com a sua precisão em relação a esta probabilidade. O método R S3 tem precisão de segunda ordem, ou seja, os erros com relação a (3.27) vão para zero com taxa #C, isto é

V V

E E

C C

inf inf e sup sup (3.28)

onde é o tamanho da amostra eC inf e sup são duas constantes.

Os intervalos padrão e os calculados pelo método dos percentis têm precisão de primeira ordem, portanto os erros com relação a (3.27) têm magnitude maior, pois

V V

E E

C C

inf inf sup sup

O método RS3 é recomendado para uso geral, já que é o único que respeita transformações e tem boa precisão.

3.5 Escolha de modelos - Teste da razão de Verossimilhança Profile

Como foi visto na seção 3 do capítulo 2, o modelo logístico é equivalente ao modelo de Richards com . Para construir o teste da razão de verossimilhança a fim de verificar qual é o modelo que se ajusta melhor aos dados, consideramos as hipóteses:

W > ' W > 5 (3.30)

Então, sob W o modelo logístico é o mais adequado e, se rejeitamos essa hipótese, ficamos com o modelo de Richards com o valor de dado pelo estimador de máxima verossimilhançaprofile E A estatística do teste é dada pela razão dos máximos das funções de verossimilhança de cada modelo.

O máximo da função de verossimilhança do modelo de Richards denotado por maxGH é obtido substituindo-se os estimadores de máxima verossimilhançaprofiledos

parâmetros do modelo EH e , e é dado por:E

maxG E exp E E ! E !E H H_! H_! C C C ! _@ maxG X E exp E !E H H H_! C ! @ (3.31)

Para o modelo logístico denotamos o máximo da função de verossimilhança por maxG=Ae, substituindo os estimadores eE=A, temos:

maxG E exp E ! ! =A =A =A _C C @ maxG X E exp E ! =A _=A =A C ! @ (3.32)

Então, a razão de máxima verossimilhança, que é a estatística do teste, é dada por:

E G G max max =A H E X E E J O E J O E !E ! =A H =A H ! E E ! ! C ! exp (3.33)

A hipótese nula é rejeitada se o máximo da verossimilhança sob o modelo logístico é menor que o máximo da verossimilhança sob o modelo de Richards. O valor crítico para esse teste não pode ser obtido diretamente porque a estatística E em (3.33) não tem uma distribuição conhecida. Podemos usar a distribuição assintótica de

E₌ _!_logE_{que é Qui-quadrado com} _$ _$ _{graus de liberdade onde é o número}_$

de parâmetros do modelo de Richards e , o número de parâmetros do modelo logístico$

(Johnson, Wichern, 1992).

Uma alternativa que propomos é gerar valores de E substituindo os estimadores de máxima verossimilhança profile em (3.33) e tomar o percentil 95% da distribuição empírica como valor crítico para o teste. Para gerar amostras dos estimadores dos parâmetros dos dois modelos, novamente usamos a técnicabootstrape então, obtivemos a distribuição de .E

No documento Inferencia e indicadores de viabilidade para modelos estocasticos de crescimento de populações (páginas 44-49)