• Nenhum resultado encontrado

Distribuição beta prime: propriedades, inferência e aplicação

N/A
N/A
Protected

Academic year: 2021

Share "Distribuição beta prime: propriedades, inferência e aplicação"

Copied!
41
0
0

Texto

(1)

Daniel Araújo Nóbrega

Distribuição beta prime: propriedades,

inferência e aplicação

Natal - RN

(2)

Daniel Araújo Nóbrega

Distribuição beta prime: propriedades, inferência e

aplicação

Monografia de Graduação apresentada ao De-partamento de Estatística do Centro de Ci-ências Exatas e da Terra da Universidade Federal do Rio Grande do Norte como re-quisito parcial para a obtenção do grau de Bacharel em Estatística.

Universidade Federal do Rio Grande do Norte

Centro de Ciências Exatas e da Terra

Departamento de Estatística

Orientador: Prof. Dr. Marcelo Bourguignon Pereira

Natal - RN

(3)

Nóbrega, Daniel Araújo.

Distribuição beta prime: propriedades, inferência e aplicação / Daniel Araújo Nóbrega. - 2018.

40f.: il.

Monografia (Bacharelado em Estatística) - Universidade Federal do Rio Grande do Norte, Centro de Ciências Exatas e da Terra, Departamento de Estatística. Natal, 2018.

Orientador: Marcelo Bourguignon Pereira.

1. Estatística Monografia. 2. Distribuição beta prime -Monografia. 3. Máxima verossimilhança - -Monografia. 4. Método dos momentos Monografia. 5. Método dos momentos modificado -Monografia. I. Pereira, Marcelo Bourguignon. II. Título. RN/UF/CCET CDU 519.2

Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI

Catalogação de Publicação na Fonte. UFRN - Biblioteca Setorial Prof. Ronaldo Xavier de Arruda - CCET

(4)
(5)
(6)

Agradecimentos

Gostaria de agracedecer primeiramente aos meus pais. Através dos esforços deles eu pude ter oportunidades na minha vida que poucas pessoas têm. Eu pude ter experiências que me ajudaram a chegar onde estou e continuarão a me levar em frente. Espero que eu consiga emular algumas das várias qualidades deles: do meu pai, o foco e determinação, e da minha mãe, a resiliência e benevolência. Sem eles, eu não estaria aqui.

Gostaria também de agradecer a minha namorada Luana por ter sido minha companheira diária nos últimos anos, sempre me ajudando, me fazendo rir e dando todo o apoio possível. Se todo mundo fosse tão bondoso quanto ela, sem sombra de dúvidas o mundo seria bem melhor.

Agradeço aos meus professores, especialmente o meu orientador Marcelo, por todos os ensinamentos, sugestões e ajudas que contribuíram bastante para meu crescimento acadêmico.

Espero que daqui pra frente, eu possa retribuir todo o apoio que eu já recebi destas pessoas.

(7)

“Limites, assim como o medo, são geralmente meras ilusões.” Michael Jordan

(8)

Resumo

Nesta monografia discorre-se a respeito da distribuição de probabilidade beta prime, discutindo em que situações esta distribuição pode ser utilizada e apresentando propriedades importantes. Além disso, são propostos seis estimadores para cada um dos parâmetros da distribuição, entre eles o estimador de máxima verossimilhança e estimador de momentos. É realizada um estudo de simulação com o intuito de avaliar a acurácia e a precisão destes. Os estimadores propostos são utilizados para estimar os parâmetros da distribuição beta prime aplicada a um conjunto de dados do tempo de reparo de transceptores de comunicação aérea. A partir desta aplicação, estimativas são avaliadas e justifica-se qual estimador aprsenta melhores propriedades. E, finalmente, conclusões a respeito de todo o processo realizado são feitas.

Palavras-chave: Distribuição beta prime. Máxima verossimilhança. Método dos momen-tos. Método dos momentos modificado.

(9)

Abstract

In this piece the beta prime probability distribution is explored, discussing what situations are advisable for this distribution to be used and introducing important properties associ-ated with it. In addition to this, six estimators for each of the distribution parameters are proposed, including the maximum likelihood estimator and moments estimator. A simula-tion study is conducted to evaluate the accuracy and precision of said estimators. These estimators are used to estimate the value of the beta prime distribution parameters, when the distribution applied to a data set containing observations referring to the repair time of aerial communication transceivers. Furthermore, the estimation values are evaluated and justifications are presented to choose which estimator has the best properties. Lastly, conclusions with regards to the whole process conducted are made.

Keywords: Beta prime distribution. Maximum likelihood. Moments method. Modified moments method.

(10)

Lista de tabelas

Tabela 1 – Médias das estimativas de α e β na simulação realizada. . . . 27 Tabela 2 – Erros quadráticos médios das estimativas de α e β na simulação realizada. 28 Tabela 3 – Dados de manutenção de transceptores de comunicação aérea. . . 30 Tabela 4 – Estimativas para os parâmetros em cada um dos estimadores. . . 30

(11)

Sumário

Lista de tabelas . . . . 8

1 INTRODUÇÃO . . . 10

2 PROPRIEDADES . . . 15

3 ESTIMAÇÃO DOS PARÂMETROS . . . 19

3.1 Estimador de máxima verossimilhança . . . 19

3.2 Estimador de máxima verossimilhança corrigido . . . 20

3.2.1 Correção de Cox-Snell . . . 20

3.2.2 Correção por bootstrap paramétrico . . . 21

3.3 Estimador pelo método dos momentos . . . 22

3.4 Estimador de momentos modificado . . . 23

3.5 Novo estimador de momentos modificado . . . 23

4 RESULTADOS NUMÉRICOS . . . 25

5 APLICAÇÃO . . . 30

6 CONCLUSÃO . . . 33

(12)

11

1 Introdução

A distribuição beta prime (BP), também conhecida como distribuição beta inversa ou distribuição beta do segundo tipo, é uma distribuição de probabilidade inicialmente introduzida por Keeping(1962) e McDonald (1984). Poucos trabalhos foram realizados com respeito a esta distribuição. Em McDonald (1987) foram discutidas algumas propriedades desta distribuição e os estimadores de máxima verossimilhança para os parâmetros foram obtidos. Já em McDonald e Keeping (1990) e Tulupeyev et al. (2013) a distribuição foi utilizada no contexto de modelos de regressão para variáveis aleatórias positivas. Em Bourguignon et al. (2018) esta distribuição foi estudada e utilizada em um contexto de modelo de regressão baseado em uma nova parametrização.

Seja X uma variável aleatória tal que X ∼ BP(α, β). A função densidade de probabilidade desta variável aleatória é dada por:

f (x; α, β) = 1 B(α, β)x

α−1(1 + x)−(α+β)

, x > 0,

em que α > 0, β > 0 são parâmetros de forma e B(α, β) é a função beta que é dada por

Z ∞

0

tα−1(1 + t)−(α+β)dt = Γ(α)Γ(β) Γ(α + β), sendo Γ(·) a função gama definida por:

Γ(λ) =

Z ∞

0

e−uuλ−1du.

A função de distribuicão acumulada desta distribuição é dada por

F (x; α, β) = I x

1+x(α, β),

em que Ix(α, β) = B(x; α, β)/B(α, β) é a função beta incompleta regularizada com

B(x; α, β) =

Z x

0

tα−1(1 + t)−(α+β)dt, x > 0.

As Figuras 1, 2, 3, 4 e 5 mostram a função densidade da distribuição BP em diferentes casos de combinações dos parâmetros α e β. Percebe-se que há deslocamentos da densidade da distribuição, diferenças na moda e mudanças com relação ao valor máximo atingido. Portanto, é possível perceber que há uma variedade de situações em que a distribuição BP pode ser ajustada a conjuntos de dados assimétricos à direita. Algumas

(13)

Capítulo 1. Introdução 12 0 2 4 6 8 10 0.0 0.2 0.4 0.6 0.8 1.0 1.2 1.4 x f(x; α , β ) α = 1.5 α = 4 α = 8

Figura 1 – Função densidade da distribuição BP para três valores de α e β = 3.

0 1 2 3 4 0.0 0.5 1.0 1.5 2.0 x f(x; α , β ) α = 1.5 α = 4 α = 8

Figura 2 – Função densidade da distribuição BP para três valores de α com β = 5.

áreas da estatística necessitam de distibuições que tenham esta forma como análise de dados de sobrevivência.

A distribuição BP pode ser utilizada na área de análise de sobrevivência como alternativa às distribuições gama e Weibull, já que o suporte de variáveis aleatórias que seguem estas distribuições é o mesmo. Neste trabalho, é realizada uma aplicação da

(14)

Capítulo 1. Introdução 13 0 1 2 3 4 0 1 2 3 4 x f(x; α , β ) α = 1.5 α = 4 α = 8

Figura 3 – Função densidade da distribuição BP para três valores de α com β = 10.

0 5 10 15 20 0.0 0.2 0.4 0.6 0.8 1.0 x f(x; α , β ) β = 0.5 β = 3

Figura 4 – Função densidade da distribuição BP para dois valores de β com α = 0.75.

distribuição BP com dados que podem ser utilizados no contexto da área mencionada para mostrar a utilidade da distribuição.

(15)

Capítulo 1. Introdução 14 0 50 100 150 0.000 0.005 0.010 0.015 0.020 0.025 0.030 x f(x; α , β )

Figura 5 – Função densidade da dsitribuição BP com α = 8 com β = 0.5.

O objetivo deste trabalho será apresentar propriedades da distribuição BP a fim de que se tenha uma maior compreensão do comportamento desta. Além disto, serão propostos seis possíveis estimadores para os parâmetros. Será feita uma comparação dos estimadores para avaliar suas efetividades quanto à acurácia e precisão além de investigar como cada um se comporta em amostras de diferentes tamanhos e diferentes combinações dos valores dos parâmetros. Desta forma, se houver interesse na utilização desta distribuição para se ajustar a conjuntos de dados diversos, a partir deste trabalho, será possivel decidir qual o método de estimação apresenta menor viés e erro quadrático médio.

Comparações similares às feitas neste trabalho aparecem na literatura. Em do Espírito Santo e Mazucheli (2014) foi realizada uma comparação entre métodos de esti-mação para a distribuição Lindley com extensão Marshall-Olkein. Em Mazucheli et al. (2016) foi feita uma comparação entre 10 estimadores diferentes para os parâmetros da

distribuição exponencial com extensão Marshall-Olkin, entre estes o estimador de máxima verossimilhança e o estimador de mínimos quadrados ponderados, para determinar quais estimadores apresentavam menor viés e menor erro quadrático média no processo de estimação dos parâmetros. Já em Teimouri et al. (2013) foi realizada uma comparação de métodos de estimação para a distribuição Weibull.

Esta monografia encontra-se dividida em seis capítulos. No Capítulo 2, algumas pro-priedades serão apresentadas afim de fornecer uma maior familiaridade com a distribuição BP. No Capítulo 3 são propostos os estimadores que serão avaliados, no capítulo seguinte comenta-se os resultados obtidos na simulação realizada. No Capítulo 5 os estimadores são

(16)

Capítulo 1. Introdução 15

aplicados a um conjunto de dados real referente à tempos de reparo de transceptores de comunicação aérea. No Capítulo 6, são discutidas as conclusões que podem ser feitas sobre qual a melhor forma de estimar os parâmetros da distribuição, ponderando as vantagens e desvantagens de cada estimador utilizado.

(17)

16

2 Propriedades

Neste segundo capítulo, são apresentadas importantes propriedades da distribuição BP. Entre estas, fala-se sobre diferentes momentos da distribuição e relações com outras distribuições de probabilidade.

Conforme dito em Bourguignon et al. (2018), pode ser demonstrado que a função densidade de probabilidade da distribuição BP é decrescente com f (x; α, β) → ∞ à medida que x → 0, se 0 < α < 1; f (x; α, β) é decrescente com moda em x = 0 no caso de α ser igual a 1 e caso α seja maior do que 1, f (x; α, β) cresce e depois decresce com moda igual a (α − 1)/(β + 1). Ademais, para 0 < α < 1, f (x; α, β) é côncava; se 1 < α ≤ 2, f (x; α, β) é convexa para baixo e depois para cima com ponto de inflexão y2; e caso α > 2, f (x; α, β)

é côncava para cima, e então para baixo e volta a ser para cima com pontos de inflexão em y1 e y2, em que y1 = (α − 1)(α + 2) −q(α − 1)(β + 2)(α + β) (β + 2)(β + 1) e y2 = (α − 1)(α + 2) +q(α − 1)(β + 2)(α + β) (β + 2)(β + 1) . 0 2 4 6 8 10 0.00 0.05 0.10 0.15 0.20 0.25 x f(x; α , β ) y1 y2

Figura 6 – Curva da densidade da distribuição BP com α = 8 e β = 3 com os pontos de inflexão y1 e y2 indicados.

(18)

Capítulo 2. Propriedades 17

A esperança de uma variável aleatória X que segue uma distribuição BP é dada por

E(X) = α

β − 1, β > 1.

O k-ésimo momento pode ser escrito como:

E(Xk) = B(α + k, β − k)

B(α, β) , β > k.

Para k ∈ N e k < β, tem-se que o k-ésimo momento é dado por

E(Xk) = k Y i=1 α + i − 1 β − i , β > k. Em particular, E(X2) = α β − 1 α + 1 β − 2, β > 2.

Consequentemente, a variância desta distribuição é dada por

V ar(X) = E(X2) − [E(X)]2 = α(α + β − 1)

(β − 2)(β − 1)2, β > 2.

A média harmônica de uma variável aleatória X é denotada por HX e é definida como

HX = 1

EX1.

No caso da distribuição BP, tem-se que HX é dada por (α − 1)/β. Isto se dá por outra propriedade da distribuição Beta Prime: se X ∼ BP(α, β), então X−1 ∼ BP(β,α). Desta forma E(X−1) = β/(α − 1), resultando que H

X = [β/(α − 1)]−1 = (α − 1)/β. Portanto, a média harmônica desta distribuição pode ser escrita como

(1 − 1/α)(1 − 1/β)E(X).

Logo, quando α → ∞ e β → ∞, HX → E(X).

(19)

Capítulo 2. Propriedades 18 E[log(X)] = 1 B(α, β) ∞ Z 0 log x xα−1(1 + x)−(α+β)dx = 1 B(α, β)    ∞ Z 0 log  x 1 + x  xα−1(1 + x)−(α+β)dx + ∞ Z 0 log(1 + x)xα−1(1 + x)−(α+β)dx    = ∂αlog [B(α, β)] − ∂β log [B(α, β)] . Além disso, E[log(1 + X)] = − ∂β log B(α, β).

A distribuição BP faz parte da família exponencial, pois sua função densidade de probabilidade pode ser escrita por

f (x; α, β) = exp{− log[B(α, β)] + (α − 1) log(x) − (α + β) log(1 + x)},

que é da forma

f (x; α, β) = exp{d(θ) + c1(θ)T1(x) + c2(θ)T2(x) + S(x)},

em que θ = (α β)>, d(θ) = − log[B(α, β)], c1(θ) = (α − 1), c2(θ) = −(α + β), T1(x) =

log(x), T2(x) = log(1 + x) e S(x) = 0.

A distribuição também possui algumas relações com algumas distribuições:

i. Se W ∼ F (2α, 2β), então αβW ∼ BP(α, β).

ii. Se Z ∼ Beta(α, β), então 1−ZZ ∼ BP(α, β).

iii. Sejam V e Y variáveis aleatórias independetes tais que V ∼ Gama(α, 1) e Y ∼ Gama(β, 1). Nestas condições

V

Y ∼ BP(α, β).

iv. Se X segue uma distribuição de Pareto com mínimo denotado por x(1) e parâmetro

(20)

Capítulo 2. Propriedades 19

É possível gerar valores aleatórios de uma variável aleatória com distribuição Beta Prime com parâmetros α e β gerando indepentemente valores aleatórios de uma variável que segue uma distribuição gama com parâmetros α e 1 e de uma variável distribuída seguindo uma gama com parâmetros β e 1 e dividindo os valores gerados. Ou, alternativamente, gerar n valores aleatórios denotados z1, . . . , zn, originados de uma distribuição beta com parâmetros α e β e então aplicar a transformação zi/(1 − zi) ∀i ∈ {1, . . . , n}.

(21)

20

3 Estimação dos parâmetros

Neste capítulo, são abordados os métodos de estimação utilizados para os parâmetros da distribuição BP neste trabalho. Os estimadores propostos abrangem entre diferentes métodos de resolução de sistemas de equações para encontrar soluções para α e β.

3.1

Estimador de máxima verossimilhança

Seja X = (X1, . . . , Xn)> uma amostra aleatória da distribuição Beta Prime com parâmetros α e β. Utilizando a função densidade de probabilidade explicitada em (1.1), tem-se que a função de verossimilhança e a função de log-verossimilhança são:

L(α, β; x) = n Y i=1 f (xi; α, β) = 1 B(α, β)n n Y i=1 xα−1i (1 + xi)−(α+β) e `(α, β; x) = log L(α, β; x) = −n log[B(α, β)] + (α − 1) n X i=1 log(xi) − (α + β) n X i=1 log(1 + xi).

Os estimadores de máxima verossimilhança para α e β, denominados ˆα e ˆβ respec-tivamente, não possuem forma fechada de maneira que se possa escrever analiticamente a expressão dos estimadores. Porém, estes podem ser obtidos maximizando numericamente

`(α, β; x). Estas estimativas são feitas resolvendo numericamente o sistema de equações:

         (∂/∂α)`(α, β; x) = 0, (∂/∂β)`(α, β; x) = 0, em que ∂α`(α, β; x) = − n B(α, β) ∂αB(α, β) + n X i=1 log  x i 1 + xi  e ∂β`(α, β; x) = − n B(α, β) ∂βB(α, β) − n X i=1 log(1 + xi).

A matriz de informação de Fisher, definida por

I =   −Eh 2 ∂α2`(α, β; x) i −Eh 2 ∂α∂β`(α, β; x) i −Eh 2 ∂α∂β`(α, β; x) i −Eh 2 ∂β2`(α, β; x) i  

(22)

Capítulo 3. Estimação dos parâmetros 21

pode ser calculada nesta distribuição, pois temos que

−Eh 2 ∂α2`(α, β; x) i = nh∂α Ψ(α) − ∂α Ψ(α + β)i −Eh 2 ∂α∂β`(α, β; x) i = −n 2 ∂α∂βΨ(α + β) −Eh 2 ∂β2`(α, β; x) i = nh∂β Ψ(β) − ∂β Ψ(α + β)i,

em que Ψ(·) é a função digamma dada por Ψ(y) = (∂Γ(y)/∂y)/Γ(y).

Quando n → ∞, o estimador de máxima verossimlhança satisfaz:

  ˆ α ˆ β   d −→ N2     α β  , I −1  .

3.2

Estimador de máxima verossimilhança corrigido

Em pequenas amostras, o estimador de máxima verossimilhança é, muitas vezes, um estimador tendencioso, ou seja, apresenta um viés. O viés de um estimador ˆθ é dado

por

vies(ˆθ) = E(ˆθ) − θ.

Desta forma, uma solução é corrigir este estimador para que se obtenha estimativas com maior acurácia. Para isto, dois métodos de correção de viés serão abordados nesta subseção.

3.2.1

Correção de Cox-Snell

Em Stošić e Cordeiro (2009) foi proposta uma forma analítica do viés do estimador de máxima verossimilhança da distribuição BP. Com isto, é possível calcular o valor do viés e assim corrigir o estimador de máxima verossimilhança.

As expressões do viés para o estimador de α e de β, Bα e Bβ, respectivamente, são

= 1 2[Ψ0(α)(Ψ0(β) − Ψ0(α + β)) − Ψ0(β)Ψ0(α + β)]2 ×{−[Ψ0(α + β)(Ψ0(α + β)(Ψ00(α) − Ψ00(β)) + Ψ0(α)Ψ00(β))] + Ψ0(β)2[−Ψ00(α) +Ψ00(α + β)] + Ψ0(β)[2Ψ0(α + β)Ψ00(α) + Ψ0(α)Ψ00(α + β)]} e = 1 2[Ψ0(α)(Ψ0(β) − Ψ0(α + β)) − Ψ0(β)Ψ0(α + β)]2 ×{Ψ0(α + β)2[Ψ00(α) − Ψ00(β)] + 2Ψ0(α)Ψ0(α + β)Ψ00(β)Ψ0(α)2[−Ψ00(β) +Ψ00(α + β)] + Ψ0(β)[−(Ψ0(α + β)Ψ00(α)) + Ψ0(α)Ψ00(α + β)]},

(23)

Capítulo 3. Estimação dos parâmetros 22

em que Ψ0(·) e Ψ00(·) são a primeira e segunda derivada, respectivamente, da função digamma Ψ(·), dada por Ψ(y) = (∂Γ(y)/∂y)/Γ(y).

Com isto, os estimadores de máxima verossimilhança corrigidos pelo viés são dados por ˆ αb = ˆα − Bαˆ e ˆ βb = ˆβ − Bβˆ.

Em Mazucheli et al. (2017) foi desenvolvido um pacote no software estatistico R chamado "mle.tools"que encontra aproximações para as expressões de Bαˆ e de Bβˆ para

diversas distribuições. Entre estas, a distribuição deste trabalho. Os autores do trabalho mencionado comentam que a aproximação do viés calculada por meio do pacote não coincide com o resultado analítico apresentado em Stošić e Cordeiro (2009). No entanto, ao recalcular as expressões analíticas, os autores perceberam que o resultado coincidia com as aproximações que haviam encontrado anteriormente. Isto indica que há algum erro analítico nas expressões propostas em Stošić e Cordeiro (2009). Contudo, neste trabalho as aproximações foram calculadas utilizando o método do pacote "mle.tools".

3.2.2

Correção por bootstrap paramétrico

Uma das maneiras de corrigir o estimador de máxima verossimilhança, é pelo método bootstrap. Este método foi inicialmente proposto por Efron (1979).

Através deste método, é possível estimar o viés de um estimador. Seja ˆθ um estimador para um parâmetro θ.

Ao gerar B amostras artificiais da distribuição em estudo utilizando as estimativas de máxima verossimilhança de α e β como os parâmetros (bootstrap paramétrico), pode-se estimar o viés do estimador calculando

viesbθ) = 1 B B X i=1 ˆ θi− ˆθ,

sendo ˆθ a estimativa do parâmetro de interesse e ˆθi a estimativa do parâmetro na i-ésima amostra artificial gerada, i = 1, . . . , B.

Portanto, pode-se propor um estimador corrigido da forma

ˆ θc = θ − viesˆ bθ) = θ −ˆ B1 B P i=1 ˆ θi− ˆθ ! = 2ˆθ −B1 PB i=1 ˆ θi.

(24)

Capítulo 3. Estimação dos parâmetros 23

Logo, para a distribuição BP, os estimadores de máxima verossimilhança corrigidos por bootstrap são

ˆ αc = 2 ˆα − 1 B B P i=1 ˆ αi, ˆ βc = 2 ˆβ − 1 B B P i=1 ˆ βi.

3.3

Estimador pelo método dos momentos

O método dos momentos é um método estatístico de estimação que consiste em igualar os momentos teóricos µk= E(Xk) aos momentos amostrais mk = (1/n)Pni=1xk, de maneira que os estimadores pelo método dos momentos ˆαM M e ˆβM M sejam as soluções do sistema:    m1 = µ1 m2 = µ2

Como visto anteriormente,

E(X) = α β − 1, β > 1 e E(X2) = α β − 1 α + 1 β − 2, β > 2.

Igualando m1 e m2 a E(X) e E(X2) respectivamente, tem-se que os estimadores

pelo método dos momentos para os parâmetros α e β são dados por

ˆ αM = n P i=1 Xi(1+Xi) n P i=1 (Xi− ¯X)2 ¯ X e ˆ βM = (2/n) n P i=1 X2 i+ ¯X(1− ¯X) (1/n) n P i=1 (Xi− ¯X)2 , respectivamente.

(25)

Capítulo 3. Estimação dos parâmetros 24

3.4

Estimador de momentos modificado

Em Kundu e Balakrishnan (2002) foi proposto um estimador pelo método dos mo-mentos modificado para estimação de parâmetros da distribuição Birnbaum-Saunders. Em uma continuação deste trabalho, este estimador foi novamente utilizado em Balakrishnan e Zhu (2013).

O estimador pelo método do momentos modificado consiste em resolver o sistema de equações (1/n)Pn

i=1Xi = E(X) e (1/n)Pni=1X

−1

i = E(X−1). Utilizando este sistema, se isola ambos os parâmetros e, desta maneira, obtém-se estimadores para α e β. Assim, para a distribuição BP, utilizando o método dos momentos modificado, tem-se que os estimadores para α e β são dados por

ˆ αM M = ¯ X ( 1+  (1/n) n P i=1 Xi−1 −1) ¯ X−  (1/n) n P i=1 Xi−1 −1 e ˆ βM M = 1+ ¯X ¯ X−  (1/n) n P i=1 Xi−1 −1, respectivamente.

3.5

Novo estimador de momentos modificado

Outro estimador proposto na literatura é um novo estimador de momentos modifi-cado, incicialmente proposto em Balakrishnan e Zhu (2013) para a estimação de parâmetros da distribuição Birnbaum-Saunders. Este método de estimação também foi utilizado em Balakrishnan et al. (2017) em que foi aplicado para obter estimativas dos parâmetros de distribuições pertencentes a uma classe de distribuições log-simétricas.

Seja X1, . . . , Xn uma amostra aleatória de tamanho n, em que Xi ∼ BP(α, β). Defina

Zij = XiXj−1, para 1 ≤ i 6= j ≤ n. É possível mostrar que

E(Zij) = E(XiXj−1) = α β − 1 β α − 1, β > 1, α > 1 (3.1) e V ar(Zij) = α + 1 β − 2 β + 1 α − 2α β − 1 β α − 1 !2 , β > 2.

(26)

Capítulo 3. Estimação dos parâmetros 25

A média amostral de Zij é dada por

¯ z = 1 2n2 X 1≤i6=j≤n Zij.

Tomando ¯X como o estimador de E(X), conforme visto anteriormente na Seção

3.3, e igualando (3.1) a ¯z tem-se um sistema de equações que, ao resolver para ˆα e ˆβ

obtém-se ˆ αM M = z + ¯¯ X ¯ z − 1 e ˆ βM M∗ = ¯ X + 1 ¯ X ¯ z ¯ z − 1.

(27)

26

4 Resultados numéricos

Neste capítulo, é descrito todo o processo de simulação utilizado para avaliar e comparar os estimadores propostos para os parâmetros da distribuição BP apresentados no capítulo 3.

Para realizar a simulação, foram escolhidos três valores para α

α1 = 1.5,

α2 = 4,

α3 = 8.

E selecionados três valores para β

β1 = 3,

β2 = 5,

β3 = 10.

Além destes, o tamanho n da amostra utilizada foi variado. Inicialmente foram utilizadas 25 unidades amostrais, este número foi aumentado para 50 e em seguida para 100 e 200.

Utilizando o software R (R Core Team 2018) foram conduzidos experimentos de Monte Carlo para observar o comportamento dos estimadores. O número de replicações do experimento foi 5000. Em cada uma destas, uma amostra artificial proveneniente de uma distribuição Beta Prime com parâmetros αk e βj ( k, j = 1, 2, 3) foi gerada. Para gerar esta amostra foi utilizada a função rinvbeta do pacote Laplaces Demon. A partir desta amostra, foram estimados os parâmetros da distribuição utilizando os estimadores explicitados anteriormente. Para obter o estimador de máxima verossimilhança foi utilizada a função

optim e para calcular o estimador de máxima verossimilhança corrigido via bootstrap

é necessário que seja executado um algoritmo: em cada replicação de Monte Carlo, 100 réplicas de bootstrap paramétrico são realizadas, em que para cada um destas réplicas se gera uma amostra de tamanho n da distribuição beta prime com parâmetros iguais às estimativas de máxima verossimilhança obtidas na respectiva iteração do método de Monte Carlo.

Após a realização da simulação, foi calculada a média das estimativas dos parâmetros

¯ ˆ α = 1 5000 5000 X i=1 ˆ αi

(28)

Capítulo 4. Resultados numéricos 27 e ¯ ˆ β = 1 5000 5000 X i=1 ˆ βi

de cada etimador apresentado no capítulo 3 em cada um dos diferentes cenários de tamanho de amostra e valores dos parâmetros. Similarmente, foi calculada a variância das estimativas e a estimativa do viés dos estimadores

s2αˆ = 1 4999 5000 X i=1 ( ˆαi− ¯α)ˆ 2 s2βˆ = 1 4999 5000 X i=1 ( ˆβiβ)¯ˆ 2 ˆ B( ˆα) = ¯α − αˆ ˆ B( ˆβ) =β − β.¯ˆ

Em seguida, calcula-se o erro quadrático médio (EQM) dos estimadores de α e β definido por s2αˆ+ ˆB2( ˆα) e s2βˆ+ ˆB2( ˆβ). Esta medida serve como uma indicadora da precisão

(29)

Capítulo 4. Resultados numéricos 28

Tabela 1 – Médias das estimativas de α e β na simulação realizada.

Estimativas de α Estimativas de β n α β αˆM αˆM M αˆM V αˆbM V αˆcM V αˆ∗M M βˆM βˆM M βˆM V βˆbM V βˆM Vc βˆ∗M M 25 1.5 3 2.3759 1.8392 1.6797 1.5000 1.4747 1.8056 4.4329 3.6757 3.4091 3.0052 2.9474 3.6264 1.5 5 2.0650 1.8544 1.6941 1.5137 1.4904 1.8202 6.7927 6.1973 5.7333 5.0304 4.9367 6.1010 1.5 10 1.8854 1.8374 1.6698 1.4928 1.4691 1.8039 12.7936 12.4906 11.4320 9.9899 9.7936 12.2805 4 3 6.2763 4.6811 4.5591 4.0273 3.9518 4.5339 4.3239 3.5005 3.4053 3.0179 2.9635 3.4215 4 5 5.3630 4.5919 4.5116 3.9913 3.9234 4.4482 6.5528 5.7537 5.6540 4.9920 4.9051 5.6046 4 10 4.8897 4.5716 4.4968 3.9814 3.9117 4.4287 12.2337 11.5038 11.3251 9.9671 9.7833 11.1752 8 3 12.5143 9.3926 9.1817 8.0781 7.9294 9.0569 4.3007 3.4986 3.4137 3.0281 2.9771 3.4091 8 5 10.6369 9.1835 9.0739 7.9977 7.8495 8.8561 6.4492 5.7061 5.6359 4.9824 4.8910 5.5382 8 10 9.7672 9.1385 9.0774 8.0097 7.8640 8.8130 12.1527 11.4297 11.3542 10.0086 9.8244 11.0580 50 1.5 3 2.0927 1.7075 1.5866 1.5023 1.4977 1.6933 3.9150 3.3780 3.1888 3.0003 2.9899 3.3582 1.5 5 1.8241 1.7095 1.5869 1.5031 1.4973 1.6953 6.0097 5.6803 5.3373 5.0099 4.9877 5.6413 1.5 10 1.7094 1.7098 1.5816 1.4983 1.4925 1.6956 11.4786 11.4639 10.6765 10.0015 9.9536 11.3769 4 3 5.5244 4.3187 4.2478 4.0006 3.9847 4.2523 3.8491 3.2335 3.1776 2.9976 2.9862 3.1991 4 5 4.7961 4.2973 4.2480 4.0037 3.9863 4.2313 5.8916 5.3772 5.3174 5.0066 4.9856 5.3099 4 10 4.4935 4.3043 4.2622 4.0186 4.0045 4.2382 11.2205 10.7817 10.6824 10.0421 10.0068 10.6314 8 3 11.0292 8.6524 8.5275 8.0150 7.9863 8.4993 3.8323 3.2262 3.1753 2.9968 2.9873 3.1867 8 5 9.5078 8.5310 8.4665 7.9649 7.9300 8.3804 5.8190 5.3224 5.2804 4.9750 4.9550 5.2460 8 10 8.9546 8.5834 8.5461 8.0441 8.0146 8.4317 11.1614 10.7361 10.6905 10.0575 10.0209 10.5640 100 1.5 3 1.9167 1.6303 1.5390 1.4982 1.4973 1.6240 3.6292 3.2306 3.0915 3.0002 2.9980 3.2219 1.5 5 1.6943 1.6308 1.5408 1.5002 1.4990 1.6245 5.5835 5.3996 5.1524 4.9943 4.9890 5.3826 1.5 10 1.6247 1.6380 1.5437 1.5032 1.5020 1.6316 10.8479 10.9126 10.3398 10.0126 10.0004 10.8740 4 3 5.0859 4.1625 4.1215 4.0017 3.9993 4.1309 3.5991 3.1261 3.0920 3.0046 3.0030 3.1099 4 5 4.4826 4.1511 4.1252 4.0067 4.0021 4.1196 5.5318 5.1904 5.1584 5.0078 5.0028 5.1586 4 10 4.2561 4.1383 4.1182 4.0008 3.9953 4.1069 10.6260 10.3534 10.3062 9.9973 9.9832 10.2824 8 3 10.1058 8.3468 8.2674 8.0190 8.0090 8.2733 3.5812 3.1318 3.0991 3.0121 3.0093 3.1130 8 5 8.9013 8.2856 8.2560 8.0115 8.0026 8.2128 5.4939 5.1776 5.1579 5.0089 5.0033 5.1409 8 10 8.4694 8.2635 8.2439 8.0020 7.9963 8.1909 10.5662 10.3304 10.3068 10.0019 9.9943 10.2483 200 1.5 3 1.7903 1.5828 1.5166 1.4966 1.4964 1.5799 3.4240 3.1365 3.0399 2.9950 2.9943 3.1326 1.5 5 1.6217 1.5893 1.5194 1.4994 1.4995 1.5863 5.3647 5.2686 5.0775 4.9996 4.9997 5.2607 1.5 10 1.5580 1.5895 1.5184 1.4985 1.4982 1.5866 10.4103 10.5909 10.1627 10.0018 9.9996 10.5731 4 3 4.7748 4.0881 4.0648 4.0058 4.0049 4.0726 3.4183 3.0662 3.0466 3.0036 3.0029 3.0584 4 5 4.2651 4.0743 4.0595 4.0012 4.0012 4.0589 5.2882 5.0919 5.0753 5.0013 5.0013 5.0764 4 10 4.1331 4.0790 4.0658 4.0078 4.0076 4.0636 10.3237 10.1975 10.1677 10.0153 10.0153 10.1628 8 3 9.4986 8.1747 8.1320 8.0098 8.0082 8.1388 3.3996 3.0628 3.0454 3.0027 3.0022 3.0538 8 5 8.5043 8.1332 8.1196 7.9995 7.9981 8.0976 5.2730 5.0828 5.0741 5.0008 4.9998 5.0649 8 10 8.2323 8.1215 8.1111 7.9921 7.9909 8.0859 10.2797 10.1517 10.1395 9.9895 9.9880 10.1116

Observando a Tabela 1, percebe-se que na menor amostra utilizada na simulação, de tamanho 25, o estimador pelo método dos momentos possui um viés positivo maior do que os demais estimadores. Isto tende a ocorrer devido ao tamanho pequeno da amostra. Também nota-se que o estimador de máxima verossimilhança apresenta um viés positivo principalmente na estimação do α = 1.5. No entanto, ambos os estimadores de máxima verossimilhança corrigidos não apresentam um viés tão significativo quando comparado aos estimadores de momentos, sobretudo no estimador corrigido utilizando a forma analítica do viés ˆαb

M V. O estimador de momentos modificado resultou em estimativas com uma tendência que, embora positiva, é menor do que a tendência do estimador pelo método dos momentos. O novo estimador de momentos modificado apresentou resultados similares ao estimador de momentos modificados, todavia a tendência positiva é menor no caso desta amostra de tamanho 25. Já na Tabela 2, analisando os erros quadráticos médios, nota-se que os estimadores de máxima verossimilhança corrigidos têm resultados similares, no entanto o estimador corrigido por bootstrap apresenta EQM menor muito embora haja um

(30)

Capítulo 4. Resultados numéricos 29

Tabela 2 – Erros quadráticos médios das estimativas de α e β na simulação realizada.

Estimativas de α Estimativas de β n α β αˆM αˆM M αˆM V αˆbM V αˆcM V αˆ∗M M βˆM βˆM M βˆM V βˆbM V βˆcM V βˆ∗M M 25 1.5 3 1.2680 0.3322 0.2625 0.1787 0.1745 0.2935 4.0438 1.5573 1.2554 0.8398 0.8187 1.4292 1.5 5 0.8044 0.3756 0.2961 0.2009 0.1976 0.3330 20.3308 13.8861 11.0677 6.8989 6.4962 13.0519 1.5 10 0.5543 0.3450 0.2618 0.1812 0.1808 0.3054 117.8360 104.8836 85.2439 59.7795 56.9312 99.9893 4 3 8.8821 2.5354 2.3688 1.5920 1.5575 2.1941 2.2140 3.3496 3.6346 4.7740 4.9728 3.5124 4 5 5.0686 2.1966 2.0985 1.4225 1.3934 1.9024 7.1751 3.5563 3.4081 2.3074 2.2647 3.1317 4 10 3.5373 2.2473 2.1432 1.4695 1.4576 1.9538 70.3976 55.6191 53.1775 34.8668 32.9597 50.4466 8 3 35.5159 11.2609 10.6016 7.1295 6.9896 9.7078 34.2586 43.4489 44.5409 49.5075 50.2021 44.5311 8 5 20.4216 9.8804 9.5558 6.5050 6.3996 8.5479 17.1448 21.4434 22.0184 27.4790 28.3494 22.6829 8 10 14.1923 9.4614 9.3011 6.3040 6.1806 8.1860 21.7668 15.0234 14.7816 10.0260 9.8106 13.0949 1.5 3 0.6015 0.1381 0.1019 0.0835 0.0842 0.1287 1.7269 0.5899 0.4669 0.3804 0.3839 0.5629 50 1.5 5 0.3382 0.1424 0.1008 0.0826 0.0831 0.1327 11.7085 8.6040 6.8018 5.2203 5.1360 8.3536 1.5 10 0.2405 0.1436 0.0988 0.0816 0.0823 0.1339 81.9367 77.7474 64.5491 53.9789 53.3384 76.0894 4 3 4.1814 0.9126 0.8543 0.7003 0.7060 0.8425 2.1322 3.5531 3.7373 4.3774 4.4238 3.6603 4 5 2.1592 0.8541 0.8137 0.6646 0.6659 0.7889 2.9409 1.3632 1.3018 1.0612 1.0669 1.2716 4 10 1.4607 0.8518 0.7981 0.6449 0.6494 0.7859 46.4019 38.4863 37.2132 29.7718 29.4592 36.5797 8 3 16.3565 3.7585 3.4778 2.8259 2.8583 3.4503 38.7964 46.3018 46.9679 49.3908 49.5280 46.8216 8 5 8.0216 3.3560 3.2500 2.6803 2.7065 3.0970 19.4085 23.0406 23.4168 26.2601 26.4698 23.7161 8 10 5.7452 3.5530 3.4957 2.8273 2.8356 3.2718 8.6097 5.6123 5.5299 4.4681 4.4712 5.1910 100 1.5 3 0.3121 0.0666 0.0435 0.0395 0.0400 0.0640 0.8674 0.2780 0.2113 0.1907 0.1936 0.2709 1.5 5 0.1620 0.0679 0.0429 0.0388 0.0392 0.0653 7.9665 6.4050 5.2015 4.5118 4.4966 6.3137 1.5 10 0.1180 0.0721 0.0449 0.0405 0.0409 0.0693 66.6026 65.5404 56.4114 51.5638 51.4147 64.8831 4 3 2.2468 0.3802 0.3509 0.3162 0.3200 0.3639 2.4058 3.7112 3.8253 4.1557 4.1642 3.7685 4 5 1.0378 0.3714 0.3481 0.3128 0.3161 0.3559 1.3854 0.5952 0.5655 0.5085 0.5121 0.5737 4 10 0.6758 0.3853 0.3574 0.3231 0.3244 0.3703 35.5205 31.1349 30.5345 27.2112 27.0806 30.3332 8 3 8.4641 1.6303 1.4975 1.3419 1.3447 1.5547 41.6124 47.3725 47.8058 49.0029 49.0439 47.6270 8 5 4.1941 1.5174 1.4754 1.3266 1.3436 1.4525 21.4045 23.7927 23.9659 25.4007 25.4638 24.1380 8 10 2.5239 1.4544 1.4286 1.2882 1.3028 1.3939 3.7304 2.2742 2.2425 2.0214 2.0463 2.1844 200 1.5 3 0.1742 0.0348 0.0202 0.0194 0.0196 0.0341 0.4547 0.1330 0.0949 0.0905 0.0914 0.1311 1.5 5 0.0900 0.0380 0.0205 0.0195 0.0198 0.0372 6.3425 5.5000 4.5963 4.2702 4.2749 5.4613 1.5 10 0.0579 0.0382 0.0201 0.0192 0.0193 0.0374 57.4873 59.1512 52.4692 50.1545 50.1303 58.8688 4 3 1.2755 0.1833 0.1655 0.1565 0.1583 0.1791 2.7666 3.8379 3.9023 4.0697 4.0735 3.8673 4 5 0.5532 0.1692 0.1587 0.1505 0.1519 0.1656 0.7052 0.2684 0.2551 0.2420 0.2440 0.2634 4 10 0.3408 0.1786 0.1638 0.1548 0.1563 0.1747 30.3210 28.1487 27.7822 26.1987 26.2098 27.7782 8 3 4.8649 0.7957 0.7149 0.6767 0.6868 0.7769 43.8139 48.2260 48.4552 49.0480 49.0558 48.3508 8 5 2.1269 0.6889 0.6739 0.6399 0.6462 0.6740 22.9379 24.4327 24.5116 25.2313 25.2433 24.6067 8 10 1.2466 0.6851 0.6755 0.6435 0.6460 0.6710 1.8459 1.0704 1.0572 1.0069 1.0115 1.0495

viés um pouco maior. Os estimadores de máxima verossimilhança corrigidos têm medidas de eqm bastante parecidas, enquanto que o estimador sem correção tem resultado maior em geral.

Quando o tamanho da amostra foi aumentado para 50, percebe-se que há uma melhora nas estimativas utilizando o método dos momentos no que se diz respeito ao viés, já que é perceptível que embora o estimador ainda esteja superestimando os valores do parâmetro, nota-se que as estimativas estão mais próximas dos verdadeiros valores dos parâmetros. Com o aumento do tamanho da amostra, podemos notar uma redução no viés do estimador de máxima verossimilhança. Isto é esperado dado que é um estimador assintoticamente não-viesado. Entre os estimadores de máxima verossimilhança corrigidos, embora apresentem estimativas próximas dos verdadeiros valores dos parâmetros, o esti-mador corrigido pela forma analítica proposto na Seção 3.5 continua com resultados mais próximos dos reais valores dos parâmetros do que o estimador corrigido por bootstrap. O estimador ˆαM M permanece com um viés positivo mas apresenta uma redução com relação ao cenário do tamanho de amostra 25, e tem média das estimativas mais próximas dos

(31)

Capítulo 4. Resultados numéricos 30

verdadeiros valores dos parâmetros comparado ao estimador de momentos modificado. Com relação ao erro quadrático médio destes estimadores, assim como no cenário anterior, os estimadores de máxima verossimilhança corrigidos são os que tem menor erro quadrático médio. O EQM dos dois estimadores de momentos modificados é comparável com o do estimador de máxima verossimilhança; em alguns casos é maior e em outros, menor.

Nos casos das amostras de tamanho 100 e 200, percebe-se que as estimativas médias dos parâmetros se aproximaram mais dos valores reais dos parâmetros. Porém, os estimadores de máxima verossimilhança corrigidos, embora tenham se aproximado mais dos verdadeiros valores dos parâmetros, não há grandes mudanças quando comparados às estimativas dos mesmos estimadores nas amostras menores, pois as estimativas anteriores já apresentavam tendência próxima de zero. As estimativas pelo estimador de momentos são bem mais próximas dos valores reais dos parâmetros, no entanto mesmo com um tamanho amostral de 200, ainda há um viés maior do que o viés dos demais estimadores. Com relação às medidas de erro quadrático médio dos estimadores, nota-se que, como esperado, há uma redução nesta medida, já que são amostras maiores, mas fica evidente que são os mesmos estimadores dos cenários anteriores a terem as menores medidas do erro.

(32)

31

5 Aplicação

Neste capítulo é feita uma aplicação dos estimadores propostos no Capítulo 3 à um conjunto de dados real. O conjunto de dados utilizado foi utilizado em Percontini et al. (2014). Os dados são formados por 46 observações do tempo ativo de reparo, em horas, de

um transceptor de comuicação aérea.

Tabela 3 – Dados de manutenção de transceptores de comunicação aérea.

0.2 0.3 0.5 0.5 0.5 0.5 0.6 0.6 0.7 0.7 0.7 0.8 0.8 1.0 1.0 1.0 1.0 1.1 1.3 1.5 1.5 1.5 1.5 2.0 2.0 2.2 2.5 2.7 3.0 3.0 3.3 3.3 4.0 4.0 4.5 4.7 5.0 5.4 5.4 7.0 7.5 8.8 9.0 10.3 22.0 24.5

A Tabela 3 apresenta os dados a serem analisados. Os dados estão ordenados, logo é possível ver que o valor mínimo é 0.2 e o valor máximo é 24.5. O primeiro quartil das observações é o valor 0.8, a mediana é igual a 1.75 e o terceiro quartil é 4.375. Já a média dos dados é igual a 3.607 e a variância é de 24.445.

Tabela 4 – Estimativas para os parâmetros em cada um dos estimadores.

ˆ α βˆ ˆ θ 2.7818 1.6576 ˆ θb 2.6062 1.5612 ˆ θc 2.6011 1.5807 ˆ θM 6.1827 2.7053 ˆ θM M 3.1113 1.8582 ˆ θM M 3.0813 1.8499

A Tabela 4 mostra as estimativas para os parâmetros obtidas por meio dos estima-dores propostos no Capítulo 3. Nota-se que as estimativas obtidas para os parâmetros pelos diferentes estimadores segue um padrão semelhante à simulação conduzida no Capítulo 4. Os estimadores de máxima verossimilhança corrigidos têm estimativas similares, princi-palmente para a estimativa de α, as estimativas pelo método dos momentos modificados e pelo novo método dos momentos modificados também são similares e com resultados maiores do que os estimadores de máxima verossimilhança. Como o estimador de máxima verossimilhança corrigida pelo método de Cox-Snell teve resultados melhores na simulação, a estimativa dos parâmetros será realizada utilizando este estimador.

A Figura 7 apresenta o boxplot dos dados. Percebe-se que de fato a distribuição dos dados é assimétrica à direita e que de fato há valores discrepantes no conjunto de dados. Isto pode ser indicativo de que as estimativas podem estar sendo influenciados devido à presença destes outliers.

(33)

Capítulo 5. Aplicação 32 0 5 10 15 20 25 T emp o at ivo d e re pa ro (h ora s)

Figura 7 – Boxplot dos dados de manutenção de transceptores de comunicação aérea.

A Figura 8 apresenta o histograma dos dados de tempo de reparo e a curva da densidade da distribuição BP com os parâmetros estimados por meio do estimador de máxima verossimilhança com o viés corrigido pelo método de Cox-Snell em azul e a curva da densidade da distribuição BP com os parâmetros estimados por meio do estimador de momentos, cujas estimativas foram bem diferentes dos demais estimadores, em vermelho. Percebe-se que a densidade ajustada utilizando as estimativas de máxima verossimilhança corrigidas pelo método de Cox-Snell é bastante parecida com a forma do histograma dos dados. Já a outra curva da densidade aparenta estar deslocada para a direita com relação à distribuição do conjunto de dados.

(34)

Capítulo 5. Aplicação 33

Tempo ativo de reparo (horas)

D en si da de 0 5 10 15 20 25 0.0 0.1 0.2 0.3

Figura 8 – Histograma dos dados de manutenção com a curva densidade da distribuição BP com parâmetros iguais às estimativas ˆαb e ˆαb em azul; e a curva de densidade da distribuição BP com parâmetros iguais às estimativas ˆαM e ˆαM em vermelho.

(35)

34

6 Conclusão

Neste capítulo são discutidas as possíveis conclusões e ponderações a serem feitas com respeito aos métodos de estimação abordados.

Nas simulações realizadas, fica claro que o estimadores de máxima verossimilhança com correção de viés fornecem estimativas mais próximas dos verdadeiros valores dos parâmetros do que os demais estimadores. Isto ocorre em todos os tamanhos de amostra e em todas as combinações dos valores dos parâmetros. Entre os estimadores corrigidos mencionados, o estimador que tem o viés corrigido pela forma analítica apresenta resultados melhores dos que o corrigido pelo método bootstrap, principalmente quando a amostra é menor. Isso pode estar occorrendo devido ao número de réplicas bootstrap ser 100, pois a tendência é que as estimativas fiquem mais próximas dos parâmetros quando se utiliza mais réplicas. Logo, apesar da possível limitação do estimador corrigido por bootstrap devido ao número de réplicas bootstrap, na ocasião de aplicar esta distribuição a conjuntos de dados diversos, caso o tamanho da amostra não seja grande, é recomendável que utilize-se o estimador de máxima verossimilhança corrigido pelo método de Cox-Snell para obter-se estimativas para os parâmetros.

Caso fosse necessário trabalhar computacionalmente com a forma analítica do viés, a utilização deste estimador não seria prática, pois se tornaria necessário que isto fosse programado. E, como há uma expressão analística diferente para cada distribuição, conforme apresentado em Stošić e Cordeiro (2009), ficaria difícil de testar diferentes distribuições para um determinado conjunto de dados. No entanto, como existe o pacote computacional "mle.tools"no software R, a implementação deste estimador torna-se viável e simples de ser programado.

Por um lado, é bem verdade que os estimadores que forneceram melhores estimativas tiveram correção de viés, o que não ocorreu para os estimadores baseados no método dos momentos, sejam estes modificados ou não. Portanto, para um estudo de comparação mais completo de métodos de estimação, seria interessante que se implementasse a correção do viés destes outros estimadores e então fosse comparados todos os estimadores corrigidos. A vantagem da utilização dos estimadores baseados no método dos momentos é a simplicidade, pois estes estimadores tem expressões que dependem de estatísticas facilmente calculáveis. Já o estimador de máxima verossimilhança requer um rigor computacional mais elevado devido ao fato que no caso da distribuição BP, não há forma analística para este estimador, logo é necessário utilizar algum método de otimização para se obter as estimativas, e este tipo de prática é sujeita a falhas compatucionais como erros de aproximação.

(36)

Capítulo 6. Conclusão 35

estimadores de momentos não foram corrigidas, o estimador de máxima verossimilhança sem correção forneceu resultados mais precisos e acurados mesmo que este também não tenha tido o viés eliminado. Portanto, é razoável imaginar que mesmo que se corrija os estimadores de momentos, os resultados não serem melhores do que os estimadores de máxima verossimilhança corrigido.

No caso da aplicação dos métodos de estimação ao conjunto de dados referente ao tempo ativo de reparo dos transceptores de comunicação aérea, abordada no capítulo 5, tem-se o estimador de máxima verossimilhança teve estimativas menores do que os estimadores baseado em algum método dos momentos. Além disso, foi calculado que este estimador teve um viés positivo ao estimar os parâmetros, logo os parâmetros foram superestimados. Isto pode indicar que os demais estimadores superestimaram ainda mais os parâmetros. Isto corrobora com o fato de que é mias prudente a utilização dos estimadores de máxima verossimilhança corrigidos para aplicações em que a distribuição BP seja relevante e útil.

(37)

36

Referências

BALAKRISHNAN, N.; ZHU, X. An improved method of estimation for the parameters of the Birnbaum-Saunders distribution. Journal of Statistical Computation and

Simulation, v. 84, n. 10, p. 2285–2294, abr 2013. ISSN 3437-3450. Disponível em: <http://dx.doi.org/10.1080/00949655.2013.789029>.

BALAKRISHNAN, N. et al. On moment-type estimators for a class of log-symmetric distributions. Computational Statistics, v. 32, n. 4, p. 1339–1355, mar 2017. ISSN 0943-4062. Disponível em: <https://doi.org/10.1007/s00180-017-0722-6>.

BOURGUIGNON, M;SANTOS-NETO, M; DE CASTRO; M. A new regression model for positive data. Disponível em: <arXiv:1804.07734v1[stat.ME]>.

DO ESPÍRITO SANTO, A.P.J.; Mazucheli, J. Comparison of estimation methods for the Marshall–Olkin extended Lindley distribution. Journal of Statistical Computation

and Simulation, v. 85, n. 17, p. 317–328, nov 2014. ISSN 3437-3450. Disponível em:

<http://dx.doi.org/10.1080/00949655.2014.977904>.

KEEPING, E. S. Introduction to Statistical Inference. Nova Iorque: Van Norstrand, 1962.

MAZUCHELI, J.; GHITANI, M.E.; LOUZADA, F. Comparisons of Ten Estimation Methods for the Parameters of Marshall-Olkin Extended Exponential Distribution.

Communications in Statistics - Simulation and Computation, v. 46, n. 7, p. 5627–5645,

maio 2016. ISSN 0361-0918. Disponível em: <http://dx.doi.org/10.1080/03610918.2016. 1171345>.

MAZUCHELI, J.; MENEZES, A. F.; NADARAJAH, S. mle.tools: An R Package for Maximum Likelihood Bias Correction. The R Journal, v. 79, n. 6, p. 751–767, dec 2017. ISSN 2073-4859. Disponível em: <https://www.researchgate.net/publication/320757321>.

McDONALD, J. B. Some generalized functions for the size distribution of income.

Econometrica, v. 52, n. 3, p. 647–663, maio 1984. ISSN 1468-0262. Disponível

em: <http://links.jstor.org/sici?sici=0012-9682%28198405%2952%3A3%3C647% 3ASGFFTS%3E2.0.CO%3B2-D>.

McDONALD, J. B. Model Selection: Some generalized distributions. Communications

in Statistics - Theory and Methods, v. 16, n. 4, p. 1049–1074, jan 1987. ISSN 03610926.

Disponível em: <http://dx.doi.org/10.1080/03610928708829422>.

NG, H. K. T; KUNDU, D.; BALAKRISHNAN, N. Modified moment estimation for the two-parameter Birnbaum-Saunders distribution. Computational Statistics

& Data Analysis, v. 43, p. 283–298, 2013. ISSN 0167-9473. Disponível em:

<https://www.researchgate.net/publication/320757321>.

PERCONTINI, A. et al. A distribuição Gama Weibull Poisson aplicada a dados de sobrevivência. Brazilian Society of Applied and Computational Mathematics, v. 15, n. 2, ago 2014. ISSN 1677-1966. Disponível em: <http://dx.doi.org/10.5540/tema.2014.015.02. 0165>.

(38)

Referências 37

R Core Team (2018). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL https://www.R-project.org/.

STOŠIC, B.D.; CORDEIRO, G. Using Maple and Mathematica to derive bias corrections for two parameter distributions. Journal of Statistical Computation and

Simulation, v. 79, n. 6, p. 751–767, maio 2009. ISSN 3437-3450. Disponível em:

<http://dx.doi.org/10.1080/00949650801911047>.

TEIMOURI, M.; HOSEINI, S.M; NADARAJAH, S. Comparison of estimation methods for the Weibull distribution. Statistics: A Journal of Theoretical and

Applied Statistics, v. 47, n. 1, p. 93–109, mar 2011. ISSN 0943-4062. Disponível em:

(39)

38

Apêndice

Propriedades

X ∼ BP(α, β). E  log  X 1 + X  = 1 B(α, β) Z ∞ 0 log  x 1 + x  xα−1(1 + x)−(α+β)dx = 1 B(α, β) Z ∞ 0 [log(x) − log(1 + x)]xα−1(1 + x)−(α+β)dx = 1 B(α, β) Z ∞ 0 [log(x) xα−1(1 + x)−(α+β) − log(1 + x) xα−1(1 + x)−(α+β) ]dx = 1 B(α, β) Z ∞ 0 ∂α  xα−1(1 + x)−(α+β)dx = 1 B(α, β) ∂α Z ∞ 0 xα−1(1 + x)−(α+β)dx = 1 B(α, β) ∂αB(α, β) = ∂αlog B(α, β) E [log (1 + X)] = 1 B(α, β) Z ∞ 0 log(1 + x) xα−1(1 + x)−(α+β)dx = 1 B(α, β) Z ∞ 0 − ∂β  xα−1(1 + x)−(α+β)dx = − 1 B(α, β) ∂βB(α, β) = − ∂β log B(α, β)

(40)

Referências 39 E [log (X)] = 1 B(α, β) Z ∞ 0 log(x) xα−1(1 + x)−(α+β)dx = 1 B(α, β) Z ∞ 0  log  x 1 + x  + log(1 + x)  xα−1(1 + x)−(α+β)dx = 1 B(α, β) Z ∞ 0 log  x 1 + x  xα−1(1 + x)−(α+β)dx + 1 B(α, β) Z ∞ 0 log(1 + x) xα−1(1 + x)−(α+β)dx = E  log  X 1 + X  + E [log (1 + X)] = ∂αlog B(α, β) − ∂β log B(α, β)

Estimação dos parâmetros

Estimador pelo método dos momentos: ¯ X = ˆαˆ β−1 ⇒ ˆβ = α+ ¯ˆX¯X (1/n)Pn i=1 Xi2 = αˆ ˆ β−1 ˆ α+1 ˆ β−2 ⇒ (1/n)Pn i=1 X2 i = ¯X  ˆ α+1 ˆ α+ ¯X ¯ X −2  ⇒ (1/n)Pn i=1 Xi2 = ¯X2α− ¯ˆα+1ˆ X ⇒ ˆα(1/n)Pn i=1 X2 i − ¯X(1/n) n P i=1 X2 i = ˆα ¯X2+ ¯X2 ⇒ ˆα  (1/n)  n P i=1 X2 i − n ¯X2  = ¯X(1/n)Pn i=1 X2 i + ¯X2 ⇒ ˆα  (1/n)Pn i=1 (Xi− ¯X)2  = ¯X  (1/n)Pn i=1 Xi(1 + Xi)  ⇒ ˆα = n P i=1 Xi(1+Xi) n P i=1 (Xi− ¯X)2 ¯ X ˆ β = α+ ¯ˆX¯X ⇒ ˆβ = (2/n) n P i=1 X2 i+ ¯X(1− ¯X) (1/n) n P i=1 (Xi− ¯X)2

Estimador de momentos modificado: ¯

X = ˆαˆ

β−1

(41)

Referências 40 (1/n)Pn i=1 Xi−1 = α−1ˆβˆ ⇒ βˆ (1/n) n P i=1 Xi−1 = ˆα − 1βˆ (1/n) n P i=1 Xi−1 = ¯X( ˆβ − 1) − 1βˆ (1/n) n P i=1 Xi−1 − ˆβ ¯X = −(1 + ¯X) ⇒ ˆβ = 1+ ¯X ¯ X−  (1/n) n P i=1 Xi−1 −1 ˆ α = ¯X( ˆβ − 1) ⇒ ˆα = ¯ X ( 1+  (1/n) n P i=1 Xi−1 −1) ¯ X−  (1/n) n P i=1 X−1i −1

Novo estimador de momentos modificado:

¯ z = ¯Xα−1ˆβˆ ˆ β = α+ ¯ˆX¯X ⇒ ¯z = α+ ¯ˆα−1ˆ X ⇒ ˆα = Z+ ¯¯Z−1¯ X ⇒ ˆβ = X+1¯X¯ z−1¯z¯

Referências

Documentos relacionados

ter se passado tão lentamente como muda uma montanha, aos nossos olhos eternamente parada e cujas mudanças só são percebidas pelos olhos de Deus” (DOURADO, 1999, p.

O objetivo deste trabalho foi realizar o inventário florestal em floresta em restauração no município de São Sebastião da Vargem Alegre, para posterior

Na medida das nossas capacidades, poderemos colaborar em iniciativas que concorram para o conhecimento do teatro greco‑latino, acompanhar o trabalho de dramaturgia (de

Dentre as principais conclusões tiradas deste trabalho, destacam-se: a seqüência de mobilidade obtida para os metais pesados estudados: Mn2+>Zn2+>Cd2+>Cu2+>Pb2+>Cr3+; apesar dos

Esta realidade exige uma abordagem baseada mais numa engenharia de segu- rança do que na regulamentação prescritiva existente para estes CUA [7], pelo que as medidas de segurança

No código abaixo, foi atribuída a string “power” à variável do tipo string my_probe, que será usada como sonda para busca na string atribuída à variável my_string.. O

Por exemplo, Rancho Grande (1940), de Frank MaDonald, para a Republic, com Gene Autry como astro, faz alusão não ape- nas à famosa canção popular mexicana Allá en el Rancho Grande,

Abstract: We consider the problem of robust model predictive control for linear sampled– data dynamical systems subject to state and control constraints and additive and