• Nenhum resultado encontrado

Regressão Quantílica Bayesiana em Modelos de Fronteira Estocástica

N/A
N/A
Protected

Academic year: 2021

Share "Regressão Quantílica Bayesiana em Modelos de Fronteira Estocástica"

Copied!
88
0
0

Texto

(1)

fronteira de produção estocástica

Angel Aníbal Arroyo Hinostroza

Brasil

2017

(2)

Regressão quantílica bayesiana em modelos de fronteira

de produção estocástica

Dissertação de Mestrado submetida ao Pro-grama de Pós-Graduação em Estatística do Instituto de Matemática da Universidade Fe-deral do Rio de Janeiro, como parte dos re-quisitos necessários à obtenção do grau de Mestre em Estatística.

Universidade Federal de Rio de Janeiro Instituto de Matemática

Departamento de Métodos Estatísticos Programa de Pós-Graduação em Estatística

Orientadores: Ralph S. Silva, Helio S. Migon

Brasil

2017

(3)

Elaborado pelo Sistema de Geração Automática da UFRJ com os dados fornecidos pelo(a) autor(a).

AA779r

Arroyo Hinostroza, Angel Aníbal

Regressão quantílica bayesiana em modelos de fronteira de produção estocástica / Angel Aníbal Arroyo Hinostroza. -- Rio de Janeiro, 2017. 73 f.

Orientador: Ralph dos Santos Silva. Coorientador: Helio dos Santos Migon.

Dissertação (mestrado) - Universidade Federal do Rio de Janeiro, Instituto de Matemática, Programa de Pós-Graduação em Estatística, 2017.

1. Amostragem de Gibbs. 2. Cobb-Douglas. 3. Distribuição Laplace assimétrica. 4. Eficiência técnica. 5. Quantil. I. Silva, Ralph dos Santos, orient. II. Migon, Helio dos Santos, coorient. III. Título.

(4)

de produção estocástica

Angel Aníbal Arroyo Hinostroza

Dissertação de Mestrado submetida ao Pro-grama de Pós-Graduação em Estatística do Instituto de Matemática da Universidade Fe-deral do Rio de Janeiro, como parte dos re-quisitos necessários à obtenção do grau de Mestre em Estatística.

Aprovado por:

Prof. Ralph dos Santos Silva D.Sc., UFRJ

Prof. Thais Cristina Oliveira da Fonseca

D.Sc., UFRJ

Prof. Fábio Nogueira Demarqui D.Sc., UFF

Brasil

2017

(5)
(6)

O agradecimento principal é direcionado a Deus.

A meus pais, Lumán Arroyo e Casimira Hinostroza, a meus irmãos Milagros, Ma-riluz, Julio e Daniel, por seu amor e por me ensinar o valor de ter uma família unida.

A Hana, por me aproximar de Deus, por seu apoio, amor e paciência.

A Charles, pela motivação para vir ao Rio de Janeiro e estudar na pós-graduação e pela sua ajuda para me adaptar a esta cidade. A Carlos, além de primo, um grande amigo que não imaginei encontrar tão longe, pela sua ajuda e hospitalidade.

A Enrique, Daniel, Renzo e Juan Carlos, pela amizade. Vocês fizeram desaparecer a distância entre Lima e Rio de Janeiro. A Juan José, Cecilia, Elena, Oscar, Roxana, Rodrigo e Yuri por seus valiosos conselhos. A Gladston, Frei Anchieta, Natália e Tiago por me fazer sentir em família.

Ao Programa de Pós-Graduação do Departamento de Métodos Estatísticos, por fornecer as condições necessárias para poder desenvolver esta dissertação. Aos professores do programa, em especial meus orientadores os professores Ralph e Helio. Obrigado por seu apoio, ideias e conselhos!. A meus companheiros Mariana, Pamela, Sergio, Widemberg, Juan Carlos, Jesús, Carlos, Ericka, Daniela, Marcos, Lucas, entre tantos outros por suas amizades e companheirismo.

A todas as pessoas que contribuíram para eu conseguir chegar até aqui. A todos, muito obrigado!

(7)

cuyos pétalos no se terminan jamás de deshojar.” (Mario Vargas Llosa, Novel de literatura 2010)

(8)

Nesta dissertação apresentamos uma nova classe de modelos que através da regressão quantílica bayesiana lida com o modelo de fronteira de produção estocás-tica. Em comparação com a abordagem clássica do modelo de fronteira de produção estocástica que utiliza regressão na média condicional, nossa proposta herda as van-tagens da regressão quantílica, tais como: robustez, o fato de não precisar assumir distribuição alguma para os dados nem a necessidade de assumir homoscedastici-dade, além de fornecer uma maior abrangência - desde que a análise em diversos quantis oferece um conhecimento maior sobre a relação entre a produção e as quanti-dades de insumos. A modelagem proposta utiliza a distribuição Laplace assimétrica cuja representação de mistura normal-exponencial permite obter distribuições con-dicionais completas fechadas e conhecidas. Um estudo de Monte Carlo é apresentado para avaliar empiricamente a metodologia para a inferência em modelos de regressão quantílica bayesiana. Apresenta-se também duas aplicações da proposta, para con-juntos de dados transversal e de painel. Compara-se resultados obtidos a partir da nossa proposta com resultados obtidos com uso de regressão na média condicional (abordagem clássica).

Palavrchaves: Amostragem de Gibbs; Cobb-Douglas; Distribuição Laplace

(9)

This dissertation proposes the use of quantile regression following a Bayesian approach to deal with stochastic frontier models. Compared with models that work with regression in the conditional mean, the proposal inherits the advantages of quantile regression, such as: robustness, does not need to assume any distribution to the data nor assume homoscedasticity, and also a broader scope - several quan-tiles provides a better understanding of the response variable. Our proposal is to use the asymmetric Laplace distribution whose normal-exponential mixture repre-sentation allows to obtain closed-form and known complete conditional distribu-tions. A Monte Carlo study is presented to empirically evaluate the methodology for Bayesian quantile regression. Two applications of the proposal are presented for cross-sectional and panel data sets. We compare the results obtained from our proposal with those obtained using conditional mean regression.

Keywords: Asymmetric Laplace density; Cobb-Douglas; Gibbs sampling; MCMC;

(10)

En esta disertación se propone una nueva clase de modelos que a través de la regresión cuantílica bayesiana lidia con modelos de frontera de producción estocástica. En comparación con el esquema clássico de los modelos de frontera de produción estocástica que utilizan regresión en la esperanza condicional, nuestra propuesta hereda las ventajas de la regresión cuantílica, tales como: robustez, el hecho de no necesitar asumir distribución alguna para los datos ni la necesidad de asumir homoscedasticidad, además de proporcionar un mayor alcance - desde que el análisis en diversos quantiles ofrece un conocimiento mayor sobre la rela-ción entre la produrela-ción y las cantidades de insumos. Nuestra propuesta utiliza la distribución Laplace asimétrica cuya representación de mixtura normal-exponencial permite obtener distribuciones condicionales completas cerradas y conocidas. Un estudio de Monte Carlo es presentado para evaluar empíricamente la metodología de inferencia en modelos de regresión cuantílica bayesiana. Se presentan también dos aplicaciones de la propuesta, para conjuntos de datos transversales y de pa-nel. Se comparan resultados obtenidos a partir de nuestra propuesta con resultados obtenidos con uso de regresión en la esperanza condicional (esquema clássico).

Palabras clave: Cobb-Douglas; Cuantil; Distribución Laplace asimétrica;

(11)

Figura 1 – Função de produção com fronteira estocástica. . . 8

Figura 2 – Densidade Laplace assimétrica e função de perda 𝜌𝜏. . . 11

Figura 3 – Estudo de Monte Carlo: monitoramento. . . 22

Figura 4 – Estudo de Monte Carlo: erro quadrático médio estimado. . . 24

Figura 5 – Estudo de Monte Carlo: probabilidade de cobertura empírica. . . 26

Figura 6 – Estudo de Monte Carlo: traço de cadeias e estimativas intervalares de 𝛽2. 27 Figura 7 – Estudo de Monte Carlo: probabilidade de cobertura empírica ajustada. 29 Figura 8 – Aplicação 1: monitoramento 𝜏 = 0, 5 (I). . . . 32

Figura 9 – Aplicação 1: monitoramento 𝜏 = 0, 5 (II). . . . 33

Figura 10 – Aplicação 1: distribuição a posteriori de 𝜎2 𝜔 em 5 quantis diferentes. . . 34

Figura 11 – Aplicação 1: estimativas intervalares para 𝛽. . . . 35

Figura 12 – Aplicação 1: intervalos de credibilidade para as eficiências técnicas. . . 37

Figura 13 – Aplicação 1: intervalos de credibilidade para 10 eficiências técnicas. . . 37

Figura 14 – Aplicação 1: histogramas das amostras a posteriori das eficiências téc-nicas associadas às firmas 35 e 44.. . . 38

Figura 15 – Aplicação 2: monitoramento 𝜏 = 0, 5 (I). . . . 40

Figura 16 – Aplicação 2: monitoramento 𝜏 = 0, 5 (II). . . . 41

Figura 17 – Aplicação 2: monitoramento 𝜏 = 0, 5 (III). . . . 42

Figura 18 – Aplicação 2: estimativas intervalares para 𝛽. . . . 43

Figura 19 – Aplicação 2: estimativas intervalares para 𝛿. . . . 44

Figura 20 – Aplicação 2: intervalos de credibilidade para as eficiências técnicas (I). 45 Figura 21 – Aplicação 2: intervalos de credibilidade para as eficiências técnicas (II). 46 Figura 22 – Aplicação 2: intervalos de credibilidade para as 5 maiores e 5 menores eficiências técnicas. . . 47

Figura 23 – Aplicação 2: intervalos de credibilidade para as eficiências técnicas da firma 43. . . 47

Figura 24 – Apêndice: f.d.p. gaussiana inversa generalizada. . . 56

Figura 25 – Aplicação 1: monitoramento 𝜏 = 0, 10. . . . 61

Figura 26 – Aplicação 1: monitoramento 𝜏 = 0, 25. . . . 62

Figura 27 – Aplicação 1: monitoramento 𝜏 = 0, 75. . . . 63

Figura 28 – Aplicação 1: monitoramento 𝜏 = 0, 90. . . . 64

Figura 29 – Aplicação 2: monitoramento 𝜏 = 0, 10 (I). . . . 66

(12)

Figura 32 – Aplicação 2: monitoramento 𝜏 = 0, 25 (II). . . . 69

Figura 33 – Aplicação 2: monitoramento 𝜏 = 0, 75 (I). . . . 70

Figura 34 – Aplicação 2: monitoramento 𝜏 = 0, 75 (II). . . . 71

Figura 35 – Aplicação 2: monitoramento 𝜏 = 0, 90 (I). . . . 72

(13)

Tabela 1 – Algumas especificações da função de produção. . . 6

Tabela 2 – Estudo de Monte Carlo: erro quadrático médio estimado. . . 23

Tabela 3 – Estudo de Monte Carlo: probabilidade de cobertura empírica. . . 25

Tabela 4 – Estudo de Monte Carlo: probabilidade de cobertura empírica ajustada. 28

Tabela 5 – Aplicação 1: sumário de estatísticas para os parâmetros da fronteira de

produção estocástica. . . 36

Tabela 6 – Descrição das variáveis do conjunto de dados riceProdPhil. . . 39

Tabela 7 – Aplicação 2: sumário de estatísticas para os parâmetros da fronteira de produção estocástica e parâmetros associados as variáveis explicativas

(14)

1 Introdução. . . . 1

1.1 Fronteira de produção estocástica . . . 2

1.2 Regressão quantílica bayesiana . . . 2

1.3 Regressão quantílica bayesiana em modelos de fronteira de produção esto-cástica . . . 3

2 Modelos, propriedades e inferência . . . . 5

2.1 Fronteira de produção estocástica . . . 5

2.2 Regressão quantílica bayesiana . . . 9

2.3 Regressão quantílica bayesiana em modelos de fronteira de produção esto-cástica . . . 14

2.3.1 Modelo básico . . . 14

2.3.2 Modelo para dados de painel . . . 16

3 Aplicação . . . 20

3.1 Regressão quantílica bayesiana: um estudo de Monte Carlo . . . 20

3.2 Regressão quantílica bayesiana em modelos de fronteira de produção esto-cástica: aplicações . . . 30

3.2.1 Aplicação 1: dados front41Data . . . 31

3.2.2 Aplicação 2: dados riceProdPhil . . . 38

4 Considerações finais . . . 48

Referências . . . 50

Apêndice A Demostração da proposição 2.2.1 . . . 53

Apêndice B Distribuição gaussiana inversa generalizada . . . 55

Apêndice C Gerando valores aleatórios para o termo de erro aleatório no modelo de regressão quantílica . . . 57

C.1 Erro com distribuição Laplace assimétrica . . . 57

C.2 Erro com distribuição Normal . . . 58

C.3 Erro com distribuição t-Student . . . 58

Apêndice D Algoritmos: Inferência com o pacote frontier . . . 59

D.1 Inferência para o modelo de dados transversais, Equação 2.3 . . . 59

(15)
(16)

Capítulo 1

Introdução

Os modelos de fronteira de produção estocástica são modelos microeconômicos que descrevem a relação entre a produção e quantidade de insumos requerida. Postulam tam-bém a existência de ineficiências técnicas como elemento inerente ao processo produtivo, o qual pode ter origem em diversos fatores tais como: anos de experiência do colaborador, idade do colaborador, frequência de capacitações, tempo de operação de uma máquina empregada na produção, frequência de revisões técnicas, etc.

A literatura desenvolvida a respeito destes modelos é ampla, sendo geralmente abordados de forma clássica e baseados na regressão linear na média condicional (Coelli

et al., 2005; Kumbhakar e Lovell, 2000; Greene, 2011, por exemplo). Frequentemente,

estes modelos consideram a distribuição gaussiana para o erro aleatório, embora existam propostas que obtém robustez na regressão ao considerar a distribuição 𝑡-Student para o erro aleatório, como mostrado em Griffin e Steel (2007).

Nesta dissertação, propõe-se utilizar regressão quantílica, sob o enfoque bayesiano, em modelos de fronteira de produção estocástica. A regressão quantílica - em contraste com a regressão na média condicional - apresenta uma série de vantagens tais como robustez, um conhecimento mais abrangente de como as covariáveis podem influenciar di-ferentes quantis da variável resposta e prescindir de uma especificação para a distribuição do termo de erro aleatório. Esta última característica permite incrementar a flexibilidade dos modelos de regressão paramétricos ao permitir heterocedasticidade. Li (2015) apre-senta as principais vantagens dos modelos de regressão quantílica. Outra das vantagens da proposta é a estimação dos efeitos da ineficiência técnica em diferentes quantis da pro-dução, pois é razoável pensar que os efeitos da ineficiência técnica serão mais evidentes nos quantis mais baixos da produção.

(17)

esto-cástica e aos modelos de regressão quantílica de forma resumida.

1.1.

Fronteira de produção estocástica

Os modelos de fronteira de produção estocástica foram propostos porAigner,

Lo-vell e Schmidt (1977) eMeeusen e Broeck (1977) de forma independente, sendo

desenvol-vidos amplamente desde então.

Surgem como modelos que atendem uma das principais preocupações das firmas, a melhora contínua de seus processos produtivos, isto é, otimizar a sua performance produ-zindo o máximo possível com a menor quantidade de insumos. Nessa linha de pensamento é importante estudar os modelos de fronteira de produção estocástica, que permitem, possivelmente através de algum método de estimação, fazer inferência das ineficiências técnicas e porventura identificar os fatores que as originam.

Uma descrição detalhada destes modelos, assim como o processo de inferência se-guindo uma abordagem clássica e regressão na média condicional, pode ser encontrada em

Coelli et al. (2005) eKumbhakar e Lovell(2000). Uma proposta que incorpora covariáveis

visando explicar os efeitos das ineficiências técnicas e aplicação para dados de painel é apresentada em Battese e Coelli (1995).

Uma descrição do pacote denominado frontier do programa R (R Core Team,

2016) pode ser encontrada em Griffin e Steel (2007), o qual faz inferência clássica nos modelos de fronteira de produção estocástica através de regressão na média condicional. Aplicações da metodologia apresentada nesta dissertação utilizam dois conjuntos de dados contidos no pacote frontier, permitindo assim comparar resultados da proposta com os resultados fornecidos pelo ajuste via o pacote.

1.2.

Regressão quantílica bayesiana

A regressão quantílica, desde a sua introdução emKoenker e Bassett(1978), vem-se devem-senvolvendo como uma ferramenta eficiente para a análivem-se das funções quantílicas de uma variável resposta condicionada as covariáveis.

A abordagem bayesiana do modelo de regressão quantílica tem recebido especial atenção devido a várias de suas propriedades. Por exemplo, os métodos de regressão quan-tílica bayesiana podem utilizar algoritmos Monte Carlo via cadeias de Markov (MCMC) para amostrar valores dos parâmetros da distribuição a posteriori e o estimador pontual (média a posteriori) resultante é tão eficiente quanto o estimador clássico calculado dire-tamente através da otimização numérica. Além disso, estimativas intervalares podem ser

(18)

facilmente obtidas a partir de uma amostra da distribuição a posteriori. Por outro lado, a matriz de covariâncias assintótica do estimador quantílico clássico envolve funções de densidade condicionais desconhecidas que são, muitas vezes, difíceis de estimar.

No modelo de regressão linear clássico, minimizar a soma dos quadrados dos des-vios em função dos coeficientes da regressão é equivalente a maximar uma função de verossimilhança, para estes mesmos coeficientes, considerando os erros normais. De forma análoga, na regressão quantílica clássica o objetivo é a minimização - nos coeficientes da regressão - da soma de desvios absolutos ponderados. Por outro lado, isto é equiva-lente a maximizar uma função de verossimilhança considerando erros com distribuição Laplace assimétrica. Uma abordagem bayesiana baseada nesta função de verossimilhança foi discutida formalmente em Yu e Moyeed (2001), sendo adotada desde então em diver-sos artigos. Destaca-se o trabalho de Kozumi e Kobayashi (2011), que fazendo uso da representação localização-escala da distribuição Laplace assimétrica, como mistura das distribuições normal e exponencial, fornece um esquema de amostragem de Gibbs com as condicionais completas conhecidas e fáceis de gerar amostras. Este algoritmo, em geral, resulta em uma convergência rápida das cadeias.Sriram, Ramamoorthi e Ghosh(2013) ex-ploram uma justificativa assintótica para a utilização da distribuição Laplace assimétrica para a função de verossimilhança do modelo de regressão quantílica bayesiana e estabele-cem condições suficientes para a consistência da distribuição a posteriori dos parâmetros do modelo. Porém, verificar consistência não implica que estimativas intervalares sejam automaticamente válidas. Yang, Wang e He (2016) mostram que os intervalos de credibi-lidade obtidos utilizando a distribuição Laplace assimétrica na função de verossimilhança do modelo não têm, em geral, o nível de credibilidade bayesiano correto, mesmo consi-derando um tamanho amostral “grande”. Isto é devido a distribuição a posteriori obtida considerando a função de verossimilhança do modelo Laplace assimétrico não ser neces-sariamente a distribuição do parâmetro condicionada aos dados. Eles ainda argumentam que é possível obter intervalos de credibilidade assintoticamente válidos utilizando a nor-malidade assintótica do estimador da regressão quantílica com um ajuste da variância a

posteriori.

1.3.

Regressão quantílica bayesiana em modelos de

fronteira de produção estocástica

O objetivo desta dissertação é estudar o uso de regressão quantílica em modelos de fronteira de produção estocástica, estimar os efeitos das ineficiências técnicas e reconhecer, se possível, os fatores que as originam. Avaliar diferentes quantis da produção permite um estudo mais abrangente dos efeitos das ineficiências técnicas em comparação aos modelos que utilizam a regressão na média condicional. Por outro lado, a regressão quantílica tem

(19)

certas propriedades, tais como robustez - no caso de fazer regressão na mediana.Li(2015) afirma que a regressão quantílica tem “a capacidade de lidar com distribuições de caudas pesadas para o termo de erro, as quais muitas vezes tornam difícil a utilização de modelos de regressão na média para investigar as relações entre a variável resposta de interesse e as covariáveis.”

A metodologia utilizada para desenvolver esta dissertação é apresentada no Ca-pítulo 2, o qual consta de três partes. Primeiro, descreve-se os modelos de fronteira de produção estocástica. Depois, faz-se uma revisão de forma razoavelmente detalhada da literatura referente aos modelos de regressão quantílica. Finalmente, na terceira parte, apresentamos uma proposta de regressão quantílica bayesiana em modelos de fronteira de produção estocástica.

Aplicações da metodologia desenvolvida são apresentadas no Capítulo 3. Este, inicia com uma avaliação empírica da metodologia considerada para a estimação dos pa-râmetros de regressão quantílica bayesiana através de um estudo de Monte Carlo, o qual contempla cenários associados com possíveis distribuições para o termo de erro aleató-rio, diferentes tamanhos amostrais e diferentes quantis. A seguir, apresenta-se aplicações de regressão quantílica em modelos de fronteira de produção estocástica utilizando dois conjuntos de dados contidos no pacote frontier do programa R (R Core Team, 2016).

(20)

Capítulo 2

Modelos, propriedades e inferência

Na primeira seção deste capítulo apresenta-se os modelos de fronteira de produção estocástica, suas características e alguns conceitos básicos úteis para o desenvolvimento da dissertação. O modelo de regressão quantílica e um procedimento de inferência baye-siana baseado na distribuição Laplace assimétrica são apresentados formalmente na se-gunda seção. A terceira parte deste capítulo utiliza os conceitos, metodologia e resultados apresentados previamente para desenvolver os modelos propostos de regressão quantílica bayesiana em fronteira de produção estocástica.

2.1.

Fronteira de produção estocástica

Em microeconomia, uma função de produção (ou fronteira de produção) é definida como a produção máxima que pode ser atingida a partir de uma determinada combi-nação de quantidades de insumos, dada a tecnologia existente disponível para as firmas envolvidas.

Esta função possui as seguintes características: monótona não decrescente, con-tínua em R+ e quase côncava (Kumbhakar e Lovell, 2000, Definição 2.9). Ela pode ser

expressada como

𝑃 = 𝑓 (𝐼1, . . . , 𝐼𝑝),

sendo 𝑃 a produção máxima, 𝐼𝑗 a quantidade do 𝑗-ésimo insumo (𝑗 = 1, . . . , 𝑝) e 𝑓 (.) a

forma analítica da função de produção.

Existem várias especificações alternativas da função de produção. Algumas delas estão listadas na Tabela1(reproduzida deKumbhakar e Lovell(2000)), sendo 𝜍, 𝛽1, . . . , 𝛽𝑝

(21)

Função de produção 𝑓 (.) (a) Linear 𝜍 +∑︁𝑝 𝑗=1𝛽𝑗𝐼𝑗 (b) Cobb-Douglas 𝜍∏︀𝑝 𝑗=1𝐼 𝛽𝑗 𝑗 (c) Quadrática 𝜍 +∑︁𝑝 𝑗=1𝛽𝑗𝐼𝑗 + 1 2 ∑︁𝑝 𝑗=1 ∑︁𝑝 𝑘=1𝛽𝑗𝑘𝐼𝑗𝐼𝑘 (d) Quadrática normalizada 𝜍 + ∑︁𝑝−1 𝑗=1𝛽𝑗 (︃ 𝐼𝑗 𝐼𝑝 )︃ +1 2 ∑︁𝑝−1 𝑗=1 ∑︁𝑝−1 𝑘=1𝛽𝑗𝑘 (︃ 𝐼𝑗 𝐼𝑝 )︃ (︃ 𝐼𝑘 𝐼𝑝 )︃

(e) Translog exp

[︂ 𝜍 +∑︁𝑝 𝑗=1𝛽𝑗log 𝐼𝑗+ 1 2 ∑︁𝑝 𝑗=1 ∑︁𝑝 𝑘=1𝛽𝑗𝑘log 𝐼𝑗log 𝐼𝑘 ]︂ (f) Leontief generalizado ∑︁𝑝 𝑗=1 ∑︁𝑝 𝑘=1𝛽𝑗𝑘(𝐼𝑗𝐼𝑘) 1/2 (g) CES (Constant Elasticity of Substitution) 𝜍 (︂ ∑︁𝑝 𝑗=1𝛽𝑗𝐼 𝛾 𝑗 )︂1/𝛾

Tabela 1 – Algumas especificações da função de produção. Tabela reproduzida de

Kumbhakar e Lovell (2000).

Uma função de produção frequentemente utilizada na literatura (Battese e Coelli,

1992;Battese e Coelli,1995; Kumbhakar e Lovell, 2000; Coelli et al., 2005) é a chamada

de Cobb-Douglas, a qual pode ser facilmente linearizada através de uma transformação logarítmica. Nesta dissertação, para fins de comparabilidade com esses modelos, analisa-se a função de produção Cobb-Douglas (Cobb e Douglas,1928) dada por

𝑓 (𝐼) = 𝜍 𝑝 ∏︁ 𝑗=1 𝐼𝛽𝑗 𝑗 , 𝑗 = 1, . . . , 𝑝; (2.1)

com 𝑃 , 𝐼𝑗, 𝜍 e 𝛽𝑗 como definidos anteriormente e 𝐼 = (𝐼1, . . . , 𝐼𝑝).

Pode-se considerar como medida de eficiência econômica a eficiência técnica

ori-entada ao produto, definida como a habilidade de maximizar a produção a partir de

uma combinação de quantidades de insumos determinada, ou também a eficiência técnica

orientada aos insumos, também chamada eficiência de alocação, definida como a

habili-dade de minimizar as quantihabili-dades de insumos para atingir uma produção determinada

(Kumbhakar e Lovell, 2000; Coelli et al., 2005, apresentam mais detalhadamente esses

conceitos).

A computação dessas medidas de eficiência envolve estimar a fronteira de produção desconhecida, uma proposta paramétrica para conseguir isso é o chamado modelo de

(22)

fronteira de produção, que considera a eficiência técnica orientada ao produto e que ao

longo desta dissertação será denominada simplesmente de eficiência técnica, e denotada por ET.

O modelo de fronteira de produção pode ser representado por

𝑃𝑖 = 𝑓 (𝐼𝑖)ET𝑖, 𝑖 = 1, . . . , 𝑁,

sendo 𝑓 (.) a fronteira de produção, 𝐼𝑖 = (𝐼1𝑖, . . . , 𝐼𝑝𝑖)𝑇 o vetor de quantidades de insumos

e ET𝑖 a eficiência técnica para a 𝑖-ésima observação. A eficiência técnica assume valor

positivo entre zero e um, assim, segue que a produção possível 𝑃𝑖, é limitada acima pela

quantidade determinística 𝑓 (𝐼𝑖).

Uma outra representação destes modelos, amplamente utilizada, é dada por

𝑃𝑖 = 𝑓 (𝐼𝑖) exp(−𝜔𝑖), 𝑖 = 1, . . . , 𝑁 ;

a variável aleatória não-negativa 𝜔𝑖, chamada de ineficiência técnica, é associada a fatores

específicos que contribuem para que a máxima eficiência de produção não seja atingida na 𝑖-ésima observação.

Aigner, Lovell e Schmidt (1977) e Meeusen e Broeck (1977) postularam que os

desvios da função de produção poderiam surgir de duas fontes, a primeira fonte dada pela eficiência produtiva, medida através do termo ineficiência técnica antes apresentado; a segunda fonte dada pelos efeitos de variáveis não controladas medida por um termo de erro aleatório sem restrição de sinal. O resultado é o chamado modelo de fronteira de

produção estocástica, cuja representação é dada por

𝑃𝑖 = 𝑓 (𝐼𝑖) exp(𝜀𝑖− 𝜔𝑖), 𝑖 = 1, . . . , 𝑁, (2.2)

sendo 𝜀𝑖 o termo de erro aleatório que torna o modelo estocástico e que segue uma

distri-buição normal com média zero e variância constante. Embora a distridistri-buição normal seja frequentemente utilizada é possível considerar outras distribuições simétricas, como por exemplo a distribuição 𝑡-Student (Griffin e Steel, 2007).

Considerando a função de produção Cobb-Douglas da Equação 2.1 no modelo anterior (Equação 2.2) temos

𝑃𝑖 = 𝜍 𝑝 ∏︁ 𝑗=1 𝐼𝛽𝑗 𝑗 exp(𝜀𝑖− 𝜔𝑖), 𝑖 = 1, . . . , 𝑁.

Esta representação pode ser linearizada tomando-se o logaritmo em ambos lados da equação, ou seja,

log(𝑃𝑖) = log(𝜍) + ∑︁𝑝

𝑗=1𝛽𝑗log(𝐼𝑗) + 𝜀𝑖− 𝜔𝑖;

(23)

Denote por 𝑦𝑖 = log(𝑃𝑖), log(𝜍) = 𝛽0, 𝛽 = (𝛽0, . . . , 𝛽𝑝)𝑇, 𝑥𝑗 = log(𝐼𝑗), 𝑥𝑇𝑖 =

(1, 𝑥1, . . . , 𝑥𝑝), com 𝑗 = 1, . . . , 𝑝. Então, pode-se expressar o modelo de fronteira de

pro-dução estocástica como

𝑦𝑖 = 𝑥𝑇𝑖 𝛽 + 𝜀𝑖− 𝜔𝑖, 𝑖 = 1, . . . , 𝑁, (2.3)

sendo 𝜔𝑖 a ineficiência técnica da 𝑖-ésima observação (unidade produtiva, firma, etc.) e 𝜀𝑖

o erro aleatório 𝑖-ésimo.

Diversas distribuições podem ser atribuídas a 𝜔𝑖, entre elas tem-se a distribuição

normal truncada (Aigner, Lovell e Schmidt, 1977; Battese e Coelli, 1995; Kumbhakar

e Lovell, 2000; Coelli et al., 2005; Greene, 2011), a distribuição gama (Tsionas, 2000;

Medrano e Migon, 2008) ou a distribuição lognormal (Medrano e Migon,2008).

A Figura 1 mostra um exemplo, para fins de ilustração, do modelo de fronteira de produção estocástica. Os dados foram simulados do modelo 𝑦𝑖 = 𝛽0 + 𝛽1𝑥1+ 𝜀𝑖− 𝜔𝑖,

com 𝑖 = 1, . . . , 200 e 𝑥𝑖 ∼ 𝒰 (0, 10), sendo 𝛽0 = 0, 6; 𝛽1 = 0, 5; 𝜀𝑖 ∼ 𝒩 (0; 0, 12) e 𝜔𝑖

𝒩 𝒯[0;∞)(0; 0, 22).

Nesta dissertação, 𝒰 (𝑎, 𝑏) denota a distribuição uniforme no intervalo entre 𝑎 e 𝑏; 𝒩 (𝜇, 𝜎2) denota a distribuição normal com média 𝜇 e variância 𝜎2; e 𝒩 𝒯

[𝑎;𝑏](𝜇, 𝜎2) denota

a distribuição normal truncada no intervalo entre 𝑎 e 𝑏, com parâmetros de localização 𝜇 e de escala 𝜎2.

Na Figura 1a pode-se ver a relação entre a produção e o insumo sob uma estru-tura que considera uma fronteira de produção estocástica e a Figura 1b exibe os dados linearizados através da transformação logarítmica.

● ● ● ●●● ● ●●● ●● ● ● ● ● ● ● ● ●●●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ●● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ●●●●● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ●● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ●●● ●●● ● ● ● ● ● ● ● ● ● ● ● ● ● 0 2 4 6 8 10 1 2 3 4 5 Insumo Produção ●●●● ●● ●●● ● ●●●●●●●●●●●● ●●●●●●●● ●●●●●●●●●●●●● ● ● ● ●●●●●●●●●●● ● ● ● ●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●● ●●●●●● ●●●●●●●●●●●●●●●●● ●●●● ●●●●●●●●●●●● ● ● ● ●●●●●●●●●● ●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ● ●●●●● ● ●

Fronteira de Prod. Estoc. Prod. com inefic. tecnica

(a) Dados. ● ●● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ●●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●●● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ●●●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●●●●● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ●● ●● ● ● ● ●● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● −1 0 1 2 −0.5 0.0 0.5 1.0 1.5 X Y ● ●●● ● ● ●● ●●● ●●●●●●●●● ● ●●●●●●●●●●●●●●●●●●●●●●●●●●●● ● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ● ●

Fronteira de Prod. Estoc. Log da produção

(b) Dados transformados.

Figura 1 – Função de produção com fronteira estocástica, dados simulados do modelo

𝑃𝑖 = exp{𝛽0 + 𝛽1𝑥1+ 𝜀𝑖− 𝜔𝑖}, 𝑖 = 1, . . . , 200, 𝑥𝑖 ∼ 𝒰 (0, 10) sendo , 𝛽0 = 0.6, 𝛽1 = 0.5,

𝜀𝑖 ∼ 𝒩 (0; 0.12), 𝜔𝑖 ∼ 𝒩 𝒯[0;∞)(0; 0.22).

Uma extensão deste modelo para dados de painel é apresentada emBattese e Coelli

(24)

as ineficiências técnicas. O modelo proposto por esses autores é representado por

𝑦𝑖𝑡 = 𝑥𝑇𝑖𝑡𝛽 + 𝜀𝑖𝑡− 𝜔𝑖𝑡,

𝜔𝑖𝑡 = 𝑟𝑇𝑖𝑡𝛿 + 𝜐𝑖𝑡, 𝑖 = 1, . . . , 𝑁 ; 𝑡 = 1, . . . , 𝑇 ; (2.4)

sendo 𝑟𝑖𝑡 o vetor de covariáveis explicativas da ineficiência técnica na 𝑖-ésima observação

no 𝑡-ésimo tempo, 𝛿 o vetor de parâmetros associado às covariáveis e 𝜐𝑖𝑡um erro aleatório

definido pelo truncamento da distribuição normal de tal modo que o ponto de truncagem inferior é −𝑟𝑇

𝑖𝑡𝛿, isto é, 𝜐𝑖𝑡 ∼ 𝒩 𝒯[−𝑟𝑇𝑖𝑡𝛿,∞)(0, 𝜎𝜔2). Essas suposições são consistentes com

𝜔𝑖𝑡 ser não negativo com distribuição 𝒩 𝒯[0,∞)(𝑟𝑇𝑖𝑡𝛿, 𝜎2𝜔).

É importante salientar que as principais referências revisadas com respeito aos modelos de fronteira de produção estocástica utilizam uma abordagem clássica, sendo a inferência baseada em estimadores de máxima verossimilhança (Kumbhakar e Lovell,

2000;Coelli et al.,2005; Greene, 2011;Battese e Coelli, 1995).

2.2.

Regressão quantílica bayesiana

Seja 𝑦 a variável de resposta (contínua) e 𝑥 o vetor 𝑝-dimensional de covariáveis. A função que relaciona o 𝜏 -ésimo quantil da variável resposta e as covariáveis é chamada

função de regressão quantílica e denotada como 𝒬𝜏(.). A função de regressão quantílica

-sob suposição de relação linear - para o 𝜏 -ésimo quantil pode ser expressa por 𝒬𝜏(𝑦 | 𝑥) = 𝑥𝑇𝛽𝜏,

sendo 𝛽𝜏 o vetor 𝑝-dimensional de coeficientes associados ao vetor de covariáveis 𝑥 para o 𝜏 -ésimo quantil fixo.

Considerando uma amostra aleatória {(𝑦𝑖; 𝑥𝑖)}𝑁𝑖=1, o modelo de regressão quantílica

pode ser representado por

𝑦𝑖 = 𝑥𝑇𝑖 𝛽𝜏 + 𝜀𝑖, (2.5)

sendo 𝜀𝑖 o termo de erro cuja densidade 𝑓𝜏(.) é restrita unicamente por acumular

proba-bilidade 𝜏 até zero, ou seja,

∫︁ 0

−∞𝑓𝜏(𝜀𝑖)𝑑𝜀𝑖 = 𝜏.

Na abordagem clássica 𝑓𝜏(.), geralmente, não é determinada de forma explícita e

o vetor de parâmetros 𝛽𝜏 é estimado minimizando a seguinte soma

𝑁 ∑︁

𝑖=1

𝜌𝜏(𝑦𝑖 − 𝑥𝑇𝑖 𝛽𝜏), (2.6)

sendo 𝜌𝜏(𝜀) = 𝜀{𝜏 − 𝐼(−∞,0)(𝜀)} a função de perda associada ao quantil 𝜏 (Koenker,2005),

(25)

usual. No restante desta dissertação, para simplificar notações, omite-se 𝜏 em algumas expressões tais como 𝛽𝜏.

Yu e Moyeed (2001) ressaltam que, minimizar a soma mostrada em 2.6 é

equi-valente a maximizar a função de verossimilhança construída a partir de especificar erros aleatórios (𝜀𝑖) independentes e identicamente distribuídos (iid) seguindo a distribuição

Laplace assimétrica (ℒ𝒜) com parâmetros de localização zero, de escala 𝜎 e de assimetria

𝜏 . Isto é denotado por 𝜀𝑖 ∼ ℒ𝒜𝜏(0, 𝜎). A função densidade de probabilidade (f.d.p.) de 𝜀𝑖

pode ser representada por

𝑓𝜏(𝜀𝑖) = 𝜏 (1 − 𝜏 ) 𝜎 exp {︃ −𝜌𝜏(𝜀𝑖) 𝜎 }︃ ,

com 𝜀𝑖 ∈ R, 0 < 𝜏 < 1, 𝜎 > 0 e 𝜌𝜏(.) como antes definido.

Daí, a esperança e variância de 𝜀𝑖 são dadas por

E(𝜀𝑖) = 𝜎 (1 − 2𝜏 ) 𝜏 (1 − 𝜏 ) e Var(𝜀𝑖) = 𝜎 2(1 − 2𝜏 + 2𝜏 2) 𝜏2(1 − 𝜏 )2 .

A função de verossimilhança resultante do modelo descrito na Equação2.5 é dada por ℒ(𝛽, 𝜎) = 𝜏 𝑁(1 − 𝜏 )𝑁 𝜎𝑁 exp {︃ −1 𝜎 𝑁 ∑︁ 𝑖=1 𝜌𝜏(𝑦𝑖− 𝑥𝑇𝑖 𝛽) }︃ . (2.7)

A proposta de Yu e Moyeed (2001) utiliza a função de verossimilhança dada na Equação

2.7.

O parâmetro de assimetria 𝜏 é fixado no quantil da variável resposta a ser avaliado. Se os parâmetros de localização e escala são zero e um, respectivamente, então chamamos a f.d.p. Laplace assimétrica de padrão.

A Figura 2a mostra as função densidade de probabilidade Laplace assimétrica padrão para cinco valores do parâmetro de assimetria 𝜏 ({0, 1; 0, 25; 0, 5; 0, 75; 0, 9}) e a Figura 2bas funções de perda para os valores de 𝜏 considerados.

Kotz, Kozubowski e Podgórski (2001) apresentam diversas representações da

dis-tribuição ℒ𝒜 em forma de mistura de outras distribuições. Uma delas está baseada na mistura entre as distribuições normal e exponencial, dada pela proposição a seguir. Proposição 2.2.1. (Kotz, Kozubowski e Podgórski, 2001). Uma variável aleatória 𝜀 com

f.d.p. ℒ𝒜𝜏(0, 1) admite a representação 𝜀 = 𝜅1𝑈 + 𝜅2 √ 𝑈 𝑍, com 𝜅1 = 1 − 2𝜏 𝜏 (1 − 𝜏 ) e 𝜅 2 2 = 2 𝜏 (1 − 𝜏 ),

sendo 𝑈 uma variável com f.d.p. exponencial com média 1, denotado por 𝑈 ∼ ℰ (1), e 𝑍 uma variável com f.d.p. normal padrão, denotado por 𝑍 ∼ 𝒩 (0, 1).

(26)

●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●● ●● ●● ●● ●● ●● ●● ●● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●●● ●●●●●●●●●●●●●●●●●●●●●●●●● −4 −2 0 2 4 0.05 0.10 0.15 0.20 0.25 ε f.d.p L Aτ (0;1) LA0.1(0;1) LA0.25(0;1) LA0.5(0;1) LA0.75(0;1) LA0.9(0;1)

(a) Laplace assimétrica.

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● −4 −2 0 2 4 0 1 2 3 4 ε ρτ ρ0.1 ρ0.25 ρ0.5 ρ0.75 ρ0.9 (b) Função de perda.

Figura 2 – Função densidade de probabilidade da Laplace assimétrica padrão, ℒ𝒜𝜏(0; 1),

e função de perda, 𝜌𝜏, para diferentes valores de 𝜏 .

Demonstração. A demonstração encontra-se em Kotz, Kozubowski e Podgórski (2001) e

é replicada no Apêndice A.

Para complementar a proposição, sabe-se que a distribuição ℒ𝒜 pertence à família localização-escala. Portanto, se 𝜀* ∼ ℒ𝒜𝜏(0, 1), então 𝜀 = 𝜎𝜀* tem f.d.p. ℒ𝒜𝜏(0, 𝜎).

Consequentemente, 𝜀 pode ser representado por

𝜎𝜅1𝑈 + 𝜎𝜅2

𝑈 𝑍,

com 𝑈 ∼ ℰ (1) e 𝑍 ∼ 𝒩 (0, 1). Para 𝑉 = 𝜎𝑈 ∼ ℰ (𝜎), a representação de 𝜀 ∼ ℒ𝒜𝜏(0, 𝜎)

pode ser rescrita como

𝜅1𝑉 + 𝜅2

𝜎𝑉 𝑍, (2.8)

com 𝑍 ∼ 𝒩 (0, 1) e 𝑉 ∼ ℰ(𝜎).

Kozumi e Kobayashi (2011) mostram que é possível obter um esquema de

amos-tragem de Gibbs utilizando a representação de mistura da Equação 2.8. Assim, pode-se reescrever o modelo da Equação 2.5 como

𝑦𝑖 = 𝑥𝑇𝑖 𝛽 + 𝜅1𝑉𝑖+ 𝜅2 √︁

𝜎𝑉𝑖𝑍𝑖, 𝑖 = 1, . . . , 𝑁,

com 𝑍𝑖 ∼ 𝒩 (0, 1) e 𝑉𝑖 ∼ ℰ(𝜎). Portanto, a função de verossimilhança do modelo para

(𝛽, 𝜎) condicional a 𝑣 = (𝑣1, . . . , 𝑣𝑁) - as variáveis latentes do modelo - é dada por

ℒ(𝛽, 𝜎 | 𝑦, 𝑣) = 𝑁 ∏︁ 𝑖=1 𝑓 (𝑦𝑖 | 𝛽, 𝜎, 𝑣𝑖), com 𝑦 = (𝑦1, . . . , 𝑦𝑁) e (𝑦𝑖 | 𝛽, 𝜎, 𝑣𝑖) ∼ 𝒩 (𝑥𝑖𝑇𝛽 + 𝜅1𝑣𝑖, 𝜅22𝜎𝑣𝑖).

Sabe-se que (𝑉𝑖 | 𝜎) ∼ ℰ(𝜎). Para completar o modelo bayesiano, utiliza-se a priori

(27)

𝑚0 e matriz de covariâncias 𝐶0, denotada por 𝛽 ∼ 𝒩 ℳ(𝑚0, 𝐶0), e 𝜎 com distribuição

inversa gama com parâmetros de forma 𝑛0 e de escala 𝑠0, denotada por 𝜎 ∼ ℐ𝒢(𝑛0, 𝑠0).

Consequentemente, a distribuição a posteriori conjunta para (𝛽, 𝜎, 𝑣) é dada por

𝑓 (𝛽, 𝜎, 𝑣 | 𝑦) ∝ [︃𝑁 ∏︁ 𝑖=1 𝑓 (𝑦𝑖 | 𝛽, 𝜎, 𝑣𝑖) ]︃ [︃𝑁 ∏︁ 𝑖=1 𝑓 (𝑣𝑖 | 𝜎) ]︃ 𝜋(𝛽)𝜋(𝜎).

A distribuição a posteriori possui uma forma analítica complicada e não permite cálculos exatos das quantidades de interesse a posteriori, portanto, recorre-se aos métodos de Monte Carlo via cadeias de Markov para gerar amostras da distribuição a posteriori e permitir assim a inferência sobre os parâmetros do modelo. Em especial, utiliza-se o esquema de amostragem de Gibbs porque as condicionais completas são conhecidas e fáceis de gerar valores.

Após algumas manipulações algébricas, tem-se as seguintes distribuições condici-onais completas: ∙ (𝛽 | 𝑦, 𝑣, 𝜎) ∼ 𝒩 ℳ(𝑚, 𝐶), sendo 𝐶−1 = 𝑁 ∑︁ 𝑖=1 𝑥𝑖𝑥𝑇𝑖 𝜅2 2𝜎𝑣𝑖 + 𝐶−10 e 𝑚 = 𝐶 [︃𝑁 ∑︁ 𝑖=1 (𝑦𝑖− 𝜅1𝑣𝑖) 𝜅2 2𝜎𝑣𝑖 𝑥𝑖+ 𝐶−10 𝑚0 ]︃ ; ∙ (𝜎 | 𝑦, 𝑣, 𝛽) ∼ ℐ𝒢(˜𝑛, ˜𝑠), com ˜ 𝑛 = 𝑛0+ 3𝑁 2 e 𝑠 = 𝑠˜ 0+ 𝑁 ∑︁ 𝑖=1 𝑣𝑖+ 𝑁 ∑︁ 𝑖=1 (𝑦𝑖− 𝑥𝑇𝑖 𝛽 − 𝜅1𝑣𝑖)2 2𝜅2 2𝑣𝑖 ; e ∙ (𝑣𝑖 | 𝑦𝑖, 𝛽, 𝜎) ∼ 𝒢ℐ𝒢 (︂1 2, 𝜒𝑖, 𝜓𝑖 )︂ , 𝑖 = 1, . . . , 𝑁 ; 𝜒𝑖 = (𝑦𝑖− 𝑥𝑇𝑖𝛽)2 𝜅2 2𝜎 e 𝜓𝑖 = 2 𝜎 + 𝜅2 1 𝜅2 2𝜎 .

A notação 𝒢ℐ𝒢 representa a distribuição gaussiana inversa generalizada ( Jørgen-sen,1982) cuja f.d.p. é apresentada no ApêndiceB. Existem métodos eficientes de se gerar valores desta distribuição.

Porém, como será mostrado empiricamente na Seção3.1, estimativas intervalares dos coeficientes da regressão quantílica - obtidas a partir da amostra da distribuição a

posteriori via a amostragem de Gibbs - subestimam a variância a posteriori quando a

distribuição de origem da variável resposta não é Laplace assimétrica.

Yang, Wang e He(2016) descrevem com precisão este problema e desenvolvem, sob

condições que garantem a normalidade assintótica do estimador dos coeficientes da regres-são quantílica, um ajuste na matriz de covariâncias a posteriori para se obter estimativas intervalares assintoticamente válidas. Isto é dado pela proposição a seguir.

(28)

Proposição 2.2.2. (Yang, Wang e He, 2016). Suponhamos que as seguintes condições sejam satisfeitas:

∙ A função de distribuição acumulada da variável 𝑦𝑖 dadas as covariáveis 𝑥𝑖 é

abso-lutamente contínua com função de densidade contínua, uniformemente delimitadas

entre zero (longe de zero) e infinito nos pontos 𝒬𝜏(𝑦 | 𝑥𝑖) = 𝑥𝑇𝑖 𝛽0, sendo 𝛽0 o vetor

que contem os valores verdadeiros dos parâmetros da regressão quantílica associado ao quantil 𝜏 , para 𝑖 = 1, . . . , 𝑁 .

∙ Existem matrizes positivas definidas 𝐷0 e 𝐷1 tais que:

lim 𝑁 →∞ 1 𝑁 𝑁 ∑︁ 𝑖=1 𝑥𝑖𝑥𝑇𝑖 = 𝐷0 e lim 𝑁 →∞ 1 𝑁 𝑁 ∑︁ 𝑖=1 𝑓 (𝑥𝑇𝑖 𝛽0 | 𝑥𝑖)𝑥𝑖𝑥𝑇𝑖 = 𝐷1. Adicionalmente, max 16𝑖6𝑁 ‖𝑥𝑖𝑁 −→ 0.

Denote por Σ(𝜎) à matriz de covariâncias a posteriori e por Σ(𝜎) ao estimador̂︀

obtido a partir da amostra a posteriori assumindo uma função de verossimilhança Laplace assimétrica.

Para um valor de 𝑁 suficientemente grande, a distribuição a posteriori é

aproxima-damente uma f.d.p. normal multivariada com vetor de médias 𝛽 (estimador de regressãô︀

quantílica convencional) e matriz de covariâncias ajustada

̂︀ Σ𝑎𝑗 = 𝑁 𝜏 (1 − 𝜏 ) 𝜎2 Σ(𝜎)̂︀ 𝐷̂︁0Σ(𝜎),̂︀ (2.9) sendo ̂︁ 𝐷0 = 1 𝑁 𝑁 ∑︁ 𝑖=1 𝑥𝑖𝑥𝑇𝑖 .

Pode-se construir estimativas intervalares para os parâmetros de regressão

quantí-lica baseadas na aproximação normal usando Σ̂︀𝑎𝑗.

A variância a posteriori ajustada é assintoticamente invariante no valor de 𝜎. Na

prática, recomenda-se fixar o valor de 𝜎 como 𝑁−1∑︁𝑁

𝑖=1𝜌𝜏(𝑦𝑖− 𝑥 𝑇

𝑖𝛽) com 𝜏 = 0, 5; que é̂︀

o estimador de máxima verossimilhança de 𝜎 na mediana.

(29)

2.3.

Regressão quantílica bayesiana em modelos de

fronteira de produção estocástica

Nesta seção propõe-se o uso de regressão quantílica bayesiana em modelos de fronteira de produção estocástica. A ordem dos modelos desenvolvidos é progressiva de tal forma que inicia-se com o modelo mais simples para dados transversais e chega-se até um modelo mais sofisticado para dados de painel, o qual também incorpora covariáveis que pretendem explicar a origem das ineficiências técnicas.

2.3.1.

Modelo básico

Considere inicialmente a estrutura do modelo básico de fronteira de produção estocástica da Equação 2.3

𝑦𝑖 = 𝑥𝑇𝑖 𝛽𝜏 + 𝜀𝑖− 𝜔𝑖, (2.10)

sendo {(𝑦𝑖, 𝑥𝑖)}𝑁𝑖=1 uma amostra aleatória de (𝑦, 𝑥); 𝑦𝑖 o logaritmo da produção - variável

resposta; 𝑥𝑖 o logaritmo do vetor 𝑝-dimensional de quantidades de insumos - covariáveis

- para a 𝑖-ésima observação (𝑖 = 1, . . . , 𝑁 ); 𝛽𝜏 o vetor 𝑝-dimensional de parâmetros de regressão associados ao quantil 𝜏 -ésimo da variável resposta; e 𝜀𝑖 o ruído branco na

fronteira de produção, independente de 𝜔𝑖 que representa o efeito de ineficiência técnica

para a 𝑖-ésima observação, para todo 𝑖, independente também entre observações.

Considera-se o efeito de ineficiência técnica com distribuição normal truncada, com parâmetro de localização zero, parâmetro de escala 𝜎2

𝜔 e truncamento no intervalo

[0; ∞), isto é, 𝜔𝑖 ∼ 𝒩 𝒯[0;∞)(0; 𝜎2𝜔). Essa suposição é feita para se obter conjugação, na

condicional completa, na inferência bayesiana.

Para desenvolver regressão quantílica bayesiana neste modelo básico pode-se consi-derar que o termo de erro aleatório 𝜀𝑖 tem distribuição Laplace assimétrica com parâmetro

de assimetria 𝜏 , parâmetro de localização zero e parâmetro de escala 𝜎𝜀 desconhecido, ou

seja, 𝜀𝑖 ∼ ℒ𝒜𝜏(0; 𝜎𝜀).

Utilizando a representação de mistura da distribuição Laplace assimétrica, mos-trada na Proposição 2.2.1, podemos reescrever o modelo como

𝑦𝑖 = 𝑥𝑇𝑖 𝛽 + 𝜅1𝑣𝑖+ 𝜅2 √ 𝜎𝜖𝑣𝑖𝑧𝑖− 𝜔𝑖, (2.11) sendo 𝜅1 = 1 − 2𝜏 𝜏 (1 − 𝜏 ) e 𝜅 2 2 = 2 𝜏 (1 − 𝜏 ),

𝑣𝑖 com distribuição exponencial com parâmetro 𝜎𝜀 - denotado por 𝑣𝑖 ∼ ℰ(𝜎𝜀) - e 𝑧𝑖 com

(30)

Pode-se observar que, condicional aos valores fixados de 𝑣𝑖 e de 𝜔𝑖, a distribuição

de 𝑦𝑖 é normal com parâmetros 𝑥𝑇𝑖𝛽 + 𝜅1𝑣𝑖− 𝜔𝑖 de localização e 𝜅22𝜎𝜀𝑣𝑖 de escala, isto é,

(𝑦𝑖 | 𝛽, 𝜎𝜖, 𝑣𝑖, 𝜔𝑖) ∼ 𝒩 (𝑥𝑇𝑖 𝛽 + 𝜅1𝑣𝑖− 𝜔𝑖, 𝜅22𝜎𝜀𝑣𝑖).

Asim, a função de verossimilhança para (𝛽, 𝜎) condicional a 𝑣 = (𝑣1, . . . , 𝑣𝑁) e

𝜔 = (𝜔1, . . . , 𝜔𝑁), no modelo dado pela Equação2.11, é dada por

ℒ(𝛽, 𝜎𝜀| 𝑦, 𝑣, 𝜔) = 𝑁 ∏︁ 𝑖=1 𝑓 (𝑦𝑖 | 𝛽, 𝜎𝜀, 𝑣𝑖, 𝜔𝑖), com 𝑦 = (𝑦1, . . . , 𝑦𝑁) e (𝑦𝑖 | 𝛽, 𝜎𝜀, 𝑣𝑖, 𝜔𝑖) ∼ 𝒩 (𝑥𝑖𝑇𝛽 + 𝜅1𝑣𝑖− 𝜔𝑖, 𝜅22𝜎𝜀𝑣𝑖).

Inferência bayesiana

Complementa-se a especificação do modelo considerando a distribuição a priori

𝜋(𝛽, 𝜎𝜀, 𝜎2𝜔) = 𝜋(𝛽)𝜋(𝜎𝜀)𝜋(𝜎𝜔2) de modo que a distribuição 𝜋(𝛽) é normal multivariada

com vetor de médias m0e matriz de covariâncias C0, isto é, 𝛽 ∼ 𝒩 ℳ(m0, C0); a

distribui-ção 𝜋(𝜎𝜀) é inversa gama com parâmetros 𝑛𝜀0 de forma e 𝑠𝜀0 de escala, 𝜎𝜀 ∼ ℐ𝒢(𝑛𝜀0; 𝑠𝜀0);

e a distribuição 𝜋(𝜎2

𝜔) é inversa gama com parâmetros 𝑛𝜔0 de forma e 𝑠𝜔0 de escala,

𝜎2

𝜔 ∼ ℐ𝒢(𝑛𝜔0; 𝑠𝜔0).

Logo, a distribuição a posteriori conjunta para 𝛽, 𝜎𝜀, 𝜎𝜔2, 𝑣 e 𝜔 é

𝑓 (𝛽, 𝜎𝜀, 𝜎𝜔2, 𝑣, 𝜔 | 𝑦) ∝ [︃𝑁 ∏︁ 𝑖=1 𝑓 (𝑦𝑖 | 𝛽, 𝜎𝜀, 𝑣𝑖, 𝜔𝑖) ]︃[︃𝑁 ∏︁ 𝑖=1 𝑓 (𝑣𝑖 | 𝜎𝜀) ]︃[︃𝑁 ∏︁ 𝑖=1 𝑓 (𝜔𝑖 | 𝜎𝜔2) ]︃ 𝜋(𝛽) 𝜋(𝜎𝜖)𝜋(𝜎𝜔2).

A distribuição a posteriori resultante não é fácil de manipular algebricamente. Portanto, para gerar uma amostra da distribuição a posteriori, e permitir assim a infe-rência sobre os parâmetros do modelo recorre-se aos métodos de Monte Carlo via cadeias de Markov.

As seguintes distribuições condicionais completas podem ser obtidas facilmente ∙ (𝛽 | 𝑦, 𝑣, 𝜔, 𝜎𝜀) ∼ 𝒩 ℳ(𝑚, 𝐶), sendo 𝐶−1 = 𝑁 ∑︁ 𝑖=1 𝑥𝑖𝑥𝑇𝑖 𝜅2 2𝜎𝜀𝑣𝑖 + 𝐶−10 e 𝑚 = 𝐶 [︃𝑁 ∑︁ 𝑖=1 (𝑦𝑖− 𝜅1𝑣𝑖+ 𝜔𝑖) 𝜅2 2𝜎𝜀𝑣𝑖 𝑥𝑖+ 𝐶−10 𝑚0 ]︃ ; ∙ (𝜎𝜀 | 𝑦, 𝑣, 𝜔, 𝛽) ∼ ℐ𝒢(˜𝑛𝜀, ˜𝑠𝜀), sendo ˜ 𝑛𝜀= 𝑛𝜀0+ 3𝑁 2 e 𝑠˜𝜀= 𝑠𝜀0+ 𝑁 ∑︁ 𝑖=1 𝑣𝑖+ 𝑁 ∑︁ 𝑖=1 (𝑦𝑖− 𝑥𝑇𝑖 𝛽 − 𝜅1𝑣𝑖+ 𝜔𝑖)2 2𝜅2 2𝑣𝑖 ; ∙ (𝑣𝑖 | 𝑦𝑖, 𝛽, 𝜎𝜀, 𝜔) ∼ 𝒢ℐ𝒢 (︂1 2, 𝜒𝑖, 𝜓𝑖 )︂ , 𝑖 = 1, . . . , 𝑁, sendo 𝜒𝑖 = (𝑦𝑖− 𝑥𝑇𝑖 𝛽 + 𝜔𝑖)2 𝜅2 2𝜎𝜀 e 𝜓𝑖 = 2 𝜎𝜀 + 𝜅 2 1 𝜅2 2𝜎𝜀 ;

(31)

∙ (𝜎2 𝜔 | 𝜔) ∼ ℐ𝒢(˜𝑛𝜔, ˜𝑠𝜔), sendo ˜ 𝑛𝜔 = 𝑛𝜔0+ 𝑁 2 e ˜𝑠𝜔 = 𝑠𝜔0+ 𝑁 ∑︁ 𝑖=1 𝜔2 𝑖 2 ; e ∙ (𝜔𝑖 | 𝑦𝑖, 𝑣𝑖, 𝛽, 𝜎𝜀, 𝜎𝜔2) ∼ 𝒩 𝒯[0,∞)(m𝜔𝑖, C𝜔𝑖), 𝑖 = 1, . . . , 𝑁, sendo 𝐶−1𝜔𝑖 = 1 𝜅2 2𝜎𝜀𝑣𝑖 + 1 𝜎2 𝜔 e 𝑚𝜔𝑖 = − [︃ 𝑦𝑖− 𝑥𝑇𝑖 𝛽 − 𝜅1𝑣𝑖 𝜅2 2𝜎𝜀𝑣𝑖 ]︃ C𝜔𝑖.

Dado que as condicionais completas são conhecidas e fáceis de gerar seus valores, pode-se utilizar o esquema de amostragem de Gibbs.

2.3.2.

Modelo para dados de painel

Considere agora a representação da proposta de Battese e Coelli (1995) para o modelo de fronteira de produção estocástica para dados de painel, mostrada na Equação

2.4 e dada por

𝑦𝑖𝑡 = 𝑥𝑇𝑖𝑡𝛽𝜏+ 𝜀𝑖𝑡− 𝜔𝑖𝑡,

𝜔𝑖𝑡 = 𝑟𝑇𝑖𝑡𝛿 + 𝜉𝑖𝑡, (2.12)

sendo 𝑦𝑖𝑡o logaritmo da produção; 𝑥𝑖𝑡é um vetor 𝑝-dimensional que representa o logaritmo

do vetor de quantidades de insumos para o 𝑖-ésimo indivíduo (𝑖 = 1, . . . , 𝑁 ) no 𝑡-ésimo tempo (𝑡 = 1, . . . , 𝑇 ); 𝛽𝜏 o vetor 𝑝-dimensional de parâmetros de regressão no quantil

𝜏 -ésimo da variável resposta; 𝜀𝑖𝑡 o ruído branco na fronteira de produção, independente

de 𝜔𝑖𝑡que representa o efeito não negativo da ineficiência técnica para o 𝑖-ésimo indivíduo

no tempo 𝑡; 𝑟𝑖𝑡o vetor 𝑞-dimensional de covariáveis explicativas dos efeitos de ineficiência

técnica para o elemento 𝑖 no tempo 𝑡; 𝛿 o vetor de parâmetros associado às covariáveis; e 𝜉𝑖𝑡

um erro aleatório com distribuição normal com parâmetro de localização zero, parâmetro de escala 𝜎2

𝜔 e truncado no intervalo [−𝑟𝑇𝑖𝑡𝛿, ∞), 𝜉𝑖𝑡 ∼ 𝒩 𝒯[−𝑟𝑇

𝑖𝑡𝛿,∞)(0, 𝜎

2

𝜔). O truncamento

garante 𝜔𝑖𝑡 ser não negativo com parâmetro de localização 𝑟𝑇𝑖𝑡𝛿, parâmetro de escala 𝜎𝜔2 e

truncamento no intervalo [0, ∞), 𝜔𝑖𝑡 ∼ 𝒩 𝒯[0,∞)(𝑟𝑇𝑖𝑡𝛿, 𝜎2𝜔).

Propõe-se uma regressão quantílica bayesiana para o modelo de fronteira de pro-dução estocástica, a partir da representação dada na Equação 2.12. Para desenvolver a proposta considera-se que o termo de erro aleatório 𝜀𝑖𝑡 segue uma distribuição Laplace

assimétrica com parâmetro de assimetria 𝜏 , parâmetro de localização zero e parâmetro de escala 𝜎𝜀 desconhecido, 𝜀𝑖𝑡 ∼ ℒ𝒜𝜏(0, 𝜎𝜀).

Utilizando a representação de mistura da distribuição Laplace assimétrica mos-trada na Proposição 2.2.1, pode-se rescrever o modelo como

𝑦𝑖𝑡 = 𝑥𝑇𝑖𝑡𝛽 + 𝜅1𝑣𝑖𝑡+ 𝜅2

𝜎𝜖𝑣𝑖𝑡𝑧𝑖𝑡− 𝜔𝑖𝑡,

(32)

sendo 𝜅1 = 1 − 2𝜏 𝜏 (1 − 𝜏 ) e 𝜅 2 2 = 2 𝜏 (1 − 𝜏 ),

𝑣𝑖𝑡 com distribuição exponencial com parâmetro 𝜎𝜀, 𝑣𝑖𝑡 ∼ ℰ(𝜎𝜀), e 𝑧𝑖𝑡 com distribuição

normal padrão, 𝑧𝑖𝑡 ∼ 𝒩 (0; 1).

Pode-se observar que, condicional aos valores fixados de 𝑣𝑖𝑡 e de 𝜔𝑖𝑡, a distribuição

de 𝑦𝑖𝑡 é normal com parâmetros 𝑥𝑇𝑖𝑡𝛽 + 𝜅1𝑣𝑖𝑡− 𝜔𝑖𝑡 de localização e 𝜅22𝜎𝜀𝑣𝑖𝑡 de escala, isto

é, (𝑦𝑖𝑡 | 𝛽, 𝜎𝜖, 𝑣𝑖𝑡, 𝜔𝑖𝑡) ∼ 𝒩 (𝑥𝑇𝑖𝑡𝛽 + 𝜅1𝑣𝑖𝑡− 𝜔𝑖𝑡, 𝜅22𝜎𝜀𝑣𝑖𝑡).

A função de verossimilhança para (𝛽, 𝜎) condicional a 𝑣 = (𝑣1 1, . . . , 𝑣𝑁 𝑇) e 𝜔 =

(𝜔1 1, . . . , 𝜔𝑁 𝑇), no modelo dado pela Equação 2.13, é dada por

ℒ(𝛽, 𝜎𝜀 | 𝑦, 𝑣, 𝜔) = 𝑁 ∏︁ 𝑖=1 𝑇 ∏︁ 𝑡=1 𝑓 (𝑦𝑖𝑡| 𝛽, 𝜎𝜀, 𝑣𝑖𝑡, 𝜔𝑖𝑡), com 𝑦 = (𝑦1 1, . . . , 𝑦𝑁 𝑇) e (𝑦𝑖𝑡 | 𝛽, 𝜎𝜀, 𝑣𝑖𝑡, 𝜔𝑖𝑡) ∼ 𝒩 (𝑥𝑖𝑡𝑇𝛽 + 𝜅1𝑣𝑖𝑡− 𝜔𝑖𝑡, 𝜅22𝜎𝜀𝑣𝑖𝑡).

Inferência bayesiana

Complementa-se a especificação do modelo, definindo a priori 𝜋(𝛽, 𝛿, 𝜎𝜀, 𝜎2𝜔) =

𝜋(𝛽)𝜋(𝛿)𝜋(𝜎𝜀)𝜋(𝜎2𝜔) sendo:

∙ a distribuição 𝜋(𝛽) normal multivariada com vetor de médias m𝛽0 e matriz de

covariâncias C𝛽0, 𝛽 ∼ 𝒩 ℳ(m𝛽0, C𝛽0);

∙ a distribuição 𝜋(𝛿) normal multivariada com vetor de médias m𝛿0 e matriz de

co-variâncias C𝛿0, 𝛿 ∼ 𝒩 ℳ(m𝛿0, C𝛿0);

∙ a distribuição 𝜋(𝜎𝜀) inversa gama com parâmetros 𝑛𝜀0 de forma e 𝑠𝜀0 de escala,

𝜎𝜀 ∼ ℐ𝒢(𝑛𝜀0; 𝑠𝜀0);

∙ e a distribuição 𝜋(𝜎2

𝜔) inversa gama com parâmetros 𝑛𝜔0 de forma e 𝑠𝜔0 de escala,

𝜎2

𝜔 ∼ ℐ𝒢(𝑛𝜔0; 𝑠𝜔0).

Segue que a distribuição a posteriori conjunta para 𝛽, 𝛿, 𝜎𝜀, 𝜎𝜔2, 𝑣 e 𝜔 é

𝑓 (𝛽, 𝛿, 𝜎𝜀, 𝜎𝜔2, 𝑣, 𝜔 | 𝑦) ∝ [︃𝑁 ∏︁ 𝑖=1 𝑇 ∏︁ 𝑡=1 𝑓 (𝑦𝑖𝑡 | 𝛽, 𝜎𝜀, 𝑣𝑖𝑡, 𝜔𝑖𝑡) ]︃[︃𝑁 ∏︁ 𝑖=1 𝑇 ∏︁ 𝑡=1 𝑓 (𝑣𝑖𝑡| 𝜎𝜀) ]︃ [︃𝑁 ∏︁ 𝑖=1 𝑇 ∏︁ 𝑡=1 𝑓 (𝜔𝑖𝑡| 𝛿, 𝜎𝜔2) ]︃ 𝜋(𝛽)𝜋(𝛿)𝜋(𝜎𝜖)𝜋(𝜎𝜔2).

Analogamente ao ocorrido no caso do modelo desenvolvido na Seção 2.3.1, a dis-tribuição a posteriori resultante não é fácil de manipular algebricamente, portanto, para

(33)

gerar uma amostra da distribuição a posteriori e permitir assim a inferência sobre os parâmetros do modelo recorre-se aos métodos de Monte Carlo via cadeias de Markov.

Cálculos algébricos permitem obter as seguintes distribuições condicionais comple-tas: ∙ (𝛽 | 𝑦, 𝑣, 𝜔, 𝜎𝜀) ∼ 𝒩 ℳ(𝑚𝛽, 𝐶𝛽), sendo 𝐶−1𝛽 = 1 𝜅2 2𝜎𝜀 𝑁 ∑︁ 𝑖=1 𝑇 ∑︁ 𝑡=1 𝑥𝑖𝑡𝑥𝑇𝑖𝑡 𝑣𝑖𝑡 + 𝐶−1𝛽0 e 𝑚𝛽 = 𝐶𝛽 [︃ 1 𝜅2 2𝜎𝜀 𝑁 ∑︁ 𝑖=1 𝑇 ∑︁ 𝑡=1 (𝑦𝑖𝑡− 𝜅1𝑣𝑖𝑡+ 𝜔𝑖𝑡) 𝑣𝑖𝑡 𝑥𝑖𝑡+ 𝐶−1𝛽0𝑚𝛽0 ]︃ ; ∙ (𝛿 | 𝜔, 𝜎2 𝜔) ∼ 𝒩 ℳ(𝑚𝛿, 𝐶𝛿), sendo 𝐶−1𝛿 = 1 𝜎2 𝜔 𝑁 ∑︁ 𝑖=1 𝑇 ∑︁ 𝑡=1 𝑟𝑖𝑡𝑟𝑇𝑖𝑡+ 𝐶 −1 𝛿0 e 𝑚𝛿 = 𝐶𝛿 [︃ 1 𝜎2 𝜔 𝑁 ∑︁ 𝑖=1 𝑇 ∑︁ 𝑡=1 𝜔𝑖𝑡𝑟𝑖𝑡+ 𝐶−1𝛿0𝑚𝛿0 ]︃ ; ∙ (𝜎𝜀 | 𝑦, 𝑣, 𝜔, 𝛽) ∼ ℐ𝒢(˜𝑛𝜀, ˜𝑠𝜀), sendo ˜ 𝑛𝜀 = 𝑛𝜀0+ 3𝑁 𝑇 2 e ˜𝑠𝜀 = 𝑠𝜀0+ 𝑁 ∑︁ 𝑖=1 𝑇 ∑︁ 𝑡=1 𝑣𝑖𝑡+ 1 2𝜅2 2 𝑁 ∑︁ 𝑖=1 𝑇 ∑︁ 𝑡=1 (𝑦𝑖𝑡− 𝑥𝑇𝑖𝑡𝛽 − 𝜅1𝑣𝑖𝑡+ 𝜔𝑖𝑡)2 𝑣𝑖𝑡 ; ∙ (𝑣𝑖𝑡| 𝑦𝑖𝑡, 𝛽, 𝜎𝜀, 𝜔𝑖𝑡) ∼ 𝒢ℐ𝒢 (︂1 2, 𝜒𝑖𝑡, 𝜓𝑖𝑡 )︂ , 𝑖 = 1, . . . , 𝑁, e 𝑡 = 1, . . . , 𝑇 sendo 𝜒𝑖𝑡 = (𝑦𝑖𝑡− 𝑥𝑇𝑖𝑡𝛽 + 𝜔𝑖𝑡)2 𝜅2 2𝜎𝜀 e 𝜓𝑖𝑡= 1 𝜎𝜀 [︃ 2 + 𝜅 2 1 𝜅2 2 ]︃ ; ∙ (𝜎2 𝜔 | 𝛿, 𝜔) ∼ ℐ𝒢(˜𝑛𝜔, ˜𝑠𝜔), sendo ˜ 𝑛𝜔 = 𝑛𝜔0+ 𝑁 𝑇 2 e 𝑠˜𝜔 = 𝑠𝜔0+ 1 2 𝑁 ∑︁ 𝑖=1 𝑇 ∑︁ 𝑡=1 (𝜔𝑖𝑡− 𝑟𝑇𝑖𝑡𝛿) 2; e ∙ (𝜔𝑖𝑡 | 𝑦𝑖𝑡, 𝑣𝑖𝑡, 𝛽, 𝛿, 𝜎𝜀, 𝜎𝜔2) ∼ 𝒩 𝒯[0,∞)(𝑚𝜔𝑖𝑡, 𝐶𝜔𝑖𝑡), 𝑖 = 1, . . . , 𝑁, e 𝑡 = 1, . . . , 𝑇 sendo 𝐶𝜔−1𝑖𝑡 = 1 𝜅2 2𝜎𝜀𝑣𝑖𝑡 + 1 𝜎2 𝜔 e 𝑚𝜔𝑖𝑡 = [︃ 𝑟𝑇𝑖𝑡𝛿 𝜎2 𝜔𝑦𝑖𝑡− 𝑥 𝑇 𝑖𝑡𝛽 − 𝜅1𝑣𝑖𝑡 𝜅2 2𝜎𝜀𝑣𝑖𝑡 ]︃ 𝐶𝜔𝑖𝑡.

Dado que as condicionais completas são conhecidas e fáceis de gerar seus valores, é possível utilizar o esquema de amostragem de Gibbs.

É também possível gerar uma amostra da distribuição a posteriori para a eficiência técnica (ET) a partir da amostragem dos efeitos de ineficiência técnica. Para o 𝑖-ésima firma no tempo 𝑡-ésimo, a eficiência técnica é definida pela equação

(34)

De acordo com a proposta de Yang, Wang e He (2016), utilizando o ajuste na matriz de covariâncias apresentado na Proposição 2.2.2, é possível construir estimativas intervalares “ajustadas”- dos parâmetros de regressão quantílica no modelo de fronteira de produção estocástica - para conseguir níveis de credibilidade adequados. Na prática, os modelos de fronteira de produção estocástica podem satisfazer a primeira condição de regularidade da proposição referida, já que a produção geralmente tem valores positivos maiores do que um ou, caso contrário, é possível mudar a escala de medida para satisfazer isso (de toneladas a quilogramas, de litros a mililitros, etc); com os valores da produção maiores do que um tem-se que, o logaritmo de todas as observações da produção - variável resposta - é maior do que zero, conseguindo com isso satisfazer a condição de regularidade de quantis delimitados no intervalo [0; ∞), como visto na Proposição 2.2.2.

(35)

Capítulo 3

Aplicação

Neste capítulo apresenta-se primeiro um estudo de Monte Carlo para o modelo de regressão quantílica bayesiana descrito na Seção2.2; a seguir, apresenta-se duas aplicações práticas dos modelos propostos, desenvolvidos na Seção 2.3.1 e na Seção 2.3.2.

Os algoritmos de amostragem de Gibbs, a manipulação de dados e as análises foram feitas utilizando o programa R (R Core Team, 2016).

3.1.

Regressão quantílica bayesiana: um estudo de

Monte Carlo

O objetivo do estudo de Monte Carlo apresentado nesta seção é uma avaliação empírica da metodologia, tomada da literatura e apresentada na Seção 2.2, que foi con-siderada para a inferência no modelo de regressão quantílica bayesiana. Essa avaliação é feita em termos de consistência das estimativas pontuais e nível de credibilidade das estimativas intervalares correspondentes aos parâmetros do modelo.

Seguindo uma abordagem bayesiana, no desenvolvimento de regressão quantílica, a distribuição Laplace assimétrica é amplamente utilizada como distribuição da variável res-posta. No entanto, é pouco provável que a distribuição que originou os dados seja Laplace assimétrica. Considerando isto, a distribuição a posteriori dos parâmetros de regressão quantílica derivada diretamente da função de verossimilhança Laplace assimétrica pode estar incorretamente especificada. Consequentemente, as estimativas dos parâmetros po-deriam não ser adequadas. Como comentado na Seção2.2,Sriram, Ramamoorthi e Ghosh

(2013) provam a consistência, sob certas condições de regularidade, dos estimadores deri-vados ao considerar distribuição Laplace assimétrica na função de verossimilhança. Mais recentemente, Yang, Wang e He (2016) propõem um ajuste na matriz de covariâncias

Referências

Documentos relacionados

Acredita-se que as pes- soas especiais devem estar presentes não só como ouvintes, mas como agentes que possam estar envolvidos nas discussões e decisões sobre uma

Objetivos: Este estudo clínico prospectivo avaliou digitalmente as oclusões estática e dinâmica de pacientes reabilitados com próteses totais removíveis convencionais

The aim of this study was to use artificial neural networks in the selection of common bean genotypes with high phenotypic adaptability and stability, and to verify their consistency

Este novo índice, validado, tem como abordagem principal a utilização da densidade energética no cálculo das porções diárias para os nove grupos de alimentos de acordo

Se o profissional perceber dificuldades no desenvolvimento de uma relação individual com cada um dos gémeos, é importante intervir, ajudando a mãe a descobrir

O que a Análise de Fronteira Estocástica (Stochastic Frontier Analysis – SFA) faz é estimar a função fronteira de produção ideal (máxima, potencial) utilizando-se regressão de

documentalmente comprovado que não foi registada qualquer autorização de loteamento para construção relativamente às desanexações requeridas, sendo que o réu apelante não alegou

(2010) apresentam que a dificuldade de acesso da população à média complexidade é um desafio para o SUS na garantia da integralidade do cuidado, e envolve questões