• Nenhum resultado encontrado

Soluções numéricas para jogos diferenciais : aplicação a uma corrida por P&D.

N/A
N/A
Protected

Academic year: 2021

Share "Soluções numéricas para jogos diferenciais : aplicação a uma corrida por P&D."

Copied!
102
0
0

Texto

(1)

INSTITUTO DE CIˆENCIAS SOCIAIS APLICADAS

PROGRAMA DE P ´OS-GRADUAC¸ ˜AO EM ECONOMIA APLICADA

SOLUC

¸ ˜

OES NUM´

ERICAS PARA JOGOS DIFERENCIAS:

APLICAC

¸ ˜

AO A UMA CORRIDA POR P&D

LUDGERO LIMA ARANTES NETO

Mariana - MG

2020

(2)

SOLUC

¸ ˜

OES NUM´

ERICAS PARA JOGOS DIFERENCIAS:

APLICAC

¸ ˜

AO A UMA CORRIDA POR P&D

Disserta¸c˜ao apresentada ao Programa de P´os-Gradua¸c˜ao em Economia Aplicada do Instituto de Ciˆencias So-ciais da Universidade Federal de Ouro Preto, como requisito parcial `a obten¸c˜ao do T´ıtulo de Mestre.

Orientador: Prof. Dr. Martin Harry Vargas Barrenechea

Mariana - MG

2020

(3)

Arantes Neto, Ludgero Lima.

AraSoluções numéricas para jogos diferenciais [manuscrito]: aplicação a uma corrida por P&D. / Ludgero Lima Arantes Neto. - 2020.

Ara102 f.

AraOrientador: Prof. Dr. Prof. Dr. Martin Harry Vargas Barrenechea. AraDissertação (Mestrado Acadêmico). Universidade Federal de Ouro Preto. Instituto de Ciências Sociais Aplicadas. Programa de Pós-Graduação em Economia Aplicada.

AraÁrea de Concentração: Economia Aplicada.

Ara1. Teoria dos Jogos. 2. Jogos Diferenciais. 3. Economia. I. Barrenechea, Prof. Dr. Martin Harry Vargas. II. Universidade Federal de Ouro Preto. III. Título.

Bibliotecário(a) Responsável: Essevalter De Sousa - Bibliotecário BIBI-ICSA/SISBIN CRB6 1407

A662s

(4)

https://sei.ufop.br/sei/controlador.php?acao=documento_imprimir_web&acao_origem=arvore_visualizar&id_documento=80281… 1/1 MINISTÉRIO DA EDUCAÇÃO

UNIVERSIDADE FEDERAL DE OURO PRETO REITORIA

INSTITUTO DE CIENCIAS SOCIAIS E APLICADAS DEPARTAMENTO DE CIÊNCIAS ECONÔMICAS

FOLHA DE APROVAÇÃO

 

Ludgero Lima Amarantes Neto

Soluções Numéricas para Jogos Diferenciais: Aplicação a uma Corrida por P&D.

  Membros da banca 

 

Martin Harry Vargas Barrenechea -  Prof. Dr. - UFOP  Antônio Francisco Neto -  Prof. Dr. - UFOP  Igor Viveiros Melo Souza -  Prof. Dr. - UFMG    

Versão final 

Aprovado em 15 de junho de 2020   

De acordo   

Martin Harry Vargas Barrenechea -  Prof. Dr. - UFOP  

Documento assinado eletronicamente por Martin Harry Vargas Barrenechea, PROFESSOR DE MAGISTERIO SUPERIOR, em 21/07/2020, às 21:18, conforme horário oficial de Brasília, com fundamento no art. 6º, § 1º, do Decreto nº 8.539, de 8 de outubro de 2015.

A autenticidade deste documento pode ser conferida no site http://sei.ufop.br/sei/controlador_externo.php?

acao=documento_conferir&id_orgao_acesso_externo=0 , informando o código verificador 0069197 e o código CRC 454B6084.

Referência: Caso responda este documento, indicar expressamente o Processo nº 23109.005249/2020-51 SEI nº 0069197 R. Diogo de Vasconcelos, 122, - Bairro Pilar Ouro Preto/MG, CEP 35400-000

(5)

Primeiramente agrade¸co a minha fam´ılia por estarem sempre ao meu lado em todos os momentos; `a Jouse e ao Caio pela amizade e companheirismo nas dificuldades do mestrado e da vida; e ao meu orientador o Prof. Martin n˜ao somente pela orienta¸c˜ao, a postura sempre atenciosa e a indica¸c˜ao de bons livros, mas principalmente pelo est´ımulo para continuar aprofundando meus conhecimentos apesar das dificuldades inerentes ao processo de pesquisa.

Por fim, agrade¸co a Universidade Federal de Ouro Preto (UFOP) pela bolsa de estudos.

(6)
(7)

Este trabalho aplica os m´etodos num´ericos de shooting e coloca¸c˜ao numa corrida tec-nol´ogica, na qual os investimentos em P&D s˜ao modelados em um jogo diferencial como inicialmente propostoReinganum(1982) e posteriormente ampliado porMalueg and Tsut-sui(1997) sob uma abordagem bayesiana. Em uma corrida por P&D assim modelada cada jogador defronta-se com um problema de controle ´otimo que pode ser reduzido a um pro-blema de valor de contorno, e cujos investimentos em P&D s˜ao a vari´avel de controle. Portanto, deduz-se os analiticamente os modelos at´e a obten¸c˜ao do problema de valor de contorno e posteriormente os m´etodos num´ericos s˜ao aplicados. A conclus˜ao do trabalho ´e que os resultados encontrados por meio dos m´etodos num´ericos abordados aproximam razoavelmente da solu¸c˜ao.

Palavras-Chave: Teoria dos Jogos, Jogos Diferenciais, Inova¸c˜ao, Corrida por P&D, M´etodos Num´ericos

(8)
(9)

This dissertation applies the shooting and collocation numeric methods at a technolo-gical race in which the investments in R&D are modeled as a differential game like firstly proposed by Reinganum (1982) and after extended by Malueg and Tsutsui (1997) with an bayesian appproach. In a R&D race modeled as such, each player face an optimal control problem which can be reduced to a boundary velue problem, and whose R&D in-vestments are the control variable. Therefore, the models are analytic deduced untill the boundary value problem is obtained and thereafter the numerical methods are applied. The dissertation conclusion is that the results found by the numerical methods considered reasonably approximate the solution.

Keywords: Game Theory, Differential Games, Inovation, R&D Race, Nume-rical Methods

(10)
(11)

1 Fun¸c˜ao de Valor Condicional 31

2 Impacto da Concorrˆencia nos Investimentos em P&D 33

3 Impacto da Concorrˆencia na Evolu¸c˜ao do Pessimismo as Firmas 34

4 Impacto de da Concorrˆencia na Trajet´oria dos Investimentos em P&D 34

5 Impacto de f nos Investimentos em P&D 35

6 Investimentos em P&D com f=0 e r=0 36

1 Gr´aficos da Solu¸c˜ao Num´erica e Erros da Aproxima¸c˜ao de ui(t) pelo M´etodo de

Shooting do PVC 1 55

2 Gr´aficos da Solu¸c˜ao Num´erica e Erros da Aproxima¸c˜ao de ui(t) pelo M´etodo de

Coloca¸c˜ao do PVC 1 55

3 Gr´aficos da Solu¸c˜ao Num´erica e Erros da Aproxima¸c˜ao de ui(t) pelo M´etodo de

Shooting do PVC 2 57

4 Gr´aficos da Solu¸c˜ao Num´erica e Erros da Aproxima¸c˜ao de ui(t) pelo M´etodo de

Coloca¸c˜ao do PVC 2 59

5 Gr´aficos da Solu¸c˜ao Num´erica e Erros da Aproxima¸c˜ao de ui(t) pelo M´etodo de

Shooting do PVC 3 61

6 Gr´aficos da Solu¸c˜ao Num´erica e Erros da Aproxima¸c˜ao de ui(t) pelo M´etodo de

Coloca¸c˜ao do PVC 3 63

1 Gr´aficos da Solu¸c˜ao Num´erica e Erros da Aproxima¸c˜ao de ui(t) pelo M´etodo de

Shooting para o Modelo de Malueg e Tsutsui (1997) 68

2 Gr´aficos da Solu¸c˜ao Num´erica e Erros da Aproxima¸c˜ao de ui(t) pelo M´etodo de

Shooting para o Modelo de Malueg e Tsutsui (1997) 69

3 Gr´aficos da Solu¸c˜ao Num´erica e Erros da Aproxima¸c˜ao de ui(t) pelo M´etodo de

Coloca¸c˜ao para o Modelo de Malueg e Tsutsui (1997) 72

(12)

4 Gr´aficos da Diferen¸ca entre as Solu¸c˜oes Num´ericas para os Dois Algoritmos do

M´etodo de Coloca¸c˜ao no Modelo de Malueg e Tsutsui (1997) 76

5 Gr´aficos da Diferen¸ca da Aproxima¸c˜ao de ui(t) pelo M´etodo de Coloca¸c˜ao com

Tempo End´ogeno para o Modelo de Malueg e Tsutsui (1997) 78

(13)

1 Erros da Aproxima¸c˜ao de ui(t) do M´etodo de Shooting para o PVC 1 53

2 Erros da Aproxima¸c˜ao de ui(t) para a Solu¸c˜ao do PVC 1 pelo de M´etodo de

Coloca¸c˜ao 54

3 Erros da Aproxima¸c˜ao de ui(t) do M´etodo de Shooting para o PVC 2 57

4 Erros da Aproxima¸c˜ao de ui(t) para a Solu¸c˜ao do PVC 2 pelo de M´etodo de

Coloca¸c˜ao 58

5 Erros da Aproxima¸c˜ao de ui(t) do M´etodo de Shooting para o PVC 3 60

6 Erros da Aproxima¸c˜ao de ui(t) para a Solu¸c˜ao do PVC 3 pelo de M´etodo de

Coloca¸c˜ao 62

1 Erros da Aproxima¸c˜ao de ui(t) do M´etodo de Shooting para o Modelo de Malueg

e Tsutsui (1997) 67

2 Erros da Aproxima¸c˜ao de ui(t) para a Solu¸c˜ao do Modelo de Malueg e Tsutsui

(1997) pelo de M´etodo de Coloca¸c˜ao 71

3 Compara¸c˜ao entre M´etodo de Shooting e Coloca¸c˜ao com Tempo End´ogeno para o

Modelo de Malueg e Tsutsui (1997) 77

(14)
(15)

Agradecimentos iii Resumo v Abstract vii Lista de Figuras ix Lista de Tabelas xi Introdu¸c˜ao 1

Cap´ıtulo 1. Jogos Diferencias e Corrida por P&D 7

1. Modelo de Reinganum (1982) 7

2. Modelo de Malueg e Tsutsui (1997) 21

Cap´ıtulo 2. Solu¸c˜oes Num´ericas para o modelo de Reinganum (1982) 39

Cap´ıtulo 3. Solu¸c˜oes Num´ericas para o modelo de Malueg e Tsutsui (1997) 65

Conclus˜ao 79

Apˆendice - M´etodos Num´ericos 81

1. M´etodo de Shooting 81

2. M´etodo de Coloca¸c˜ao 82

Bibliografia 85

(16)
(17)

A corrida por inova¸c˜ao atrav´es de investimento em pesquisa e desenvolvimento (P&D) ´e uma poss´ıvel intera¸c˜ao estrat´egica entre as firmas, as quais objetivam a descoberta de um novo produto que lhes garantam algum ganho. Entretanto, em tal corrida as firmas alocam recursos em P&D sob a hip´otese de resultados incertos, tanto em rela¸c˜ao ao momento da descoberta, quanto qual jogador ganhar´a a corrida ao ser o primeiro a obter sucesso ao inovar. (Van Long, 2010, p. 155)

Uma primeira abordagem seria o jogo apresentado no trabalho de Scherer (1967) no qual o ganho pela inova¸c˜ao ´e obtido em dado per´ıodo de comercializa¸c˜ao que se inicia logo ap´os a termino do projeto de inova¸c˜ao. Por sua vez, o tempo de execu¸c˜ao do projeto pode ser determinado pela firmas ao dispenderem maiores recursos em P&D. Al´em disso,

Scherer(1967) pressup˜oe que cada firma considera que seus gastos em P&D n˜ao afetar˜ao a escolha das demais. Os resultados obtidos pelo autor foram que o aumento do n´umero de jogadores implica no aumento dos investimento em P&D visando reduzir o tempo de desenvolvimento mesmo que esses incorram em maiores custos. (Scherer, 1967, p. 390)

Posteriormente, Kamien and Schwartz (1976) prop˜oe um modelo cuja estrutura de mercado ´e incerta de modo que as firmas, ao reduzirem seus investimento em P&D bus-cando menor custo, estendem o tempo de inova¸c˜ao ampliando a possibilidade da entrada de um rival. O resultado obtido pelos autores corrobora com os de Scherer (1967) ao concluir que h´a o aumento dos investimentos em P&D sob um maior n´umero de firmas. (Kamien and Schwartz,1976, p. 255)

Entretanto, Loury(1979) ressalta que os trabalhos anteriores analisam um equil´ıbrio parcial parametrizando a estrutura de mercado o que seria insatisfat´orio, pois, os investi-mentos em P&D afetam a probabilidade da entrada de concorrentes, e desse modo, n˜ao poderiam ser tomados como parˆametro. O modelo alternativo proposto porLoury(1979) pressup˜oe que a probabilidade de sucesso de uma dada firma na corrida ´e descrita por uma distribui¸c˜ao exponencial na qual as firmas maximizam sua probabilidade de ganho comprometendo-se com um fluxo de investindo em P&D. Os resultados deste modelo di-vergem dos trabalhos anteriores concluindo que o aumento no n´umero de firmas reduz

(18)

os investimentos em P&D de cada firma, mas corrobora em rela¸c˜ao a redu¸c˜ao do tempo necess´ario para ocorrer a inova¸c˜ao.

O pressuposto adotado porLoury(1979) que as firmas se comprometem com um fluxo de investimento em P&D ´e questionado porLee and Wilde (1980), o qual amplia tal mo-delo pressupondo que as firmas escolhem, ou um dispˆendio fixo em P&D, ou encerram seus projetos. Sob tal modifica¸c˜ao Lee and Wilde (1980) obt´em entretanto que os inves-timento s˜ao ampliados com o aumento do n´umero de firmas, corroborando assim com os trabalhos anteriores `aLoury (1979).

Por sua vez, Reinganum(1982) prop˜oe um jogo diferencial que re´une tanto o aspecto estrat´egico dos agentes em modelos como Scherer (1967), Loury (1979) e Lee and Wilde

(1980), nos quais as firmas escolhem sua estrat´egia de investimento de um conjunto dos R+; quanto o aspecto dinˆamico do modelo de Kamien and Schwartz (1976), no qual as

firmas escolhem uma fun¸c˜ao que descreve no tempo a trajet´oria do gasto em P&D. Os resultados obtidos por Reinganum (1982) corroboram com Scherer (1967), Kamien and Schwartz (1976) e Lee and Wilde (1980). (Reinganum,1982, p. 672)

Contudo,Malueg and Tsutsui(1997) observa que o modelo deReinganum(1982) pres-sup˜oe que a inova¸c˜ao ´e sempre fact´ıvel e sua distribui¸c˜ao de probabilidade ´e conhecida. Assim, Malueg and Tsutsui (1997) prop˜oem uma abordagem Bayesiana para o modelo na qual a n˜ao obten¸c˜ao de sucesso em inovar, dado o aumento no estoque de conheci-mento, produz informa¸c˜ao extra para as firmas, de modo que suas cren¸cas em rela¸c˜ao a distribui¸c˜ao de probabilidade de sucesso em inovar ´e atualizada a cada instante.

A abordagem de Malueg and Tsutsui (1997), entretanto, adiciona grande complexi-dade ao problema, o que pode ser percebido no fato que o modelo apenas possui solu¸c˜ao alg´ebrica para parˆametros espec´ıficos. Assim, para analisar o comportamento dos inves-timento em P&D com o aumento do n´umero de fimas, os autores comparam diferentes solu¸c˜oes num´ericas para o jogo.

Contudo, n˜ao foi explicitado emMalueg and Tsutsui(1997) quais os m´etodos num´ericos utilizados, e portanto, cabe a discuss˜ao de diferentes m´etodos para a obten¸c˜ao da solu¸c˜ao. Tal discuss˜ao para os modelos de Reinganum (1982) e Malueg and Tsutsui (1997) ´e objetivo do presente trabalho, e como esses jogos podem ser reduzidos a resolu¸c˜ao de um problema de valor de contorno, temos como hip´otese que os m´etodos de coloca¸c˜ao e shooting, por serem capazes de resolver tais problemas, produzem solu¸c˜oes num´ericas razo´aveis.

(19)

O fato de podermos reduzir os modelos Malueg and Tsutsui(1997), e tamb´em Reinga-num(1982), a um problema de valor de contorno ocorre por esses serem jogos diferencias. Segundo Van Long (2010) um jogo diferencial que ocorre em um per´ıodo de tempo finito ou infinito possui as seguintes propriedades:

• os jogadores recebem um payoff a cada per´ıodo, sendo o payoff total a integral dos payoffs descontados;

• o payoff a cada per´ıodo depende tanto da a¸c˜ao do jogador quanto das a¸c˜oes dos demais jogadores, al´em da vari´avel de estado do sistema;

• o estado do sistema tem sua evolu¸c˜ao determinada pela(s) vari´avel(eis) de controle que depende da a¸c˜ao dos jogadores;

• a taxa de mudan¸ca da vari´avel de estado ´e descrita por uma equa¸c˜ao de transi¸c˜ao, a qual ´e uma equa¸c˜ao diferencial. (Van Long, 2010, p. 1)

Observe, portanto, que um jogo diferencial resulta em um problema de controle ´otimo, que por sua vez, pode ser reduzido a um problema de valor de contorno quando tomamos as condi¸c˜oes necess´arias para ´otimo da fun¸c˜ao Hamiltoniana associada ao problema de controle ´otimo.

Quanto ao equil´ıbrio de um jogo diferencial, Van Long (2010) tamb´em ressalta que ´e estabelecido na literatura a busca da obten¸c˜ao dois tipos de equil´ıbrio; o Equil´ıbrio de Nash open-loop (OLNE); e o Equil´ıbrio de Nash Markoviano-Perfeito (MPNE), sendo que ambos advˆem dos pressupostos dos jogadores para estabelecerem sua estrat´egia, e portanto, de como ´e definido a vari´avel de controle, ui(t). (Van Long, 2010, p. 2)

Dockner et al. (2000) nos apresenta as seguinte defini¸c˜oes:

Definic¸˜ao 0.1. Uma estrat´egia open-loop (ou de pr´e-comprometimento) ´e a trajet´oria de a¸c˜oes planejadas no tempo por um jogador, ui(t) = φOLi (t). (Dockner et al., 2000,

p. 86)

Definic¸˜ao 0.2. Uma estrat´egia markoviana-perfeita (ou com feedback) ´e uma regra que condiciona as a¸c˜oes para todo tempo segundo o estado observado em um dado mo-mento (tempo), ui(t) = φF Bi (x(t), t), onde x ∈ X. (Dockner et al., 2000, p. 86)

Definic¸˜ao 0.3. Equil´ıbrio de Nash open-loop ´e: “A n-upla (φ1i, φ2i, ..., φni) de fun¸c˜oes

φi : X × [0, T ) 7→ Rmi, i ∈ {1, 2, ..., n}, ´e chamada de equil´ıbrio de Nash open-loop se,

para cada i ∈ {1, 2, ..., n}, uma trajet´oria de controle ´otimo, ui, do problema”[que define

(20)

Definic¸˜ao 0.4. Equil´ıbrio de Nash markoviano-perfeito ´e: “A n-upla (φ1i, φ2i, ..., φni)

de fun¸c˜oes φi : X × [0, T ) 7→ Rmi, i ∈ {1, 2, ..., n}, ´e chamada de equil´ıbrio de Nash

markoviano-perfeito se, para cada i ∈ {1, 2, ..., n}, uma trajet´oria de controle ´otimo, ui,

do problema”[que define o jogo diferencial] ”existe e ´e dada pela estrat´egia markoviana-perfeita ui(t) = φF Bi (x(t), t).” (Dockner et al., 2000, p. 86)

O OLNE tem a propriedade de consistˆencia em rela¸c˜ao ao tempo, de modo que a cada per´ıodo os jogadores n˜ao possuem incentivo de desviarem da trajet´oria ´otima inicialmente definida. Contudo, caso haja, por raz˜ao ex´ogena ao modelo, algum desvio de um ou mais jogadores da trajet´oria ´otima inicialmente definida, ent˜ao uma nova trajet´oria ´otima passa a ser adotada pelos jogadores, ou seja, o OLNE n˜ao ´e robusto a perturba¸c˜oes. Por outro lado, o MPNE ´e definido como uma regra que condiciona as poss´ıveis a¸c˜oes dos jogadores em fun¸c˜ao do tempo e estado da vari´avel, e consequentemente, ´e robusto em rela¸c˜ao `a perturba¸c˜oes. (Van Long, 2010, p. 3)

A relevˆancia da abordagem destes conceitos de equil´ıbrio reside no fato que o OLNE representa a situa¸c˜ao em que os jogadores s˜ao capazes de estabelecerem um compromisso razoavelmente confi´avel, enquanto o MPNE a situa¸c˜ao em que h´a robustez em rela¸c˜ao `a perturba¸c˜oes, e por isso, a compara¸c˜ao entre esses equil´ıbrios ´e frequentemente realizada quando poss´ıvel.

Assim, frente as dificuldades ou impossibilidade de c´alculo destes equil´ıbrios analiti-camente, refor¸ca-se a justificava do estudo da aplica¸c˜ao de m´etodos num´ericos, uma vez que ampliaria o n´umero de poss´ıveis abordagens do problema. Tal ponto ´e ressaltado em Jørgensen and Zaccour (2006), segundo o qual h´a um trade-off entre complexidade e generalidade dos m´etodos anal´ıticos e num´ericos quando utilizados em aplica¸c˜oes da teo-ria de jogos diferenciais. Os m´etodos anal´ıticos permitiriam grande generalidade de suas conclus˜oes, mas ao custo de se restringirem a jogos com estrutura simples. Por outro lado, os m´etodos num´ericos se desfazem da generalidade de suas conclus˜oes ao requisitarem a especifica¸c˜ao de parˆametros a priori, mas permitem a abordagem de jogos com estrutura mais complexa. (Jørgensen and Zaccour, 2006, p. 160)

Como mencionado anteriormente, abordamos como metodologia do presente trabalho os m´etodos shooting e de coloca¸c˜ao, cujas simula¸c˜oes s˜ao realizadas em Python vers˜ao 2.7 devido a simplicidade de leitura e flexibilidade da linguagem. J´a para verificarmos a razo-abilidade das solu¸c˜oes num´ericas foi feita a compara¸c˜ao entre os m´etodos, como proposto por Beach (2017) e Judd (1998), al´em de, quando poss´ıvel, a escolha de parˆametros que

(21)

nos permitam obter uma solu¸c˜ao anal´ıtica para compara¸c˜ao, como proposto por Linge and Langtangen (2016). Com tais compara¸c˜oes, conclu´ımos ao final do trabalho que os m´etodos de shooting e de coloca¸c˜ao produziram solu¸c˜oes num´ericas razo´aveis, mesmo para casos de dif´ıcil aproxima¸c˜ao como Malueg and Tsutsui (1997), e portanto, podem ser adotados em outros jogos diferencias com estrutura similar.

(22)
(23)

Jogos Diferencias e Corrida por P&D

1. Modelo de Reinganum (1982)

Reinganum (1982) aborda a inova¸c˜ao como um processo estoc´astico influenciado pelo estoque de conhecimento relevante, z(t). Por sua vez, a aquisi¸c˜ao de conhecimento1 por uma firma i ∈ {1, ..., n} ´e dada a uma taxa µi(t) ∈ [ 0, B ], onde B ´e um limite f´ısico

determinado exogenamente. Al´em disso, supomos que as firmas podem escolher µi(t)

ao investir recursos em P&D, ui(·), os quais acumuladamente s˜ao iguais zi(t). Logo,

pressup˜oe-se

˙

zi(t) = ui(·). (1)

A restri¸c˜ao a µi(t) implica que ui(·) ∈ U = [ 0, B ] e zi(t) ∈ [ 0, T B ] para todo

t ∈ [ 0, T ], o qual T tamb´em ´e definido exogenamente e representa o momento fim da corrida. (Reinganum, 1982, p. 672).

O fato de uma firma definir a sua capacidade inovativa n˜ao garante necessariamente que essa ganhe a corrida em P&D, para tanto, ´e necess´ario que seja a primeira `a obter sucesso ao inovar. Assim, a incerteza em rela¸c˜ao a qual firma ser´a efetivamente a inovadora ´e modelada por Reinganum (1982) ao pressupor que o momento de sucesso como uma vari´avel aleat´oria com distribui¸c˜ao exponencial influenciada pelo estoque de conhecimento acumulado.

Portanto, a probabilidade de inova¸c˜ao da firma i com conhecimento acumulado menor ou igual a zi no tempo t ´e descrito pela distribui¸c˜ao acumulada

Pr(ti ≤ t) = 1 − exp{−λzi(t)} = Fi(t) (2)

e distribui¸c˜ao de densidade, fi(t),

1EmReinganum(1982) h´a a distin¸ao entre conhecimento e informa¸ao. Conhecimento refere-se a fatos

relevantes que contribuem para o desenvolvimento da inova¸c˜ao e restringe-se ao projeto de pesquisa. J´a a informa¸c˜ao diz respeito ao conhecimento da firma sobre seus pares. (Reinganum,1982, p. 672)

(24)

fi(t) = dFi(t) dt = λ  dzi dt  exp{−λzi(t)} fi(t) = λui(·) exp{−λzi(t)}. (3)

Supondo independˆencia, de (2) e (3) temos que a probabilidade da firma i ganhar a corrida no tempo t, ´e fi(t) Pr(tj = t, tj > t , j 6= i) = fi(t) n Y j6=i [1 − Fi(t)]

= λui(·) exp{−λzi(t)} exp{−λZ−i(t)} (4)

= λui(·) exp{−λZ(t)}

onde Z(t) ≡Pn

k=1zk(t) e Z−i(t) ≡

P

j6=izk(t).

Uma vez dada a probabilidade de sucesso da firma i, o ganho pela inova¸c˜ao a valor presente, PL, e o ganho pela imita¸c˜ao da inova¸c˜ao de outra firma a valor presente, PF,

Reinganum(1982) define o ganho esperado de i pela inova¸c˜ao como

PLλui(·) e−λZ(t)

e o ganho esperado de i por uma imita¸c˜ao da inova¸c˜ao de outra firma como PFλ

X

j6=i

uj(·)e−λZ(t).

Al´em disso, pressup˜oe-se uma fun¸c˜ao de custo de inova¸c˜ao

ui(·)2

2 .

Logo, a fun¸c˜ao de payoff de i ´e dada por todo o ganho esperado por i a valor presente subtra´ıdo de todo custo incorrido por i para acumula¸c˜ao de conhecimento, ou seja,

(25)

Ji = Z T 0 e−λZ(t) " λPLui(·) + λPF X j6=i uj(·) − e−rt 2 ui(·) 2 # dt (5)

onde r a taxa de desconto dos custos.

Observe que os ganhos a valor presente no modelo s˜ao considerados como constantes ao longo do tempo, ou alternativamente, crescentes a mesma taxa que a utilizada para desconto, o que, segundo Dockner(2000), permite que o modelo foque na rivalidade entre as firmas. (Dockner et al., 2000, p. 155)

Definido o conjunto dos n jogadores, suas preferˆencias atrav´es da fun¸c˜ao de payoff, e o conjunto de a¸c˜oes dado por ui, podemos derivar os equil´ıbrios open-loop e markoviano

perfeito.

Quando as firmas adotam estrat´egias open-loop escolhem o investimento em P&D apenas em fun¸c˜ao do tempo, ui(t) = φOLi (t), e esperam que as demais firmas fa¸cam o

mesmo. Logo, a firma i depara-se com o seguinte problema de controle:

max ui∈ U Z T 0 e−λZ(t) " λPLui(t) + λPF X j6=i uj(t) − e−rt 2 ui(t) 2 # dt (6) sujeito a Z˙i(t) = ui(t), Zi(0) = 0. A fun¸c˜ao Hamiltoniana Hi(t, Z, ui, ψi) = e−λZ(t) " λPLui(t) + λPF X j6=i uj(t) − e−rt 2 ui(t) 2 # + ψi(t)ui(t)

´e concava em ui, e portanto, aplicando o Princ´ıpio do M´aximo de Pontryagin2 temos as

seguintes condi¸c˜oes necess´arias para extremo:

∂Hi(t, Z∗, u∗i, ψi) ∂ui            > 0, ∀ ui ∈ [0, B] implica em u∗i = B = 0, ∀ ui ∈ (0, B) implica em u∗i(t) = ert λPL+ ψi(t)eλZ ∗(t) < 0, ∀ ui ∈ [0, B] implica em u∗i = 0 (7)

2Para maiores detalhes sobre o Princ´ıpio do M´aximo de Pontryagin verSydsaeter et al.(2008) eDockner et al.(2000).

(26)

˙ ψi = − ∂Hi(t, Z, ui, ψi) ∂Z ⇒ ˙ψi = λe −λZ " λPLui + λPF X j6=i uj − e−rt 2 u 2 i # . (8)

Supondo que as firmas s˜ao sim´etricas temos de (8),

˙ ψi = λe−λZ  λ [PL+ (n − 1)PF] ui− e−rt 2 u 2 i  . (9) Substituindo (7) em (9), ˙ ψi = λe−λZ  λ [PL+ (n − 1)PF] ert λPL+ ψieλZ − ert 2 λPL+ ψie λZ2  . (10)

Assim reduzimos nosso problema de controle (6) a um problema de valor de contorno com a equa¸c˜ao diferencial (10), e condi¸c˜oes de contorno Z(0) = 0 e ψi(T ) = 0 3. Para

resolvˆe-lo, a equa¸c˜ao (7) sugere definimos b(t) = λPL+ ψi(t) eλZ(t), e portanto,

ψi = e−λZ( b − λPL).

Diferenciando esta ´ultima equa¸c˜ao em rela¸c˜ao ao tempo temos,

˙ ψi = −λe−λZZ ( b − λP˙ L) + e−λZ ˙b. Contudo, ˙Z = nui, logo ˙ ψi = −λe−λZnert(λPL+ ψieλZ) ( b − λPL) + e−λZ ˙b ˙ ψi = −nλerte−λZb ( b − λPL) + e−λZ ˙b ˙ ψi = e−λZ ˙b − nλertb2+ nPLλ2ertb  . (11)

Igualando (11) a (10) e com alguma ´algebra obtemos

3Observe que a condi¸ao de transversalidade ´e ψ

i(T ) = 0, pois, somente h´a inova¸c˜ao se Z∗(T ) > 0, j´a que caso contr´ario Pr(ti≤ t) = 0 para toda firma i. Para mais detalhes sobre esta condi¸c˜ao de transversalidade verSydsaeter et al.(2008)

(27)

˙b − (2n − 1)λert 2 b

2+ λ2ert(n − 1)(P

L− PF) b = 0 (12)

a qual ´e um equa¸c˜ao de Riccati que aplicando a transforma¸c˜ao b(t) ≡ −w(t)1 temos uma equa¸c˜ao diferencial linear de primeira ordem.

˙ w w2 − (2n − 1) λert 2 1 w2 − λ 2ert(n − 1)(P L− PF) 1 w = 0 ˙ w − λ2ert(n − 1)(PL− PF)w = (2n − 1) λert 2 . (13)

A solu¸c˜ao de (13) ´e dada por

w = e−λ2(n−1)(PL−PF)(ert−erT)/r  C + Z T t eλ2(n−1)(PL−PF)(erξ−erT)/r(2n − 1)λe rξ 2 dξ  .

Resolvendo a integral, temos

w = e−m  C + (2n − 1) (1 − e m) 2λ (n − 1) (PL− PF) 

onde m = λ2(n − 1) (PL− PF) ert− erT /r. Utilizando o fato que ψi(T ) = 0,

w(T ) = − 1 b(T ) = − 1 λPL+ ψi(T ) eλZ(T ) = − 1 λPL e m(T ) = 0, temos que C = w(T ) = −λP1 L. Logo, w = (2n − 1) PL(e m− 1) − 2 (n − 1) (P L− PF) em 2λPL(n − 1) (PL− PF) w = e m[(2n − 1) P L− 2 (n − 1) (PL− PF)] − (2n − 1) PL 2λPL(n − 1) (PL− PF) w = −(2n − 1) PL− [PL+ 2 (n − 1) PF] e m 2λPL(n − 1) (PL− PF) . Assim como b = 2λPL(n − 1) (PL− PF) (2n − 1) PL− [PL+ 2 (n − 1) PF] em . (14)

(28)

De (14) temos a estrat´egia da firma i, pois u∗i(t) = ert λPL+ ψieλZ = ertb u∗i(t) = 2λPL(n − 1) (PL− PF) e rt (2n − 1) PL− [PL+ 2 (n − 1) PF] em . (15)

Para obtermos a equa¸c˜ao da vari´avel de co-estado substitu´ımos (14) em ψi = e−λZ(b − λPL),

e com alguma ´algebra, temos

ψi =

λPL(em− 1) [PL+ 2 (n − 1) PF] e−λZ

(2n − 1) PL− [PL+ 2 (n − 1) PF] em

. (16)

No caso em que as firmas adotam estrat´egias markoviana perfeita a firma i adota uma estrat´egia com base no tempo e estoque de conhecimento, ui(t) = φF Bi (Z(t), t).

Entretanto, como ressaltado por Dockner et al. (2000) podemos supor que as firmas conhecem apenas uma fun¸c˜ao do estoque total de conhecimento, uj(t) = φF Bj (y(t), t)

(Dockner et al., 2000, p. 276). No caso temos, como sugerido por Dockner et al.(2000),

y(t) = exp ( −λ n X i=1 zi(t) ) . (17)

Logo, a firma i se depara com o seguinte problema de controle:

max ui∈ U Z T 0 y " λPLui(t) + λPF X j6=i uj(t) − e−rt 2 ui(t) 2 # dt (18) sujeito a y(t) = −λ˙ n X i=1 ui(t), y(0) = 1. A fun¸c˜ao Hamiltoniana Hi(t, Z, ui, ψi) = y " λPLui(t) + λPF X j6=i uj(t) − e−rt 2 ui(t) 2 # − ψi(t)λy " ui(t) + X j6=i uj(t) # ´

e concava em ui, portanto, aplicamos novamente o Princ´ıpio do M´aximo de Pontryagin

(29)

∂Hi ∂ui            > 0, ∀ ui ∈ [0, B] implica em u∗i = B = 0, ∀ ui ∈ (0, B) implica em u∗i(t) = λ (PL− ψi) ert < 0, ∀ ui ∈ [0, B] implica em u∗i = 0 (19) ˙ ψi = − ∂Hi ∂y ⇒ ˙ψi = − " λPLui+ λPF X j6=i uj − e−rt 2 u 2 i − ψiλ ui(t) + X j6=i uj(t) !# . (20)

Supondo simetria temos de (20),

˙ ψi = −  λPLui+ λPF(n − 1) ui− e−rt 2 u 2 i − ψiλnui  . (21)

Substituindo (19) e rearranjando termos

˙ ψi = ert 2 λ 2 (PL− ψi) [(2n − 1) ψi− PL− 2 (n − 1) PF] . (22) Adicionando e subtraindo (2n − 1)PL, ˙ ψi = ert 2 λ 2(P L− ψi) [(2n − 1) (ψi− PL) + (2n − 1) PL− PL− 2 (n − 1) PF] ˙ ψi = ert 2 λ 2(P L− ψi) [(2n − 1) (ψi− PL) + 2 (n − 1) (PL− PF)] . (23)

As equa¸c˜oes (19) e (23) sugerem que definamos b(t) = ψi − PL, o que implica que

˙ ψi(t) = ˙b(t). Logo, ˙b = −ert 2 λ 2(2n − 1) b2+ 2 (n − 1) (P L− PF) b  ˙b + ert 2 λ 2(2n − 1) b2+ ertλ2(n − 1)(P L− PF) b = 0. (24) Aplicando a transforma¸c˜ao b(t) = − 1 w(t) em (24)

(30)

w−2w +˙ e rt 2 λ 2(2n − 1) w−2− ertλ2(n − 1)(P L− PF) w−1 = 0 ˙ w − ertλ2(n − 1)(PL− PF) w + ert 2 λ 2(2n − 1) = 0. (25) A solu¸c˜ao de (25) ´e w = em  C + (2n − 1) 2 (n − 1) (PL− PF) e−m− 1  . (26) onde m = 1rλ2(n − 1)(P

L− PF) ert− erT. Observe que m(T ) = 0, e que a condi¸c˜ao

de transversalidade ψi(T ) = 0 implica em w(T ) = P1

L, pois ψi(T ) = PL+ b(T ). Assim

avaliando (26) em T temos que C = P1

L. Logo, w = em  1 PL + (2n − 1) 2 (n − 1) (PL− PF) e−m− 1  w = 2 (n − 1) (PL− PF) e m+ (2n − 1)P L(1 − em) 2PL(n − 1) (PL− PF) w = (2n − 1)PL− [ (2n − 1)PL− 2 (n − 1) PL+ 2 (n − 1) PF ] e m 2PL(n − 1) (PL− PF) w = (2n − 1)PL− [ PL+ 2 (n − 1) PF] e m 2PL(n − 1) (PL− PF) . Ent˜ao, b(t) = − 2PL(n − 1) (PL− PF) (2n − 1)PL− [ PL+ 2 (n − 1) PF ] em . (27)

Substituindo (27) em u(t) = −b(t)λert,

u∗(t) = 2λPL(n − 1) (PL− PF) e rt (2n − 1)PL− [ PL+ 2 (n − 1) PF ] em (28) onde m = 1rλ2(n − 1)(P L− PF) ert− erT.

Assim, as estrat´egias markoviana perfeita s˜ao degeneradas por n˜ao serem fun¸c˜ao da vari´avel de estado (Van Long,2010, p. 157). Al´em disso, as estrat´egias open-loop, (15), e

(31)

as estrat´egias markoviana perfeita, (28), s˜ao iguais, o que segundo Dockner et al. (2000) resulta do fato que as primeiras levam a um jogo exponencial e as ´ultimas a um jogo linear no estado4. (Dockner et al., 2000, p. 277)

Obtidas as estrat´egias das firmas, Reinganum(1982) analisa o comportamento dessas sob a varia¸c˜ao dos parˆametros e apresenta os seguintes corol´arios e proposi¸c˜oes.

Corol´ario 1. No caso de perfeita prote¸c˜ao com patente, PL= P e PF = 0, onde P

´e o valor da patente, as estrat´egias no equil´ıbrio de Nash da firma i, i ∈ {1, 2, , ..., n}, s˜ao

u∗i(t, z; P, 0) = 2λ (n − 1) P e

rt

2n − 1 − exp {P λ2(n − 1) (ert− erT) /r}.

(Reinganum, 1982, p. 679).

Sob prote¸c˜ao imperfeita de patente (PF > 0) temos a seguinte proposi¸c˜ao:

Proposic¸˜ao 1.1. Se PL> PF, ent˜ao o aumento no payoff pela inova¸c˜ao, PL, implica

em aumentos nos investimentos em inova¸c˜ao, ou seja, ∂u

∗ i

∂PL

> 0. Al´em disso, o aumento no payoff pela imita¸c˜ao implica em redu¸c˜ao dos investimentos em inova¸c˜ao, ou seja,

∂u∗i ∂PF

< 0. (Reinganum, 1982, p. 680)

Prova. Derivando (28) em rela¸c˜ao `a PL, temos pela regra do quociente 4

Um jogo linear no estado ocorre quando,

Ji= Z T 0 e−rtLi(x(t), u(t), t) dt + e−rTSi(x(T )) ˙ x = f (x(t), u(t), t)

onde x ´e a vari´avel de estado, u a vari´avel de controle, Li uma fun¸ao linear de x, e S

i um payoff em T . J´a um jogo exponencial ocorre quando,

Ji= Z T 0 e−rtLi(u(t), t) e−λix(t)dt ˙ x = f (u(t), t)

onde λi´e um vetor fixo em Rn. AssimDockner et al.(2000) ressalta que tomando yi= e−λix(t)podemos definir um jogo exponencial como,

Ji= Z T 0 e−rtLi(u(t), t) yi(t) dt ˙ yi= −yi(t)λif (u(t), t) o qual ´e um jodo linear no estado. (Dockner et al.,2000, p. 195)

(32)

∂u∗i ∂PL = 2λ(n − 1)e rt(2P L− PF) [(2n − 1)PL− [PL+ 2(n − 1)PF] em] [(2n − 1)PL− [PL− 2(n − 1)PF] em]2 − 2λ(n − 1)e rtP L(PL− PF)[PL+ 2(n − 1)PF] emλ2(n − 1)(ert− erT)/r  [(2n − 1)PL− [PL− 2(n − 1)PF] em] 2 − 2λ(n − 1)e rtP L(PL− PF)(2n − 1 − em) [(2n − 1)PL− [PL− 2(n − 1)PF] em] 2 .

Com alguma ´algebra ∂u∗i ∂PL = 2λ(n − 1)e rth(m) [(2n − 1)PL− [PL− 2(n − 1)PF] em]2 onde h(m) = (2n − 1)P2 L+ em[PL2(m − 1) + 2PLPF(n − 1)(m − 2) + 2(n − 1)PF2]. Logo sgn ∂u ∗ i ∂PL

= sgn h(m), portanto, devemos provar que h(m) > 0. Para tanto derivamos h(m) concluindo que ´e crescente em t ≤ T e avaliamos seu ponto m´ınimo como positivo.

Assim, h0(m) = emPL2(m − 1) + 2PLPF(n − 1)(m − 2) + 2(n − 1)PF2 + e mP2 L+ 2PLPF(n − 1)  h0(m) = emPL2m + 2PLPF(n − 1)m + 2(n − 1)PF(PF − PL) .

Se PL > PF, temos m ≤ 0 para t ≤ T , j´a que m = λ2(n − 1) (PL− PF) ert− erT /r,

e portanto, h0(m) < 0. Observe que m ´e decrescente em t, o que implica em h(m) crescente em t com ponto m´ınimo h(0).

h(0) = 2(n − 1)PL2− 4PLPF(n − 1) + 2PF2(n − 1)

h(0) = 2(n − 1) (PL− PF)2.

Logo h(m) > 0, e portanto, ∂u

∗ i ∂PL > 0 para todo t ≤ T . A prova de ∂u ∗ i ∂PF

< 0 utiliza o mesmo argumento. Inicialmente deriva-se (28) em rela¸c˜ao `a PF.

(33)

∂u∗i ∂PL = (−2)λPL(n − 1)e rt[(2n − 1)P L− [PL+ 2(n − 1)PF] em] [(2n − 1)PL− [PL− 2(n − 1)PF] em]2 − [2λPL(PL− PF)(n − 1)e rt](−2)(n − 1)em[P L+ 2(n − 1)PF] emλ2(n − 1)(ert− erT)/r  [(2n − 1)PL− [PL− 2(n − 1)PF] em] 2 .

Com alguma ´algebra ∂u∗i ∂PL

= 2λPL(n − 1)e

rtg(m)

[(2n − 1)PL− [PL− 2(n − 1)PF] em]2

onde g(m) = PL(2n−1−m)em−(2n−1)PL−2PF(n−1)mem. Logo sgn

∂u∗i ∂PL

= sgn g(m). Derivando g(m) em rela¸c˜ao a m

g0(m) = (−PL)em+ PL(2n − 1 − m)em− 2PF(n − 1)em+ −2PF(n − 1)mem

g0(m) = [2(n − 1)(PL− PF) − (PL+ 2(n − 1)PF)m] em.

Novamente, m ≤ 0 para t ≤ T e se PL> PF, ent˜ao h0(m) > 0, o que implica em g(m)

crescente em t com ponto m´ınimo g(0) = 0. Portanto, ∂u

∗ i

∂PL

> 0.



Ainda sob prote¸c˜ao imperfeita de patente temos o caso particular em que PL = PF,

cujos investimentos de equil´ıbrio diferem do caso determin´ıstico, no qual as firmas prefe-rem n˜ao investir. Tal fato ocorre uma vez que sob incerteza tecnol´ogica a probabilidade de nenhum jogador obter sucesso no per´ıodo ´e positiva, e portanto, a estrat´egia ´otima da firma ´e realizar investimentos em P&D. (Reinganum, 1982, p. 680)

Proposic¸˜ao 1.2. Sob incerteza tecnol´ogica e PF = PL as estrat´egias no equil´ıbrio s˜ao

u∗i(t, z; PF, PF) =

2PFλrert

2r − (2n − 1)PFλ2(ert− erT)

.

(Reinganum, 1982, p. 680).

(34)

u∗i(t, z; PF, PF) = lim PL→PF u∗i = lim PL→PF 2λPL(n − 1) (PL− PF) ert (2n − 1)PL− [ PL+ 2 (n − 1) PF] em .

Pela regra de l’Hopital

u∗i(t, z; PF, PF) = lim PL→PF 2λ (2PL− PF) (n − 1) ert 2n − 1 − em− [ P L+ 2 (n − 1) PF] em(n − 1)λ2(ert− erT) /r = 2PFλre rt 2r − (2n − 1)PFλ2(ert− erT) > 0, ∀ PF > 0.  Do corol´ario e proposi¸c˜oes acima temos,

Corol´ario 2. Se PL < P e PF ≥ 0, ent˜ao os investimentos em P&D ser˜ao maiores

sob perfeita prote¸c˜ao com patente do que quando h´a imperfeita prote¸c˜ao, ou seja,

u∗i(t, z; P, 0) > u∗i(t, z; PL, PF) para todo t ≤ T.

(Reinganum, 1982, p. 681).

Proposic¸˜ao 1.3. ”Se PL > 4PF(n − 1)e−1/2/2n − 1 − 2e−1/2, ent˜ao ∂u∗i/∂λ > 0

para todo t ≤ T ; caso contr´ario ∂u∗i/∂λ ≤ 0 para algum t; entretanto, ∂u∗i/∂λ > 0 perto t = T ” (Reinganum, 1982, p. 681).

Prova. Derivando (28) em rela¸c˜ao a λ, temos pela regra do quociente

∂u∗i ∂λ = 2PL(PL− PF)(n − 1)ert[(2n − 1)PL− [PL+ 2(n − 1)PF] em] [(2n − 1)PL− [PL+ 2(n − 1)PF] em] 2 +2λPL(PL− PF)(n − 1)e rt[P L+ 2(n − 1)PF] em(PL− PF)(n − 1)2λ(ert− erT)/r [(2n − 1)PL− [PL+ 2(n − 1)PF] em] 2 = 2PL(PL− PF)(n − 1)e rt[(2n − 1)P L− [PL+ 2(n − 1)PF] em+ [PL+ 2(n − 1)PF] em2m] [(2n − 1)PL− [PL+ 2(n − 1)PF] em] 2 = 2PL(PL− PF)(n − 1)e rt[(2n − 1)P L+ (2m − 1) [PL+ 2(n − 1)PF] em] [(2n − 1)PL− [PL+ 2(n − 1)PF] em] 2 .

(35)

Logo, sgn ∂u ∗ i ∂λ  = sgn ((2n − 1)PL+ (2m − 1) [PL+ 2(n − 1)PF] em) . Defina f (m) = (2n − 1)PL+ (2m − 1) [PL+ 2(n − 1)PF] em, ent˜ao ∂f ∂m = (2m + 1) [PL+ 2(n − 1)PF] e m ∂2f ∂m2 = (2m + 3) [PL+ 2(n − 1)PF] e m.

Logo m = −1/2 ´e ponto de m´ınimo, com m < 0 para todo t < T se PL > PF. Contudo,

se f (−1/2) > 0 ent˜ao f (m) ´e positivo para todo m, e consequentemente, ∂u∗i/∂λ < 0 para todo t ≤ T . Desse modo,

∂u∗i ∂λ < 0 ⇔ f (−1/2) > 0 ⇔ (2n − 1)PL− 2 [PL+ 2(n − 1)PF] e−1/2 > 0 ⇔ 2n − 1 − 2e−1/2 P L− 4(n − 1)PFe−1/2 > 0 ⇔ PL> 4PF(n − 1)e−1/2 [2n − 1 − 2e−1/2].

Entretanto, caso PL > PF mas PL ≤ 4PF(n − 1)e−1/2/2n − 1 − 2e−1/2



temos f (−1/2) ≤ 0, e portanto, ∂u∗i/∂λ ≥ 0.

J´a para a afirma¸c˜ao que ∂u∗i/∂λ > 0 perto t = T , basta avaliarmos f (0), pois m = 0 quando t = T . Logo,

f (0) = (2n − 1)PL− [PL+ 2(n − 1)PF] = 2(n − 1)(PL− PF) > 0, se PL> PF.

 Assim, Reinganum(1982) ressalta que no caso do ganho pela inova¸c˜ao ser suficiente-mente alto em rela¸c˜ao ao ganho pela imita¸c˜ao as firmas buscaram investir em projetos que em m´edia demandam menor n´ıvel de conhecimento, 1/λ. Contudo, caso PL n˜ao

seja suficientemente alto as firmas preferiram projetos que demandam em m´edia maior conhecimento. (Reinganum,1982, p. 681)

(36)

Proposic¸˜ao 1.4. ” ∂u∗i/∂T < 0 para todo t ≤ T ; a medida que o horizonte de

planejamento aumenta, as firmas distribuem seus esfor¸cos em P&D sobre o horizonte estendido” (Reinganum, 1982, p. 682).

Prova. Derivando (28) em rela¸c˜ao a T , temos pela regra do quociente

∂u∗i ∂T = − 2λPL(n − 1) (PL− PF) ert[PL+ 2 (n − 1) PF] em(n − 1) λ2(PL− PF) erT [(2n − 1)PL− [ PL+ 2 (n − 1) PF] em]2 = −2 (n − 1) 2 λ3P L(PL− PF)2er(t+T )[PL+ 2 (n − 1) PF] em [(2n − 1)PL− [ PL+ 2 (n − 1) PF ] em] 2 . Logo, sgn ∂u ∗ i ∂T  = sgn 2 (n − 1)2λ3PL(PL− PF)2er(t+T )[PL+ 2 (n − 1) PF] em < 0.  Proposic¸˜ao 1.5. Sob perfeita prote¸c˜ao de patente e n ≥ 2 temos que ∂u∗i/∂n > 0

para todo t ≤ T e ∂u∗i/∂n = 0 em t = T (Reinganum, 1982, p. 684).

Prova. Assim como Reinganum (1982) supomos n cont´ınuo e derivamos (1) em rela¸c˜ao a esse parˆametro para obter

∂u∗i ∂n = 2λP ert[2n − 1 − eα] − 2λ (n − 1) P ert2 − eαP λ2 ert− erT /r [2n − 1 − eα]2 = 2P λe rt[1 − (1 − α)eα] (2n − 1 − eα)2

onde α = P λ2(n − 1) ert− erT /r. Se g(α) = 1 − (1 − α)eα, ent˜ao sgn (∂u

i/∂n) =

sgn (g(α)). Mas, g0(α) = αeα < 0 para todo t ≤ T j´a que α < 0 para todo t ≤ T . Al´em

disso, min g(α) = g(0) = 0, portanto g(α) > 0 para todo t ≤ T e g(0) = 0 para t = T , o que implica em ∂u∗i/∂n > 0 para todo t ≤ T e ∂u∗i/∂n = 0 em t = T .

 Se supormos que a rivalidade ´e determinada pelo n´umero de firmas, e n˜ao pelo n´ıvel do comportamento competitivo entre essas, temos da proposi¸c˜ao acima que o aumento na rivalidade implica em maiores investimentos de cada firma. (Reinganum,1982, p. 684)

(37)

Observe entretanto que a conclus˜ao que ∂u∗i/∂n > 0 tem como pressuposto a perfeita prote¸c˜ao de patentes. Assim, caso haja imperfeita prote¸c˜ao de patente,Reinganum(1982) argumenta que os ganhos de inova¸c˜ao e imita¸c˜ao dependeram da estrutura de mercado, ou seja, PL= PL(n) e PF = PF(n), o que implica pela regra da cadeia

du∗i dn = ∂u∗i ∂n + ∂u∗i ∂PL dPL dn + ∂u∗i ∂PF dPF dn .

Contudo, sabemos que ∂u∗i/∂PL> 0 e ∂u∗i/∂PF ≤ 0. Mas esperamos que dPL/dn < 0

e dPF/dn < 0, sendo que ∂u∗i/∂n poderia n˜ao ter sinal definido. Assim, o sinal de du ∗ i/dn

´e amb´ıguo e necessita do mecanismo de determina¸c˜ao de PL(n) e PF(n) para que se elimine

a ambiguidade. (Reinganum, 1982, p. 684)

2. Modelo de Malueg e Tsutsui (1997)

Malueg and Tsutsui (1997) utilizam o modelo deReinganum(1982) sob uma aborda-gem bayesiana, e para tanto, pressup˜oem a existˆencia de incerteza em rela¸c˜ao a taxa de aquisi¸c˜ao de conhecimento, µ, como inicialmente proposto por Choi (1991). O fato da µ ser incerto implica que as firmas desconhecem o qu˜ao fact´ıvel ´e a inova¸c˜ao. Contudo, o ac´umulo de conhecimento relevante sem a ocorrˆencia de sucesso aumenta o pessimismo em rela¸c˜ao a dificuldade de inovar, e portanto, as firmas atribuem menor probabilidade ao sucesso. (Malueg and Tsutsui, 1997, p. 752)

A mudan¸ca das expectativas das firmas em rela¸c˜ao `a inova¸c˜ao ´e abordado pelos au-tores como um processo de aprendizado que ´e incorporado no modelo ao considerar a probabilidade de inova¸c˜ao, (2), como probabilidade condicional.

Malueg and Tsutsui (1997) apresentam o caso em que a inova¸c˜ao ´e infact´ıvel, U , ou seja, µ = 0, ou fact´ıvel, S, ou seja, µ = λ > 0, pressupondo que a probabilidade condicional de inova¸c˜ao dado o estoque de conhecimento ´e dada por F (zi(t) | U ) = 0 e

F (zi(t) | S) = 1 − e−λzi(t).

Assim a probabilidade de inova¸c˜ao no tempo t pela firma i ´e

Pr(ti ≤ t | U ) = F (zi(t) | U ) = 0 e Pr(ti ≤ t | S) = F (zi(t) | S) = 1 − e−λzi(t). (29)

Pressupondo independˆencia temos que a probabilidade condicional de que nenhuma firma obter sucesso no tempo t ´e

(38)

Pr(t1 > t, ... , tn > t | U ) = 1 Pr(t1 > t, ... , tn > t | S) = n Y i=1 Pr(ti > t | S) = exp n −λXzi(t) o .

Al´em disso, se as firmas possuem as mesmas cren¸cas sobre µ inicial com probabilidade a priori da inova¸c˜ao ser infact´ıvel, p0, temos a probabilidade n˜ao condicional de nenhuma

firma ter obtido sucesso no tempo t

Pr(t1 > t, ... , tn> t) = p0+ (1 − p0)e−λP zi(t). (30)

J´a a probabilidade n˜ao condicional da firma i obter sucesso no tempo t ´e

Pr(ti = t, tj > t, j 6= i) = p0Pr(ti = t, tj > t, j 6= i | U ) + (1 − p0)Pr(ti = t, tj > t, j 6= i | S) Pr(ti = t, tj > t, j 6= i) = p0Pr(ti = t | U )Pr(tj > t, j 6= i | U ) + (1 − p0)Pr(ti = t | S)Pr(tj > t, j 6= i | S) Pr(ti = t, tj > t, j 6= i) = (1 − p0) dF (zi(t) | S) dt n Y j6=i [1 − F (zj(t) | S)] Pr(ti = t, tj > t, j 6= i) = (1 − p0)λ ˙zi(t) exp {−λzi(t)} exp ( −λ n X j6=i zj(t) ) . Mas ˙zi(t) = ui(t, Z), logo Pr(ti = t, tj > t, j 6= i) = (1 − p0)λ uiexp n −λXzi o . (31)

Contudo, pela Regra de Bayes a probabilidade da inova¸c˜ao ser infact´ıvel dado que nenhuma firma obteve sucesso no tempo t, p(t), ´e

(39)

p(t) = Pr(U | t1 > t, ... , tn > t) = p0 p0+ (1 − p0)e−λP zi(t) . (32) Portanto, p0+ (1 − p0)e−λP zi(t) = p0 p(t) (33) e (1 − p0)e−λP zi(t) = p0(1 − p(t)) p(t) , (34)

Substituindo (33) em (30) e (34) em (31) temos, respectivamente,

Pr(t1 > t, ... , tn > t) = p0 p(t) (35) e Pr(ti = t, tj > t, j 6= i) = p0(1 − p(t)) p(t) λ ui. (36)

Uma vez obtido a probabilidade de sucesso das firmas, (36), e a probabilidade de nenhuma firma inovar, (35), e dado um vetor de estrat´egias de investimento em P&D, o payoff instantˆaneo esperado da firma i no tempo t a valor presente ´e

e−rt{Pr(ti = t, tj > t, j 6= i) π − Pr(t1 > t, ... , tn> t)c(ui)}

= e−rt p0

p(t)((1 − p(t))λ uiπ − c(ui)) (37)

onde π ´e o ganho pelo sucesso e c(ui) ´e o custo instantˆaneo incorrido no processo inovativo.

AssimMalueg and Tsutsui(1997), diferentemente deReinganum(1982), n˜ao abordam ganhos com imita¸c˜ao e sup˜oem a seguinte fun¸c˜ao de custo

c(ui) =      f + u2i 2 , se ui > 0 0, , se ui = 0

(40)

Logo, integrando (37) em rela¸c˜ao ao tempo temos que o payoff esperado pela firma i a valor presente ´e Ji = Z Ti 0 e−rt p0 p(t)  (1 − p(t)) λ π ui− f − u2 i 2  dt (38)

onde Ti ´e a data em que a firma i abandona a corrida se nenhuma firma ainda tiver obtido

sucesso.

Malueg and Tsutsui (1997) argumentam que a fun¸c˜ao de payoff dos jogadores, (38), sugere que p(t) seja tomada como vari´avel de estado, o que ´e corroborado se resolvermos (32) para Z. (Malueg and Tsutsui,1997, p. 755)

Z(t) = 1 λ ln  (1 − p0) p0 p(t) (1 − p(t))  .

Assim, Malueg and Tsutsui (1997) pressup˜oem a ado¸c˜ao pelas firmas de estrat´egias markoviana perfeita, ui(t) = φF Bi (p(t), t), j´a que os investimentos em P&D s˜ao fun¸c˜ao do

tempo e do pessimismo das firmas descrito pela probabilidade da inova¸c˜ao ser infact´ıvel. A mudan¸ca de vari´avel de estado entretanto implica que devemos definir a equa¸c˜ao de movimento ˙p para que o problema de otimiza¸c˜ao das firmas esteja completamente definido. Para tanto, a evolu¸c˜ao do pessimismo das firmas no tempo t pode ser obtida ao derivarmos (32), ˙ p(t) = p0(1 − p0)λ (P ˙zi(t)) e −λP zi(t) [p0+ (1 − p0)e−λP zi(t)] 2 . (39) Substituindo (33), ˙ p(t) = p(t) 2(1 − p 0)λ (P ˙zi(t)) e−λP zi(t) p0 . (40) Substituindo (34), ˙ p(t) = p(t) 2 p0 p0(1 − p(t)) p(t) λ X ˙zi(t).

Simplificando e utilizando novamente o fato de ˙zi(t) = ui(t, Z),

˙

(41)

Observe que (41) nos diz que a medida em que a corrida continua sem a ocorrˆencia de inova¸c˜ao as firmas se tornam progressivamente mais pessimistas quanto a factibilidade do projeto. Isto ocorre pelo fato que enquanto houver incerteza em rela¸c˜ao a µ haver´a investimentos em P&D,P ui > 0, e portanto, ˙p > 0. (Malueg and Tsutsui, 1997, p. 754)

Logo, o problema de otimiza¸c˜ao da firma i ´e:

Vi(t, p) = max Ti, ui Z Ti t e−rs p0 p(s) (1 − p(s)) λ π ui(s, p(s)) − f − (ui(s, p(s)))2 2 ! ds sujeito a p(s) = λ p(s)(1 − p(s))˙ Xui(s, p(s)), p(t) = p (42)

onde Vi(t, p) ´e a fun¸c˜ao de valor da firma i. Para resolvermos este problema de controle utilizamos a equa¸c˜ao de Hamilton-Jacobi-Bellman5.

rVi− Vi t = maxu i ( p0 p  (1 − p) λ π ui− f − u2 i 2  + Vpiλ p (1 − p) ui+ X j6=i ¯ uj !) (43)

onde ¯u s˜ao as estrat´egias de investimento em P&D das demais firmas dadas como fixas, Vi

t = ∂Vi/∂t e Vpi = ∂Vi/∂p .

Observe que (43) ´e concava em ui, portanto, ´e condi¸c˜ao n˜ao somente necess´aria mas

tamb´em suficiente para ´otimo. Assim a condi¸c˜ao de primeira ordem para ´otimo de (43) nos d´a, p0 p λ (1 − p) π − p0 p u ∗ i + V i p λ (1 − p) = 0 e u∗i = λ (1 − p)  π + p p0 Vpi  . (44)

Malueg and Tsutsui(1997) afirma que a equa¸c˜ao (44) implica que os investimentos em P&D dependem apenas do estado corrente das expectativas de factibilidade da inova¸c˜ao, p, e desse modo o momento quem que as firmas abandonam a corrida ser´a determinado endogenamente pelas expectativas terminais. (Malueg and Tsutsui, 1997, p. 756)

Supondo que a solu¸c˜ao de (43) pertence a seguinte classe de fun¸c˜oes

(42)

Vi(t, p) = p0 p v(p)

onde v(p) ´e uma fun¸c˜ao de valor condicional que descreve o valor esperado da firma i no ´

otimo dado que a inova¸c˜ao ainda n˜ao ocorreu, portanto v(p) ≥ 0. (Malueg and Tsutsui,

1997, p. 756) Desse modo, Vpi = p0  v0p − v p2  . (45)

Logo a equa¸c˜ao de Hamilton-Jacobi-Bellman, (43), ´e

p0 p rv = p0 p (1 − p) λ π u ∗ i − f − (u∗i)2 2 ! +p0 p (v 0 p − v) λ (1 − p) ui+ X j6=i ¯ uj ! .

Supondo simetria entre as firmas

rv = (1 − p) λ π u∗i − f − (u ∗ i) 2 2 + (v 0 p − v) λ (1 − p) n u∗i. (46) Substituindo (45) em (44), temos u∗i = λ (1 − p) (π + v0p − v) . (47)

Agora, substituindo (47) em (46) temos que o equil´ıbrio deve satisfazer a seguinte equa¸c˜ao diferencial

2rv = λ2(1 − p)2(π + v0p − v) (π + (2n − 1)v0p − (2n − 1)v) − 2f. (48)

Assim como Malueg and Tsutsui (1997), analisamos as propriedades das solu¸c˜ao de (48) para posteriormente obtermos a solu¸c˜ao numericamente. Inicialmente definimos a curva C0 no plano (p, v) onde v0 = 0, demonstramos que C0 ´e decrescente, e por fim que

v(p) ´e positiva em 0 ≤ p < ¯p e limitada superiormente por C0.

(43)

2rv = λ2(1 − p)2(π − v) (π − (2n − 1)v) − 2f λ2(1 − p)2(2n − 1)v2− 2 λ2(1 − p)2nπ + r v + λ2(1 − p)2π2− 2f = 0. Assim, v = nπλ 2(1 − p)2+ r (2n − 1)λ2(1 − p)2 ± pπ 2λ4(1 − p)4(n − 1)2+ 2nrπλ2(1 − p)2+ r2+ 2f (2n − 1)λ2(1 − p)2 (2n − 1)λ2(1 − p)2 . (49)

Entretanto, como ressalta Malueg and Tsutsui (1997), apenas uma das ra´ızes tem sentido econˆomico, para demonstrarmos tal fato substitu´ımos (49) em (47) dado que v0 = 0 e verificamos se ui ≥ 0, u∗i = λ(1 − p) π −r + nπλ 2(1 − p)2± (2n − 1)λ2(1 − p)2 ! onde ∆ = π2λ4(1 − p)4(n − 1)2+ 2nrπλ2(1 − p)2 + r2+ 2f (2n − 1)λ2(1 − p)2. (Malueg and Tsutsui, 1997, p. 756) Logo, u∗i = π(n − 1)λ 2(1 − p)2− r ± (2n − 1)λ2(1 − p)2 . Portanto, sgn (u∗i) = sgn π(n − 1)λ 2(1 − p)2− r ± (2n − 1)λ2(1 − p)2 ! = sgnπ(n − 1)λ2(1 − p)2− r ±√∆. Implicando em π(n − 1)λ2(1 − p)2− r −pπ2λ4(1 − p)4(n − 1)2+ 2nrπλ2(1 − p)2+ r2+ 2f (2n − 1)λ2(1 − p)2 ≥ 0. (50)

(44)

ou

π(n − 1)λ2(1 − p)2− r

+pπ2λ4(1 − p)4(n − 1)2 + 2nrπλ2(1 − p)2+ r2+ 2f (2n − 1)λ2(1 − p)2 ≥ 0.

(51)

Resolvendo as inequa¸c˜oes temos de (50) que 2rπ(n − 1) + f (2n − 1) ≤ 0, o que absurdo j´a que π, r e f s˜ao n˜ao negativos, e de (51) temos 2rπ(n − 1) + f (2n − 1) ≥ 0 o que ´e sempre verdadeiro. Assim,

v = nπλ 2(1 − p)2+ r (2n − 1)λ2(1 − p)2 − pπ 2λ4(1 − p)4(n − 1)2+ 2nrπλ2(1 − p)2 + r2+ 2f (2n − 1)λ2(1 − p)2 (2n − 1)λ2(1 − p)2 ≡ g0(p). (52)

Agora provamos que C0 ´e decrescente em p, e para tanto derivamos (52) em rela¸c˜ao a

p, e com alguma ´algebra temos

∂g0 ∂p = 2r√A − r  − 2λ2(1 − p)2(nrπ + (2n − 1)f ) √ A(2n − 1)λ2(1 − p)3 . onde A = (n − 1)2π2λ4(1 − p)4+ 2nrπλ2(1 − p)2+ r2+ 2f (2n − 1)λ2(1 − p)2. Mas, sgn ∂g0 ∂p  = sgn2r√A − r− 2λ2(1 − p)2(nrπ + (2n − 1)f ).

Se ∂g0/∂p < 0, ent˜ao com mais alguma ´algebra temos a seguinte inequa¸c˜ao,

(2n − 1)2f2+ 2nrπ(2n − 1)f + (2n − 1)π2r2 > 0.

Observe que a inequa¸c˜ao ´e sempre verdadeira, pois temos uma par´abola convexa com m´ınimo (2n − 1)π2r2 > 0. Entretanto, se supormos ∂g

0/∂p ≥ 0 temos a seguinte

ine-qua¸c˜ao,

(45)

a qual, pelo argumentado anteriormente, ´e falsa para todo o dom´ınio de f , e portanto, conclu´ımos que ∂g0/∂p < 0.

Al´em de termos que C0 ´e estritamente decrescente, temos a interse¸c˜ao com os eixos

nos pontos (0, v0(n, f )) e (¯p, 0), pois,

g0(0) = r + nλ2π −pr2+ 2nrλ2π + (n − 1)2λ4π2+ 2(2n − 1)λ2f (2n − 1)λ2 ≡ v0(n, f ) e g0(¯p) = 0 ⇒ 0 = nπλ2(1 − p)2+ r (2n − 1)λ2(1 − p)2 − pπ 2λ4(1 − p)4(n − 1)2+ 2nrπλ2(1 − p)2 + r2+ 2f (2n − 1)λ2(1 − p)2 (2n − 1)λ2(1 − p)2 ⇒ ¯p = 1 − √ 2f πλ . (53)

De (53) temos que f < λ2π2/2, pois caso contr´ario teremos ¯p ≤ 0 implicando que as

firmas n˜ao investem. (Malueg and Tsutsui,1997, p. 757) Agora, temos de (48) a seguinte equa¸c˜ao de segundo grau,

λ2(1 − p)2p2(2n − 1) (v0)2+ λ2(1 − p)22p(nπ − (2n − 1)v) v0

+λ2(1 − p)2(2n − 1)v2− λ2(1 − p)22πnv − 2rv + λ2(1 − p)2π2− 2f = 0.

(54)

Resolvendo para v0 temos

v0 = (−λ)(1 − p)(nπ − (2n − 1)v) ±p(n − 1)

2λ2(1 − p)2π2+ 2(2n − 1)(f + rv)

(2n − 1)λ(1 − p)p .

Entretanto, novamente substituindo (2) em (47)

u∗i = λ(1 − p)π(n − 1) ±p(n − 1)

2λ2(1 − p)2π2+ 2(2n − 1)(f + rv)

2n − 1 .

(46)

sgn (u∗i) = sgn λ(1 − p)π(n − 1) ±p(n − 1) 2λ2(1 − p)2π2+ 2(2n − 1)(f + rv) 2n − 1 ! = sgn  λ(1 − p)π(n − 1) ±p(n − 1)2λ2(1 − p)2π2+ 2(2n − 1)(f + rv). Contudo, ui ≥ 0, logo λ(1 − p)π(n − 1) −p(n − 1)2λ2(1 − p)2π2+ 2(2n − 1)(f + rv) ≥ 0 (55) ou λ(1 − p)π(n − 1) +p(n − 1)2λ2(1 − p)2π2 + 2(2n − 1)(f + rv) ≥ 0. (56)

De (55) temos que f ≤ −rv, o que absurdo j´a que v, r e f s˜ao n˜ao negativos. J´a de (56) temos f ≥ rv o que ´e sempre verdadeiro.

Portanto conclu´ımos que a ´unica ra´ız de (54) ´e

v0 = (−λ)(1 − p)(nπ − (2n − 1)v) +p(n − 1)

2λ2(1 − p)2π2 + 2(2n − 1)(f + rv)

(2n − 1)λ(1 − p)p . (57)

Utilizando a regra l’Hopital temos que v0 → −∞ quando p → 0, al´em disso Malueg and Tsutsui (1997) observa que (0, v0(n, f )) ´e um n´o, e portanto temos v´arias solu¸c˜oes

de (57) partindo de (0, v0(n, f )) que pelo menos inicialmente mantem-se abaixo de C0.

Entretanto, de (57) temos as solu¸c˜oes que ultrapassam C0 tendem a infinito quando p

tende a 1, o que ´e absurdo j´a que v(p) ≤ π. (Malueg and Tsutsui,1997, p. 757) Do acima exposto tem-se a seguinte proposi¸c˜ao.

Proposic¸˜ao 2.1. ”O equil´ıbrio da fun¸c˜ao de valor condicional v(p) ´e estritamente positivo e estritamente decrescente para 0 ≤ p < ¯p ≡ 1 −√2f /(λπ), com v(0) = v0(n, f )

e limp ↑ ¯pv(p) = 0. Al´em disso, v(p) = 0 para ¯p ≤ p ≤ 1” (Malueg and Tsutsui, 1997,

p. 757).

Al´em disso temos,

(47)

Figura 1. Fun¸c˜ao de Valor Condicional

Fonte: (Malueg and Tsutsui,1997, p. 757)

(1) ∂v(p) ∂n < 0; (2) ∂v(p) ∂r < 0; (3) ∂v(p) ∂π > 0; (4) ∂v(p) ∂λ > 0”

(Malueg and Tsutsui, 1997, p. 758). Prova. Ver apˆendice A de Malueg and Tsutsui(1997). 

Malueg and Tsutsui (1997) argumentam que a proposi¸c˜ao 2.2 possui resultados in-tuitivos uma vez que o valor em estar na corrida por P&D aumenta com a redu¸c˜ao da concorrˆencia, representado pelo n´umero de jogadores, n; com a redu¸c˜ao da taxa de des-conto r que aumenta o valor presente do ganho; com o aumento do ganho pela inova¸c˜ao, π; e com o aumento da velocidade em que o ganho poderia ser obtido, λ. (Malueg and Tsutsui, 1997, p. 758)

Proposic¸˜ao 2.3. ”A estrat´egia markoviana perfeita de equil´ıbrio, u∗i, ´e uma fun¸c˜ao

estritamente decrescente em p para todo p < ¯p. Para todo p > ¯p, u∗i = 0. Portanto, os investimentos em P&D de equil´ıbrio decrescem ao longo do tempo e limp ↑ ¯pu∗i(p) =

√ 2f ” (Malueg and Tsutsui, 1997, p. 758).

Prova. Substituindo (57) em (47) temos

u∗i = λπ(n − 1)(1 − p) +p(n − 1)

2λ2(1 − p)2π2+ 2(2n − 1)(f + rv)

(48)

Derivando (58) em rela¸c˜ao a p ∂u∗i ∂p = (2n − 1)rv0− (n − 1)2λ2π2(1 − p) (2n − 1)p(n − 1)2λ2(1 − p)2π2+ 2(2n − 1)(f + rv) − λπ(n − 1) 2n − 1 .

Como v0 < 0 para todo p < ¯p, temos que ∂u∗/∂p < 0 para todo p < ¯p. Para o caso em que p → ¯p basta tomarmos o limite de (58)

lim p ↑ ¯pu ∗ i(p) = (n − 1)√2f +p2f(n − 1)2+ 2f (2n − 1) 2n − 1 = p 2f . 

As proposi¸c˜oes 2.1 e 2.3 implicam que se f = 0, ent˜ao ¯p = 1 e u∗i > 0 para p < ¯p, ou seja, se as firmas n˜ao possuem um fluxo de custo fixo essas ir˜ao permanecer na corrida por P&D investindo de forma decrescente at´e que a inova¸c˜ao ocorra ou seja considerada com imposs´ıvel. (Malueg and Tsutsui, 1997, p. 758)

Quanto a an´alise de est´atica comparativa de u∗i, temos a seguinte proposi¸c˜ao. Proposic¸˜ao 2.4. ”Para 0 ≤ p < ¯p: (1) ∂u ∗ i(p) ∂π > 0; (2) ∂u ∗ i(p) ∂λ > 0”

(Malueg and Tsutsui, 1997, p. 759). Prova. Derivando (47) ∂u∗i(p) ∂π = π(n − 1)2λ2(1 − p)2 (2n − 1)p(n − 1)2λ2(1 − p)2π2+ 2(2n − 1)(f + rv) + λ(n − 1)(1 − p) 2n − 1 > 0 ∂u∗i(p) ∂λ = λ(n − 1)2(1 − p)2π2 (2n − 1)p(n − 1)2λ2(1 − p)2π2+ 2(2n − 1)(f + rv) + π(n − 1)(1 − p) 2n − 1 > 0  A proposi¸c˜ao 2.4 entretanto apenas nos diz sobre o comportamento das estrat´egias ´

otimas para π e λ, pois, ao desconhecermos v analiticamente e nada podemos dizer sobre n, f e r atrav´es de ∂u∗i(p)/∂n, ∂u∗i(p)/∂f ou ∂u∗i(p)/∂r. Tal fato, a princ´ıpio, restringe a capacidade do modelo em responder como a corrida por P&D ´e impactada pela estrutura

(49)

Figura 2. Impacto da Concorrˆencia nos Investimentos em P&D

Fonte: (Malueg and Tsutsui,1997, p. 760)

de mercado, entretanto, Malueg and Tsutsui (1997) prop˜oe a compara¸c˜ao de solu¸c˜oes num´ericas para analisarmos tais vari´aveis. Infelizmente, os autores n˜ao especificam o m´etodo num´erico utilizado apenas se referem a simula¸c˜oes num´ericas.

O primeiro resultado obtido pelos autores foi que o aumento de n ´e acompanhado pelo aumento de investimento em P&D para cada cren¸ca de p, e consequentemente, h´a o acumulo mais acelerado de conhecimento provocando a redu¸c˜ao do tempo da corrida. Cabe ressaltar, entretanto, que o fim da corrida ´e antecipado uma vez que ¯p ´e atingido mais rapidamente, e n˜ao pela altera¸c˜ao da distribui¸c˜ao probabilidade de inova¸c˜ao, (29), a qual n˜ao depende da estrutura de mercado6. (Malueg and Tsutsui,1997, p. 760)

Malueg and Tsutsui(1997) ressaltam que o aumento dos investimentos como fun¸c˜ao de p implica que as trajet´orias para diferentes n´umeros de firmas se cruzam. Tal fato ocorre uma vez que no modelo o pessimismo, ou cren¸ca na n˜ao factibilidade do projeto, ´e endoge-namente determinado pelos investimentos em P&D atrav´es de ˙p, (41), e ao mesmo tempo o investimento ´otimo, u∗i, ´e fun¸c˜ao da vari´avel de estado p, (47). Assim o aumento inicial dos investimentos causado pelo aumento da concorrˆencia implica, no primeiro momento, uma maior taxa de varia¸c˜ao de p, e consequentemente uma maior queda dos investimentos posteriores, provocando que as trajet´orias de investimentos se cruzem.

6Observe que o aumento de ˙p aumenta a probabilidade ex ante de inova¸ao, 1 − p

0/p(t), at´e o limite de 1 − p0/¯p = (λπ(1 − p0) −

(50)

Figura 3. Impacto da Concorrˆencia na Evolu¸c˜ao do Pessimismo as Firmas

Fonte: (Malueg and Tsutsui,1997, p. 761)

Figura 4. Impacto de da Concorrˆencia na Trajet´oria dos Investimentos em P&D

Fonte: (Malueg and Tsutsui,1997, p. 761)

Quanto ao aumento de r os resultados obtidos pelos autores foram que h´a est´ımulo para o aumento dos investimentos em P&D como fun¸c˜ao de p. Portanto, o estoque de conhecimento cresce a uma maior taxa e p se aproxima de ¯p mais rapidamente. Assim, as trajet´orias de investimento para diferentes taxas de desconto se cruzam como ocorrido como o aumento de n. (Malueg and Tsutsui, 1997, p. 760)

(51)

Figura 5. Impacto de f nos Investimentos em P&D

Fonte: (Malueg and Tsutsui,1997, p. 762)

Por fim, um aumento em f amplia o custo de permanˆencia das firmas na corrida, e portanto, essas buscaram reduzir o tempo de corrida tanto aumentando seus investimentos em P&D quanto reduzindo o n´ıvel de pessimismo necess´ario para abandono da corrida, ¯

p. (Malueg and Tsutsui,1997, p. 761)

Malueg and Tsutsui (1997) tamb´em observam que para o caso de as firmas n˜ao possu´ırem um fluxo de custo fixo, f = 0, e taxa de desconto, r = 0, podemos obter a solu¸c˜ao exata do jogo diferencial. Para tanto, avaliamos (58) em f = 0 e r = 0 obtendo

(52)

u∗i(p) = 2(n − 1)λπ(1 − p)

2n − 1 . (59)

Figura 6. Investimentos em P&D com f=0 e r=0

Fonte: (Malueg and Tsutsui,1997, p. 764)

Da mesma forma temos de (41)

v0(p) = (2n − 1)v − π (2n − 1)p

a qual nos d´a

v(p) = π(1 − p) 2n − 1 .

Agora, substituindo (59) em (41) temos

˙

p(t) = 2n(n − 1)λ

2πp(1 − p)2

2n − 1 .

(53)

1 1 − p(t)+ ln  p(t) 1 − p(t)  = 2n(n − 1)πλ 2 2n − 1 t + 1 1 − p0 + ln  p0 1 − p0  . (60)

(54)
(55)

Solu¸

oes Num´

ericas para o modelo de Reinganum (1982)

Para obtermos as solu¸c˜oes num´ericas para o modelo de Reinganum (1982) primeira-mente identificamos o problema de valor de contorno que nos d´a a solu¸c˜ao para cada tipo de equil´ıbrio. No OLNE com firmas sim´etricas o problema de controle ´otimo, (6), nos d´a pelo Princ´ıpio de M´aximo de Pontryagin as equa¸c˜oes (7) e (9). Ent˜ao temos,

˙ Z = nui ˙ ψi = λe−λZ  λ [PL+ (n − 1)PF] ui− e−rt 2 u 2 i  ui = ert λPL+ ψieλZ  Z(0) = 0, ψi(T ) = 0.

Substituindo (7) nas demais equa¸c˜oes identificamos o seguinte problema de valor de contorno: ˙ Z = nert λPL+ ψieλZ  ˙ ψi = λert 2 λPLe −λZ + ψi  2λ(n − 1)PF + λPL− ψieλZ  (PVC 1) Z(0) = 0, ψi(T ) = 0.

Alternativamente, podemos resolver (7) para a vari´avel de coestado,

ψi = e−λZ uie−rt− λPL . (61)

Derivar (7) em rela¸c˜ao ao tempo

˙

ui = rert λPL+ ψie−λZ + ert ˙ψieλZ + ψiλeλZZ˙



. (62)

(56)

Substituir (9) e (61) em (62) para obtermos

˙u =λ2[PL+ (n − 1)PF] ert+ r ui−

λu2i

2 + λ ˙Z ui− λPLe

rt .

Assim, temos o seguinte problema de valor de contorno,

˙ Z = nui ˙ ui =λ2[PL+ (n − 1)PF] ert+ r ui− λu2 i 2 + λ ˙Z ui− λPLe rt Z(0) = 0, ui(T ) = λPLerT Substituindo ˙Z = nui temos, ˙ Z = nui ˙ ui =(n − 1)λ2(PF − PL)ert+ r ui+ (2n − 1) λu2 i 2 (PVC 2) Z(0) = 0, ui(T ) = λPLerT

Observe que no PVC 2 a equa¸c˜ao de ˙ui n˜ao ´e fun¸c˜ao de Z, ˙Z = nui e Z(0) = 0,

portanto, ˙ui e ui(T ) determinam a solu¸c˜ao do sistema.

J´a para o MPNE temos as seguintes equa¸c˜oes de (18), (19) e (21)

˙ y = −y λ n ui ˙ ψi = e−rt 2 u 2 i − λ [PF(n − 1) + PL− nψi] ui ui = λ (PL− ψi) ert y(0) = 1; ψi(T ) = 0

(57)

˙ y = −y n λ2(PL− ψi) ert ˙ ψi = ert 2 λ 2(P L− ψi) [(2n − 1) ψi− PL− 2 (n − 1) PF] (PVC 3) y(0) = 1; ψi(T ) = 0

Novamente, observe que ˙ψi e ψi(T ) determinam a solu¸c˜ao do PVC 3, j´a que ˙ψi n˜ao ´e

fun¸c˜ao de y, ˙y ´e fun¸c˜ao ψ e y(0) ´e dado.

Alternativamente, poder´ıamos resolver (18) para a vari´avel de coestado, o que nos d´a

ψi = PL−

e−rt

λ ui. (63)

Derivar (18) em rela¸c˜ao ao tempo,

˙

ui = λrert(PL− ψi) − λertψ˙i.

Substituir (63) e (21) nesta ´ultima equa¸c˜ao para obtermos

˙

ui =(n − 1)λ2(PF − PL)ert+ r ui+ (2n − 1)

λu2i 2 Assim, podemos escrever

˙ y = −y λ n ui ˙ ui =(n − 1)λ2(PF − PL)ert+ r ui+ (2n − 1) λu2 i 2 (64) y(0) = 1; ψi(T ) = 0

que ´e equivalente ao PVC 2, pois, resolvendo y(t) = e−λZ para Z temos

Z(t) = −1

λln(y(t)). (65)

(58)

˙ Z = −1 λ ˙ y y = − 1 λ (−λ) y n ui y = nui. Logo (64) equivale ao PVC 2.

At´e ent˜ao identificamos trˆes problemas de valor de contorno, sendo que PVC 1 e PVC 2 nos d˜ao a solu¸c˜ao do ONLE, e os PVC 2 e PVC 3 a solu¸c˜ao do MPNE. Uma vez que as solu¸c˜oes num´ericas s˜ao muitas vezes sens´ıveis a combina¸c˜ao do m´etodo num´erico e a forma funcional que se quer aproximar, ´e relevante a compara¸c˜ao da solu¸c˜oes abordando os diferentes problemas de valor de contorno acima.

Para encontrarmos as solu¸c˜oes num´ericas, inicialmente, escrevemos em Python1o pro-blema de valor de contorno, que para o PVC 1 pode ser codificado como:

f r o m sympy i m p o r t * i m p o r t sympy a s sp f r o m numpy i m p o r t l i n s p a c e , z e r o s , exp ### P a r a m e t r o s d o M o d e l o ### T = 1 . 0 # M o m e n t o d o f i m d a c o r r i d a lamb = 0 . 0 0 1 # P a r a m e t r o l a m b d a r = 0 . 0 1 # T a x a d e d e s c o n t o P L = 10 # G a n h o d a i n o v a c a o P F = 9 # G a n h o d e i m i t a c a o n = 2 # N u m e r o d e f i r m a s e p s = 1E=17 # E r r o a c e i t a v e l ### P r o b l e m a d e V a l o r d e C o n t o r n o ### BC = [ 0 , 0 ] # C o n d i c o e s d e c o n t o r n o # Em s y m p y z = symbols ( ’ z ’ ) p s i = symbols ( ’ p s i ’ ) t = symbols ( ’ t ’ )

d z d t = n*sp . exp ( r*t )*( lamb*P L + p s i*sp . exp ( lamb*z ) )

d p s i d t = 0 . 5*lamb*sp . exp ( r*t )*( lamb*P L*sp . exp (=lamb*z)+ p s i )* \

( 2 .*lamb*( n=1)*P F+lamb*P L=p s i*sp . exp ( lamb*z ) )

# Em n u m p y

(59)

n p d z d t = l a m b d i f y ( ( z , p s i , t ) , d z d t ) n p d p s i d t = l a m b d i f y ( ( z , p s i , t ) , d p s i d t ) d e f f ( u , t ) : z , p s i = u ode1 = n p d z d t ( z , p s i , t ) ode2 = n p d p s i d t ( z , p s i , t ) r e t u r n [ ode1 , ode2 ]

Observe que definimos as equa¸c˜oes diferenciais em sympy, pois, mais a frente ao resol-vermos por coloca¸c˜ao utilizamos o m´etodo de Newton, e portanto, a computa¸c˜ao alg´ebrica dispon´ıvel reduz significativamente o trabalho necess´ario para definirmos a matriz jacobi-ana do sistema de equa¸c˜oes n˜ao lineares2. Al´em disso, quando demanda as equa¸c˜oes em numpy como mo m´etodo de shooting podemos facilmente obtˆe-las utilizando o comando lambdify.

Tamb´em escrevemos as equa¸c˜oes (7) e (28):

# u n u m e r i c o d e f u ( z , p s i , t ) :

r e t u r n exp ( r*t )*( lamb*P L+p s i*exp ( lamb*z ) )

# s o l u c a o a l g e b r i c a d e f u s o l u t i o n ( t ) :

m = ( 1 . / r )*( P L=P F )*( n=1 )*( lamb* *2 )*( exp ( r*t )=exp ( r*T) ) b = 2*lamb*P L*( P L=P F )*( n=1)*exp ( r*t )

c = ( 2*n=1)*P L = ( P L +2*(n=1)*P F )*exp (m)

r e t u r n b/ c

Posteriormente, definimos fun¸c˜oes que resolvem numericamente tais problemas pelos m´etodos de shooting e coloca¸c˜ao, e nos retornam a solu¸c˜ao. O m´etodo de shooting consiste em um algoritmo de duas camadas combinando de m´etodos para problemas de valor inicial e m´etodos para encontrar raiz de equa¸c˜oes n˜ao lineares (Judd, 1998, p. 351). Assim, escrevemos as fun¸c˜oes que aplicam m´etodos para problemas de valor inicial, o m´etodo da

2Maiores detalhes sobre os m´etodos num´ericos abordados podem ser encontrados noApˆendice - M´etodos Num´ericose emBurden et al.(2016),Judd(1998),Linge and Langtangen(2016) eMiranda and Fackler (2004).

Referências

Documentos relacionados

Temos assim em Renata a figura de uma verdadeira artista, que não consegue viver longe da sua arte, isso aloca o romance O quarto fechado 2004 na categoria de um Künstlerroman

Para aprofundar a compreensão de como as mulheres empreendedoras do município de Coxixola-PB adquirem sucesso em seus negócios, aplicou-se uma metodologia de

Ficou com a impressão de estar na presença de um compositor ( Clique aqui para introduzir texto. ), de um guitarrista ( Clique aqui para introduzir texto. ), de um director

• Não há inflação de alimentos, há inflação, causada por choques cambiais, auxílio emergencial, problemas fiscais e má gestão de estoques públicos;. • O Brasil precisa

• Quando o navegador não tem suporte ao Javascript, para que conteúdo não seja exibido na forma textual, o script deve vir entre as tags de comentário do HTML. &lt;script Language

II - os docentes efetivos, com regime de trabalho de 20 (vinte) horas semanais, terão sua carga horária alocada, preferencialmente, para ministrar aulas, sendo o mínimo de 8 (oito)

Com a inclusão desse mesmo “3º Concerto” no programa de um Concurso para jovens estudantes do instrumento organizado pela Associação Portuguesa do Clarinete

Dessa forma, a partir da perspectiva teórica do sociólogo francês Pierre Bourdieu, o presente trabalho busca compreender como a lógica produtivista introduzida no campo