• Nenhum resultado encontrado

Equação 18 – Valor presente das recompensas de n etapas trazidas a etapa atual

4 APRESENTAÇÃO E DISCUSSÃO DO JOGO

4.2 Etapas da modelagem do jogo

4.2.1 Por que se seguiu uma determinada sequência de apresentação de condições de interação?

Na metodologia de avaliação de empresas de Venture Capital a sequencia de cálculos

pode seguir a sequencia Valor de Saída, Valor do Aporte e Participação Acionária Equivalente, sendo esta foi adotada com o objetivo de guiar o raciocínio lógico do empreendedor.

4.2.2 Por que foram propostas três negociações?

As três rodadas de interações foram necessárias para que se evitasse construir uma ferramenta com falhas de Erros do Tipo I e II. Por isso, a repetitividade de negociações que contivessem a mesma sequencia das três variáveis nas três rodadas com sete interações cada.

4.2.3 Por que os valores das variáveis têm essa sequencia em relação as rodadas?

Para minimizar o Efeito de Ancoragem.

4.2.4 Por que esse número de interações?

O número de interações se deu por causa da quantidade que pode garantir pelo menos 6 mudanças de estados de cooperação durante um sequencia de interação, o que caracteriza o tipo de estratégia do agente.

4.2.5 Por que o empreendedor vem primeiro?

Devido ao requisito da “Teoria dos Jogos para Sub-Jogos Infinitamente Repetidos do tipo Dilema dos Prisioneiros” que contém assimetria de informação. Ele decide sem saber o que o investidor vai decidir na presente interação. Ele tem somente o histórico.

4.2.6 Por que a primeira decisão em nova de cada nova variável é sempre coopera?

Este é um requisito da “Teoria dos Jogos para Sub-Jogos Infinitamente Repetidos do tipo Dilema dos Prisioneiros”, devido a Estratégia Gatilho.

4.2.7 Por que a quantidade de conjuntos de estratégias para as rodadas é de 70?

Pelo princípio da parcimônia foram colocadas as quantidades mínimas de conjunto de estratégias para as rodadas livres que equilibra as Estratégias Olho por Olho e Severa.

4.2.8 Por que a primeira estratégia é sempre Olho por Olho?

Para que se desse a chance do jogador observar um outro mecanismo “menos punitivo” do que a Estratégia Severa, na qual o empreendedor observa claramente um mecanismo de punição que não permite alternância e assim o experimento perderia a oportunidade de observar eventuais mudanças de estratégia / decisão do jogador.

4.2.9 Por que há somente 4 estratégias Severa e 5 estratégias Olho por Olho em cada conjunto de estratégias para as rodadas?

Dado o número impar de sequencia de interações (rodadas), decidiu-se por uma maior exposição do empreendedor a um outro mecanismo “menos punitivo” do que a Estratégia Severa, na qual o empreendedor observa claramente um mecanismo de punição que não permite alternância e assim o experimento perderia a oportunidade de observar eventuais mudanças de estratégia / decisão do jogador.

4.2.10 Por que os valores calculados foram apresentados em faixas?

Para que houvesse aderência com a forma que as avaliações de ativos são apresentadas e para que a percepção de ancoragem das alternativas estivesse perto dos limites de maximização de valores segundo a racionalidade econômica.

4.2.11 Por que as faixas de valores calculados estão neste nível de amplitude?

Pois precisavam considerar o “delta” para não haver sobreposição entre faixas e encaixe das variações entre as alternativas.

4.2.12 Por que o número de casas decimais das faixas é de dois dígitos?

Para que não houvesse problemas de interpretação, visto que a velocidade das telas não permitiria.

4.2.13 Por que a dinâmica das faixas de valores calculados é dessa forma?

A dinâmica das faixas se baseou na “Teoria dos Jogos para Sub-Jogos Infinitamente Repetidos do tipo Dilema dos Prisioneiros”. O equilíbrio de Nash se encontra na cooperação mútua, mesmo que haja a não maximização da função recompensa imediata.

Ela foi feita de acordo com os seguintes passos:

1) Foi modelado a função de recompensa (individual) de cada agente.

2) Uma vez modelada, partiu-se em busca da resposta a questão de qual seria a racionalidade econômica que maximizaria essa função. (p. ex: quanto mais alto

valor de saída melhor para o empreendedor, sendo o contrário para o investidor)

3) A partir desta maximização, seriam colocadas as posições de partida das negociações.

4) Colocadas as posições de partida de cada agente, foi o momento de se arbitrar segundo as práticas vigentes no mercado e literatura, quais seriam as faixas de valores cabíveis.

5) Uma vez que se tinha as posições iniciais de cada agente fixadas foi possível medir a distância entre elas.

6) Dada a distância, esta foi dividida pela quantidade total de interações entre os agentes (do empreendedor para o investidor; do investidor para o empreendedor), chegando-se ao valor de acréscimo / decréscimo de cada interação de forma EQUIDISTANTE (não há maior / menor convergência para uma posição).

7) Os acréscimos / decréscimos foram programados para refletir movimentos de convergência ou divergência dos valores das posições.

8) Os movimentos de convergência diminuíam a distancia das posições. Os movimentos de divergência aumentavam a distancia das posições.

9) A cada decisão que o agente (jogador) tomava essa era classificada como cooperação / ou não cooperação.

10) A partir desta classificação, se houvesse cooperação, o movimento era de convergência, caso contrário o movimento era de divergência em relação as posições da jogada anterior.

11) Se um jogador cooperar, seu valor calculado pode aumentar / diminuir contrariamente a função de maximização do agente.

Como visto, o fato de convergir, diminui a distancia de suas posições, porém deixa de maximizar o valor da função de recompensa individual de cada agente.

Essa decorrência da convergência reflete “Teoria dos Jogos para Sub-Jogos Infinitamente Repetidos do tipo Dilema dos Prisioneiros”, uma vez que as recompensas imediatas individuais (não cooperação) são maiores do que as recompensas de interação (cooperação).

4.2.14 Qual foi a proxy de cooperação (valor calculado x valor escolhido)?

Houve uma proxy de cooperação que é estar dentro da faixa de Valores Calculados. A proxy de não cooperação consistia em estar fora de forma sensível da faixa de Valores Calculados.

Havia uma frase que caracterizava ainda mais a situação de cooperação e não cooperação.

4.2.15 Por que as alternativas de valores são as que foram oferecidas?

Na proxy de cooperação o valor da alternativa, além de estar dentro da faixa de Valores Calculados, precisava estar muito próximo ao limite do sentido que maximizaria a função recompensa individual. Isso por assumir que o efeito ancoragem da faixa de Valores Calculados deixaria claro quais os limites em que os valores “técnicos” (calculados) ficariam. A proximidade com o limite que maximizaria a função recompensa individual visou, nesta situação, se aproximar ao máximo da racionalidade econômica em detrimento de qualquer outra forma diferente de tomada de decisão.

Na proxy de não cooperação o valor da alternativa, estava fora de forma sensível da faixa de Valores Calculados. A expressão “de forma sensível” precisou ser feita desta forma a fim de ser discriminante. Ao mesmo tempo essa forma, não poderia sobrepor a duas faixas de Valores Calculados. Baseado na “Teoria dos Jogos para Sub-Jogos Infinitamente Repetidos do tipo Dilema dos Prisioneiros”, o valor de não cooperação necessariamente maximizava a função de recompensa individual e imediata.

4.2.16 Por que se fez o feedback de convergência ou não?

O feedback foi a forma de garantir que o mecanismo de recompensa e punição estivesse claro.

4.2.17 Por que se fez o gráfico de tempo para decisão?

O tempo controlado é uma condição da metodologia experimental.

As formas possíveis de “disparo da decisão” eram: 1-baseado no tempo; 2- baseado no evento.

Para que se pudesse fornecer essa informação foi necessário respeitar as seguintes condições: deveria se evitar que fosse uma informação a mais que utilizasse mecanismos de cognição (sensibilização, interpretação, análise e decisão); ter contagem regressiva, pois quando se zera o tempo é mais fácil interpretar do que se fosse progressivo e se acompanhasse contra uma meta; ser um gráfico no estilo de uma ampulheta, pois sua imagem remete a aspectos físicos de “esvaziamento do tempo”;

Dessa forma a utilização dos mecanismos de cognição em relação ao tempo que o empreendedor dispunha para tomar uma decisão foi sensivelmente minimizada.

A qualquer instante, dentro do intervalo dado ao empreendedor, ele poderia decidir e acionar o mecanismo de escolha da alternativa coerente com essa decisão.

4.2.18 Qual foi o mecanismo de recompensa / punição?

O mecanismo de recompensa consistia numa resposta de cooperação do investidor e na possível convergência das faixas de valores calculados dos investidores aos valores calculados dos empreendedores em interações posteriores. Cabe observar que, de acordo com a “Teoria dos Jogos para Sub-Jogos Infinitamente Repetidos do tipo Dilema dos Prisioneiros” no equilíbrio Nash, a convergência implementada não maximiza a função de recompensa individual de curto prazo.

O mecanismo de punição consistia numa resposta de não cooperação do investidor e na possível divergência das faixas de valores calculados dos investidores aos valores calculados dos empreendedores em interações posteriores. Cabe observar que, de acordo com a “Teoria dos Jogos para Sub-Jogos Infinitamente Repetidos do tipo Dilema dos Prisioneiros” no equilíbrio Nash, a convergência implementada maximiza a função de recompensa individual de curto prazo.

4.2.19 Qual foi a proxy de Estratégia Olho por Olho e Severa?

As Estratégias Severa e Olho por Olho possuem um discriminante importante que é a quantidade de alternâncias de estado (de cooperação para não cooperação e de não cooperação para cooperação). Para a Estratégia Severa o numero da alternâncias deve ser menor que a Olho por Olho. Cabe dizer que é alternância de estados que faz com que seja captada e não o estado em si. De forma complementar, a Estratégia Olho por Olho contém um numero de alternâncias maior do que a Severa. Como a cada rodada foram programados sete pares de interação, isso possibilita seis até seis alternâncias de estado. Quando houver mais de três alternâncias, a estratégia tende mais para Olho por Olho, para menos de três alternâncias severa e para três indefinida.

Cabe dizer que não foi adotada a análise da Estratégia Gatilho, uma vez que essa possui, a priori, menos poder explicativo uma vez que seria difícil separar dos mecanismos de recompensa e punição.

4.2.20 Por que foi feita a ordem do experimento foi Cadastro, SVO e CABLE?

O Cadastro, SVO e CABLE foram colocados em um primeiro bloco, por não serem um experimento comportamental, que precisa de condições mais controladas segundo a metodologia experimental.

Além da questão da metodologia experimental, foram priorizadas os passos que contivessem menor Aprendizagem Contextual e Carga Cognitiva.

O Cadastro foi colocado em primeiro lugar pois o mesmo minimiza qualquer chance de aprendizagem contextual.

A SVO foi colocada em segundo lugar uma vez que já começa a colocar o respondente no contexto do fenômeno que se quer capturar, e contém menos alternativas para se escolher. Devido a isto a carga de processamento cognitivo é menor do que a próxima survey.

O CABLE foi colocado em terceiro lugar, uma vez que insere o respondente no contexto do fenômeno que se quer capturar. As asserções apresentadas para que se decida o

grau de concordância são fatores que possuem influencia sobre a relação de cooperação. A quantidade de alternativas é maior. Isso tende a aumentar o processamento cognitivo em relação aos passos / etapas anteriores.

4.3 Possíveis situações para controle da situação experimental embutida

no Jogo do Empreendedor

Questões de tamanho da amostra (indivíduos), nível de significância 1% não foram considerados visto que o objetivo da presente dissertação é a construção da ferramenta e não a análise das respostas dos indivíduos.

Para que se pudesse fazer a implementação do experimento foram necessárias algumas definições, conforme é descrito a seguir.

Para a minimização dos erros do tipo I e II, foram dimensionadas nove repetições de rodadas com sete interações em cada rodada sendo que a quantidade de respostas do empreendedor pode chegar até 54.

O erro que corresponde à decisão incorreta de declarar que o efeito existe quando ele não existe é denominado erro tipo 1. O outro erro de decisão, correspondente a declarar que o efeito não existe quando ele existe é denominado erro tipo 2.

A partir destas necessidades foram feitas as questões seguintes.

4.3.1 Por que foram utilizadas figuras?

As figuras que foram utilizadas estão na forma de infográficos. Ele contém todos os elementos chave para uma tomada de decisão e servem como controle de contexto. O contexto é apresentado com as fases da empresa, os momentos de investimento e desinvestimento, os jogadores, as variáveis em questão, bem como seus significados.

Nota: Questionário desenvolvido por Ana Maria Roux V.C.Cesar, Mauricio Takahashi e Ana Carolina Adamson Correa, a partir do texto de Cable e Shane (1980), para utilização em pesquisas da linha de pesquisa em Tomada de Decisão, liderada pela primeira autora, em desenvolvimento no NECO – Núcleo de Estudos em Controladoria da Universidade Presbiteriana Mackenzie.

4.3.2 Porque se escolheu o presente layout, com cor amarela e azul, com valor da variável em cima, com valores calculados, com valores decididos?

A fim de que o respondente discriminasse quem estava jogando, as cores do fundo das telas foram as mesmas dos ícones. As posições das informações também variavam de acordo com o jogador, sendo posições iguais das explicações do experimento e do case, os quais objetivaram controle de contexto.

O valor da variável ficou acima, pois essa é a posição mais comumente usada para títulos, sendo que isso visou esclarecer a variável que estava sendo negociada na rodada.

Os valores calculados foram colocados em seus respectivos posicionamentos a fim de se fornecer os elementos necessários a tomada de decisão. A posição dos valores calculados ficou em “forma de enunciado”, seguido de uma frase indutora de decisão.

Os valores a serem escolhidos foram associados a alternativas. Tais alternativas foram construídas em forma de “botão de ação”. Cada “botão de ação” foi programado para registrar uma considerável quantidade de dados e automaticamente prosseguir com o experimento, trocando de tela (jogador) e parametrizando a resposta comportamental que este teria. Através de apenas um “clique” girar toda a dinâmica de uma interação do experimento.