Primeira Etapa: identificação dos modelos de pesquisa e o

3.3 Evidências Empíricas sobre a Importância do Crédito para a AF

3.4.1 Estratégia Empirica

3.4.1.1 Primeira Etapa: identificação dos modelos de pesquisa e o

Heinrich et al. (2010) e Sekhon (2007) expõem que nos modelos experimentais, a designação para tratamento por meio de uma intervenção, participação em programa ou em determinada política, é aleatória. Isso assegura que, ao serem comparados os grupos de tratamento e grupos de controle, a única diferença entre estes seja o efeito da participação. Quando é realizado um modelo experimental, cujo tratamento a um determinado indivíduo é aleatório, permite que as características relevantes e não relevantes sejam balanceadas, isto é, que as unidades estejam distribuídas igualmente entre tratados e não tratados.

Quando existe balanceamento entre as unidades tratadas e o grupo de comparação, ambas unidades têm a mesma probabilidade de serem escolhidas (receber tratamento) as- segurando a comparabilidade entre ambos indivíduos, uma vez que o grupo de comparação constitui um adequado contrafactual (controle ou grupo de comparação) próximo da unidade tratada. Isto significa que as médias dos controles e dos tratados não diferem, a exceção da intervenção. Uma vez que se considera o tratamento como designado aleatoriamente, o status de tratamento não é correlacionado com as variáveis observáveis e não observáveis, já que os potencias resultados serão estatísticamente independentes do status de tratamento.

𝑦𝑖 dos estabelecimentos agrícolas familiares 𝑖, foi afetada pelo acesso ao crédito 𝐶𝑖. Ainda

pode ser realizada a seguinte pergunta: o que teria acontecido com a produtividade 𝑦𝑖, dos

estabelecimentos agrícolas familiares 𝑖 que acessaram ao crédito 𝐶1𝑖, caso não houvessem

tido a possibilidade de ter acessado ao crédito 𝐶0𝑖. O resultado observado de 𝑦𝑖 pode ser

representado em termos de resultado potencial (MORGAN; WINSHIP, 2007; SEKHON, 2007; ANGRIST; PISCHKE, 2008). Tomando como referência a demonstração de Angrist e Pischke (2008) tem-se que:

𝑦𝑖 = 𝑦0𝑖+ (𝑦1𝑖− 𝑦0𝑖)𝐶𝑖 (3.1) 𝑦𝑖 = ⎧ ⎨ ⎩ 𝑦1𝑖, se 𝐶𝑖 = 1 𝑦0𝑖, se 𝐶𝑖 = 0 (3.2) em que 𝑦0𝑖 é a produtividade do estabelecimento que não teve acesso ao crédito 𝐶0𝑖 (inde-

pendente de receber ou não), e 𝑦1𝑖 é o estado da produtividade do estabelecimento que teve

acesso ao crédito 𝐶1𝑖; (𝑦1𝑖− 𝑦0𝑖) é o efeito causal do acesso ao crédito sobre a produtividade

do estabelecimento agrícola familiar 𝑖. De acordo com Angrist e Pischke (2008), quando o in- teresse é analisar o impacto de uma determinada variável, não basta uma comparação direta de médias, mesmo que a média da produtividade com o acesso ao crédito esteja relacionado ao efeito causal médio, conforme:

(3.3) com 𝐸(𝑦𝑖|𝐶𝑖 = 1) − 𝐸(𝑦𝑖|𝐶𝑖 = 0) sendo a diferença observada na produtividade média;

[𝐸(𝑦1𝑖|𝐶𝑖 = 1) − 𝐸(𝑦0𝑖|𝐶𝑖 = 1)] o efeito médio do tratamento sobre os tratados; e [𝐸(𝑦0𝑖|𝐶𝑖 =

1) − 𝐸(𝑦0𝑖|𝐶𝑖 = 1)] sendo o viés de seleção. O efeito médio do tratamento sobre os tratados

também pode ser expresso como:

𝐸(𝑦𝑖|𝐶𝑖 = 1) − 𝐸(𝑦𝑖|𝐶𝑖 = 0) = 𝐸(𝑦1𝑖− 𝑦0𝑖|𝐶𝑖 = 1) (3.4)

o qual é o efeito causal médio do crédito sobre aqueles estabelecimentos agrícolas familiares que receberam crédito, 𝐸(𝑦𝑖|𝐶𝑖 = 1), e o que teria acontecido aos estabelecimentos que

receberam crédito, caso ele não tivesse acesso, 𝐸(𝑦𝑖|𝐶𝑖 = 0). Esta diferença observada no

estado de acesso ao crédito, acrescentando o viés de seleção [𝐸(𝑦0𝑖|𝐶𝑖 = 1) − 𝐸(𝑦0𝑖|𝐶𝑖 = 1)],

é a diferença média entre os que tiveram acesso e os que não tiveram acesso ao crédito, e que pode ser negativo ou positivo.

Supondo que a atribuição de crédito seja aleatória, tem-se:

𝐸(𝑦𝑖 | 𝐶𝑖 = 1) − 𝐸(𝑦𝑖 | 𝐶𝑖 = 0) = 𝐸(𝑦1𝑖 | 𝐶𝑖 = 1) − 𝐸(𝑦0𝑖| 𝐶𝑖 = 0)

= 𝐸(𝑦1𝑖 | 𝐶𝑖 = 1) − 𝐸(𝑦0𝑖| 𝐶𝑖 = 1)

(3.5) em que a independência de 𝑦0𝑖 e 𝐶𝑖, permite substituir 𝐸(𝑦0𝑖 | 𝐶𝑖 = 1) por 𝐸(𝑦0𝑖 | 𝐶𝑖 = 0).

Dessa forma, tem-se:

𝐸(𝑦1𝑖| 𝐶𝑖 = 1) − 𝐸(𝑦0𝑖 | 𝐶𝑖 = 0) = 𝐸(𝑦1𝑖− 𝑦0𝑖| 𝐶𝑖 = 1)

= 𝐸(𝑦1𝑖− 𝑦0𝑖)

(3.6) em que 𝐸(𝑦1𝑖− 𝑦0𝑖) mede o efeito do acesso ao crédito designado ou atribuído aleatoriamente

para a unidade tratada, sendo o mesmo que o efeito da atribuição ou acesso ao crédito em um estabelecimento escolhido aleatoriamente, permitindo, assim, reduzir o viés de seleção. Ainda que num primeiro momento possa resolver o viés de seleção, os dados experimentais não estão livres de problemas, em especial, porque pode-se ter os chamados dados quase- experimentais, já que “experiments often reveal things that are not what they seem on the

basis of naive comparisons alone”(ANGRIST; PISCHKE, 2008, p. 12).

Dados observacionais

De acordo com Silva (2018) os modelos econométricos lidam, na maioria das vezes, com dados observacionais8_{, que tentam se aproximar de dados experimentais, de modo a}

identificar a relação entre um determinado tratamento ou controle, 𝐶𝑖, e o resultado 𝑦𝑖. No

enfoque quase-experimental, isto é, na ausência de aleatoriedade, os grupos de tratamento podem diferir tanto no seu status de tratamento como também nos seus valores 𝑋𝑖.

No caso de dados quase-experimentais, o interesse também é na avaliação de impacto de algum programa, política ou intervenção específica, ou em conhecer o resultado de determinado tratamento sobre uma variável de interesse. Em uma análise de Regressão Linear Simples, quando é avaliada apenas a esperança condicional do status de tratado e não tratado sobre o nível de produtividade, a questão é o viés de seleção. De acordo com Angrist e Pischke (2008), tem-se:

𝑦𝑖 = 𝛽0+ 𝛾𝐶𝑖+ 𝜇𝑖 (3.7)

8 _{O autor distingue cinco modelos a serem considerados: Regressão Linear Múltipla, Regressão Descontínua,}

em que 𝛽0 = 𝐸(𝑦0𝑖), 𝛾 = (𝑦1𝑖− 𝑦0𝑖), 𝐶𝑖 é uma variável dummy que representa se o estabe-

lecimento teve ou não acesso ao crédito e 𝜇𝑖 = 𝑦0𝑖− 𝐸(𝑦0𝑖) representa a parte aleatória de

𝑦𝑖.

Avaliando a esperança condicional,

𝐸(𝑦𝑖|𝐶𝑖 = 1) = 𝛽0 + 𝛾 + (𝜇𝑖|𝐶𝑖 = 1) (3.8)

𝐸(𝑦𝑖|𝐶𝑖 = 0) = 𝛽0+ 𝐸(𝜇𝑖|𝐶𝑖 = 0) (3.9)

Subtraindo (3.9) de (3.8), tem-se a diferença observada:

𝐸(𝑦𝑖|𝐶𝑖 = 1) − 𝐸(𝑦𝑖|𝐶𝑖 = 0) = 𝛾 + [𝐸(𝜇𝑖|𝐶𝑖 = 1) − 𝐸(𝜇𝑖|𝐶𝑖 = 0)] (3.10)

em que 𝛾 representa o efeito de tratamento e [𝐸(𝜇𝑖|𝐶𝑖 = 1) − 𝐸(𝜇𝑖|𝐶𝑖 = 0)] é o viés de

seleção. Ao se estimar a Regressão Linear Simples, o viés de seleção contínua a existir como consequência da correlação entre o termo de erro da regressão dado por 𝜇𝑖 e o regressor 𝐶𝑖,

dado por:

𝐸(𝜇𝑖 | 𝐶𝑖 = 1) − 𝐸(𝜇𝑖 | 𝐶𝑖 = 0) = 𝐸(𝑦0𝑖| 𝐶𝑖 = 1) − 𝐸(𝑦0𝑖| 𝐶𝑖 = 0) (3.11)

Esta correlação reflete a diferença nos resultados potencias (sem tratamento) da produtividade entre aqueles que tiveram acesso ao crédito e aqueles que não tiveram acesso.

Este procedimento revela que em cenários observacionais os grupos de tratamento e de controle quase nunca são equilibrados “because the two groups are not ordinarily drawn

from the same population”(SEKHON, 2007, p. 06). A Equação (3.11) não pode ser estimada

diretamente porque 𝑦0𝑖 não é observado para o tratado. De acordo com Sekhon (2007), a

estimativa pode ser feita assumindo que a seleção para tratamento depende de covariáveis observáveis 𝑋𝑖. Angrist e Pischke (2008) expõem que o problema do viés de seleção pode ser

contornado considerando também algumas proposições que fazem das estimativas de impacto muito mais eficientes.

Dado um conjunto de variáveis explicativas, pode-se estimar o impacto marginal do acesso ao crédito sobre a produtividade a partir de um modelo de Regressão Linear Múltipla. Seguindo a notação de Angrist e Pischke (2008), tem-se:

em que, 𝑦𝑖 representa a variável de interesse (outcome of interest) – produtividade da terra ou

do trabalho - para o estabelecimento agrícola familiar 𝑖; 𝐶𝑖indica se o estabelecimento recebeu

crédito (𝐶𝑖 = 1) ou não (𝐶𝑖 = 0); 𝛾 é o parâmetro do modelo que mede o impacto/efeito

do crédito; 𝑋𝑖 é um vetor-coluna que denota as características estruturais e individuais dos

estabelecimentos agrícolas familiares (variáves explanatórias); 𝛽0 e 𝛽1 são os parâmetros do

modelo; e 𝜇𝑖 é o termo aleatório do modelo.

Avaliando a esperança condicional da Equação (3.12), tem-se:

(3.13) De acordo com Angrist e Pischke (2008) e Sekhon (2007) a introdução de covariá- veis permite atender a hipótese de independência condicional que afirma que assumindo a suposição de independência condicional das características observadas, 𝑋𝑖, a atribuição de

tratamento é independente, ou seja, 𝑦1, 𝑦0 ⊥ 𝐶𝑖 | 𝑋𝑖, e que existe sobreposição (overlap),

0 < 𝑃 𝑟(𝐷 = 1 | 𝑋𝑖) < 1, o viés de seleção pode desaparecer.

Dada esta condição de independência condicional sobre as covariáveis, o impacto do crédito sobre a produtividade média tem uma interpretação causal, isto é:

𝐸(𝑦𝑖 | 𝑋𝑖, 𝐶𝑖 = 1) − 𝐸(𝑦𝑖 | 𝑋𝑖, 𝐶𝑖 = 0) = 𝐸(𝑦1𝑖− 𝑦0𝑖| 𝑋𝑖) (3.14)

Ainda que sejam condicionados esses fatores às covariáveis 𝑋𝑖, a regressão estimada,

não atende inteiramente a suposição de sobreposição, 0 < 𝑃 𝑟(𝐷 = 1 | 𝑋𝑖) < 1, uma vez

que se quer encontrar indivíduos que tenham características observáveis muito semelhantes. Assim, deve-se condicionar as covariáveis por meio da probabilidade condicional. Os autores Resembaum e Rubin (1983), Dehejia e Wahba (1998) e Becker e Ichino (2002) expõem que para conhecer o contrafactual, devem ser estabelecidos critérios de balanceamento, os quais são descritos a seguir.

No documento Agricultura familiar em El Salvador : caracterização e análise do impacto do crédito (páginas 84-88)