• Nenhum resultado encontrado

ESTIMADORES DE PAREAMENTO COM BASE NO ESCORE DE

4 METODOLOGIA DE PROPENSITY SCORE MATCHING

4.1 ESTIMADORES DE PAREAMENTO COM BASE NO ESCORE DE

A inclusão das variáveis de background familiar e de identificação dos indivíduos que receberam o tratamento, permite calcular a probabilidade de participação, P(Xi), no caso deste estudo, a probabilidade de frequentar a educação infantil, creche ou pré-escola.

Depois de balanceadas as variáveis pelo escore de propensão, as amostras foram calculadas para estabelecer os grupos de tratamento e de controle. Esses pares de indivíduos devem possuir os mesmos escores de propensão de participar do tratamento.

Segundo Rubin (2001), existem três tipos de pareamentos: matching, subclassificação e ponderação, sendo que, todos são baseados no escore de propensão, mas diferem na forma de construção dos pares de comparação e na forma do cálculo do ATT.

O pareamento por matching combina os indivíduos, tratado e controle, tomando como base os mesmos valores dos escores de propensão. Assim, cada indivíduo tratado é pareado com outro indivíduo de controle. A diferença entre o resultado médio dos indivíduos tratados e o resultado médio dos indivíduos de controle corresponde ao ATT, obtido pela média das diferenças entre os dois grupos (ROSENBAUM e RUBIN, 1983; RUBIN, 2001).

A subclassificação, consiste em ordenar todos os indivíduos pelos valores próximos dos escore de propensão e, divididos em blocos de tratados e controles. O resultado do ATT será obtido pela diferença média entre os blocos (RUBIN, 2001).

E, por último, pode-se fazer a ponderação utilizando os pesos amostrais de cada indivíduo que recebeu o tratamento. Neste caso, são atribuídos diferentes pesos para o grupo de tratamento e de controle. No grupo de tratamento o peso é determinado pelo inverso do escore de propensão, já no grupo de controle, o peso é dado por um menos o inverso do escore de propensão (RUBIN, 2001). A seguir foram formalizados os métodos de pareamento, Nearest Neighbour Matching e

4.1.1 Nearest Neighbour Matching

O método baseado no Nearest Neighbor Matching ou pareamento pelo vizinho mais próximo, consiste em encontrar um correspondente no grupo de controle com base no valor mais aproximado possível do valor do escore observado dos indivíduos do grupo de tratamento. Esta técnica de pareamento permite a escolha entre a reposição e a exclusão dos casos de controle pareados.

Neste caso, empregou-se a técnica que permite a reposição dos casos de controles, dessa forma, o mesmo indivíduo pôde ser utilizado como controle para mais de um caso do grupo de tratamento, ou seja, a observação não é descartada.

No método de pareamento Nearest Neighbor, C(i) representa o conjunto de indivíduos participantes do grupo de controle pareados aos indivíduos tratados, i, com um valor estimado do escore de propensão de pi, representado pela equação:

(17)

Seja, T, o conjunto de indivíduos tratados e, C, o conjunto de indivíduos de controle. Os resultados observados, YiT e YjC, são respectivamente as unidades, tratada e controle. M é matching ou pareamento pelo método de vizinhos mais próximos, NT, representa o número de indivíduos no grupo tratamento, sendo que, os pesos são definidos por wj, definidos por wj = Σiwij. Dessa forma, o estimador de pareamento Nearest Neighbor será representado pela equação:

(18)

(19)

Para derivar as variâncias desses estimadores os pesos são considerados fixos e os resultados são considerados independentes entre as unidades tratadas e controles.

(21)

(22)

(23)

Segundo Becker e Ichino (2002), o método ordena todas as observações de acordo com os escores de propensão para identificar um controle mais similar possível, ou seja, com os escores mais próximos possíveis, por isso o termo “vizinhos”. Depois do ordenamento são atribuídos pesos iguais aos controles mais próximos possíveis.

Quando não são atendidas as condições de pareamento por de Nearest

Neighbor Matching, a opção de controle se dá sob a forma de escolha aleatória.

4.1.2 Stratification Matching Method

O segundo método pareamento empregado, o stratification method, estima o Efeito Médio do Tratamento sobre os Tratados (ATT), pela média ponderada dos blocos específicos do efeito do tratamento. De forma que, a estimativa do ATT e o número de blocos gerados no escore de propensão são baseados no princípio da estratificação.

Este estimador baseia-se na estratificação, ou seja, na divisão da amostra em blocos de variação do propensity score, de tal forma que, dentro de cada bloco, a média do escore propensão seja a mesma em cada um dos grupos de tratamento e de controle.

Assim, o método é utilizado para estimar o escore de propensão dentro de cada bloco, de forma que as variáveis sejam balanceadas dentro de cada bloco, sendo que a participação no tratamento é considerada aleatória.

O indexador dos blocos é representado por, q, sendo os blocos são definidos nos intervalos dos escores de propensão, dentro de cada um dos blocos, da seguinte maneira:

(24)

Em que, I(q) representa o conjunto de indivíduos por bloco, NqT, é o número de indivíduos tratados e, NqC, representa o número de indivíduos controles.

Segundo Becker e Ichino (2002), o estimador do ATT baseado no método de estratificação pode ser calculado pela equação abaixo:

(25)

Os pesos foram calculados para cada bloco pela fração correspondente de indivíduos tratados e, Q, representa o número total de blocos.

Assumindo a independência dos resultados entre os indivíduos, tem-se a variância de , representada pela expressão:

A equação mostra que, pode-se calcular o ATT em cada um dos blocos. Uma das vantagens da metodologia de pareamento é a não exigência da exogeneidade das variáveis selecionadas, o que representa um grande atrativo para a sua aplicabilidade quando são utilizados dados não-experimentais que representam parte significativa dos estudos relacionados à economia da educação.

Segundo Becker e Ichino (2002), um dos limites do método de estratificação é que se caso não houver um par de pareamento para os indivíduos tratados, ou seja, na ausência da unidade de controle, todas as observações são excluídas da análise. Este procedimento será executado em faixas específicas dos escores de propensão, Dado que o descarte é não aleatório pode levar à resultados viesados, além da perda de parte da amostra. Neste estudo estimou-se a variância via bootstrap em todas as estimativas do ATT.