• Nenhum resultado encontrado

O conceito escore de propensão foi introduzido pela primeira vez no artigo de Rosenbaum & Rubin (1983) como ferramenta na área de estudos experimentais e para a situação em que há apenas duas possíveis classificações com relação ao tratamento recebido. Note que é possível ter dois tratamentos aplicados a todos os indivíduos, com cada indivíduo recebendo um único tratamento. Aqueles que recebem um dos tratamentos realizam o mesmo papel dos controles definidos na seção anterior no contexto da YNSPMS quando o outro tratamento é que está sob estudo pelo pesquisador. Dada uma variável resposta de interesse R, qualquer inferência causal para o efeito do tratamento nos indivíduos de 1 O código utilizado para a produção dos resultados enunciados se encontra na seçãoB.1do apêndice.

fato tratados (aqueles que residem em domicílios que passaram a receber o SWF) envolve especular também sobre qual seria este mesmo efeito nos controles.

Em princípio, cada indivíduo i da amostra terá uma única resposta r1i se receber o tratamento de interesse (denotado por 1) ou outra resposta r0i se não recebê-lo (a ausência do tratamento de interesse é denotada por 0). Partindo desta definição, o efeito do tratamento é dado por uma comparação envolvendo as duas respostas, como uma diferença (r1i− r0i) ou razão (r1i/r0i). Assumimos também que o tratamento (ou a ausência deste) que um indivíduo recebe não influenciará o que qualquer um dos outros indivíduos receberem2. Uma vez que um mesmo indivíduo de fato receberá ou não o tratamento, teremos apenas uma das duas respostas. Logo, as comparações realizadas terão um grau de incerteza. Assim, estimar o efeito do tratamento (o impacto do SWF) é um problema de não-resposta, já que r1i ou r0i não é observado.

Seja T a variável (binária) indicadora do tratamento de interesse, logo Ti = 1 se

o indivíduo i recebeu o tratamento (reside em domicílio com beneficiário do SWF) e Ti = 0 se não o recebeu. Sejam xi um vetor de p covariáveis fixas ao longo do tempo ou

observadas antes da decisão de receber ou não o tratamento (para que as duas classes sejam comparáveis) e X a matriz cujas linhas representam estes n vetores (o nº de indivíduos pesquisados). Suponha que a indexação dos n indivíduos foi feita aleatoriamente, não havendo informação fornecida pelo valor de i. Logo, a informação observada para o indivíduo i está contida apenas no vetor xi.

Se o experimento for aleatorizado, os resultados nas duas classes (controle e tra- tamento) poderão ser diretamente comparáveis, pois supomos que todos indivíduos sob estudo são similares entre si. Porém, a avaliação do impacto de políticas de transferência de renda é, em geral, realizada a partir de um experimento não-aleatorizado, no qual os indivíduos que recebem o tratamento diferem dos que não o recebem. A comparação direta não pode mais ser feita. Por razões éticas, nem sempre se escolhe de forma aleatória na população quais domicílios serão ou não alvo da política, a menos que os domicílios da po- pulação considerada sejam bastante homogêneos com relação às condições socioeconômicas de seus residentes.

Para experimentos não-aleatorizados, Rosenbaum & Rubin (1983) definem oescore de balanceamento b(xi), uma função das covariáveis observadas tal que a distribuição

condicional de xi, dado b(xi), é a mesma para controles e tratados (ou seja, é independente

de T ), ou seja, ∀ i. Em notação matemática, xi⊥ Ti|b(xi). O escore de balanceamento

mais trivial é a função identidade b(xi) = xi. Em experimentos aleatorizados, b(xi) é

conhecido e dado por um único valor, não sendo necessário estimá-lo. Isso se explica pelo 2 Segundo Rosenbaum & Rubin (1983), tal pressuposto não é crucial para obter a expressão do escore

de propensão mas, como veremos adiante (equação (2.1)), facilita seu cálculo. Podemos modificá-la assumindo dependência de T com relação a i.

fato de que a distribuição de T é dada por um mecanismo aleatório. Ou seja, todos os n indivíduos têm probabilidade positiva de serem controles ou tratados. Contudo, em experimentos não-aleatorizados b(xi) é desconhecido e deve ser estimado por um modelo

estatístico, visto que a atribuição do tratamento é determinística.

Além disso, em experimentos aleatorizados as respostas r1 e r0 são condicional- mente independentes de T dado X, ou seja, Ri⊥ Ti|xi (hipótese de ignorabilidade ou

independência condicional nas covariáveis), com 0 < Pr(Ti = 1|xi) < 1, ∀i (hipótese de

sobreposição). Isto permite incluir na matriz X variáveis que influenciem simultaneamente a atribuição do tratamento (1 ou 0) a cada i e a variável resposta R. Esta independência condicional nem sempre é assegurada, em experimentos não-aleatorizados, para todas as variáveis observadas na pesquisa, mas apenas para um subconjunto de q ≤ p variáveis. Nesta situação, a atribuição do tratamento é dita ser fortemente ignorável com relação às q covariáveis (excluímos de X as colunas correspondentes às outras p − q variáveis), ou abreviadamente, PATFI (Pressuposto da Atribuição do Tratamento Fortemente Ignorável). Por esta razão, as q variáveis escolhidas para cálculo do escore de balanceamento b(xi) em

experimentos não-aleatorizados devem ser mensuradas antes da atribuição do tratamento para que os indivíduos sejam comparáveis. Na YNSPMS, estes são representados pelos que não residem em domicílios com beneficiários do SWF na 1ª rodada. Uma parte destes indivíduos - os tratados - mudarão esta característica a partir da 2ª rodada.

Considere agora a distribuição amostral de T dadas as q variáveis escolhidas para X e denote por Pr(Ti = 1|xi) = c(xi) a probabilidade do indivíduo i receber o tratamento.

Como assumimos que a atribuição do tratamento é estocasticamente independente nos n indivíduos, temos que

Pr(T1, . . . , Tn|x1, . . . , xn) = n Y i=1

c(xi)ti[1 − c(xi)]1−ti (2.1)

em que c(xi) é o escore de propensão para o indivíduo i.

A partir das definições acima para os escores de balanceamento e propensão, temos dois resultados importantes:

Teorema 1. (Rosenbaum & Rubin, 1983, p. 44) Seja b(xi) uma função qualquer de xi.

Então, b(xi) é um escore de balanceamento, ou seja, xi⊥ Ti|b(xi), ∀i, se, e somente se, o

escore de propensão c(xi) é tal que c(xi) = f [b(xi)] para alguma função f . Nesta situação,

b(xi) é dito ser mais fino que c(xi).

Prova. (⇒) Vamos primeiro supor que c(xi) = f [b(xi)]. Como c(xi) = Pr(Ti = 1|xi), para

mostrar que b(xi) é um escore de balanceamento, é suficiente mostrar que

Pr [Ti = 1|b(xi)] = c(xi) (2.2)

Pela definição de c(xi), temos ao tomar sua esperança condicional a b(xi) que

Porém, c(xi) = f [b(xi)], logo

E [c(xi)|b(xi)] = c(xi)

Portanto, b(xi) é um escore de balanceamento.

(⇐) Suponha por absurdo que b(xi) é um escore de balanceamento, mas que c(xi)

não pode ser escrito como uma função f de b(xi). Então, existem xk e xl, com k 6= l, tais

que c(xk) 6= c(xl) mas b(xk) = b(xl).

Porém, pela definição do escore de propensão, Pr(Tk = 1|xk) 6= Pr(Tl = 1|xl), logo

T e X não são independentes dado b(xi). Portanto, b(xi) não é um escore de balanceamento.

Para sê-lo, é necessário que c(xi) = f [b(xi)].

Como corolário do teorema acima, temos que o escore de propensão também é um escore de balanceamento, bastando tomar a função identidade: c(xi) = b(xi). Isto implica

que se um par controle-tratado é homogêneo com relação ao escore de propensão c(·), então os indivíduos deste par terão a mesma distribuição nas covariáveis consideradas. Teorema 2. (Rosenbaum & Rubin, 1983, p. 45) Se o PATFI é válido para as q covariáveis

escolhidas para X, ou seja, (r1, r0) ⊥⊥ Ti|xi com 0 < Pr(Ti = 1|xi) < 1 ∀ i, então o PATFI

também é válido para qualquer escore de balanceamento b(xi): (r1, r0) ⊥⊥ Ti|b(xi) com

0 < Pr [Ti = 1|b(xi)] < 1 ∀ i e ∀ b(·).

Prova. A desigualdade dado b(xi) segue diretamente da desigualdade dado xi. Logo, basta

provar que

Pr [Ti = 1|r1, r0, b(xi)] = Pr [Ti = 1|b(xi)] (2.3)

O que, pela equação (2.2) do teorema anterior, é equivalente a mostrar que

Pr [Ti = 1|r1, r0, b(xi)] = c(xi)

Analogamente ao que foi feito na prova do teorema anterior, pela definição de c(xi)

e sabendo que c(xi) = f [b(xi)], temos ao tomar sua esperança condicional às respostas r1

e r0 e ao escore de balanceamento b(xi) que:

c(xi) = E [c(xi)|r1, r0, b(xi)]

= E [Pr(Ti = 1|xi)|r1, r0, b(xi)]

= E [Pr(Ti = 1|r1, r0, xi)|r1, r0, b(xi)]

= Pr [Ti = 1|r1, r0, b(xi)]

Logo, o PATFI é válido para qualquer escore de balanceamento b(xi).

O teorema anterior garante que, se as covariáveis escolhidas influenciam ao mesmo tempo na atribuição do tratamento para cada indivíduo i e na correspondente resposta

(r1 ou r0), então qualquer escore de balanceamento (incluindo o de propensão) aplicado a estas mesmas covariáveis terá o mesmo comportamento.

Definido o escopo teórico para o escore de propensão, discutiremos como modelá-lo em duas etapas: escolha do modelo estatístico apropriado com relação à distribuição suposta para a variável dependente (note que T é binária), e seleção de covariáveis dentre as variáveis pesquisadas na amostra para o modelo. Como toda análise estatística a ser descrita nesta dissertação, dividiremos cada etapa da modelagem do escore para o caso IID e para a situação em que o PAC é considerado, com maior enfoque nesta última perspectiva.