Ajuste de Modelos para o Escore de Propensão com PAC

B.2 Código para o Cálculo de Estimativas

B.2.2 Ajuste de Modelos para o Escore de Propensão com PAC

Sempre que formos incorporar o PAC, faremos uso do objeto relativo a este criado na subseção B.1.2. Nos modelos para o escore de propensão e na avaliação de impacto do SWF, temos o interesse de estimar o EPAA para saber o quanto se perde ao ignorar (indevidamente) o PAC. Desta forma, ele será impresso junto com o erro-padrão das estimativas dos coeficientes, o qual será aproximado através da LST (opção padrão no pacote survey do R).

Como inserimos novas variáveis no banco original (para crianças e adultos), devemos recriar os objetos relativos ao PAC de cada grupo (apenas o argumentodata de svydesign se altera na prática). Tomando novamente as mesmas candidatas ao modelo definitivo para o escore no caso IID e na mesma ordem de especificação, inicialmente para o grupo das crianças (apenas um indivíduo foi removido), temos

d.re.c = svydesign(id = ~f15 + f1, strat = ~f5, weight = ~pl, nest = TRUE, data = ym.c.p)

m1.cp = svyglm(crit ~ cri.d.mun + aus.mae + pension.x.x + aus.pai +

charit.x.x + cri.d.avi + cri.d.inc + remit.x.x + poor.x.x, family = binomial(link = logit), design = d.re.c)

names(m1.cp); anova(m1.cp, deff = T); m1.cp$null.deviance

No pacote survey, a função svyglm é a responsável pela estimação por MP dos coeficientes do modelo para o escore de propensão. No momento, o pacote xtable não tem suporte para a classe dos objetos gerados pelas funções do pacote survey. Por padrão, a análise de desvio é feita pelo teste da RP, a versão do teste da RV adaptada para dados amostrais complexos. Neste primeiro ajuste, temos duas covariáveis significativas ao nível

nominal de 5%: DRC e CRDAI. Além disso, em quatro destas covariáveis (CRDCM; COM; COP e CRDAPI) o EPAA estimado é menor do que o valor unitário. Isto indica que o PAC utilizado na YNSPMS produziu ganhos de eficiência na estimação dos respectivos coeficientes (com relação a um plano AAS), mesmo desconsiderando a informação de estratificação no 2º estágio. Mantendo apenas as covariáveis significativas, temos

m2.cp = svyglm(crit ~ charit.x.x + cri.d.avi, design = d.re.c, family = binomial (link = logit))

names(m2.cp); anova(m2.cp, deff = T) m2.cp$null.deviance; summary(m2.cp)

Novamente, as duas covariáveis continuam significativas e permanecerão na especi- ficação do modelo final. Testando as demais candidatas, uma por vez, obtemos

m3.cp.1 = svyglm(crit ~ cri.d.mun + charit.x.x + cri.d.avi, design = d.c, family = binomial (link = logit)) m3.cp.2 = svyglm(crit ~ aus.mae + charit.x.x + cri.d.avi,

design = d.c, family = binomial (link = logit)) m3.cp.3 = svyglm(crit ~ pension.x.x + charit.x.x + cri.d.avi,

design = d.c, family = binomial (link = logit)) m3.cp.4 = svyglm(crit ~ aus.pai + charit.x.x + cri.d.avi,

design = d.c, family = binomial (link = logit)) m3.cp.5 = svyglm(crit ~ charit.x.x + cri.d.avi + cri.d.inc,

design = d.c, family = binomial (link = logit)) m3.cp.6 = svyglm(crit ~ charit.x.x + cri.d.avi + remit.x.x,

design = d.c, family = binomial (link = logit)) m3.cp.7 = svyglm(crit ~ charit.x.x + cri.d.avi + poor.x.x,

design = d.c, family = binomial (link = logit)) anova(m3.cp.1, deff = T); anova(m3.cp.2, deff = T);

anova(m3.cp.3, deff = T); anova(m3.cp.4, deff = T); anova(m3.cp.5, deff = T); anova(m3.cp.6, deff = T); anova(m3.cp.7, deff = T)

Quando adicionadas uma por vez, nenhuma das demais variáveis é significativa ao nível nominal de 5% quando especificada conjuntamente às covariáveis do modelo m2.cp. Portanto, para modelar o escore de propensão das crianças, incorporando devidamente o PAC, adotamos o modelo m2.cp e removemos os demais

rm(m1.cp, m3.cp.1, m3.cp.2, m3.cp.3, m3.cp.4, m3.cp.5, m3.cp.6, m3.cp.7) Para obter o EPAA estimado dos coeficientes da regressão, também precisamos das estimativas de suas variâncias (quadrado do erro-padrão) quando ignoramos o PAC no mesmo modelo, com os mesmos dados

m2.cp.s = glm(crit ~ charit.x.x + cri.d.avi, data = ym.c.p, family = binomial (link = logit))

summary(m2.cp.s)

Tomando os escores preditos do modelo escolhido, para saber se o PATFI é atendido, fazemos

esc.cp = fitted.values(m2.cp); count(esc.cp)

hist(esc.cp, breaks = 10, main = "", xlab = "Escores Preditos", ylab = "Frequência", col = "gray", border = "black", axes = F) axis(side = 1); axis(side = 2, las = 1, line = -.4)

Todos os escores preditos estão acima de 0.01 e abaixo de 0.99, logo o PATFI é respeitado. Tomamos os seus escores preditos e removemos os demais modelos

esc.cp = fitted.values(m2.cp); ym.c.p = cbind(ym.c.p, esc.cp)

rm(m1.cp, m3.cp.1, m3.cp.2, m3.cp.3, m3.cp.4, m3.cp.5, m3.cp.6, m3.cp.7) Por fim, falta apenas modelar os escores preditos para os adultos incorporando o plano amostral, com as respectivas covariáveis candidatas

d.re.a = svydesign(id = ~f15 + f1, strat = ~f5, weight = ~pl, nest = TRUE, data = ym.adu)

m1.ap = svyglm(crit ~ mun + inc + pension.x.x + avi + charit.x.x + remit.x.x + poor.x.x, design = d.re.a,

anova(m1.ap, deff = T); m1.ap$null.deviance; summary(m1.ap)

No modelo com todas as covariáveis candidatas, somente API; DRC e NPD são significativas ao nível nominal de 5%. Dentre estas três covariáveis, apenas API tem EPAA estimado abaixo de 1. Mantendo as covariáveis significativas e retirando as demais, temos

m2.ap = svyglm(crit ~ inc + charit.x.x + poor.x.x, design = d.re.a, family = binomial(link = logit))

anova(m2.ap, deff = T); m2.ap$null.deviance; summary(m2.ap)

As três covariáveis, isoladas, permanecem significativas. Inserindo uma por vez as demais covariáveis, temos os modelos abaixo

m3.ap.1 = svyglm(crit ~ mun + inc + charit.x.x + poor.x.x,

design = d.re.a, family = binomial(link = logit)) m3.ap.2 = svyglm(crit ~ inc + pension.x.x + charit.x.x + poor.x.x, design = d.re.a, family = binomial(link = logit)) m3.ap.3 = svyglm(crit ~ inc + avi + charit.x.x + poor.x.x,

design = d.re.a, family = binomial(link = logit)) m3.ap.4 = svyglm(crit ~ inc + charit.x.x + remit.x.x + poor.x.x,

design = d.re.a, family = binomial(link = logit)) anova(m3.ap.1, deff = T); anova(m3.ap.2, deff = T)

anova(m3.ap.3, deff = T); anova(m3.ap.4, deff = T)

Mesmo incluídas uma por vez, nenhuma das quatro variáveis passará a ser significativa ao nível nominal de 5%. Ficamos então com o modelo m2.ap. Novamente, para obter o EPAA estimado dos coeficientes da regressão precisaremos das estimativas de suas variâncias (quadrado do erro-padrão) quando ignoramos o PAC no mesmo modelo, com os mesmos dados

m2.ap.s = glm(crit ~ inc + charit.x.x + poor.x.x, data = ym.a, family = binomial(link = logit))

Note que o intercepto deixou de ser significativo quando incorporamos o PAC, logo ele não pode ser considerado para a interpretação dos coeficientes. Tomando os escores preditos por este para fazer o pareamento e balanceamento no grupo dos adultos, considerando o PAC

esc.ap = fitted.values(m2.ap); count(esc.ap)

hist(esc.ap, breaks = 10, main = "", xlab = "Escores Preditos", ylab = "Frequência", col = "gray", border = "black", axes = F) axis(side = 1); axis(side = 2, las = 1, line = -.4);

ym.adu = cbind(ym.adu, esc.ap)

rm(m1.ap, m3.ap.1, m3.ap.2, m3.ap.3, m3.ap.4)

Antes de parear cada grupo etário em cada perspectiva (com e sem PAC), o que será feito nas subseções B.2.3 eB.2.4, vamos por praticidade renomear os quatro modelos escolhidos

mc = m3.c; ma = m2.a; mcp = m2.cp; map = m2.ap rm(m3.c, m2.a, m2.cp, m2.ap)

No documento Avaliação do impacto de políticas de transferência de renda a partir de dados amostrais complexos (páginas 169-173)