Avaliação de Impacto do SWF em TSAT com PAC

B.2 Código para o Cálculo de Estimativas

B.2.6 Avaliação de Impacto do SWF em TSAT com PAC

Agora considerando o PAC, para os dois bancos pareados obtidos na subseção

B.2.4, ajustaremos modelos de regressão linear normal para TSAT a fim de avaliarmos o impacto do SWF nesta resposta de interesse, dado pela interação entre RSWF e RC. Para cada modelo, também quantificaremos a influência de RSWF e RC isoladamente, bem como de potenciais covariáveis de confundimento. Começando novamente pelo grupo das crianças, temos que as candidatas a covariáveis de confundimento são as mesmas do caso IID. Dentre estas, para todas as variáveis categóricas na 1ª e 4ª rodadas, exceto EC; EMC; EPC; GC; IC; LD e TD (para as quais consideramos observações apenas na 1ª rodada), a frequência nas categorias é dada por

count(ym.par.cp.1$f8); count(ym.par.cp.1$topography.x.x) count(ym.par.cp.1$p2_q_03.x.x)

count(ym.par.cp.1$p2_q_11.x.x); count(ym.par.cp.1$p2_q_11.y.y) count(ym.par.cp.1$p3_q_2.x.x); count(ym.par.cp.1$p3_q_2.y.y) count(ym.par.cp.1$yrschl.x.x); count(ym.par.cp.1$motheredu.x.x)

count(ym.par.cp.1$fatheredu.x.x) count(ym.par.cp.1$cri.d.mun); count(ym.par.cp.1$cri.d.mun.4) count(ym.par.cp.1$cri.d.avi); count(ym.par.cp.1$cri.d.avi.4) count(ym.par.cp.1$cri.d.inc); count(ym.par.cp.1$cri.d.inc.4) count(ym.par.cp.1$pension.x.x); count(ym.par.cp.1$pension.y.y) count(ym.par.cp.1$charit.x.x); count(ym.par.cp.1$charit.y.y) count(ym.par.cp.1$remit.x.x); count(ym.par.cp.1$remit.y.y) count(ym.par.cp.1$poor.x.x); count(ym.par.cp.1$poor.y.y)

Por possuírem cinco ou menos observações em categorias que não podem ser agrupadas com outras da mesma variável para pelo menos uma das rodadas, também no banco pareado considerando o PAC, excluímos da especificação para o modelo de regressão linear normal as variáveis CPI; LD e CRDCM. Logo, especificaremos as mesmas 14 covariáveis de confundimento do caso IID. Antes do ajuste, novamente reuniremos categorias, alterando também a de referência quando necessário, nas covariáveis EC; EMC; EPC e TD

ym.par.cp.1$yrschl.x.x = mapvalues(ym.par.cp.1$yrschl.x.x, from = c("7 years of schooling", "8 years of schooling",

"9 years of schooling", "non-standard: Quran & Literacy"), to = c("7 years or more", "7 years or more",

"7 years or more", "no schooling")) count(ym.par.cp.1$yrschl.x.x)

ym.par.cp.1$motheredu.x.x = mapvalues(ym.par.cp.1$motheredu.x.x, from = c("2 years of schooling", "3 years of schooling",

"4 years of schooling", "5 years of schooling", "6 years of schooling", "8 years of schooling", "9 years of schooling", "10 years of schooling",

"12 years of schooling", "non-standard: Quran & Literacy", "non-app: orphan or mother does not live HH"),

to = c("1 to 4 years of schooling", "1 to 4 years of schooling", "1 to 4 years of schooling", "5 to 8 years of schooling", "5 to 8 years of schooling", "5 to 8 years of schooling", "9 years or more", "9 years or more", "9 years or more", "no schooling", "orphan or mother does not live HH")) count(ym.par.cp.1$motheredu.x.x)

ym.par.cp.1$fatheredu.x.x = mapvalues(ym.par.cp.1$fatheredu.x.x, from = c("2 years of schooling", "3 years of schooling",

"4 years of schooling", "5 years of schooling", "6 years of schooling", "7 years of schooling", "8 years of schooling", "9 years of schooling", "10 years of schooling", "11 years of schooling", "12 years of schooling", "13 years of schooling", "14 years of schooling", "15 years of schooling",

"16+ years of schooling", "non-standard: Quran & Literacy", "non-app: orphan or father does not live HH"),

to = c("1 to 4 years of schooling", "1 to 4 years of schooling", "1 to 4 years of schooling", "5 to 8 years of schooling", "5 to 8 years of schooling", "5 to 8 years of schooling", "5 to 8 years of schooling", "9 years or more",

"9 years or more", "9 years or more", "9 years or more", "9 years or more", "9 years or more", "9 years or more", "9 years or more", "no schooling",

"orphan or father does not live HH")) count(ym.par.cp.1$fatheredu.x.x)

ym.par.cp.1$topography.x.x = mapvalues(ym.par.cp.1$topography.x.x, from = c("CoastalArea-ArabianSea", "CoastalArea-RedSea"),

to = c("CoastalArea", "CoastalArea")) count(ym.par.cp.1$topography.x.x)

ym.par.cp.1$yrschl.x.x = relevel(ym.par.cp.1$yrschl.x.x, ref = "no schooling")

ym.par.cp.1$motheredu.x.x = relevel(ym.par.cp.1$motheredu.x.x, ref = "no schooling") ym.par.cp.1$fatheredu.x.x = relevel(ym.par.cp.1$fatheredu.x.x,

ref = "no schooling")

Os dados estão prontos para que façamos o ajuste do modelo. Note que agora incorporaremos o PAC da YNSPMS na estimação dos coeficientes da regressão

r.pre.cp = data.frame(ym.par.cp.1$p6a_q_10.x.x, ym.par.cp.1$crit, ym.par.cp.1$topography.x.x, ym.par.cp.1$crowd2.x.x,

ym.par.cp.1$p2_q_03.x.x, ym.par.cp.1$p2_q_05_y.x.x, ym.par.cp.1$p3_q_2.x.x, ym.par.cp.1$yrschl.x.x, ym.par.cp.1$motheredu.x.x, ym.par.cp.1$fatheredu.x.x, ym.par.cp.1$cri.d.avi, ym.par.cp.1$cri.d.inc, ym.par.cp.1$pension.x.x, ym.par.cp.1$charit.x.x, ym.par.cp.1$remit.x.x, ym.par.cp.1$poor.x.x)

r.pos.cp = data.frame(ym.par.cp.1$p6a_q_10.y.y, ym.par.cp.1$crit, ym.par.cp.1$topography.x.x, ym.par.cp.1$crowd2.y.y, ym.par.cp.1$p2_q_03.x.x, ym.par.cp.1$p2_q_05_y.x.x, ym.par.cp.1$p3_q_2.y.y, ym.par.cp.1$yrschl.x.x, ym.par.cp.1$motheredu.x.x, ym.par.cp.1$fatheredu.x.x, ym.par.cp.1$cri.d.avi.4, ym.par.cp.1$cri.d.inc.4, ym.par.cp.1$pension.y.y, ym.par.cp.1$charit.y.y, ym.par.cp.1$remit.y.y, ym.par.cp.1$poor.y.y)

names(r.pre.cp); names(r.pos.cp) #Note que os nomes são distintos #para as mesmas variáveis.

colnames(r.pre.cp) = c("p6a_q_10", "crit", "topography", "crowd2", "p2_q_03", "p2_q_05_y", "p3_q_2", "yrschl", "motheredu", "fatheredu", "cri.d.avi", "cri.d.inc", "pension", "charit", "remit", "poor")

colnames(r.pos.cp) = c("p6a_q_10", "crit", "topography", "crowd2", "p2_q_03", "p2_q_05_y", "p3_q_2", "yrschl", "motheredu", "fatheredu", "cri.d.avi", "cri.d.inc", "pension", "charit", "remit", "poor")

dd.av1.cp = rbind.data.frame(r.pre.cp, r.pos.cp)

indper.cp = c(rep(0, nrow(ym.par.cp.1)), rep(1, nrow(ym.par.cp.1))) dd.av2.cp = cbind.data.frame(dd.av1.cp, indper.cp)

d.c = svydesign(id = ~f15 + f1, strat = ~f5, weight = ~pl, nest = TRUE, data = dd.av2)

d.c

m.dd.cp = svyglm(p6a_q_10 ~ topography + crowd2 + p2_q_03 + p2_q_05_y + p3_q_2 + yrschl + motheredu + fatheredu +

cri.d.avi + cri.d.inc + pension + charit + remit + poor + crit + indper + crit:indper,

design = d.c, family = gaussian(link = "identity")) summary(m.dd.cp); xtable(summary(m.dd.cp), digits = 4)

Pelos resultados do modelo acima, também no caso em que consideramos o PAC, o SWF não tem impacto significativo ao longo do tempo, dado o nível nominal de 5%, na resposta de interesse TSAT para o grupo das crianças. Isoladamente, os coeficientes associados à RSWF e RC também não são significativos. Para os demais coeficientes, somente os associados ao intercepto; às crianças que possuem 2 ou 3 anos de escolaridade; cujas mães têm de 5 a 8 anos de estudo; cujos pais têm de 1 a 4 anos de estudo ou não residem no domicílio (ausente); residentes em domicílios que recebem fundos de pensão ou renda através de caridade são significativos. Finalmente, residir em um domicílio em situação de pobreza moderada ou de vulnerabilidade também influencia significativamente em TSAT.

Para estimar o EPAA, um modelo adicional com os mesmos dados e especificação deve ser ajustado, mas partindo da premissa incorreta de que o banco foi pareado supondo observações IID

m.dd.cp.s = glm(p6a_q_10 ~ topography + crowd2 + p2_q_03 +

p2_q_05_y + p3_q_2 + yrschl + motheredu + fatheredu + cri.d.avi + cri.d.inc + pension + charit +

remit + poor + crit + indper + crit:indper,

data = dd.av2.cp, family = gaussian(link = "identity")) summary(m.dd.cp.s, digits = 4); xtable(summary(m.dd.cp.s), digits = 4)

De forma análoga, mas agora considerando o PAC, a avaliação de impacto pode ser feita para os adultos. Neste grupo etário, temos as mesmas candidatas a covariáveis de confundimento do caso IID. Para todas as variáveis categóricas na 1ª e 4ª rodadas, exceto EA; GA; IA; LD e TD (para as quais consideramos observações apenas na 1ª rodada), a frequência nas categorias pode ser obtida por

count(ym.par.ap$f8); count(ym.par.ap$topography.x.x) count(ym.par.ap$p2_q_03.x.x); count(ym.par.ap$yrschl.x.x) count(ym.par.ap$mun); count(ym.par.ap$mun.4)

count(ym.par.ap$avi); count(ym.par.ap$avi.4) count(ym.par.ap$inc); count(ym.par.ap$inc.4)

count(ym.par.ap$pension.x.x); count(ym.par.ap$pension.y.y) count(ym.par.ap$charit.x.x); count(ym.par.ap$charit.y.y) count(ym.par.ap$remit.x.x); count(ym.par.ap$remit.y.y) count(ym.par.ap$poor.x.x); count(ym.par.ap$poor.y.y)

Também aqui, não há nenhuma variável com cinco ou menos observações em categorias que não podem ser agrupadas com outras da mesma para pelo menos uma das rodadas. Logo, especificaremos todas as 13 covariáveis. Antes do ajuste, reuniremos categorias, alterando também a de referência quando necessário (para que corresponda a uma das categorias extremas), nas covariáveis EA e TD

ym.par.ap$yrschl.x.x = mapvalues(ym.par.ap$yrschl.x.x,

from = c("13 years of schooling", "14 years of schooling", "15 years of schooling", "16+ years of schooling"), to = c("13 years or more", "13 years or more",

"13 years or more", "13 years or more")) count(ym.par.ap$yrschl.x.x)

ym.par.ap$topography.x.x = relevel(ym.par.ap$topography.x.x, ref = "CoastalArea-RedSea") ym.par.ap$yrschl.x.x = relevel(ym.par.ap$yrschl.x.x,

ref = "no schooling")

Por fim, prosseguimos para o ajuste do modelo correspondente

r.pre.ap = data.frame(ym.par.ap$p6a_q_10.x.x, ym.par.ap$crit, ym.par.ap$f8, ym.par.ap$topography.x.x,

ym.par.ap$crowd2.x.x, ym.par.ap$p2_q_03.x.x, ym.par.ap$p2_q_05_y.x.x, ym.par.ap$yrschl.x.x, ym.par.ap$mun, ym.par.ap$avi, ym.par.ap$inc, ym.par.ap$pension.x.x, ym.par.ap$charit.x.x, ym.par.ap$remit.x.x, ym.par.ap$poor.x.x)

r.pos.ap = data.frame(ym.par.ap$p6a_q_10.y.y, ym.par.ap$crit, ym.par.ap$f8, ym.par.a$topography.x.x,

ym.par.ap$crowd2.y.y, ym.par.ap$p2_q_03.x.x, ym.par.ap$p2_q_05_y.x.x, ym.par.ap$yrschl.x.x, ym.par.ap$mun.4, ym.par.ap$avi.4, ym.par.ap$inc.4, ym.par.ap$pension.y.y, ym.par.ap$charit.y.y,

ym.par.ap$remit.y.y, ym.par.ap$poor.y.y)

names(r.pre.ap); names(r.pos.ap) #Note que os nomes são distintos #para as mesmas variáveis.

colnames(r.pre.ap) = c("p6a_q_10", "crit", "f8", "topography", "crowd2", "p2_q_03", "p2_q_05_y", "yrschl", "mun", "avi", "inc", "pension", "charit", "remit", "poor")

colnames(r.pos.ap) = c("p6a_q_10", "crit", "f8", "topography", "crowd2", "p2_q_03", "p2_q_05_y", "yrschl", "mun", "avi", "inc", "pension", "charit", "remit", "poor")

dd.av1.ap = rbind.data.frame(r.pre.ap, r.pos.ap)

indper.ap = c(rep(0, nrow(ym.par.ap)), rep(1, nrow(ym.par.ap))) dd.av2.ap = cbind.data.frame(dd.av1.ap, indper.ap)

d.a = svydesign(id = ~f15 + f1, strat = ~f5,

weight = ~pl, nest = TRUE, data = dd.av2) d.a

m.dd.ap = svyglm(p6a_q_10 ~ f8 + topography + crowd2 + p2_q_03 + p2_q_05_y + yrschl + mun + avi + inc +

pension + charit + remit + poor +

crit + indper + crit:indper, design = d.a, family = gaussian(link = "identity")) summary(m.dd.ap); xtable(summary(m.dd.ap), digits = 4)

Pelos resultados do modelo acima, o SWF não tem impacto significativo ao longo do tempo, dado o nível nominal de 5%, na resposta de interesse TSAT para o grupo dos adultos. Isoladamente, o coeficiente associado à RC não é mais significativo, ao contrário do que ocorre no caso IID. Dentre os demais coeficientes, são significativos os associados ao intercepto; aos adultos residentes na zona urbana; do gênero masculino; que possuem 2 ou pelo menos 13 anos de escolaridade; que são mulheres e chefiam o domicílio; e que residem em domicílios que recebem remessas de parentes ou amigos. Por fim, residir em um domicílio em situação de pobreza moderada também influencia significativamente em

TSAT.

Para estimar o EPAA, um modelo adicional com os mesmos dados e especificação deve ser ajustado, mas partindo da premissa incorreta de que o banco foi pareado supondo observações IID

m.dd.ap.s = glm(p6a_q_10 ~ f8 + topography + crowd2 + p2_q_03 + p2_q_05_y + yrschl + mun + avi + inc +

pension + charit + remit + poor + crit + indper + crit:indper,

data = dd.av2.ap, family = gaussian(link = "identity")) summary(m.dd.ap.s, digits = 4); xtable(summary(m.dd.ap.s), digits = 4)

ANEXO A – Histogramas da Densidade da

Variável TSAT

Figura 2 – Densidade da variável TSAT nos adultos, caso IID, 1ª rodada.

Figura 4 – Densidade da variável TSAT nas crianças, caso IID, 1ª rodada.

Figura 6 – Densidade da variável TSAT nos adultos, considerando o PAC da YNSPMS, 1ª rodada.

Figura 7 – Densidade da variável TSAT nos adultos, considerando o PAC da YNSPMS, 4ª rodada.

No documento Avaliação do impacto de políticas de transferência de renda a partir de dados amostrais complexos (páginas 189-200)