Avaliação de Impacto do SWF em TSAT sem PAC

B.2 Código para o Cálculo de Estimativas

B.2.5 Avaliação de Impacto do SWF em TSAT sem PAC

Para os dois bancos pareados obtidos na subseçãoB.2.3 (caso IID), ajustaremos modelos de regressão linear normal para TSAT, a resposta de interesse, a fim de avaliarmos o impacto do SWF, dado pela interação entre RSWF (a variável de atribuição do tratamento)

e RC (a rodada de coleta das observações). Também é relevante quantificar a influência de RSWF e RC isoladamente, bem como de variáveis em tese fortemente associadas ao tempo que a criança ou adulto aloca semanalmente para o trabalho (potenciais covariáveis de confundimento do modelo). Começando pelo grupo das crianças, temos as seguintes candidatas a covariáveis de confundimento, além das utilizadas para a modelagem do escore de propensão, com seus nomes originais na YNSPMS entre parênteses:

• CPI: Criança é Portadora de Invalidez (p2_q_11); • EC: Escolaridade da Criança (yrschl);

• EMC: Escolaridade da Mãe da Criança (motheredu); • EPC: Escolaridade do Pai da Criança (fatheredu);

• GC: Gênero da Criança, masculino ou feminino (p2_q_03); • IC: Idade da Criança, em anos (p2_q_05_y);

• LD: Localização do Domicílio, na zona urbana ou rural (f8); • MCPE: Matrícula da Criança em Programa Educacional (p3_q_2); • PCD: Pessoas por Cômodo no Domicílio (crowd2);

• TD: Topografia do Domicílio (topography).

Para todas as variáveis categóricas (IC é discreta e PCD é contínua) candidatas a covariáveis de confundimento na 1ª e 4ª rodadas, exceto EC; EMC; EPC; GC; IC; LD e TD (para as quais consideramos observações apenas na 1ª rodada), a frequência nas categorias é dada por

count(ym.par.c$f8); count(ym.par.c$topography.x.x) count(ym.par.c$p2_q_03.x.x) count(ym.par.c$p2_q_11.x.x); count(ym.par.c$p2_q_11.y.y) count(ym.par.c$p3_q_2.x.x); count(ym.par.c$p3_q_2.y.y) count(ym.par.c$yrschl.x.x); count(ym.par.c$motheredu.x.x) count(ym.par.c$fatheredu.x.x) count(ym.par.c$cri.d.mun); count(ym.par.c$cri.d.mun.4) count(ym.par.c$cri.d.avi); count(ym.par.c$cri.d.avi.4) count(ym.par.c$cri.d.inc); count(ym.par.c$cri.d.inc.4) count(ym.par.c$pension.x.x); count(ym.par.c$pension.y.y) count(ym.par.c$charit.x.x); count(ym.par.c$charit.y.y) count(ym.par.c$remit.x.x); count(ym.par.c$remit.y.y) count(ym.par.c$poor.x.x); count(ym.par.c$poor.y.y)

Por possuírem cinco ou menos observações em categorias que não podem ser agrupadas com outras da mesma variável para pelo menos uma das rodadas, excluímos da especificação para o modelo de regressão linear normal as variáveis CPI; LD e CRDCM. Logo, especificaremos 14 covariáveis de confundimento. Antes do ajuste, reuniremos categorias, alterando também a de referência quando necessário (para que corresponda a uma das categorias extremas), nas covariáveis EC; EMC; EPC e TD

ym.par.c$yrschl.x.x = mapvalues(ym.par.c$yrschl.x.x,

from = c("7 years of schooling", "8 years of schooling",

"9 years of schooling", "non-standard: Quran & Literacy"), to = c("7 years or more", "7 years or more",

"7 years or more", "no schooling")) count(ym.par.c$yrschl.x.x)

ym.par.c$motheredu.x.x = mapvalues(ym.par.c$motheredu.x.x, from = c("2 years of schooling", "3 years of schooling", "4 years of schooling", "5 years of schooling", "6 years of schooling", "8 years of schooling", "9 years of schooling", "10 years of schooling",

"12 years of schooling", "non-standard: Quran & Literacy", "non-app: orphan or mother does not live HH"),

to = c("1 to 4 years of schooling", "1 to 4 years of schooling", "1 to 4 years of schooling", "5 to 8 years of schooling", "5 to 8 years of schooling", "5 to 8 years of schooling", "9 years or more", "9 years or more", "9 years or more", "no schooling", "orphan or mother does not live HH")) count(ym.par.c$motheredu.x.x)

ym.par.c$fatheredu.x.x = mapvalues(ym.par.c$fatheredu.x.x, from = c("2 years of schooling", "3 years of schooling", "4 years of schooling", "5 years of schooling", "6 years of schooling", "7 years of schooling", "8 years of schooling", "9 years of schooling", "10 years of schooling", "11 years of schooling", "12 years of schooling", "13 years of schooling", "14 years of schooling", "15 years of schooling",

"non-app: orphan or father does not live HH"),

to = c("1 to 4 years of schooling", "1 to 4 years of schooling", "1 to 4 years of schooling", "5 to 8 years of schooling", "5 to 8 years of schooling", "5 to 8 years of schooling", "5 to 8 years of schooling", "9 years or more",

"9 years or more", "9 years or more", "9 years or more", "9 years or more", "9 years or more", "9 years or more", "9 years or more", "no schooling",

"orphan or father does not live HH")) count(ym.par.c$fatheredu.x.x)

ym.par.c$topography.x.x = mapvalues(ym.par.c$topography.x.x, from = c("CoastalArea-ArabianSea", "CoastalArea-RedSea"), to = c("CoastalArea", "CoastalArea"))

count(ym.par.c$topography.x.x)

ym.par.c$yrschl.x.x = relevel(ym.par.c$yrschl.x.x, ref = "no schooling") ym.par.c$motheredu.x.x = relevel(ym.par.c$motheredu.x.x,

ref = "no schooling") ym.par.c$fatheredu.x.x = relevel(ym.par.c$fatheredu.x.x,

ref = "no schooling")

Agora os dados estão prontos para que façamos o ajuste do modelo

r.pre.c = data.frame(ym.par.c$p6a_q_10.x.x, ym.par.c$crit, ym.par.c$topography.x.x, ym.par.c$crowd2.x.x, ym.par.c$p2_q_03.x.x, ym.par.c$p2_q_05_y.x.x, ym.par.c$p3_q_2.x.x, ym.par.c$yrschl.x.x, ym.par.c$motheredu.x.x, ym.par.c$fatheredu.x.x, ym.par.c$cri.d.avi, ym.par.c$cri.d.inc, ym.par.c$pension.x.x, ym.par.c$charit.x.x, ym.par.c$remit.x.x, ym.par.c$poor.x.x)

r.pos.c = data.frame(ym.par.c$p6a_q_10.y.y, ym.par.c$crit, ym.par.c$topography.x.x, ym.par.c$crowd2.y.y,

ym.par.c$p2_q_03.x.x, ym.par.c$p2_q_05_y.x.x, ym.par.c$p3_q_2.y.y, ym.par.c$yrschl.x.x,

ym.par.c$motheredu.x.x, ym.par.c$fatheredu.x.x, ym.par.c$cri.d.avi.4, ym.par.c$cri.d.inc.4, ym.par.c$pension.y.y, ym.par.c$charit.y.y, ym.par.c$remit.y.y, ym.par.c$poor.y.y)

names(r.pre.c); names(r.pos.c) #Note que os nomes são distintos #para as mesmas variáveis.

colnames(r.pre.c) = c("p6a_q_10", "crit", "topography", "crowd2",

"p2_q_03", "p2_q_05_y", "p3_q_2", "yrschl", "motheredu", "fatheredu", "cri.d.avi", "cri.d.inc", "pension", "charit", "remit", "poor")

colnames(r.pos.c) = c("p6a_q_10", "crit", "topography", "crowd2",

"p2_q_03", "p2_q_05_y", "p3_q_2", "yrschl", "motheredu", "fatheredu", "cri.d.avi", "cri.d.inc", "pension", "charit", "remit", "poor")

dd.av1.c = rbind.data.frame(r.pre.c, r.pos.c)

indper.c = c(rep(0, nrow(ym.par.c)), rep(1, nrow(ym.par.c))) dd.av2.c = cbind.data.frame(dd.av1.c, indper.c)

m.dd.c = glm(p6a_q_10 ~ topography + crowd2 + p2_q_03 + p2_q_05_y + p3_q_2 + yrschl + motheredu + fatheredu +

cri.d.avi + cri.d.inc + pension + charit + remit + poor + crit + indper + crit:indper, data = dd.av2.c,

family = gaussian(link = "identity")) summary(m.dd.c); xtable(summary(m.dd.c), digits = 4)

Pelos resultados do modelo acima, o SWF não tem impacto significativo ao longo do tempo, dado o nível nominal de 5%, na resposta de interesse TSAT para o grupo das crianças. Este impacto é dado pela estimativa pontual do coeficiente associado à interação entre RSWF e RC. Isoladamente, os coeficientes associados à RSWF e RC também não são significativos. Para os demais coeficientes, somente os associados ao intercepto; às crianças residentes em regiões desérticas; atualmente matriculadas em algum programa educacional; com 4 ou 6 anos de escolaridade ou cujos pais têm de 1 a 4 anos de estudo são significativos.

De maneira similar e ainda dentro do caso IID, a avaliação de impacto pode ser feita para os adultos. Neste grupo etário, temos as seguintes candidatas a covariáveis de confundimento, além das utilizadas para a modelagem do escore de propensão, com seus nomes originais na YNSPMS entre parênteses:

• EA: Escolaridade do Adulto (yrschl);

• GA: Gênero do Adulto, masculino ou feminino (p2_q_03); • IA: Idade do Adulto, em anos (p2_q_05_y);

• LD: Localização do Domicílio, na zona urbana ou rural (f8); • PCD: Pessoas por Cômodo no Domicílio (crowd2);

• TD: Topografia do Domicílio (topography).

Novamente, para todas as variáveis categóricas (IA é discreta e PCD é contínua) candidatas a covariáveis de confundimento na 1ª e 4ª rodadas, exceto EA; GA; IA; LD e TD (para as quais consideramos observações apenas na 1ª rodada), a frequência nas categorias pode ser obtida por

count(ym.par.a$f8); count(ym.par.a$topography.x.x) count(ym.par.a$p2_q_03.x.x); count(ym.par.a$yrschl.x.x) count(ym.par.a$mun); count(ym.par.a$mun.4) count(ym.par.a$avi); count(ym.par.a$avi.4) count(ym.par.a$inc); count(ym.par.a$inc.4) count(ym.par.a$pension.x.x); count(ym.par.a$pension.y.y) count(ym.par.a$charit.x.x); count(ym.par.a$charit.y.y) count(ym.par.a$remit.x.x); count(ym.par.a$remit.y.y) count(ym.par.a$poor.x.x); count(ym.par.a$poor.y.y)

Não há nenhuma variável com cinco ou menos observações em categorias que não podem ser agrupadas com outras da mesma para pelo menos uma das rodadas. Logo, especificaremos todas as 13 covariáveis. Antes do ajuste, reuniremos categorias, alterando também a de referência quando necessário (para que corresponda a uma das categorias extremas), nas covariáveis EA e TD

ym.par.a$yrschl.x.x = mapvalues(ym.par.a$yrschl.x.x,

from = c("13 years of schooling", "14 years of schooling", "15 years of schooling", "16+ years of schooling"), to = c("13 years or more", "13 years or more",

"13 years or more", "13 years or more")) count(ym.par.a$yrschl.x.x)

ym.par.a$topography.x.x = relevel(ym.par.a$topography.x.x, ref = "CoastalArea-RedSea") ym.par.a$yrschl.x.x = relevel(ym.par.a$yrschl.x.x,

ref = "no schooling")

Por fim, prosseguimos para o ajuste do modelo correspondente

r.pre.a = data.frame(ym.par.a$p6a_q_10.x.x, ym.par.a$crit, ym.par.a$f8, ym.par.a$topography.x.x,

ym.par.a$crowd2.x.x, ym.par.a$p2_q_03.x.x, ym.par.a$p2_q_05_y.x.x, ym.par.a$yrschl.x.x, ym.par.a$mun, ym.par.a$avi, ym.par.a$inc, ym.par.a$pension.x.x, ym.par.a$charit.x.x, ym.par.a$remit.x.x, ym.par.a$poor.x.x)

r.pos.a = data.frame(ym.par.a$p6a_q_10.y.y, ym.par.a$crit, ym.par.a$f8, ym.par.a$topography.x.x,

ym.par.a$crowd2.y.y, ym.par.a$p2_q_03.x.x, ym.par.a$p2_q_05_y.x.x, ym.par.a$yrschl.x.x, ym.par.a$mun.4, ym.par.a$avi.4, ym.par.a$inc.4, ym.par.a$pension.y.y, ym.par.a$charit.y.y, ym.par.a$remit.y.y, ym.par.a$poor.y.y)

names(r.pre.a); names(r.pos.a) #Note que os nomes são distintos #para as mesmas variáveis.

colnames(r.pre.a) = c("p6a_q_10", "crit", "f8", "topography", "crowd2", "p2_q_03", "p2_q_05_y", "yrschl", "mun", "avi", "inc", "pension", "charit", "remit", "poor")

colnames(r.pos.a) = c("p6a_q_10", "crit", "f8", "topography", "crowd2", "p2_q_03", "p2_q_05_y", "yrschl", "mun", "avi", "inc", "pension", "charit", "remit", "poor")

dd.av1.a = rbind.data.frame(r.pre.a, r.pos.a)

indper.a = c(rep(0, nrow(ym.par.a)), rep(1, nrow(ym.par.a))) dd.av2.a = cbind.data.frame(dd.av1.a, indper.a)

m.dd.a = glm(p6a_q_10 ~ f8 + topography + crowd2 + p2_q_03 + p2_q_05_y + yrschl + mun + avi + inc +

pension + charit + remit + poor +

crit + indper + crit:indper, data = dd.av2.a, family = gaussian(link = "identity"))

summary(m.dd.a); xtable(summary(m.dd.a), digits = 4)

Pelos resultados do modelo acima, o SWF não tem impacto significativo ao longo do tempo, dado o nível nominal de 5%, na resposta de interesse TSAT para o grupo dos adultos. Isoladamente, o coeficiente associado à RC é negativo e significativo, indicando que os adultos trabalham menos na 4ª rodada do que na 1ª. Dentre os demais coeficientes, são significativos os associados ao intercepto; aos adultos residentes na zona urbana ou no litoral Leste (banhado pelo Mar Arábico); à PCD; aos adultos do gênero masculino; à IA; que possuem 2, 11 ou pelo menos 13 anos de escolaridade; que são mulheres e chefiam o domicílio; residem em domicílios que recebem fundos de pensão ou remessas de parentes ou amigos. Ainda, todos os três coeficientes associados às categorias de NPD (exceto a de referência) são significativos.

No documento Avaliação do impacto de políticas de transferência de renda a partir de dados amostrais complexos (páginas 182-189)