3.2 Imputação
3.2.3 Método de imputação utilizado na PAC
Atualmente, na PAC, o questionário de uma empresa pode ser imputado de duas formas distin-
tas: ou através de seu histórico ou através de uma empresa doadora.
É feita imputação por histórico quando a empresa tiver respondido à pesquisa nos dois anos
anteriores ou posteriores ao ano que se deseja imputar, desde que não pertença ao estrato A1
(empresas de pequeno porte), pois todas as empresas desse estrato são indicadas para imputação
por doadora devido ao alto número de mortalidade das empresas de pequeno porte. Caso a empresa
não atenda aos critérios de imputação por histórico é feita a imputação pela empresa doadora,
3.2 IMPUTAÇÃO 33
Figura 3.1: Fluxo de imputação pelo modelo do IBGE
Independentemente do tipo de imputação utilizada, as informações referentes a P O e SALARIO
são obtidas diretamente da RAIS através dos valores informados pelas empresas ao Ministério do
Trabalho: P ORAIS e SALARIORAIS; sendo necessária assim, somente a imputação das informações
adicionais. Portanto, só podem ser imputadas empresas que tenham respondido à RAIS, tendo
respondido haver exercido atividade e informado seus valores de P O e SALARIO no ano a se
imputar.
No caso de imputação pelo histórico, utiliza-se a estrutura da empresa no ano considerado
como histórico, isto é, a relação entre as variáveis da empresa como base para calcular um fator de
variação de cada variável dentro dos blocos de P O e de SALARIO com os respectivos valores de
P O e SALARIO do ano em que se tem informação (ano do histórico) e multiplica-se essa variação
pelo valor informado de P O e de SALARIO do ano de referência da imputação obtido pela RAIS,
isto é, P ORAIS e SALARIORAIS, respectivo de cada bloco. Esse cálculo é replicado em todo o
bloco de P O e SALARIO do questionário imputado.
Estima-se a RECEIT A1 por um fator de variação entre os valores informados de RECEIT A e
SALARIORAIS do ano histórico, multiplicado pelo valor de SALARIORAIS do ano de imputação.
1
As definições das variáveis P O, P OAt, P ON A, SAL, SALARIO, RECEIT A, REC1 e REC2 encontram-se nas
34 IMPUTAÇÃO E OUTRAS FORMAS DE LIDAR COM A NÃO-RESPOSTA 3.2
Nos demais blocos, essa variação é feita em relação ao valor de REC1 informado no ano do
histórico. Com isso, multiplica-se essa variação à RECEIT A estimada para estimar as demais
variáveis econômicas do questionário não pertencentes aos blocos citados acima.
Já no caso de imputação através de uma empresa doadora (também conhecido como vizinho
mais próximo), primeiramente estima-se o valor da RECEIT A através da mediana dos valores
conhecidos da variável RECEIT A das empresas que estejam no mesmo estrato final da empresa
imputada no ano de imputação: RECEIT AM ED. Caso não seja possível calcular a mediana desse
modo, formam-se outras agregações até que seja possível encontrar a mediana.
Posteriormente, são utilizadas as variáveis P ORAIS, SALARIORAIS e RECEIT AM ED para
analisar qual será a empresa doadora, sendo escolhida aquela com menor distância considerando
as variáveis citadas no ano de imputação, como também respeitando a mesma agregação utilizada
para estimar a RECEIT A no processo anterior.
Em seguida, é aplicado um procedimento similar ao realizado nas empresas imputadas por
histórico aproveitando a estrutura da empresa doadora como suporte. Utiliza-se, então, um fator
de variação de cada variável dentro dos blocos de P O e de SALARIO com os respectivos valores
de P O e SALARIO do ano de imputação e multiplica-se essa variação com o valor informado de
P ORAIS e SALARIORAIS do ano de referência da imputação. Replica-se esse cálculo em todo o
bloco de P O e SALARIO do questionário imputado.
Nos demais blocos, essa variação é feita em relação ao valor de REC1 informada pela doa-
dora. Posteriormente, aplica-se essa variação à RECEIT AM ED para estimar as demais variáveis
econômicas do questionário não pertencentes aos blocos citados acima.
Os métodos de imputação por histórico e através de uma empresa doadora serão melhor de-
talhados adiante, mas para isso serão apresentadas algumas novas definições: as variáveis P Ot, P OAt,
P ON A
t , SALt, SALARIOt, RECEIT At, RECt1, RECt2, CON SIN Tt, P ORAIS;te SALARIORAIS;t representam, respectivamente, as variáveis P O, P OA, P ON A, SAL, SALARIO, RECEIT A, REC1,
REC2, CON SIN T , P ORAIS e SALARIORAIS no ano t.
Imputação por Histórico
Sejam receitait e salarioit os respectivos valores das variáveis RECEIT At e SALARIOtpara
a empresa i, então quando a imputação é feita por histórico, pode-se estimar receitaitpela seguinte
relação: \ receitait= receitait0 salarioit0 ∗ salarioit,
3.2 IMPUTAÇÃO 35
em que:
t é o ano de referência da empresa que está sendo imputada; e
t0 é o ano do histórico usado para estimar a receita da empresa i no ano t, para o qual existem
informações de RECEIT A e SALARIO.
As demais variáveis do questionário são estimadas replicando a estrutura da empresa no ano do
histórico.
Seja P OQ uma variável qualquer pertencente ao bloco de número 5 de perguntas dos questi-
onários simplificado (Anexo A) e completo (Anexo B) da PAC referentes ao quadro funcional da
empresa (pessoal ocupado). Seja também SALQ uma variável qualquer do bloco de número 8 do
questionário simplificado e de número 14 do questionário completo referentes aos gastos com pessoal
da empresa e seja ainda V ARQ uma variável qualquer dos questionários simplificado ou completo
pertencente à parte II dos questionários (Informações da empresa) com exceção dos blocos referentes
a pessoal ocupado e gastos com pessoal, então são estimadas as demais variáveis dos questionários
da seguinte forma:
• Para o bloco das variáveis de P O:
ˆ
poqit= poqit0 poit0
∗ poRAIS;it,
• Para o bloco das variáveis de SALARIO:
ˆ
salqit= salqit0 salarioit0
∗ salarioRAIS;it,
• Para as demais variáveis, temos:
ˆ
varqit = dit0 receitait0
∗ \receitait,
em que:
t é o ano de referência da empresa que está sendo imputada;
t0 é o ano do histórico usado para estimar poqit, salqit e varqit no ano t;
poRAIS;it e salarioRAIS;it são os respectivos valores de P ORAIS;t e SALARIORAIS;t da empresa i;
e
poqit, salqit e dit são, respectivamente, os valores das variáveis P OQ, SALQ e V ARQ da empresa
36 IMPUTAÇÃO E OUTRAS FORMAS DE LIDAR COM A NÃO-RESPOSTA 3.2
Imputação por Empresa Doadora
No caso de empresas imputadas por empresa doadora, estima-se a receitait com base na medi-
ana dos valores dos respondentes do estrato do qual a empresa foi selecionada (UF, CNAE, e ESTF
- que será chamado de GRU P O1). Caso o número de respondentes do GRU P O1 seja menor do
que quatro, então procura-se o valor da mediana dos respondentes a partir de outros agrupamentos,
sempre começando pelo GRU P O2. Caso o GRU P O2 também não tenha quatro empresas respon-
dentes, então seguimos para o GRU P O3, depois para o GRU P O4 e por último o GRU P O5, caso
os agrupamentos continuem com menos de quatro empresas respondentes.
A descrição de todos os agrupamentos, do GRU P O1 ao GRU P O5 são apresentados na Tabela
3.1:
Tabela 3.1: Agrupamento para o cálculo da mediana da RECEIT A
Grupo Agrupamento
1 UF x CNAE x ESTF
2 REGIÃO GEOGRÁFICA x CNAE x ESTF
3 CNAE x ESTF
4 CNAE x ESTF-A1
5 CNAE
Ou seja, caso o estrato não tenha quatro respondentes, amplia-se a abrangência regional e caso
esse corte ainda não seja suficiente para encontrar uma mediana, desconsidera-se a sua posição
geográfica e se mesmo assim, ainda não for suficiente, desconsidera-se o estrato final original da
empresa.
Com isso, podemos dizer que:
\
receitait= med{RECEIT At}G, (3.2)
em que med{RECEIT At}G é a mediana da variável RECEIT At sob o o agrupamento G, sendo
G um dos agrupamentos GRU P O1, GRU P O2, GRU P O3, GRU P O4 ou GRU P O5, conforme
ordenação descrita anteriormente.
Em seguida, a partir dos valores de poRAIS;it, salRAIS;it e receita\it da empresa a ser imputada,
seleciona-se uma empresa respondente do mesmo ano da empresa a ser imputada pelo critério da
menor distância de uma base pré-criticada a fim de modelar a estrutura da empresa, estimando a
relação dessas variáveis com o restante do questionário. 1
3.2 IMPUTAÇÃO 37
O cálculo da distância entre as empresas é feito da seguinte forma:
distanciail = distP Oil + distSALil + distRECil ,
tal que:
distanciail é o valor simbólico da distância entre as empresas i e l no ano t;
distP Oil é a parcela do cálculo da distância referente à variável P O entre as empresas i e l no ano t;
distSALil é a parcela do cálculo da distância referente à variável SAL entre as empresas i e l no ano
t;
distREC
il é a parcela do cálculo da distância referente à variável RECEIT A entre as empresas i e l
no ano t;
As parcelas distP Oil , distSALil e distRECil são obtidas através do seguinte cálculo:
distP Oil = poRAIS;it− polt poRAIS;it ; distSALil =
salRAIS;it− sallt salRAIS;it ; distRECil = \ receitait− receitalt \ receitait ;
tal que polt, sallte receitaltsão os valores das variáveis P Ot, SALte RECEIT Atpara uma empresa
l, l 6= i.
A empresa escolhida para ser usada como doadora é aquela que tem o menor valor distanciaik
e por isso essa empresa também é conhecida como vizinho mais próximo, pois acredita-se ser ela a
que mais se assemelha à empresa a ser imputada.
Sejam gpoqit, gsalqit, ]varqit, poeit e ^salarioit, respectivamente, os valores referentes às variáveis P OQ, SALQ e V ARQ da empresa selecionada como doadora da empresa imputada i no ano t,
então são estimadas as demais variáveis do questionário usando como referência a estrutura dessa
empresa como se segue:
• Para o bloco das variáveis de P O:
ˆ
poqit = poqgit e
38 IMPUTAÇÃO E OUTRAS FORMAS DE LIDAR COM A NÃO-RESPOSTA 3.2
• Para o bloco das variáveis de SALARIO:
ˆ
salqit= salqgit ^ salarioit
∗ salarioRAIS;it
• Para as demais variáveis, temos:
ˆ dit= ] varqit ^ receitait ∗ \receitait, em que:
t é o ano de referência da empresa que está sendo imputada; e
t0 é o ano do histórico usado para estimar poqit, salqit e dit no ano t.
poRAIS;it e salarioRAIS;it são os respectivos valores de P ORAIS;t e SALARIORAIS;t da empresa i;
e
]
poqit, ^salqit e ^varqit são, respectivamente, os valores referentes às variáveis P OQ, SALQ e V ARQ da empresa i no ano t.