• Nenhum resultado encontrado

3.2 Imputação

3.2.3 Método de imputação utilizado na PAC

Atualmente, na PAC, o questionário de uma empresa pode ser imputado de duas formas distin-

tas: ou através de seu histórico ou através de uma empresa doadora.

É feita imputação por histórico quando a empresa tiver respondido à pesquisa nos dois anos

anteriores ou posteriores ao ano que se deseja imputar, desde que não pertença ao estrato A1

(empresas de pequeno porte), pois todas as empresas desse estrato são indicadas para imputação

por doadora devido ao alto número de mortalidade das empresas de pequeno porte. Caso a empresa

não atenda aos critérios de imputação por histórico é feita a imputação pela empresa doadora,

3.2 IMPUTAÇÃO 33

Figura 3.1: Fluxo de imputação pelo modelo do IBGE

Independentemente do tipo de imputação utilizada, as informações referentes a P O e SALARIO

são obtidas diretamente da RAIS através dos valores informados pelas empresas ao Ministério do

Trabalho: P ORAIS e SALARIORAIS; sendo necessária assim, somente a imputação das informações

adicionais. Portanto, só podem ser imputadas empresas que tenham respondido à RAIS, tendo

respondido haver exercido atividade e informado seus valores de P O e SALARIO no ano a se

imputar.

No caso de imputação pelo histórico, utiliza-se a estrutura da empresa no ano considerado

como histórico, isto é, a relação entre as variáveis da empresa como base para calcular um fator de

variação de cada variável dentro dos blocos de P O e de SALARIO com os respectivos valores de

P O e SALARIO do ano em que se tem informação (ano do histórico) e multiplica-se essa variação

pelo valor informado de P O e de SALARIO do ano de referência da imputação obtido pela RAIS,

isto é, P ORAIS e SALARIORAIS, respectivo de cada bloco. Esse cálculo é replicado em todo o

bloco de P O e SALARIO do questionário imputado.

Estima-se a RECEIT A1 por um fator de variação entre os valores informados de RECEIT A e

SALARIORAIS do ano histórico, multiplicado pelo valor de SALARIORAIS do ano de imputação.

1

As definições das variáveis P O, P OAt, P ON A, SAL, SALARIO, RECEIT A, REC1 e REC2 encontram-se nas

34 IMPUTAÇÃO E OUTRAS FORMAS DE LIDAR COM A NÃO-RESPOSTA 3.2

Nos demais blocos, essa variação é feita em relação ao valor de REC1 informado no ano do

histórico. Com isso, multiplica-se essa variação à RECEIT A estimada para estimar as demais

variáveis econômicas do questionário não pertencentes aos blocos citados acima.

Já no caso de imputação através de uma empresa doadora (também conhecido como vizinho

mais próximo), primeiramente estima-se o valor da RECEIT A através da mediana dos valores

conhecidos da variável RECEIT A das empresas que estejam no mesmo estrato final da empresa

imputada no ano de imputação: RECEIT AM ED. Caso não seja possível calcular a mediana desse

modo, formam-se outras agregações até que seja possível encontrar a mediana.

Posteriormente, são utilizadas as variáveis P ORAIS, SALARIORAIS e RECEIT AM ED para

analisar qual será a empresa doadora, sendo escolhida aquela com menor distância considerando

as variáveis citadas no ano de imputação, como também respeitando a mesma agregação utilizada

para estimar a RECEIT A no processo anterior.

Em seguida, é aplicado um procedimento similar ao realizado nas empresas imputadas por

histórico aproveitando a estrutura da empresa doadora como suporte. Utiliza-se, então, um fator

de variação de cada variável dentro dos blocos de P O e de SALARIO com os respectivos valores

de P O e SALARIO do ano de imputação e multiplica-se essa variação com o valor informado de

P ORAIS e SALARIORAIS do ano de referência da imputação. Replica-se esse cálculo em todo o

bloco de P O e SALARIO do questionário imputado.

Nos demais blocos, essa variação é feita em relação ao valor de REC1 informada pela doa-

dora. Posteriormente, aplica-se essa variação à RECEIT AM ED para estimar as demais variáveis

econômicas do questionário não pertencentes aos blocos citados acima.

Os métodos de imputação por histórico e através de uma empresa doadora serão melhor de-

talhados adiante, mas para isso serão apresentadas algumas novas definições: as variáveis P Ot, P OAt,

P ON A

t , SALt, SALARIOt, RECEIT At, RECt1, RECt2, CON SIN Tt, P ORAIS;te SALARIORAIS;t representam, respectivamente, as variáveis P O, P OA, P ON A, SAL, SALARIO, RECEIT A, REC1,

REC2, CON SIN T , P ORAIS e SALARIORAIS no ano t.

Imputação por Histórico

Sejam receitait e salarioit os respectivos valores das variáveis RECEIT At e SALARIOtpara

a empresa i, então quando a imputação é feita por histórico, pode-se estimar receitaitpela seguinte

relação: \ receitait= receitait0 salarioit0 ∗ salarioit,

3.2 IMPUTAÇÃO 35

em que:

t é o ano de referência da empresa que está sendo imputada; e

t0 é o ano do histórico usado para estimar a receita da empresa i no ano t, para o qual existem

informações de RECEIT A e SALARIO.

As demais variáveis do questionário são estimadas replicando a estrutura da empresa no ano do

histórico.

Seja P OQ uma variável qualquer pertencente ao bloco de número 5 de perguntas dos questi-

onários simplificado (Anexo A) e completo (Anexo B) da PAC referentes ao quadro funcional da

empresa (pessoal ocupado). Seja também SALQ uma variável qualquer do bloco de número 8 do

questionário simplificado e de número 14 do questionário completo referentes aos gastos com pessoal

da empresa e seja ainda V ARQ uma variável qualquer dos questionários simplificado ou completo

pertencente à parte II dos questionários (Informações da empresa) com exceção dos blocos referentes

a pessoal ocupado e gastos com pessoal, então são estimadas as demais variáveis dos questionários

da seguinte forma:

• Para o bloco das variáveis de P O:

ˆ

poqit= poqit0 poit0

∗ poRAIS;it,

• Para o bloco das variáveis de SALARIO:

ˆ

salqit= salqit0 salarioit0

∗ salarioRAIS;it,

• Para as demais variáveis, temos:

ˆ

varqit = dit0 receitait0

∗ \receitait,

em que:

t é o ano de referência da empresa que está sendo imputada;

t0 é o ano do histórico usado para estimar poqit, salqit e varqit no ano t;

poRAIS;it e salarioRAIS;it são os respectivos valores de P ORAIS;t e SALARIORAIS;t da empresa i;

e

poqit, salqit e dit são, respectivamente, os valores das variáveis P OQ, SALQ e V ARQ da empresa

36 IMPUTAÇÃO E OUTRAS FORMAS DE LIDAR COM A NÃO-RESPOSTA 3.2

Imputação por Empresa Doadora

No caso de empresas imputadas por empresa doadora, estima-se a receitait com base na medi-

ana dos valores dos respondentes do estrato do qual a empresa foi selecionada (UF, CNAE, e ESTF

- que será chamado de GRU P O1). Caso o número de respondentes do GRU P O1 seja menor do

que quatro, então procura-se o valor da mediana dos respondentes a partir de outros agrupamentos,

sempre começando pelo GRU P O2. Caso o GRU P O2 também não tenha quatro empresas respon-

dentes, então seguimos para o GRU P O3, depois para o GRU P O4 e por último o GRU P O5, caso

os agrupamentos continuem com menos de quatro empresas respondentes.

A descrição de todos os agrupamentos, do GRU P O1 ao GRU P O5 são apresentados na Tabela

3.1:

Tabela 3.1: Agrupamento para o cálculo da mediana da RECEIT A

Grupo Agrupamento

1 UF x CNAE x ESTF

2 REGIÃO GEOGRÁFICA x CNAE x ESTF

3 CNAE x ESTF

4 CNAE x ESTF-A1

5 CNAE

Ou seja, caso o estrato não tenha quatro respondentes, amplia-se a abrangência regional e caso

esse corte ainda não seja suficiente para encontrar uma mediana, desconsidera-se a sua posição

geográfica e se mesmo assim, ainda não for suficiente, desconsidera-se o estrato final original da

empresa.

Com isso, podemos dizer que:

\

receitait= med{RECEIT At}G, (3.2)

em que med{RECEIT At}G é a mediana da variável RECEIT At sob o o agrupamento G, sendo

G um dos agrupamentos GRU P O1, GRU P O2, GRU P O3, GRU P O4 ou GRU P O5, conforme

ordenação descrita anteriormente.

Em seguida, a partir dos valores de poRAIS;it, salRAIS;it e receita\it da empresa a ser imputada,

seleciona-se uma empresa respondente do mesmo ano da empresa a ser imputada pelo critério da

menor distância de uma base pré-criticada a fim de modelar a estrutura da empresa, estimando a

relação dessas variáveis com o restante do questionário. 1

3.2 IMPUTAÇÃO 37

O cálculo da distância entre as empresas é feito da seguinte forma:

distanciail = distP Oil + distSALil + distRECil ,

tal que:

distanciail é o valor simbólico da distância entre as empresas i e l no ano t;

distP Oil é a parcela do cálculo da distância referente à variável P O entre as empresas i e l no ano t;

distSALil é a parcela do cálculo da distância referente à variável SAL entre as empresas i e l no ano

t;

distREC

il é a parcela do cálculo da distância referente à variável RECEIT A entre as empresas i e l

no ano t;

As parcelas distP Oil , distSALil e distRECil são obtidas através do seguinte cálculo:

distP Oil = poRAIS;it− polt poRAIS;it ; distSALil =

salRAIS;it− sallt salRAIS;it ; distRECil = \ receitait− receitalt \ receitait ;

tal que polt, sallte receitaltsão os valores das variáveis P Ot, SALte RECEIT Atpara uma empresa

l, l 6= i.

A empresa escolhida para ser usada como doadora é aquela que tem o menor valor distanciaik

e por isso essa empresa também é conhecida como vizinho mais próximo, pois acredita-se ser ela a

que mais se assemelha à empresa a ser imputada.

Sejam gpoqit, gsalqit, ]varqit, poeit e ^salarioit, respectivamente, os valores referentes às variáveis P OQ, SALQ e V ARQ da empresa selecionada como doadora da empresa imputada i no ano t,

então são estimadas as demais variáveis do questionário usando como referência a estrutura dessa

empresa como se segue:

• Para o bloco das variáveis de P O:

ˆ

poqit = poqgit e

38 IMPUTAÇÃO E OUTRAS FORMAS DE LIDAR COM A NÃO-RESPOSTA 3.2

• Para o bloco das variáveis de SALARIO:

ˆ

salqit= salqgit ^ salarioit

∗ salarioRAIS;it

• Para as demais variáveis, temos:

ˆ dit= ] varqit ^ receitait ∗ \receitait, em que:

t é o ano de referência da empresa que está sendo imputada; e

t0 é o ano do histórico usado para estimar poqit, salqit e dit no ano t.

poRAIS;it e salarioRAIS;it são os respectivos valores de P ORAIS;t e SALARIORAIS;t da empresa i;

e

]

poqit, ^salqit e ^varqit são, respectivamente, os valores referentes às variáveis P OQ, SALQ e V ARQ da empresa i no ano t.

Documentos relacionados