• Nenhum resultado encontrado

Seleção das variáveis para o método Hot Deck com seleção via ABB

3.3 Discussão

4.1.2.3 Seleção das variáveis para o método Hot Deck com seleção via ABB

Baseado na análise das razões de chances realizadas no Capítulo 3, observou-se evidências de que todas as variáveis do estudo são determinantes para a não declaração da escolaridade do óbito e, portanto, deveriam ser consideradas por métodos de imputação que se baseiam em outras características disponíveis dos óbitos que apresentaram dados faltantes na escolaridade no processo de imputação.

Entretanto, uma das exigências desses métodos é que as variáveis utilizadas para compor estratos homogêneos e, consequentemente, os candidatos a doadores da escolaridade aos que não possuem registro (receptores), tenham todos os registros completos. Essa condição está implícita ao supor que os dados são do tipo MAR. Em princípio, essa condição não é verificada, pois ficou evidenciado no Capítulo 3 que, exceto as variáveis Região e Causa básica de morte, todas as outras também apresentaram dados faltantes. Uma alternativa seria imputar também as variáveis auxiliares antes de imputar a escolaridade ou trabalhar com métodos para padrão geral

de dados faltantes (multivariado), mas seria um exercício exaustivo que fugiria do foco desse trabalho.

Outra opção seria excluir os casos incompletos de todas as variáveis auxiliares, mas isso geraria uma perda considerável de casos onde a escolaridade é faltante e teria que ser imputada. As variáveis estado civil e cor/raça apresentaram percentuais consideráveis de casos em que essas variáveis não foram registradas na declaração de óbito conjuntamente com a variável escolaridade, 23,6% e 14,0%, respectivamente. Se esses casos fossem excluídos, o impacto seria uma perda de 37.102 casos, o que representa 11,2% do total de registros de óbito e 37,6% dos casos a serem imputados. Para as variáveis sexo, idade e local de ocorrência esses percentuais foram menos representativos, sendo 0,2%, 3,9% e 0,9%, respectivamente. As variáveis Região e Causa básica de morte não apresentaram dados faltantes. Sendo assim, por essa razão as variáveis estado civil e raça/cor seriam candidatas a não serem utilizadas na imputação, apesar de sua importância demográfica.

Uma questão que merece atenção na seleção desses atributos é a quantidade de doadores nas combinações entre as categorias das variáveis que gerarão os estratos. Considerar todas as variáveis e suas categorias tornam os estratos mais homogêneos e mais assertivos na doação da escolaridade. Contudo, a chance de surgir um receptor com escolaridade faltante, mas que não tenha nenhum candidato a doador aumenta na mesma velocidade em que as combinações das categorias das variáveis aumentam. Se isso ocorrer, a imputação para esses casos fica comprometida. Outra questão é a escassez de doadores em um estrato. Isso pode causar uma sobre-utilização de uma única unidade para imputar os casos (ANDRIDGE; LITTLE, 2010).

Por essas razões, foram analisados três cenários de combinação de variáveis. O primeiro considerou todas as variáveis; o segundo excluiu estado civil e cor/raça; o terceiro excluiu-se estado civil, cor/raça e local de ocorrência. Nos três cenários foram considerados apenas os casos onde as variáveis auxiliares eram completas, ou seja, foram excluídas da base de dados todos os casos onde pelo menos uma variável auxiliar era ausente.

Ao incluir todas as variáveis no primeiro cenário, observou-se um total de 28.000 combinações possíveis entre as categorias das variáveis, Região (5), Sexo (2), Idade (7), Raça/cor (4), Estado civil (4), Local de ocorrência (5), Causa básica de morte (5). Esse montante representa as possíveis formações de estratos ao considerar todas as variáveis e categorias. Sendo assim, observa-se que 778 estratos (2,8%) não possuem nenhum possível doador, ou seja, dentro desses estratos os dados faltantes não seriam imputados. Isso mostra que utilizar

todas as variáveis e categorias inviabiliza a utilização desse tipo de método. Ainda no cenário 1, 23% dos estratos teriam apenas de 1 a 5 doadores. No cenário 2, com a exclusão das variáveis cor/raça e estado civil, seriam formados 1.750 estratos dos quais 31 (1,8%) não teria nenhuma unidade doadora da escolaridade. Estratos com 1 a 5 doadores representaram 21,0% nesse cenário. Por último, no cenário 3, apenas as variáveis Região, sexo, idade e Causa básica de morte foram mantidas, excluindo a variável local de ocorrência (em relação ao cenário 2). Para esse caso, todos os estratos (total de 350 combinações das categorias) apresentaram pelo menos 6 candidatos a doadores. A Tabela 4 apresenta os resultados dessa breve simulação.

Tabela 4: Frequência absoluta e relativa de estratos segundo a condição da quantidade de doadores disponíveis para imputar escolaridade do óbito.

Condição dos estratos Cenário 1 Cenário 2 Cenário 3

freq. % freq. % freq. %

Sem doador 778 2,8% 31 1,8%

Não houve estrato com menos de 6

doadores

Com 1 doador 3019 10,8% 121 6,9%

Com 2 a 5 doadores 3405 12,2% 246 14,1%

Com mais de 5 doadores 20798 74,3% 1352 77,3%

Total de combinações das categorias 28000 100,0% 1750 100,0% 350 100,0% Fonte: SIM - Sistema de Informação sobre Mortalidade, 2010.

Variáveis do Cenário 1: Região, Sexo, Idade, Cor/raça, Estado civil, Local de ocorrência e Causa básica de morte Variáveis do Cenário 2: Região, Sexo, Idade, Local de ocorrência e Causa básica de morte

Variáveis do Cenário 3: Região, Sexo, Idade e Causa básica de morte

Diante do que foi observado nessa simulação e na análise de perda de casos, as variáveis que serão utilizadas para compor os estratos são: Região, Sexo, Idade e Causa básica de morte. Com isso, foram excluídos da base de dados final os casos onde pelo menos sexo ou idade eram faltantes, saindo de um total de 329.815 óbitos para 325.829, uma perda de apenas 3.986 (1,2%) registros de óbito. Vale salientar que decidiu-se utilizar a variável escolaridade a ser imputada com a categorização original (Nenhuma, 1 a 3 anos, 4 a 7 anos, 8 a 11 anos, 12 anos ou mais, Ignorado), o que torna as doações da escolaridade aos receptores mais fidedignas.

Documentos relacionados