TRATAMENTO DOS DADOS - Determinantes do voto, corrupção e impacto eleitoral nas eleições presid

Capítulo 3: METODOLOGIA

3.3 TRATAMENTO DOS DADOS

Foram escolhidas e analisadas as variáveis, segundo questionário ESEB, que contribuiriam para a verificação das hipóteses apontadas no estudo. As variáveis utilizadas tanto nas análises descritivas quanto na modelagem foram:

Voto no primeiro turno  Variável qualitativa nominal cujas categorias são os

próprios candidatos. Foram excluídos os candidatos com menor expressão; e os votos brancos e nulos foram agregados numa nova categoria: Não voto. Essa é a variável dependente do estudo.

Voto no segundo turno  Variável qualitativa nominal cujas categorias são os

candidatos. Essa variável teve um tratamento semelhante à variável voto no primeiro turno. Essa também é a variável dependente do estudo.

Percepções sobre corrupção como principal problema nacional  Codificada

através das perguntas abertas: “Qual o maior problema do Brasil hoje?” e “Qual o segundo maior problema?”. Os entrevistados que citaram a corrupção (e categorias afins) como sendo o maior problema do Brasil receberam o valor 2 (dois). Já os que a indicaram como segundo maior problema receberam o valor 1 (um). Os demais receberam o valor 0 (zero). Trata-se de uma variável qualitativa ordinal.

Percepções sobre a economia  Codificada através das perguntas abertas: “Qual o

maior problema do Brasil hoje?” e “Qual o segundo maior problema?”. Os entrevistados que citaram a economia (e categorias afins) como sendo o maior problema do Brasil receberam o valor 2 (dois). Já os que a indicaram como segundo maior problema receberam o valor 1 (um). Os demais receberam o valor 0 (zero). Trata-se de uma variável qualitativa ordinal.

Avaliação do desempenho do governo anterior  Variável qualitativa nominal

com as categorias: “Bom”, para os entrevistados que avaliaram o governo anterior como “de regular pra bom”, “bom” e “ótimo” e “Ruim”, para os que avaliaram como “péssimo”, “ruim” e “de regular pra ruim”.

Identificação partidária com o PT  Variável escalar que mensura quanto o

entrevistado gosta do partido em questão.

Identificação partidária com o PSDB  Variável escalar que mensura quanto o

entrevistado gosta do partido em questão.

Rejeição ao PT  Variável qualitativa nominal com duas categorias: “Votaria” e

“Não votaria” no partido em questão.

Rejeição ao PSDB  Variável qualitativa nominal com duas categorias: “Votaria” e

“Não votaria” no partido em questão.

Preferência ideológica  Variável inicialmente escalar que mensura o quão de

esquerda ou direita o entrevistado se autoclassifica. O tratamento dessa variável tornou-se complicado, já que, no ESEB 2006, 41% dos entrevistados não souberam se posicionar na escala direita-esquerda. Ao harmonizar a base de dados para todos os anos (ESEB 2002, 2006 e 2010), notou-se que a média dos posicionamentos é um pouco superior a 5, e que o desvio padrão é superior a 3. Mais de um terço da amostra se concentrou entre os valores 0 a 5. Dessa forma, tratou-se essa variável como uma série de dummies, recodificando-a de forma que aos eleitores de esquerda (0 a 5) imputou-se o valor 0, para os de direita imputou-se o valor 1 e, para os que não souberam se posicionar, atribuiu-se o valor 2. Essa operacionalização pode gerar erro de mensuração, resultado eventualmente em um falso negativo (Erro Tipo II). A dificuldade em operacionalizar essa variável, entretanto, não pode fazer com que excluamos variável que se configurou como importante para explicar os determinantes do voto no Brasil (Singer, 1999), sob pena de cometer erro de especificação do modelo. A categoria de referência utilizada para interpretação é sempre “direita”.

Interesse por política  Variável qualitativa ordinal com três categorias: ”Não tem

interesse”, “Têm um pouco de interesse” e “Têm muito interesse”, referentes à pergunta “O(A) Sr(a) se considera uma pessoa muito interessada por política, um pouco interessada, ou o(a) Sr(a) não tem interesse por política?”.

Conhecimento político  Variável escalar definida por quatro questões de

conhecimentos políticos. Cada resposta certa soma 1 ponto para o entrevistado. Eleitores com mais conhecimento político pontuam 4, se acertarem as quatro perguntas do questionário.

Nível Educacional  Variável qualitativa ordinal com cinco categorias: “Sem

instrução”, “Até a 4ª série”, “De 5ª a 8ª série”, “2º grau” e “Superior ou mais”.

Sexo  Variável qualitativa nominal com duas categorias: “Homem” e “Mulher”. Idade  Variável contínua (anos de idade).

Raça  Variável qualitativa nominal com cinco categorias: “Preto”, “Pardo”,

“Branco”, “Amarelo” e “Índio”.

3.3.1 MODELO LOGÍSTICO MULTINOMIAL

Os modelos logísticos são apropriados quando o objetivo é estudar a relação de algumas variáveis explicativas com uma variável que represente possíveis escolhas mutualmente exclusivas de um indivíduo. Em especial, os modelos multinomiais resolvem o problema quando há múltiplas escolhas possíveis. Nesse caso, os modelos são estimados sequencialmente de forma pareada, sempre a partir de uma categoria que servirá de referência (BUSSAB; MORETTIN, 2002; CROISSANT, 2012).

Esses modelos são do tipo lineares generalizados. Assim, ao se adotar esta estratégia de resolução de problemas deve ser assumido que uma combinação linear de variáveis explicativas estejam associadas a uma variável dependente (no caso as possíveis escolhas) a partir de uma função de ligação. No caso, assume-se que a probabilidade de escolha de um candidato específico seja uma combinação (soma) de fatores. Deve-se, portanto, estimar os coeficientes associados a cada variável e testar se os valores encontrados são estatisticamente significativos ou não.

Há dois tipos específicos de variáveis. Variáveis associadas aos indivíduos, ou às categorias de escolha. Por exemplo, idade, sexo, preferências políticas e percepções do meio são variáveis associadas aos indivíduos. Já o partido político, ser “ficha limpa”, ou experiência, são exemplos de possíveis variáveis associadas aos candidatos. Nesse estudo, há apenas variáveis do primeiro tipo. A presença de diversos tipos implica unicamente em uma maneira distinta de estimação (formulação matemática).

Os modelos de regressão podem conter, ou não, interações. Isso ocorre, quando é investigado o comportamento de duas variáveis conjuntamente (JACCARD; TURRISI, 2003). Um modelo completo com duas variáveis como sexo e escolaridade, por exemplo, avalia o impacto de ser homem ou mulher num estudo, bem como o impacto dos níveis de escolaridade, assim como a componente de interação que seria o impacto dos níveis de escolaridade por sexo dos indivíduos. Os modelos logísticos (multinomial, ou não) são

adequados quando é desejável estimar probabilidades de um evento dadas algumas características observáveis (ALTHAUS, 1998).

No documento Determinantes do voto, corrupção e impacto eleitoral nas eleições presidenciais brasileiras de 2002 a 2010 (páginas 56-59)