• Nenhum resultado encontrado

DOUTORADO EM CIÊNCIAS SOCIAIS São Paulo 2013

N/A
N/A
Protected

Academic year: 2018

Share "DOUTORADO EM CIÊNCIAS SOCIAIS São Paulo 2013"

Copied!
185
0
0

Texto

(1)

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO

PUC-SP

Mamerto Granja Garcia

O PROCESSO ELEITORAL: Eleitores e Candidatos

Análise quantitativa nas Ciências Sociais: limites e possibilidades

DOUTORADO EM CIÊNCIAS SOCIAIS

(2)

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO

PUC-SP

Mamerto Granja Garcia

O PROCESSO ELEITORAL: Eleitores e Candidatos

Análise quantitativa nas Ciências Sociais: limites e possibilidades

DOUTORADO EM CIÊNCIAS SOCIAIS

Tese apresentada à Banca Examinadora da Pontifícia Universidade Católica de São Paulo, como exigência parcial para obtenção do título de Doutor em Ciências Sociais, Área de Concentração Política, sob a orientação do Professor Doutor Miguel W. Chaia.

(3)
(4)

Dedicatória

A meus pais, Mamerto (in memoriam) e Manolvina, por acreditarem.

À minha companheira, Lucilene, pelo apoio incondicional.

(5)

AGRADECIMENTOS

Na minha infância e parte da adolescência, estive inserido em um círculo social repleto de figuras caricatas e inesquecíveis. Meu pai, um imigrante espanhol, chegou ao Brasil em 1955, com a idade de 27 anos. Deixou para trás (e nunca mais retornou) as Ilhas Canárias, região formada por sete ilhas vulcânicas tendo o vulcão El Teide como o principal, com quase 4.000 metros acima do nível do mar. Região pertencente à Espanha, próxima da costa africana do Oceano Atlântico, fica muito distante da Península Ibérica, e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus habitantes, a buscarem uma nova vida fora das ilhas. Meu pai abandonou sua terra natal na esperança de encontrar uma vida melhor não no Brasil, mas na Venezuela, considerada a terra das oportunidades, onde se poderia enriquecer com facilidade. Infelizmente, para o meu pai, devido a uma política de cotas de imigração, não foi possível imigrar para a Venezuela e decidiu vir ao Brasil com a esperança de depois se mudar para a “vizinha” Venezuela. Não tinha noção da imensidão das terras sul-americanas. Acabou ficando no Brasil até o fim da vida.

(6)

desse meio rural, acompanhando a luta dos meus pais na lavoura. Lembro-me perfeitamente das plantações de cenoura, cebola, tomates, milho e mandioca.

Apesar da vida simples, havia uma riqueza cultural extensa, composta de uma mistura de Brasil e Espanha. Meu pai era um exímio cozinheiro e no final de semana o cardápio do almoço quase sempre era composto das comidas típicas da região que meu pai vivia na Espanha. Nunca me esqueço da cazuela, uma espécie de sopa de peixes, e do gofio, farinha de trigo extremamente fina e torrada para ser adicionada à sopa.

Esse convívio social era partilhado intensamente com vizinhos, principalmente nas datas festivas tais como natal, ano novo e festas juninas.

Com o tempo e após muito trabalho árduo, meus pais deixaram a lavoura para trás e iniciaram um pequeno comércio, uma mistura de bar e mercearia. Nessa fase a família aumentou com o nascimento da minha querida irmã, carinhosamente chamada de “Niña” (pequenina), apelido que persiste até hoje. Nesse ambiente de bar conheci pessoas que influenciaram e moldaram parte da minha concepção de vida. Essa convivência com pessoas de lugares distantes e culturas variadas, um clima que somente o ambiente de bar poderia proporcionar, permitiu que eu construísse uma visão mais realista da natureza humana do que muitos da minha idade. Nesse ambiente as pessoas expõem seus problemas, seus traumas, suas angústias e também suas alegrias, tudo potencializado pelo efeito inebriante das bebidas alcóolicas.

Desde cedo senti a necessidade de compreender o desconhecido, sentindo uma forte atração pelas ciências exatas, principalmente a física. Encontrava nas leis matemáticas, que buscavam delinear modelos funcionais da realidade, uma sensação de que tudo poderia ser explicado, ser determinado, desde que pudéssemos encontrar a equação certa. Puro delírio de uma mente inexperiente.

(7)

pelas discussões de bar, chegou a minhas mãos um livro que foi um verdadeiro sucesso na época, “Eram os deuses astronautas?”, do escritor suíço Erich Von Däniken. Nesse livro o autor faz varias considerações inusitadas (para não dizer fantasiosas) a respeito de visitações de seres extraterrestres ao nosso planeta no passado. Na verdade o que mais me chamou a atenção foram alguns trechos do capítulo II, no qual se discutia a teoria da relatividade e tentava explicar o que era a dilatação do tempo. Quando soube que a relatividade era um fato e não mera fantasia do escritor, fiquei chocado. Percebi, naquele momento, que a realidade apresentada à nossa frente não é bem o que parece. Fiquei impressionado ao saber que o tempo, tal como o concebemos no dia a dia é, na verdade, o produto da situação específica que nos cerca, não tendo, necessariamente, o mesmo comportamento em outra região do Universo. Vemos apenas uma casca, e que o conhecimento completo da realidade provavelmente seja algo impossível.

Esse breve resumo autobibliográfico serve para evidenciar a minha convicção de que somos moldados por pessoas singulares que, por pura sorte ou destino, entram no momento exato da nossa vida.

Agradeço aos meus pais, sempre solícitos, amorosos e éticos. Sinto-me compelido a agradecer àquelas pessoas especiais, as quais tive o privilégio de conhecer nas várias fases da minha vida. Pessoas na grande maioria muito simples, mas com uma riqueza de espírito imensurável.

Na vida acadêmica, como professor ou como aluno, conheci pessoas extraordinárias, incentivadoras e amigas, que me apoiaram e trouxeram novas oportunidades de desenvolvimento pessoal. A elas o meu sincero agradecimento.

(8)

RESUMO

Compreender o processo eleitoral e identificar as variáveis explicitamente ou implicitamente envolvidas continua sendo um campo repleto de mistérios tão obscuros quanto a mente humana. Os fatores psicossociais despertados no período eleitoral remetem o pesquisador a um ambiente repleto de simbologias, as mais inusitadas emoções e interesses diversos que compreendem uma busca empreendida pelo eleitor, aparentemente racional, no sentido de encontrar convergência entre seus anseios pessoais e as características do potencial representante.

Este trabalho tem como objetivo delinear considerações sobre o tema com base em uma análise do comportamento do eleitor a partir de três fatores que se destacam durante o processo eleitoral: a indecisão, a continuidade e o candidato. A indecisão será analisada a partir do levantamento dos eleitores indecisos apontados em diversas pesquisas eleitorais. Demonstra-se que pelo simples fato de se situar no estrato dos indecisos, o eleitor apresenta tendências de voto para determinado candidato. No tópico continuidade e candidato, avalia-se a questão dos parlamentares que se mantem no cargo eletivo por longos períodos, através de sucessivas reeleições e como complemento, é feita uma análise do perfil do candidato e seus efeitos na decisão do eleitor.

Para todas essas questões, são utilizados modelos quantitativos apropriados, os quais buscam criar uma ponte entre a pesquisa nas Ciências Sociais e a análise das observações por meio de ferramentas estatísticas.

(9)

ABSTRACT

Understand the electoral process and to identify the variables explicitly or implicitly involved remains a field full of mysteries as dark as the human mind. Psychosocial factors awakened in the election period refer the researcher to an environment full of symbols , the most unusual emotions and diverse interests that include a search undertaken by the voter , apparently rational , in order to find convergence between their personal aspirations and potential characteristics representative .

This paper aims to outline considerations on the subject based on an analysis of voter behavior from three factors that stand out during the election process: indecision, the continuity and the candidate. Indecision will be analyzed from a survey of undecided voters indicated in several polls. It is demonstrated that the simple fact of being located in the stratum of the undecided voter presents trends vote for a particular candidate. On the topic continuity and candidate assesses the issue of parliamentarians that keeps on elective position for long periods, through successive re-elections, and in addition, an analysis of the candidate's profile and its effect on the voter's decision.

To all these questions, appropriate quantitative models are used, which seek to create a bridge between research in the social sciences and the analysis of observations by means of statistical.

(10)

SUMÁRIO

LISTA DE FIGURAS ... 12

LISTA DE TABELAS ... 13

Introdução ... 1

Capítulo 1... 17

Métodos Empíricos nas Ciências Sociais. ... 17

Capítulo 2... 43

Comportamento do Eleitor Paulistano na Eleição para Prefeito em 2008. Uma abordagem usando os conceitos de Campo e Habitus de Pierre Bourdieu. ... 43

2.1 As eleições de 2008 e o cenário político na Cidade de São Paulo. ... 43

2.2 O comportamento do eleitor paulistano, uma analogia aos conceitos de campo e habitus de Pierre Bourdieu. ... 55

2.3 A dinâmica dos campos: uma proposta de modelagem. ... 61

2.4 Avaliação dos campos pela análise de correspondência ... 69

2.4.1 Campo Escolaridade ... 69

2.4.2 Campo Renda ... 76

2.4.3 Campo Faixa Etária ... 78

2.4.4 Campo Religioso ... 80

Capítulo 3... 85

Eleições para Prefeito de São Paulo em 2008: A questão das declarações incompletas dos eleitores nas pesquisas eleitorais e como estas podem ser “tratadas” a partir da criação de modelos estatísticos adequados. ... 85

3.1 Conceituação de Dados Incompletos ... 85

3.2 Modelos Estatísticos para dados omissos ou incompletos ... 87

3.3 Apresentação do Problema ... 91

3.4 Modelando o Problema ... 92

3.5 Estimação dos Parâmetros ... 96

3.6 Aplicação nos Problemas Propostos ... 102

3.3.1 Variável Idade ... 102

3.3.2 Variável Escolaridade ... 110

3.3.2 Variável Renda... 113

(11)

Reeleição e Perfil do Candidato: Eleições proporcionais e modelos que possam apontar a probabilidade do candidato ser reeleito em função das diversas variáveis

explicativas previamente estabelecidas. ... 118

4.1 Introdução ... 118

4.2 O fenômeno da reeleição dentro do sistema eleitoral ... 121

4.3 Proposta de modelagem estatística ... 129

Capítulo 5... 136

O perfil do candidato e o comportamento do eleitor: eleições para vereador no Estado de São Paulo em 2012. ... 136

5.1 Partidos políticos e a participação da mulher ... 137

5.2 As profissões e os candidatos ... 141

5.3 Candidatos: escolaridade, estado civil e faixa etária. ... 143

5.4 Modelagem Estatística do Perfil do Candidato e a Escolha do Eleitor ... 147

Considerações Finais ... 155

Apêndices ... 165

A.1 Código R referente ao capítulo 3 ... 165

(12)

LISTA DE FIGURAS

Figura 1: Exemplo de modelo funcional. Ajuste de uma reta. ... 26

Figura 2: Exemplo de modelo funcional. Ajuste de uma função senoidal. ... 30

Figura 3: Proporção de avaliações negativas dos candidatos Gilberto Kassab e Marta Suplicy. ... 53

Figura 4: Proporção de avaliações positivas dos candidatos Gilberto Kassab e Marta Suplicy. ... 54

Figura 5: Número de citações positivas dos candidatos Gilberto Kassab e Marta Suplicy. ... 54

Figura 6: Número de citações negativas dos candidatos Gilberto Kassab e Marta Suplicy. ... 55

Figura 7: A dinâmica dos campos: renda, religião e escolaridade. ... 62

Figura 8: Diagrama simplificado para "estados" religiosos. ... 65

Figura 9: Diagrama de uma situação hipotética para "estados" religiosos. ... 67

Figura 10: Diagrama de uma situação hipotética para estados religiosos. ... 68

Figura 11: Mapa de percepção para o campo escolaridade. ... 71

Figura 12: Mapa de percepção do debate na televisão quanto ao campo escolaridade. ... 75

Figura 13: Mapa de percepção para o campo renda... 77

Figura 14: Mapa de percepção para o campo idade (faixa etária) ... 79

Figura 15: Mapa de percepção para o campo religião. ... 82

Figura 16: Esquema básico de mecanismos de censura. ... 89

Figura 17: Comparativo dos percentuais de votos válidos o sob o modelo NMAR. .... 106

Figura 18: Comparativo do modelo NMAR e resultado do TSE (votos válidos). Eleição para prefeitura de São Paulo, 2008 ... 112

Figura 19: Comparativo do modelo NMAR e resultado oficial do TSE. eleições para a prefeitura de São Paulo, 2008 ... 115

Figura 20: Eleições para vereador no Município de São Paulo. Relação entre receita para fins de campanha e número de votos obtidos. ... 133

Figura 21: Correlação entre o nível de lembrança ("Recall") e o número de votos. .... 135

Figura 22: Eficiência das candidaturas por partido e por gênero. ... 137

Figura 23: Mapa de percepção. Percentual de participação da mulher e eficiência. .. 138

Figura 24: Percentual de candidatos eleitor estratificado por profissão. ... 142

Figura 25: Percentual de candidatos eleitos estratificados por gênero e escolaridade. ... 144

Figura 26: Desempenho dos candidatos estratificados por estado civil e gênero. ... 145

Figura 27: Desempenho dos candidatos estratificados por faixa etária e gênero. ... 147

Figura 28: Ciclo de estados da consciência ... 157

(13)

LISTA DE TABELAS

Tabela 1: Variação da arrecadação tributária no Município de São Paulo de 2004 a

2006. ... 45

Tabela 2: Imagem de Kassab à época da saída de Serra para concorrer ao governo do Estado de São Paulo. NS - não sabe, Outra - apontou outro nome. ... 47

Tabela 3: Modelagem da evolução das proporções de eleitores em cada estado do campo religião. ... 67

Tabela 4: Pesquisa eleitoral de preferência de voto para prefeito de São Paulo estratificada pelo nível de escolaridade. ... 70

Tabela 5: Pesquisa eleitoral para prefeito de São Paulo, debate na TV, estratificada pelo nível de escolaridade. ... 72

Tabela 6: Pesquisa eleitoral de preferência de voto para prefeito de São Paulo estratificada por renda. ... 76

Tabela 7: Pesquisa eleitoral para prefeito de São Paulo estratificada por faixa etária. 78 Tabela 8: Pesquisa eleitoral de preferência de voto para prefeito de São Paulo estratificada por religião. ... 80

Tabela 9: Pesquisa Religiões do Brasil, confiança no Congresso Nacional. ... 83

Tabela 10: Pesquisa Religiões do Brasil, confiança no Sistema Judiciário. ... 83

Tabela 11: Pesquisa Religiões do Brasil, confiança no Sistema Educacional. ... 84

Tabela 12: Notação das frequências observadas na tabela de contingência. ... 93

Tabela 13: Frequências e "pseudo-frequências" observadas com a introdução da variável indicadora R. ... 94

Tabela 14: Distribuição da frequência de eleitores por período e faixa etária. SREP: sem resposta. ... 103

Tabela 15: Percentuais de eleitores por período e faixa etária. ... 104

Tabela 16: Intenção de votos, valores imputados nos modelos MAR e NMAR. ... 104

Tabela 17: Intenção de votos imputados em percentuais. Modelo NMAR. ... 105

Tabela 18: Número de eleitores por faixa etária. ... 107

Tabela 19: Posição do eleitor quanto à obrigatoriedade do voto. ... 108

Tabela 20: Apropriação estimada de abstenção por faixa etária. ... 109

Tabela 21: Percentuais na intenção de voto candidato Gilberto Kassab na eleição de 2008 no segundo turno do Município de São Paulo. ... 110

Tabela 22: Intenções de voto estratificadas por escolaridade ... 110

Tabela 23: Intenção de voto segundo escolaridade. Valores imputados nos modelos MAR e NMAR ... 111

Tabela 24: Intenção de voto segundo escolaridade. Valores imputados percentuais nos modelos MAR e NMAR ... 111

(14)

Tabela 26: Intenção de voto para a prefeitura de São Paulo, 2008, estratificação por renda... 114

Tabela 27: Intenção de voto, valores percentuais. Prefeitura de São Paulo, 2008, estratificação por renda ... 114

Tabela 28: Imputação dos dados segundo modelo NMAR para a variável renda ... 116

Tabela 29: Imputação dos dados, valores percentuais, segundo modelo NMAR para a variável renda ... 116

Tabela 30: Resultado do modelo de regressão logística usando o método "Stepwise" do pacote estatístico R. ... 132

Tabela 31: Número de vereadoras eleitas no Brasil no período 1996 a 2012. ... 139

Tabela 32: Perfil dos candidatos a vereador no Estado de São Paulo. Gênero, idade e escolaridade. ... 148

Tabela 33: Esquema notacional para o modelo logístico-linear, com interação até primeira ordem, transcrito em uma tabela de contingência. ... 149

Tabela 34: Coeficientes estimados sob o modelo logístico-linear com interação de primeira ordem. ... 151

Tabela 35: Chances de ser eleito estratificadas por gênero, idade e escolaridade. ... 152

(15)

Uma resposta aproximada da questão certa é mais valiosa do que uma resposta certa de um problema aproximado.

(16)

Introdução

Compreender o processo eleitoral e identificar as variáveis explicitamente ou implicitamente envolvidas continua sendo um campo repleto de mistérios tão obscuros quanto a mente humana. Os fatores psicossociais despertados no período eleitoral remetem o pesquisador a um ambiente repleto de simbologias, as mais inusitadas emoções e interesses diversos que compreendem uma busca empreendida pelo eleitor, aparentemente racional, no sentido de encontrar convergência entre seus anseios pessoais e as características do potencial representante.

Pode-se afirmar que os anseios serão sempre pessoais, pois não há como se falar em anseios coletivos se considerarmos que estes apenas representam as vontades individuais se materializando em uma coletividade. O voto é individual, não coletivo. Tentar descrever o processamento dos anseios e conflitos nas mentes individuais é uma tarefa difícil. Na melhor situação, podem-se ter fatores psicossociais estratificados, ou seja, uma estimativa ou uma estatística de como o eleitor se comporta dentro das categorias analisadas.

(17)

O trabalho comportará cinco capítulos e sexto para considerações. O capítulo um busca esclarecer como métodos empírico-indutivos se tornaram as ferramentas mais usadas na abordagem explicativa do comportamento eleitoral empregando a visão de vários pesquisadores e seus trabalhos científicos. Essas visões formam um conglomerado de conceitos, análises e conclusões de diversos autores que permitem melhorar o foco desse tema delicado e controvertido através de métodos estatísticos de análise do comportamento eleitoral. A principal intenção do capítulo é criar uma ponte mais sólida entre a pesquisa nas Ciências Sociais e a análise das observações por meio das ferramentas estatísticas.

O fato social, na forma apresentada por Emile Durkheim (DURKHEIM, 2007), pode ser submetido a uma modelagem matemática dentro de limites que são impostos pelo próprio fato social, ou seja, o modelo é válido para um momento específico do fenômeno, tal qual uma fotografia, a qual representa apenas um instante no tempo. Deve-se ser cuidadoso no uso de modelos indutivos nas ciências sociais, pois nem sempre é possível prever o futuro a partir do passado no comportamento social, existindo inúmeras situações que endossam essa afirmação. Talvez o fenômeno social que mais evidencia a fragilidade da indução seja a economia. Nada é mais instável do que um cenário econômico projetado pelos economistas. Os períodos de prosperidade e de crise se alternam de forma que nenhum modelo estatístico pode ser usado para uma modelagem segura. É bem verdade, no contexto das ciências econômicas, que os cenários se alternam dentro de um limite probabilístico, mas tal condição torna-se extremamente fragilizada quando observamos crises extremas, fora de qualquer intervalo probabilístico delineado pela estatística. Os estatísticos, conscientes do problema das situações extremas, buscaram teorias que modelassem as situações extremas, ou seja, a Teoria dos Valores Extremos, ou no jargão dos estatísticos, a distribuição das caudas1, o que

(18)

implica uma distribuição de probabilidades dentro de outra distribuição de probabilidades.

Valores extremos estão associados a baixas probabilidades. A teoria dos valores extremos (TVE) trata das questões probabilísticas e estatísticas relacionadas a valores muito baixos ou muito altos em sequências da variáveis aleatórias e em processos estocásticos. Assim, dados considerados como eventos raros não podem ser tratados simplesmente como “outliers", pois, podem ser inseridos em uma modelagem de extremos.

Mais diretamente, o interesse pode ser modelar as caudas de uma distribuição de alguma variável aleatória; esta pode representar dados sobre climatologia ou hidrologia ou outra área, como seguros ou finanças. Busca-se eventualmente precaver-se contra algum evento extremo (evento raro) cujas consequências podem ser indesejáveis ou desastrosas. Modelando essa cauda, pode-se ter ciência sobre as probabilidades de ocorrências de valores altos ou baixos.

Entretanto, extremos não são usualmente bem modelados via distribuições clássicas, como, por exemplo, a distribuição normal (BERGER e BRASIL, 2012).

Parece que os valores extremos estão mais ligados com eventos caóticos do que com probabilísticos, ou seja, a modelagem não seria probabilística abrindo caminho para que a teoria do caos forneça melhor explicação. Pela teoria do caos, uma pequena variação dentro de um sistema dinâmico como a economia pode gerar situação extremas e catastróficas. É o popularmente chamado “efeito borboleta”, situação na qual o bater das asas de

(19)

uma borboleta numa ilha remota do pacífico pode gerar uma amplificação de efeitos que culminariam com um furacão no Caribe.

Assim, acreditar que os fenômenos sociais possam ser domados a ponto de serem previsto dentro de um intervalo de confiança2 é, no mínimo, agir com ingenuidade. Isso não significa que devemos descartar completamente a modelagem probabilística, longe disso. Deve-se, entretanto, considerar suas limitações quanto ao fenômeno estudado, pois a concepção exata do comportamento do fenômeno no instante imediatamente posterior à observação é impossível. Torna-se claro que o fluxo do tempo é a principal variável que afeta as modelagens que dependem da indução. A seta do tempo permite que sistemas aparentemente em equilíbrio entrem em colapso a partir de interferências mínimas.

Independentemente da polemica envolvendo a explicação dos fenômenos sociais através da análise quantitativa, não há como abrir mão desse recurso para parte dos estudos acadêmicos na área das ciências sociais. É importante, entretanto, tentar separar como a explicação ocorre no campo das ciências sociais. Brage e Cañellas (2005) consideram que a explicação apresenta comportamentos diferentes dentro dos variados campos da ciência.

Definir o que é uma explicação não acarreta maior dificuldade, pode-se dizer que significa falar de algo para dar conhecimento a outros a fim de que o compreendam. Mas, quando levamos a explicação ao campo da ciência o problema se faz mais complexo, por exemplo, uma explicação na física inclui, pelo menos, dois elementos fundamentais; em primeiro lugar, algumas leis que formam parte de una teoria mais ampla e, em segundo lugar, uma linguagem matemática na qual as leis se expressam. As

(20)

ciências da vida (biologia) e as ciências sociais apresentam outra maneira de considerar a explicação. Na história da ciência pode-se observar como as diversas tradições evoluíram em formas de explicação diferenciadas (BRAGE e CAÑELLAS, 2005).

Explicar o comportamento da matéria, campo vinculado à física, exige o reconhecimento incontestável do fenômeno, uma teoria e um conjunto de leis.

Na explicação física pode-se encontrar, portanto, três aspectos fundamentais, a saber: o fenômeno que se trata de explicar a lei em função da qual se explica e a teoria em que se inserem essas leis. Entre outras considerações, o que se pode aproveitar do modelo das explicações físicas é que os fenômenos aparecem inseridos em marcos mais amplos que lhes permitem entrar em relação com outros fenômenos, ou seja, estão compreendidos entre si (BRAGE e CAÑELLAS, 2005).

Não é difícil compreender a referência aos limites ampliados da explicação do comportamento da matéria quando se constata que as leis explicativas são regidas por uma linguagem universal, a matemática.

Albert Einstein possuía intuição aguçada para a física, mas, segundo suas próprias palavras, não dispunha de conhecimento matemático suficiente para definir as leis que regem as suas teorias. Conseguia reconhecer o fenômeno e até criar uma teoria para explica-lo, entretanto, as leis que regem o fenômeno, quase sempre uma expressão matemática, não eram facilmente obtidas por seu esforço próprio, sendo obrigado, em muitas ocasiões, recorrer a amigos matemáticos.

(21)
(22)

(WITTLINGER, WEHNER e WOLF, 2007). Embora seja uma explicação válida e convincente, não é possível determinar, ainda, se é a única e definitiva explicação ou uma combinação de várias explicações.

Se nas ciências da vida a explicação pode apresentar várias facetas, o que dizer então das Ciências Sociais, onde a complexidade das inter-relações assume um papel preponderante, tornando a explicação mais enigmática e imprevisível em função do comportamento humano.

O contexto apresentado pelas ciências sociais mostra uma dinâmica desconhecida pelas ciências da matéria e parcialmente reconhecida nas ciências da vida. Tal dinâmica está atrelada ao consciente coletivo e como este reage às ações individuais. A busca de explicações no campo das ciências sociais revela que o fato social, objeto de estudo, apresenta características que vão muito além da explicação funcionalista, ou seja, uma relação de causa e efeito. O segmento específico deste trabalho, o qual está voltado para o comportamento eleitoral, não apresenta melhor sorte quanto ao fato social estudado, ou seja, o processo eleitoral. Encontrar relações de causa e efeito no processo eleitoral sempre é possível quando delimitado dentro de um lapso de tempo. Pode-se explicar, por exemplo, porque um candidato cresceu nas pesquisas de intenção de voto, mas é impossível inferir com exatidão, a partir do seu ritmo de crescimento até o presente, se essa intenção crescerá, estabilizará ou decrescerá nas próximas pesquisas. Enquanto as leis da física e boa parte das leis da vida apresentam boa possibilidade de previsão, as leis sociais fogem com maior frequência do controle probabilístico, ficando a mercê da regência do caos.

(23)

Nas ciências da vida o caos também tem o seu papel. Esse papel pode ser de modo relevante, sendo capaz de alterar toda a estrutura da biodiversidade em um único momento. A sessenta e cinco milhões de anos atrás houve uma extinção em massa na Terra, eliminando por completo os dinossauros, os quais imperavam no ambiente terreno por milhões de anos consecutivos. A teoria mais aceita é que a extinção se deu em um único momento, quando o nosso planeta foi atingido por um grande meteoro, causando mudanças radicais no meio ambiente por um longo período, matando boa parte dos seres vivos e extinguindo outros. Após a recuperação das condições normais do ambiente sobreveio o domínio de novos biótipos, sobreviventes da catástrofe, entre eles os mamíferos, árvore genealógica que deu origem ao homo sapiens. Tal evento radical é fruto de movimentos caóticos no universo, estrelas nascendo e morrendo, buracos negros, supernovas, quasares, pulsares, cometas e asteroides circulando aleatoriamente no espaço, etc. Um evento dessa magnitude certamente não pertence ao campo das probabilidades, tão raro são as suas condições de ocorrência, entretanto, são possíveis, como é possível um candidato azarão ganhar uma eleição. Muitos poderiam contestar essa analogia afirmando que a trajetória de um corpo celeste, tal como um asteroide, é determinista, sofrendo apenas de pequenos erros de medição que poderiam se encaixar perfeitamente na teoria das probabilidades. Mas aí está o problema: não há qualquer garantia que esses erros ficariam sob o controle estatístico. Qualquer intervenção não prevista na sua trajetória (impacto com outro corpo celeste, por exemplo, mesmo que diminuto) poderia gerar um desvio mínimo, mas que culminará com um grande desvio após longo tempo. Do mesmo modo agem os fenômenos sociais, tais como as eleições. Um pequeno evento, aparentemente inofensivo, pode mudar completamente os rumos de uma eleição.

(24)

O comportamento do eleitor paulistano é marcado pelas condições sociais e culturais da população. Explicar o voto é uma tarefa árdua quando imaginamos a variabilidade cultural do paulistano. Acrescenta-se ainda uma variável de peso nessa explicação do voto: a escolaridade. O comportamento do eleitor é avaliado a partir de diversas pesquisas efetuadas pelo instituto de pesquisas Datafolha. Esses dados secundários possuem informações que permitem uma avaliação dos diversos aspectos comportamentais do eleitor paulistano no processo eleitoral.

É realizado um acompanhamento pormenorizado da eleição para prefeito da Cidade de São Paulo em 2008 e como a mídia focou as ações dos principais candidatos e sua correlação com as intenções de votos divulgados pelas pesquisas.

Tomou-se esse caso especificamente em função da situação desfavorável do candidato Gilberto Kassab no início do processo eleitoral e como este conseguiu alcançar o segundo turno e obter a cadeira de Prefeito da maior cidade do país.

Busca-se demonstrar que os fatos políticos e midiáticos que permearam o processo eleitoral foram de extrema relevância para que o candidato obtivesse uma projeção positiva perante o eleitorado suficiente para coloca-lo entre os dois mais votados no primeiro turno. Fenômenos relacionados à identidade partidária e à rejeição se abateram sobre a candidata Marta Suplicy, permitindo que o candidato considerado “azarão” se impusesse de modo surpreendente no segundo turno. Delimitar e quantificar os fatos políticos e midiáticos que permitiram tamanha proeza é o objetivo desse capítulo, através do levantamento bibliográfico do tema e a análise de dados obtidos nos principais jornais que circulam na Cidade de São Paulo, das pesquisas eleitorais e do comportamento do eleitor.

(25)

demonstrar que essa veiculação pode ter um papel decisivo na eleição do candidato.

Outras questões levantadas nesse capítulo estão vinculadas ao perfil do eleitor e como se encaixa na sua decisão de voto. A intenção é avaliar até que ponto as teorias expostas sobre o comportamento do eleitor se aderem aos dados colhidos nas diversas pesquisas de opinião colhidas pelos institutos.

Questões relacionadas à emoção, à utilidade, à racionalidade ou à irracionalidade são abordadas nesse capítulo.

O fluxo de emoções que acompanham o processo eleitoral é um fator de peso no momento da decisão do voto. Desde os primórdios da humanidade, na formação dos primeiros conglomerados humanos, o poder da persuasão através do carisma pessoal viabilizou o destaque daqueles que melhor dominavam as emoções humanas. O carisma, ou seja, o poder de poder influenciar pessoas é um atributo que a maioria dos políticos de sucesso costuma apresentar. Além do carisma do candidato, as emoções dos eleitores podem ser despertadas por propagandas partidárias realizadas com o objetivo de influenciar emocionalmente o eleitor. Quem não se lembra das eleições para presidente da república em 2002, na disputa entre José Serra e Lula. Nessa ocasião a atriz Regina Duarte protagonizou uma das mensagens de maior apelo emotivo no horário político, quando afirmava que “tinha medo” de como ficaria a situação do país caso Lula fosse eleito.

Distintamente da emoção, o voto utilitário apresenta uma maior racionalidade do voto, ou seja, o eleitor busca atender suas necessidades pessoais no momento da votação. Assim uma função utilidade direcionaria a escolha do candidato conforme a relação entre voto e potencial de retorno aumentasse.

(26)

partidárias na atualidade. A identidade partidária está muito enfraquecida no contexto político atual.

O fator indecisão será abordado no capítulo três, o qual se resume na análise do comportamento do eleitor indeciso traduzido no campo da estatística como uma variável que apresenta informações incompletas ou omitidas. A problemática envolvida nesse tema está diretamente relacionada com tendências do eleitor ao longo de várias pesquisas eleitorais, ou seja, será aventada a hipótese de que o eleitor, pelo simples fato de estar na condição de indeciso, revela sua preferência por determinado candidato. Essa preferência será traduzida via modelos estatísticos de estimação paramétrica. Tais parâmetros viabilizam a distribuição dos eleitores indecisos, entre os candidatos, quanto a sua preferência revelada pelo modelo estatístico a partir de informações latentes extraídas de outras características observadas nesses indecisos. Parte desse capítulo toma como base trabalho anterior sobre o tema desenvolvido na dissertação de mestrado buscando-se as adaptações necessárias do texto, proporcionando uma visão dentro dos moldes exigidos pelas Ciências Sociais. Essas adaptações permitem vislumbrar a problemática no contexto tanto da Sociologia quanto da estatística, ou seja, permite que o leitor não habituado com o rigor formal da matemática relacionada aos modelos estatísticos consiga compreender os resultados obtidos e, caso tenha interesse, aprofundar os conhecimentos a respeito dos modelos utilizados através da literatura recomendada.

A delimitação empírica se restringe aos resultados de pesquisas eleitorais realizadas pelo Instituto Datafolha referente à eleição para Prefeito de São Paulo, segundo turno, em 2008. Os dados secundários obtidos serão ajustados em modelos estatísticos voltados para a análise de dados categorizados incompletos3.

(27)

A questão da falta de informações em variáveis que compõe os dados nas mais diversas áreas do conhecimento é lugar comum e constitui um verdadeiro desafio para os pesquisadores. O grande problema envolvendo dados incompletos está relacionado com a maneira pela qual serão tratados. A abordagem mais comum é simplesmente ignorá-los, ou seja, são descartados do banco de dados sem um critério prévio de análise com o intuito de identificar os motivos de serem incompletos. Descartar dados sem um critério implica que a estimação, de alguma forma, está prejudicada por algum tipo de viés. A área das Ciências Sociais não foge a regra, pois a exclusão das observações com informações incompletas resulta numa simplificação que permite a análise por métodos convencionais mais parcimoniosos. Essa estratégia é conhecida nas Ciências Sociais como exclusão listwise ou casewise (ALLISON, 2002).

O desenvolvimento de modelos estatísticos que abordassem as observações incompletas ocorreu a partir de meados da década de 80, entretanto, já havia alguns trabalhos pioneiros da década de 70. (GRAHAM, 2009) faz uma breve descrição desses primeiros trabalhos:

“Problemas gerados por falta de dados começaram a ser tratados de uma forma importante a partir de 1987, embora já houvesse alguns artigos influentes até então (por exemplo, Dempster et al. 1977, Heckman 1979, Rubin 1976). O que aconteceu em 1987 foi nada menos que uma revolução no pensamento sobre a análise de dados incompletos. A revolução começou com dois grandes livros que foram publicados naquele ano. Little e Rubin (1987) publicaram o livro clássico Statistical Analysis with Missing

Data ( segunda edição publicada em 2002). Além disso, Rubin (1987) publicou seu livro, Multiple Imputation for

Nonresponse in Surveys. Esses dois livros, juntamente com o aumento da capacidade computacional e o uso dos

(28)

computadores pessoais, lançaram as bases para os pacotes computacionais voltados para a estatística e, mais especificamente, nos vinte anos seguintes e além, para o tratamento de dados incompletos. Também foram publicados em 1987 dois artigos descrevendo o primeiro método verdadeiramente acessível para lidar com dados incompletos usando programas computacionais existentes de modelagem de equações estruturais (Allison 1987, Muthen et al. 1987). Por fim, Tanner e Wong (1987) publicaram artigo sobre o aumento de dados, o qual se tornaria a pedra angular do programa computacional de imputação múltipla (MI) desenvolvido uma década depois.”

Assim, podemos ver que tais fenômenos, envolvendo dados incompletos, se repetem nas pesquisas eleitorais quando uma fração dos eleitores não declara o seu voto, seja por indecisão ou por convicção (em branco ou nulo). Mesmo aqueles eleitores que declaram voto em branco ou nulo, podem se decidir no momento do voto por algum candidato. O fluxo dessa mudança pode ser quantificado através de modelos estatísticos para dados incompletos.

A adaptação da realidade do processo eleitoral a partir dos modelos de dados incompletos pode trazer novas interpretações para o comportamento do eleitor, principalmente daquele que se mostra indeciso no momento que responde uma pesquisa eleitoral. Na modelagem sugerida por este trabalho são tomadas conjuntamente com seu estado de indecisão variáveis conhecidas do eleitor indeciso tais como escolaridade, faixa etária, renda e outras que podem auxiliar na imputação do seu voto a algum candidato.

(29)

acadêmica e resultados práticos para a realidade brasileira. Tais análises são amplamente consideradas em trabalhos realizados fora do Brasil e podem-se citar, como destaque, os trabalhos realizados por Paul D. Allison, professor de Sociologia da Universidade de Pensilvânia.

A continuidade e o candidato será objeto do capítulo quatro. Considera-se, neste trabalho, continuidade como o fenômeno das reeleições sucessivas de um político, tornando-o praticamente o dono da sua cadeira de representante seja no Senado, na Câmara dos Deputados Federais, na Assembleia Legislativa como Deputado Estadual ou ainda como vereador na Câmara Municipal. Quais condições externas e características do candidato que lhe permitem permanecer num cargo eletivo por um tempo extremamente longo?

Buscando compreender o fenômeno, são trabalhadas variáveis consideradas relevantes para explicar a reeleição. Tais variáveis estarão vinculadas às atividades do parlamentar no que se refere a sua produção legislativa, sua capacidade administrativa, sua identidade com o governo (situação ou oposição) e seu grau de exposição na mídia.

A sua exposição na mídia, seja de forma positiva ou negativa, será obtida a partir do volume de informação que circula nos principais sites de busca na internet ou nos principais jornais que circulam na sua cidade ou estado. Eventualmente, são coletadas informações pontuais, mas de grande impacto referente ao candidato, tais como escândalos políticos ou ações que, perante o eleitorado, o rotulam como um verdadeiro paladino da justiça. Essas informações adicionais são quantificadas e adicionadas ao modelo como mais uma variável a ser considerada.

(30)

parlamentares respeitando a imparcialidade. Sempre que houver desconfiança quanto à imparcialidade da ONG, são buscadas alternativas que possam confirmar as informações tais como páginas das Câmaras Municipais ou assembleias estaduais. Em último caso, não havendo confiança nas informações, estas serão descartadas.

A identidade do parlamentar com o governo é quantificado em termos do seu grau de aproximação com a situação. A importância dessa variável está no fato da sua proximidade com a máquina administrativa. Apesar da ilegalidade do uso da máquina administrativa para fins eleitorais, é impossível separar as eleições da máquina administrativa. Qualquer cidadão, com o mínimo de percepção do seu meio, vislumbra atividades do poder público distintas no período eleitoral como, por exemplo, maior investimento em obras públicas. Tais atividades aparentemente estariam revestidas de legalidade, afinal o investimento público não pode parar no período eleitoral. A suspeita recai na distribuição desses investimentos, com uma concentração maior de gastos no período eleitoral. Assim, não há dúvidas que a proximidade do candidato com a situação pode gerar um viés nas intenções de votos a seu favor.

Já a capacidade administrativa do candidato ou “currículo” é avaliada a partir do seu histórico de atividades políticas tais como luta sindical ou trabalhos sociais de relevância. A busca desses atributos vinculados à experiência do candidato é realizada a partir de informações contidas na sua página pessoal, nas páginas da Justiça Eleitoral, mídia e ONGs.

A variável explicada será sua probabilidade de reeleição, definida através de um modelo probabilístico adequado e dentro dos intervalos de confiança estatísticos. Procura-se dessa maneira quantificar o fenômeno da reeleição dentro de um contexto mais geral definido pelo processo eleitoral.

(31)

permitem maior probabilidade de vitória nas urnas. Para avaliar o perfil do candidato, é utilizado um banco de dados disponibilizado pelo Tribunal Superior Eleitoral (TSE) que disponibiliza informações pessoais do candidato. Essas informações são buscadas entre os candidatos a vereador nos Municípios do Estado de São Paulo nas eleições de 2012. A relação dos atributos dos candidatos e o seu potencial de voto é modelada de forma permitir encontrar uma medida para a intensidade dessa relação, destacando e comparando candidatos.

Assim, nota-se claramente que este trabalho busca destacar o quanto é imprescindível em toda campanha eleitoral uma avaliação do desempenho do candidato. Sem essa avaliação os riscos se elevam consideravelmente, pois o candidato caminha praticamente às cegas.

A avaliação da campanha normalmente é realizada por meio das pesquisas eleitorais, as quais trazem informações que auxiliarão o candidato nas formulações de estratégias.

As pesquisas qualitativas, por exemplo, fornecem subsídios para as decisões com base na análise de caso. A análise de caso pode ser útil para definir parâmetros que deverão estimados numa pesquisa quantitativa.

Uma campanha bem sucedida certamente depende do grau de conhecimento que o candidato tem do seu eleitorado e como este reage às suas atitudes.

(32)

Capítulo 1

Métodos Empíricos nas Ciências Sociais.

Em razão do uso intensivo de ferramentas estatísticas, procura-se, neste primeiro capítulo, traçar um paralelo entre os métodos quantitativos utilizados na tese e sua aplicabilidade no campo das Ciências Sociais. Não se trata de resumos ou noções desses métodos, pois a bibliografia recomendada atende plenamente a esse quesito. Busca-se discorrer sobre sua importância como ferramenta para as ciências sociais e quais as limitações impostas à sua aplicação nos fenômenos sociais.

A ciência estatística, principal ferramenta do positivismo, apresentou um grande avanço, tanto na geração de novas teorias como na ampliação do seu repertório de modelos probabilísticos para as mais diversas aplicações. Hoje é possível encontrar no mercado uma variedade de pacotes computacionais voltados exclusivamente para o tratamento estatístico de dados oriundos de pesquisas efetuadas em áreas do conhecimento que vão desde o direito até a medicina, sem deixar de passar pela área da sociologia. Não resta dúvida que, com o advento da informática, viabilizando o tratamento em tempo curto de uma grande massa de dados, foi uma das principais razões desse crescimento acentuado da estatística.

O uso das pesquisas empíricas nas Ciências Sociais é, atualmente, lugar comum nas publicações acadêmicas, fornecendo uma grande quantidade de análises estatísticas apoiadas em pacotes estatísticos que são “pilotados” de forma que, no mínimo, gera dúvidas se as conclusões obedecem a um método científico isento de interferências que desqualificariam tais conclusões. Deve-se, portanto, evitar o foco estritamente “quantitativista” em detrimento da verdadeira realidade social.

(33)

descobertas sobre padrões de comportamento social com implicações nas teorias sociais já existentes. Para isso, é preciso evitar duas armadilhas principais. A primeira é o excesso de quantitativismo, que não raras vezes transforma a ferramenta estatística, que deveria servir como forma de acesso à realidade social, em finalidade última da pesquisa empírica (CERVI, 2008).

O pesquisador deve tomar o cuidado de abordar seu trabalho de maneira que não gere desconfiança quanto aos procedimentos adotados, principalmente no que se refere ao rigor no levantamento das observações que servirão como base para o processo empírico indutivo. Não se trata de uma crítica à automação disponibilizada pelos pacotes computacionais, mas a falta de uso criterioso desses pacotes.

A base de um trabalho empírico está atrelada às observações, sejam elas do todo (universo) ou de uma parcela (amostra). Florestan Fernandes busca delinear o processo de observação em três espécies:

Portanto, nas ciências sociais o processo de observação abrange três espécies distintas de operações intelectuais: a) as operações através das quais são acumulados dados brutos, de cuja análise dependerá o conhecimento objetivo dos fenômenos estudados; b) as operações que permitem identificar e selecionar, nessa massa de dados, os fatos que possuem alguma significação determinável na produção daqueles fenômenos; c) as operações mediante as quais são determinadas, isoladas e coligidas – nesse grupo restrito de fatos – as instâncias empíricas relevantes para a reconstrução e a explanação dos fenômenos, nas condições em que foram considerados (FERNANDES, 1959).

(34)

levantamento de dados primários ou secundários, ou seja, dados oriundos de uma pesquisa de campo (primários) ou de um banco de dados existente (secundários); b) a análise exploratória de dados implica organizar e resumir as informações através dos recursos da estatística descritiva, identificando e selecionando aquilo determinante para o estudo; c) a inferência, a qual só faz sentido quando se devem estimar parâmetros a partir de uma parcela do universo (população) tomando-se uma amostra. Temos ai, na amostra, o ponto sensível da pesquisa voltada para as ciências sociais ou qualquer outra área do conhecimento.

(35)

A estatística, quando considerada como ferramenta essencial ao processo de indução, somente faz sentido quando é analisada uma parte da população, uma amostra. Não existe indução no censo, pois todo o universo está presente.

A importância da indução deve ser reconhecida, entretanto o seu uso obedece a critérios precisos com a finalidade de se evitar conclusões errôneas. Essa preocupação foi externada por J. S. Mill em sua obra Sistema de Lógica Dedutiva e Indutiva. A citação a seguir, apesar de longa, mostra claramente as armadilhas presentes no uso da indução.

Este uso tem engendrado uma grave confusão na teoria da indução, exemplificada nos mais recentes e bem elaborados tratados sobre a filosofia indutiva que existem em nossa língua. O erro em questão é o de confundir uma mera descrição, por meio de termos gerais, de um grupo de fenômenos observados como uma indução tirada desses fenômenos.

(36)

procedimento? Ele inferiu alguma coisa que não tinha sido observada de uma outra que o tinha sido? Certamente não: tinha observado tudo que a proposição afirma. Que a terra em questão é uma ilha não é uma inferência dos fatos parciais que o navegante viu no curso de sua circunavegação; ela é os próprios fatos; é um resumo desses fatos, a descrição de um fato completo em relação ao qual fatos mais simples são como as partes de um todo (MILL, 1979).

Se um pesquisador pudesse perguntar a todos os eleitores de uma cidade em quem irão votar para prefeito e encontrar a proporção de 60% então pode-se afirmar que tal proporção não é fruto da indução e sim uma constatação da verdadeira proporção de eleitores do candidato naquele momento. Se a variável tempo for introduzida, então a indução ressurge, pois se estima que no dia seguinte à pesquisa a proporção se manterá nos 60%. Para contradizer ou confirmar essa estimativa, o pesquisador deverá realizar uma nova pesquisa e introduzir o componente tempo. Uma sucessão de valores no tempo proporcionará um novo modelo de previsão por meio da indução, estimando, por exemplo, as tendências das proporções de voto no tempo.

(37)

O grande problema a ser enfrentado nesse procedimento é que a média amostral também é um valor aleatório e que está estreitamente ligada à forma adotada para a coleta da amostra, ou seja, ao planejamento amostral.

Nas Ciências Sociais, na maioria das vezes impossibilitada de fazer uso da observação experimental, a amostra é muito sensível a interferências, exigindo um planejamento amostral robusto.

A construção do caso típico, que se obtém mediante a observação experimental, e a formulação de sua explicação, que constitui um processo lógico de abstração e de generalização das instâncias empíricas, interpretativamente relevantes, encontram uma expressão comum nas mesmas operações intelectuais, que culminam na descrição sintética do fenômeno.

Isso não ocorre, de forma regular, com as ciências sociais, em que ainda são muito limitadas as possibilidades de praticar a observação em condições experimentais. Os dois momentos ou fases do processo de investigação se separam com nitidez: primeiro se procede à eliminação do que é acidental, circunstancial e fortuito, mediante a construção analítica de casos típicos; só então é que se pode passar ao tratamento interpretativo das instâncias empíricas selecionadas, com o propósito de explicar os fenômenos observados. Em outras palavras, as operações intelectuais de caráter “técnico” precedem e condicionam as operações intelectuais de caráter “logico” (FERNANDES, 1959).

(38)

segunda fase sem ter o controle da primeira. Seria uma estrutura de aço sendo construída numa base de areia.

Uma estimativa somente tem importância se a amostra que lhe deu origem provém da população de interesse e a representa em todos os aspectos que estão sendo estudados. Toma-se, por exemplo, uma pesquisa eleitoral em que a amostra de eleitores foi coletada dentro de um reduto eleitoral de certo candidato. Provavelmente essa pesquisa apresentará falta de representatividade da população de eleitores, gerando um viés em favor desse candidato.

As operações intelectuais de caráter “lógico” definem as ferramentas necessárias para a reconstrução proposta por Fernandes, o que implica interpretar o todo a partir da parte, ou seja, pela lógica da indução, do conhecido para o desconhecido. Essa reconstrução faz uso de modelos probabilísticos funcionais, mas sempre admitindo uma parcela aleatória desconhecida, chamada de parcela residual. Essa parcela residual, ou ruído, não pode ser explicada pelo modelo mas, teoricamente, está sob controle probabilístico.

Normalmente esse resíduo é tratado como um erro intrínseco ao modelo e adota-se, para esse erro, um tamanho apropriado. Nas pesquisas de intenção de voto, por exemplo, é comum anunciar que um candidato possui tantos por cento das intenções de voto com uma margem de erro de tantos por cento, para mais ou para menos.

É importante compreender que essa margem de erro4 depende de duas grandezas: do tamanho da amostra e da confiança probabilística5 desejada.

4 Trata-se do erro amostral, ou seja, a diferença esperada entre o valor estimado pela amostra (estimativa) e o verdadeiro valor populacional (parâmetro).

(39)

Assim é possível ter-se um erro pequeno, mas com baixa confiança probabilística.

Adota-se na maioria das pesquisas um nível de confiança de 95% para o erro amostral. Uma vez fixada a confiança, o erro somente poderá ser reduzido a partir do aumento do tamanho da amostra.

Assim, a explicação dos fatos sociais com base na observação amostral não foge à regra, depende de um termo aleatório mas com uma diferença, sofre perturbações cruciais ao longo do tempo. O mesmo não ocorre com as ciências experimentais. Se um pesquisador da área da física estuda a resistência que um determinado corpo geométrico oferece à passagem de um fluido, pode, empiricamente, determinar um modelo explicativo funcional para aquela forma geométrica. Os erros envolvidos estão sob tal controle probabilístico, que é possível repetir a experiência e colher dados que levarão a resultados similares em qualquer instante. Assim, a variável tempo, aparentemente, não possui relevância nesse caso.

De qualquer forma, as ciências sociais não dispõem de meios regulares para a constatação e a retificação dos erros, através das próprias condições de observação e da experiência. Essa é uma possibilidade característica das ciências que podem praticar a observação em condições experimentais. Como já sugeria Comte, elas também carecem dos meios de controle das explicações, fornecidos pela experimentação propriamente dita. Mesmo a psicologia social, que dispõe de maiores recursos para a observação controlada e a exploração dos modelos experimentais de pesquisa, não conta com as facilidades das “ciências de laboratório”, nas quais basta repetir artificialmente as condições de produção do fenômeno para saber-se se a explicação é verdadeira ou falsa (FERNANDES, 1959).

(40)

É importante esclarecer o significado do erro na análise de dados (erro amostral), buscando não confundi-lo com os erros de amostragem. Os erros de amostragem podem ocorrer de várias maneiras como, por exemplo, erros de medidas, de objeto, de representatividade, omissões de respostas, informações incompletas, entre outros. Assim o erro de amostragem é uma falha na coleta dos dados, enquanto o erro amostral é probabilístico, intrínseco a análise de dados e vinculado ao processo de modelagem, ou seja, em função do grau de aderência do modelo aos dados. Um modelo com maior aderência apresenta erro amostral menor.

Pode-se melhor esclarecer o uso da modelagem na pesquisa social usando um exemplo simples. O pesquisador está interessado em verificar o número de votos de um vereador em função dos gastos com a campanha. Assim o pesquisador parte do princípio que existe uma correlação entre gasto de campanha e número de votos. Pode-se perceber que essa hipótese é intuitiva, advinda da experiência do pesquisador, mas que carece de comprovação empírica. O estudo busca obter os gastos de todos os candidatos a vereador e quantos votos cada um obteve. Apesar do levantamento dos gastos e número de votos de todos os vereadores até aquela data, ainda se trata de uma amostra, pois não sabemos como os futuros candidatos a vereador irão se portar frente às variáveis gasto e número de votos. A estimativa para os futuros vereadores é o interesse principal e será obtida através do modelo proposto.

(41)

os dados usando ferramentas que permitam vislumbrar a correlação entre as variáveis gasto e número de votos. Uma ferramenta que permite a visualização de uma possível correlação entre as variáveis é o chamado gráfico de dispersão. A figura 1 mostra um conjunto de dados obtidos no site do Tribunal Superior Eleitoral (TSE) envolvendo uma amostra de 11 vereadores posicionados em um gráfico de dispersão. A simples observação desse gráfico permite afirmar que a correlação existe, pois a medida que os gastos aumentam o número de votos também aumenta. Uma possível modelagem para o comportamento das duas variáveis seria uma reta, a qual está desenhada na figura. Trata-se de um modelo funcional, no qual entramos com o valor gasto na campanha e obtemos uma estimativa do número de votos que esse candidato terá.

Figura 1: Exemplo de modelo funcional. Ajuste de uma reta.

Fonte: TSE. Elaborada pelo autor.

(42)

Dizemos que aparenta existir uma dependência pelo simples fato de que existem outros fatores que afetam o número de votos e que mesmo os gastos devem ser considerados como causa com algumas reservas, pois por trás dos gastos existem fatores que podem possuir maior correlação com o número de votos do que o próprio gasto. O que se quer dizer é que os fatores determinantes conspiram de tal forma que trazem como resultado o volume de gastos, que na verdade apenas simboliza a conjunção desses fatores. Uma analogia para a situação pode ser feita quando temos um quadro valioso. O quadro é valioso não pelo material que é feito, mas pelas qualidades atribuídas ao seu autor, as quais permitem que o quadro seja valioso. De mesma forma o pesquisador deve ter em mente que muitas vezes o objeto não se revela por completo. A visão dos verdadeiros fatores está ofuscada por um fenômeno que na realidade apenas é o portador de tais fatores.

Pode-se notar uma observação (apontada por uma seta na figura 1) que foge do comportamento do restante. Tal observação discrepante aponta um vereador que obteve muitos votos com baixo gasto em campanha. O pesquisador deve realizar uma melhor análise dessa observação, pois afeta o modelo no sentido de reduzir a aderência das observações, ou seja, aumenta o erro amostral. Independentemente se o gasto divulgado é verdadeiro ou não, obriga o pesquisador tomar uma decisão: se retira ou não essa observação da análise. Uma justificativa para essa atitude está vinculada ao fato de que tal observação é muito rara e mantê-la para fins de modelagem poderia gerar um viés desnecessário na previsão. Por outro lado, caso se tenha certeza de que o gasto foi realmente baixo, justificaria manter essa observação, pois se trata de uma observação verdadeira. Nota-se, portanto, que mesmo na racionalidade envolvendo o processo de indução, há espaço para alguma subjetividade inerente à experiência do pesquisador. Mas essa subjetividade é relativa, pois o pesquisador deve tomar sua decisão com algum respaldo técnico.

(43)

da investigação), em dados manipuláveis pelo raciocínio científico. Em contraste com o conhecimento de senso comum, o conhecimento científico exige matéria prima própria, que permita representar objetivamente as ocorrências observadas. De fato, seria impossível explicar positivamente a realidade, se só a pudéssemos perceber e representar através de aparências e de atributos superficiais. Por isso, a primeira etapa da pesquisa científica [coleta de dados], nas disciplinas indutivas, se funde com uma indagação sistemática sobre os caracteres e as condições das ocorrências (FERNANDES, 1959).

A questão da modelagem probabilística para explicar a realidade apresenta limitações não somente com o erro amostral, mas também com sua estrutura. Teoricamente, sempre é possível ajustar um modelo de explanação que torna o erro amostral menor que outro modelo, ou seja, existem modelos probabilísticos concorrentes que apresentam melhor aderência aos dados do que outros modelos. O principal problema enfrentado com esses modelos está relacionado com a complexidade. Normalmente maior aderência implica modelos com maior complexidade matemática e nem sempre o ganho obtido com essa melhor aderência justifica a adoção desses modelos. Convém, portanto, buscar modelos probabilísticos mais parcimoniosos, mesmo que esses impliquem menor aderência aos dados. A busca descontrolada por uma aderência perfeita torna-se inútil, pois além da complexidade maior do modelo, sua explicação para o fenômeno seria artificial em demasia.

(44)

tipo , provavelmente teria um ajuste muito melhor aos dados do que uma equação de reta do tipo .

A figura 2 mostra o ajuste de um modelo senoidal aos dados. Pode-se observar que a curva do modelo está mais aderente aos dados. Quando o pesquisador encontra modelos que apresentam essa característica, deve eleger aquele que melhor se adequa à realidade do fenômeno. Fica claro que o uso de um modelo mais complexo como o senoidal no exemplo é inútil do ponto de vista prático. É inútil porque a realidade não se comporta dessa maneira, e tudo leva a crer que caso se adicione mais observações para fins de modelagem, nada garante que esse modelo continue sendo tão aderente, demonstrando a sua artificialidade. Também é inútil a adoção do novo modelo quando se constata o aumento de complexidade, flagrantemente desnecessária para o modelo, tendo em vista que um modelo mais parcimonioso atende satisfatoriamente as previsões necessárias tanto quanto o modelo simplificado. Alias, é possível que um modelo mais simples apresente previsões melhores do que um modelo mais complexo.

Pode causar surpresa tal situação no uso de ferramentas estatísticas, pois se tem a ideia que tais ferramentas são inteiramente originárias de regras objetivas. Nota-se, portanto, que o cientista deve encarar situações que exigem algum grau de subjetividade, entretanto, essa subjetividade é relativa quando se tem em mente que a experiência do pesquisador permite considerar que a subjetividade envolvida é desprezível.

(45)

introduzidas no modelo e este continua mantendo seu grau de aderência, pode-se afirmar que apresenta uma boa qualidade.

Figura 2: Exemplo de modelo funcional. Ajuste de uma função senoidal.

Fonte: TSE. Elaborado pelo autor.

O comportamento social implica uma complexidade que transcende as leis naturais, exigindo uma compreensão adicional do pesquisador, ou seja, segundo Durkheim, “o sentimento da especificidade da realidade social”:

A sociologia, portanto, não é o anexo de nenhuma outra ciência; ela própria é uma ciência distinta e autônoma, e o sentimento da especificidade da realidade social é inclusive tão necessário ao sociólogo, que somente uma cultura especificamente sociológica é capaz de prepará-lo para a compreensão dos fatos sociais (DURKHEIM, 2007).

(46)

empírico-indutivo exigindo, entretanto, que se deva levar em conta que o dinamismo dos fatos sociais carece de atualização constante. Um comportamento social pode mudar completamente num curto intervalo de tempo.

Durkheim, na sua obra As Regras do Método Sociológico, afirma:

A sociologia não tem de tomar partido por uma das grandes hipóteses que dividem os metafísicos. Ela não precisa afirmar a liberdade nem o determinismo. Tudo o que ela pede que lhe concedam é que o princípio de causalidade se aplique aos fenômenos sociais. E, ainda assim, esse princípio é por ela estabelecido não como uma necessidade racional, mas somente como um postulado empírico, produto de uma indução legítima. Visto que a lei da causalidade foi verificada nos outros reinos da natureza e que progressivamente ela estendeu seu domínio do mundo físico-químico ao mundo biológico, e deste ao mundo psicológico, é lícito admitir que ela igualmente seja verdadeira para o mundo social; e é possível afirmar hoje que as pesquisas empreendidas sobre a base desse postulado tendem a confirmá-lo. Mas a questão de saber se a natureza do vínculo causal exclui toda contingência nem por isso está resolvida (DURKHEIM, 2007).

(47)

A indução permite obter conclusões a respeito de um determinado fenômeno, ou fato social, a partir da observação de uma parte desse fato, ou seja, do particular para o geral, da parte para o todo. Como a indução, nesse método, parte da observação empírica, o objeto de pesquisa deve ser definido com clareza de modo delinear como a parte deve ser tomada.

Fica claro, portanto, que se deve isolar a população a ser pesquisada, a qual deve apresentar características exteriores que lhes são comuns, as quais escapam da vontade do observador, ou seja, completamente definidas pela natureza do objeto. Assim, não é possível tomar como objeto aquele que não representa a população (categoria) de interesse, ou seja, desejando-se verificar a incidência de um fato social dentro de uma categoria, seria absurdo utilizar categorias diversas6.

Ao proceder dessa maneira, o sociólogo, desde seu primeiro passo, toma imediatamente contato com a realidade. Com efeito, o modo como os fatos são assim classificados não depende dele, da propensão particular de seu espírito, mas da natureza das coisas. O sinal que possibilita serem colocados nesta ou naquela categoria pode ser mostrado a todo o mundo, reconhecido por todo o mundo, e as afirmações de um observador podem ser controladas pelos outros (DURKHEIM, 2007).

Percebe-se a necessidade de se afirmar que o procedimento se enquadra na realidade do objeto de tal forma que pode ser reconhecido, compreendido e reproduzido por outros interessados, tal qual um desencadeamento lógico de uma equação matemática, ou seja, despojado de qualquer subjetividade. Essa necessidade não foge à regra adotada pelas ciências naturais.

6

(48)

Em outros casos, toma-se o cuidado de definir o objeto sobre o qual incidirá a pesquisa; mas, em vez de abranger na definição e de agrupar sob a mesma rubrica todos os fenômenos que têm as mesmas propriedades exteriores, faz-se uma triagem entre eles. Escolhem-se alguns, espécie de elite, que são vistos como os únicos com o direito a ter esses caracteres. Quanto aos demais, são considerados como tendo usurpado esses sinais distintivos e não são em conta. Mas é fácil prever que dessa maneira só se pode obter uma noção subjetiva e truncada. Essa eliminação, com efeito, só pode ser feita com base numa ideia preconcebida, uma vez que, no começo da ciência, nenhuma pesquisa pôde ainda estabelecer a realidade dessa usurpação, supondo-se que ela seja possível (DURKHEIM, 2007).

Logo, para decidir se uma determinada observação merece ou não estar na pesquisa, não se permite simplesmente tomar o caminho da subjetividade. Pode-se afirmar que somente a realidade do objeto permitiria fazê-lo, nunca o critério subjetivo do observador. Qualquer atitude fora do contexto da realidade atentaria contra o princípio da imparcialidade, podendo desmoralizar a pesquisa por falta de objetividade ou, em caso extremo, gerar desconfiança quanto à ética do pesquisador.

Durkheim mostra sua convicção no poder da explicação, ou seja, uma postura funcionalista:

Mostramos que um fato social só pode ser explicado por outro fato social, e, ao mesmo tempo, indicamos de que maneira esse tipo de explicação é possível ao assinalarmos *no meio social interno o motor principal da evolução coletiva*. (...)

Referências

Documentos relacionados

O CASA Cidades é direcionado às Regiões Metropolitanas de Belém, Belo Horizonte, Brasília, Porto Alegre, Recife, Rio de Janeiro, Salvador, São Luís, São Paulo e Vitória.. 1.1

Examinamos as demonstrações financeiras, individuais e consolidadas, da CTEEP - Companhia de Transmissão de Energia Elétrica Paulista e controladas (“Companhia”),

Os resultados obtidos e suas análises estatísticas permitiram concluir que o inicio do controle da ferrugem alaranjada deve ser realizado com até 5% de infecção para

Lawrence Manly Harte, Olga Silva Fortes, Raimundo de Jesus Cardoso Sobrinho, Ivalcir Centenaro, Nelson Massami Itikawa, Genor Luiz Faccio, Luiz Afonso Faccio,

ANÁLISE, CRÍTICA OU ENSAIO – (individualmente ou grupos de até 4 discentes) - texto analítico, crítico ou ensaio sobre um conto de Clarice Lispector ou de Guimarães Rosa... NAP

Marcadores para quadro branco Cartucho Filmadora HDD Máquina Fotográfica Creative commons Elaboração de projetos Produção de eventos Data Show Computador Caixa de som Conexão

O presente Regulamento regula a fixação dos perío- dos de abertura, funcionamento e encerramento dos estabelecimentos de venda ao público e de presta- ção de serviços, previstos

O próximo passo foi a decisão da técnica e dos materiais, optou- se então pela Pulpectomia, com a técnica instrumentada e obturação com a Pata Guedes- Pinto, já que