• Nenhum resultado encontrado

ANÁLISE DAS ESTRATÉGIAS estratégias de Sherlock Holmes:

D) O DESEMPREGO ATACA

3.2.1.2. Cuidados com as estatísticas

Todos estes conceitos que temos vindo a tratar são casos de medições numéricas da realidade, mais conhecidas por

estatísticas. À primeira vista, as estatísticas, porque são números,

parecem fornecer informações exactas, rigorosas, sobre a realidade. No entanto, embora um número seja sempre uma indicação precisa, isso não quer dizer que a informação que esse número quer veicular o seja, nem sequer que haja a segurança de que tal informação seja real.

Toda a estatística se baseia num olhar para a realidade, que terá sempre de ser selectivo. Por exemplo, nas medições do produto, despesa e rendimento, de que acima falámos, o cálculo das estatísticas é feito apenas para as transacções que passam pelo mercado. Assim, se alguém produz e vende, as estatísticas contam essa transacção, mas se alguém produz para si próprio (a pessoa que faz bricolage em casa, quem cultiva couves no quintal, etc.), essa actividade já não é contada. Por essa razão se diz que, se um homem casa com a cozinheira, o produto nacional fica mais pequeno, pois, embora ela possa continuar a fazer o mesmo, agora não é paga por isso.

3.2.1.2.1. Amostragem

Relacionado com este aspecto está um dos truques mais frequentemente usados para obter dados: a amostragem. Como é impossível atender a todas as situações, medem-se algumas e depois usam-se métodos especiais que nos permitem avaliar todas as situações. É assim que se fazem as previsões eleitorais, os ensaios de medicamentos ou os testes de qualidade nas fábricas: escolhe-se uma amostra, analisa-se o problema nesse campo e depois a conclusão é extrapolada (de forma científica) para o universo. Mesmo quando se mede tudo (por exemplo quando se faz um censo geral da população), na realidade isso é uma amostra, pois deduz-se que a análise feita nesse momento se mantém válida durante uns anos, para poder tirar conclusões. Assim, mede-se algo que não é o que queremos.

A forma de extrapolar da amostra para o universo baseia-se numa ciência chamada «teoria estatística», a qual exige que a amostra seja «aleatória», isto é, perfeitamente ao acaso, sem enviesamentos internos. Para isso, os elementos da amostra devem ser escolhidos ao acaso, aleatoriamente.

Numa das primeiras sondagens eleitorais feitas no mundo, em 1936 nos EUA, foi decidido perguntar as preferências eleitorais a um número de pessoas escolhidas ao acaso. Para isso usou-se a lista telefónica e, com a ajuda de dados de jogo, escolhia-se de forma neutra a quem se ia telefonar. O resultado da sondagem disse que o candidato republicano (Landon) ia ganhar. Depois da vitória do presidente Roosevelt, democrata, percebeu-se qual havia sido o erro da amostragem: apenas se consultaram pessoas que tinham telefone, que, nessa altura, eram apenas os mais ricos. Esse facto foi suficiente para enviesar o resultado.

Por todas estas razões, na maior parte dos países desenvolvidos, incluindo Portugal, por lei, as sondagens de opinião e outros estudos estatísticos têm de indicar qual a amostra, como foi recolhida e quais os cuidados que foram tomados para evitar enviesamentos. Mesmo assim, toda a cautela é pouca.

3.2.1.2.2. Medidas de localização

Mas mesmo a informação reduzida de uma amostra é de mais para nós. Uma vez obtida a amostra, queremos ter informação mais concreta, sobre «à volta de quanto anda este fenómeno» (a altura dos Portugueses é mais ou menos quanto?, as notas deste aluno andam à volta de quanto?, etc.). Para isso, a teoria estatística utiliza as medidas de

localização. Estas são essencialmente três:

— A média , a mais usada, mas que é uma construção

aritmética feita sobre os valores da distribuição (um aluno que tem média de 12,6 pode nunca ter tido nenhuma nota 12,6).

A moda, que representa o valor mais vezes observado (a nota que o aluno mais vezes teve).

— A mediana , que é a observação do meio, aquela que tem

tantos valores observados acima como abaixo (aquela nota que o aluno teve e que ele superou tantas vezes quantas as que teve abaixo dela).

Estas medidas são três alternativas que nos permitem ter uma ideia de localização do problema. As três são boas, mas o essencial é notar que são diferentes. Nem sempre é equivalente usar qualquer uma das três.

Uma fábrica de sapatos, ao lançar o seu produto num novo mercado, decidiu contratar uma empresa de estudos de mercado para lhe dizer qual o tamanho do pé das pessoas dessa região. O estudo, depois de feito, disse que a dimensão média do pé das pessoas era de tamanho 40. Lançando muitos sapatos de tamanho 40, a empresa teve um grande prejuízo e a razão foi simples: o tamanho do pé dos homens era 41, das mulheres era 39; a média dava 40, mas quase não havia pessoas com pé n.º 40. Ou seja, a medida que se deveria ter usado não era a média, mas sim a moda. O erro foi grave.

A distribuição, conhecida pelo nome de «distribuição de

Gauss» ou «normal», representa o caso mais comum: um

depois alguns casos estranhos, fora do normal, que são poucos e que são tantos os situados acima como os abaixo. Nesta distribuição, a moda, a média e a mediana têm o mesmo valor, o que está a meio, logo não faz diferença qual das três medidas usar. Mas há muitos casos em que a distribuição não é normal (como o exemplo dos sapatos), e nesses é importante ter em atenção qual a medida de localização a usar.

3.2.1.2.3. Medidas de dispersão

É fundamental ter também ideia de qual o grau de confiança que se pode ter nessa informação. Dois alunos com média de 12 podem ser completamente diferentes, se um deles tem todas as notas muito perto do 12 e se o outro é muito irregular, com notas muito altas e muito baixas. Para o primeiro, a média (o 12) é uma informação relevante, é um bom indicador do seu valor.

Uma possível informação relevante é o tamanho da amostra. Se, por exemplo, alguém me diz que 50 % dos seus amigos jogam ténis, é importante saber quantos amigos ele tem, para ter uma ideia sobre a relevância do problema. Se ele tem só dois amigos, então apenas uma pessoa joga ténis, e isso pode ser um acaso; se ele tem 40 amigos então, com 20 tenistas, já pode criar um clube.

Outro dado que pode ser relevante é a frequência do acontecimento. Num estudo sobre uma vacina para a poliomielite, foi escolhida uma amostra de duzentas crianças. A vacina foi administrada a cem crianças, enquanto as outras cem não eram vacinadas. O resultado foi um sucesso: nenhuma das cem crianças vacinadas teve a doença! Mas... por acaso, nenhuma das outras cem também teve a doença, porque esta é uma doença rara.

Daqui nasce o problema de, muitas vezes, diferenças entre medidas de localização não serem significativas. Não há dois anos em que a média da precipitação de chuva seja exactamente igual, mas não é por isso que os anos deixam de ter o mesmo clima.

3.2.1.2.4. Informação errónea

Um dos erros (ou manipulação) mais frequentes na interpretação das estatísticas, e um dos mais difíceis de evitar, dá-se quando a informação que se fornece é verdadeira, está relacionada com a conclusão, mas não é a informação relevante para a conclusão. Por exemplo, é verdade que morreu mais gente em desastres de aviação o ano passado do que em 1910. É claro que parece, portanto, que os aviões são menos seguros hoje do que em 1910, o que é ridículo. O truque está em que, como o ano passado andou muito mais gente de avião do que em 1910, é normal que morresse mais gente. O indicador correcto aqui deveria ser não um valor absoluto, mas uma percentagem (percentagem de passageiros que morreram em desastres). Aqui temos um exemplo de uma afirmação exacta,

relacionada com o problema, mas suficientemente afastada para ser errónea.

É claro que um país maior tem de ter mais produto, só porque tem mais gente. O que deve ser utilizado na comparação é o produto per capita , ou seja, o produto total a dividir pela população. Por exemplo, a Índia tem um produto que é mais de seis vezes superior ao português; mas, como a população da Índia é muito maior que a de Portugal (mais de oitenta vezes), em média cada português tem acesso a mais de 12 vezes o produto que um indiano tem.

É claro que os sindicatos escolhem sempre como referência o ano em que os salários estiveram mais altos, para mostrarem como se desceu ou cresceu pouco desde então até agora, enquanto os patrões escolhem o ano da crise, para demonstrarem que hoje se está muito melhor. A oposição centra-se no último período de expansão e o Governo escolhe o fundo da última crise, para que o momento actual pareça pior ou melhor do que é.

3.2.1.2.5. Correlação errónea

Outro erro deste tipo aparece na falácia post hoc, de que já falámos. Uma correlação não implica uma causalidade, e pode até ser coincidência. A identificação de uma correlação estatística entre dois fenómenos não implica necessariamente a conclusão teórica de um nexo de causalidade entre eles. O facto de os dados indicarem que há alguma relação entre os fumadores e os doentes de cancro pode ser informação relevante para apoiar uma teoria médica que, por razões teóricas particulares, tem essa conclusão. Pode ser uma coincidência sem sentido ou, ser um facto originado por uma terceira causa, que motiva a verificação simultânea dos dois factos.

Algumas hipóteses implícitas podem causar conclusões bastante enviesadas. Por exemplo, quando uma conclusão tirada num momento do tempo é extrapolada para o futuro. É tentador pensar que os países pobres amanhã serão os ricos de hoje. Dizer que Moçambique será daqui a vinte anos como o Chile, daqui a quarenta como a Espanha e daqui a cem como os Estados Unidos não tem qualquer sentido, mas equivale a tomar a escala que hoje existe como indicador para a evolução futura de um dos pontos. Este erro é mais frequente do que se imagina.

Outro erro semelhante se comete ao supor que a evolução futura será igual à do passado, ou que ela seguirá uma linha proporcional à verificada. É claro que se a população mundial ou a poluição continuarem a aumentar à mesma taxa que cresceram nos últimos cem anos, em breve não haverá possibilidade de vivermos no Planeta. Mas também é claro que exactamente porque se cresceu tão rápido nos últimos tempos é natural esperar que a situação actual seja diferente da de há cem anos, pelo que o crescimento futuro não deva ser igual ao que então se verificou. Fugir a um estudo directo do problema, refugiando-se em truques expeditos, é sempre errado.

3.2.1.2.6. Representação errónea

Um dos meios mais fáceis de dar uma ideia errada de um número é representá-lo num gráfico. Um gráfico é uma das formas mais simples de sugerir uma interpretação errada das estatísticas.

Por exemplo, um gráfico a que faltam escalas nos eixos dá sempre uma ideia indefinida (e, normalmente, enganadora), enquanto que, se há escala, mas falta a origem, é fácil que o gráfico apareça com um aspecto muito diferente do real.

3.2.1.2.7. Conclusões

É essencial ter muita atenção quando um número é invocado para suportar um argumento. A maior parte das pessoas, quando uma estatística é invocada como justificação, confia instintivamente. Pelo contrário, a atitude correcta é a de aguçar as cautelas, pois a possibilidade de engano sobe quando uma estatística aparece.

Perante um número, Darrel Huff (autor inglês de cujo livro foram retirados boa parte dos exemplos anteriores) afirma que é bom fazer as seguintes perguntas:

i) Quem diz?

— A informação vem de um estudo sério ou de um palpite sem fundamento? Qual a fonte de certa informação? ii) Como é que ele sabe?

— Qual a amostra em que se baseou? Como foi recolhida e qual o método (medida de localização, etc.) usado para obter a afirmação?

iii) O que é que falta?

— Será que está indicado, de forma correcta e suficiente, a confiança que se pode ter nesse número? Estão presentes os indicadores necessários para ter uma noção dessa confiança?

iv)Será que alguém mudou o assunto?

— O número referido mede aquilo que queríamos medir? Não haverá ligeiras mudanças que transformem completamente o sentido?

v) E sobretudo... será que faz sentido?

— Não há estatística que substitua o bom senso e o estudo aturado do problema. Se uma estatística não faz sentido, é provável que haja, algures, um erro que invalide esse número.

Se toda a análise de números for feita com estes cuidados, teremos uma boa hipótese de não sermos enganados.