• Nenhum resultado encontrado

CAPÍTULO 3 – A AVALIAÇÃO EM EDUCAÇÃO

3.1. A evolução do conceito de avaliação

3.1.1. As quatro gerações da avaliação

Guba e Lincoln (1989) defendem a existência de períodos demarcados da evolução da avaliação, dominados cada um deles por uma linha de força que estaria presente nas diferentes concepções e práticas da avaliação. Apesar de não os considerarem estanques, como mostraremos um pouco mais à frente, essas “linhas de força” constituiriam uma espécie de denominador comum para essa época. Passamos então a apresentar sucintamente as quatro gerações descritas pelos autores.

55

i. Avaliação como medida (1ª geração)

Guba e Lincoln (1989) apresentam a primeira geração da avaliação associada a uma função técnica do/a avaliador/a que deveria recorrer a uma panóplia de instrumentos de medida já existentes ou então ser ele próprio capaz de criar o/s instrumento/s necessário/s, caso não existissem disponíveis, para medir de forma rigorosa e objectiva, por exemplo, as aprendizagens dos estudantes. Este enfoque na avaliação como medida levou ao florescimento de inúmeros testes com este objetivo, tanto que, em 1945, uma bibliografia publicada por Gertrude Hildreth já incluía mais de 3.500.

Esta “geração” teria a apoiá-la dois marcos fundamentais: o surgimento da psicometria e o movimento da gestão científica do trabalho.

Relativamente à psicometria, os autores (Guba & Lincoln, 1989) fazem referência a Binet como o criador do primeiro teste de inteligência com aplicação prática, elaborado na sequência de uma solicitação do ministério da educação que pretendia uma forma simples e rápida de identificar os alunos que teriam dificuldades em acompanhar o percurso dito normal de escolaridade. Surge aqui a noção de idade mental, dado que o teste de Binet fazia corresponder a cada idade um conjunto de tarefas passíveis de serem realizadas/respondidas com sucesso pelas crianças da respetiva faixa etária, a que se segue posteriormente, nos E.U.A., a versão Standford- Binet, onde o “quociente de inteligência” (QI) passa a ser utilizado. A quantificação das funções psicológicas surge aqui de forma bem-sucedida. Ainda a nível da medida psicológica é igualmente um sucesso a aplicação de testes de inteligência em grupo e em número elevado, para seleção de pessoal, durante a I Guerra Mundial.

A medida psicológica integra o “espírito” das ciências sociais e humanas que surgem no final do século XIX, início do século XX, adotando a abordagem científica das já consagradas ciências “duras” como a física ou a química. A adoção do método científico importado para as ciências humanas era um sinal da procura de um estatuto de cientificidade. O mesmo aconteceu na psicologia com Wundt, quando este criou em

56

1989, o primeiro laboratório de psicologia, onde se estudava a resposta individual dos sujeitos a estímulos físicos também eles quantificáveis. O estabelecimento de leis que relacionavam estímulos físicos com respostas psicológicas foi a pedra de toque proporcionada pela matemática à afirmação da psicologia como ciência.

A gestão científica do trabalho irá influenciar não só a concepção do trabalho como também da escola. A preocupação com a eficácia e uma maior produtividade leva à organização do trabalho de forma padronizada, que se traduziu na famosa linha de montagem. O taylorismo passaria a influenciar a visão do ensino em que os estudantes seriam a matéria-prima que deveria ser processada na fábrica-escola e em que os testes constituiriam aquilo que atualmente consideraríamos o controlo de qualidade do produto produzido.

ii. Avaliação como descrição (2ª geração)

A segunda geração da avaliação surge pela tentativa de ultrapassar as limitações da perspetiva anterior, na medida em que a centração da avaliação nos estudantes não permitiu a criação de estratégias que se adequassem à avaliação de outros aspetos do sistema educativo, nomeadamente dos currículos.

A preocupação com a avaliação dos currículos nos E.U.A. é despoletada pelo “Eight Year Study”, um estudo iniciado em 1933 e que, como o nome indica, teve a duração de oito anos. Pretendia-se avaliar o sucesso, no ensino superior, dos estudantes oriundos do ensino secundário mas que não tinham frequentado um currículo de preparação para esse nível de ensino. Assim sendo, o objetivo seria verificar em que medida o novo currículo das escolas secundárias atingiria o objetivo de permitir aos estudantes obterem sucesso no ensino superior.

Neste contexto surge a figura de Ralph Tyler considerado o pai da avaliação educacional e que anteriormente ao surgimento do estudo já se encontrava a trabalhar no desenvolvimento de testes que permitiriam avaliar se os estudantes tinham (ou não) conseguido atingir aquilo que os professores pretendiam que aprendessem. Surge assim a noção de objetivos de aprendizagem, que rapidamente se transporta para o “Eight

57

Year Study” que Tyler passa a integrar, onde se procuraria assim descrever e analisar, os aspetos positivos e negativos do novo currículo e o grau de cumprimento dos objetivos definidos para o mesmo. Temos assim o avaliador imbuído do papel de descritor e não de medidor, e o nascimento da avaliação de programas.

iii. Avaliação como juízo de valor (3ª geração)

A terceira geração da avaliação surge associada ao lançamento do Sputnik em 1957 pela União Soviética e à reação dos E.U.A. a este evento, dado que o mesmo causou um sentimento de que os E.U.A. teriam sido ultrapassados. Nesse sentido, realizou-se um investimento significativo na formação dos jovens, em particular nas áreas das ciências e da matemática, decorrente de importantes reformas educativas desenvolvidas com o objetivo de acompanhar (ou ultrapassar) o desenvolvimento tecnológico e científico da então União Soviética. Foi assim necessário realizar nos E.U.A. e na Europa, fundamentalmente nos países mais desenvolvidos, a “(…) avaliação dos currículos, dos projetos e das aprendizagens dos alunos porque queriam certificar-se de que os novos currículos obedeciam aos critérios de qualidade que se pretendiam alcançar” (D. Fernandes, 2005, p. 58).

Dá-se nesta época um grande incremento na avaliação mas surge a necessidade de introduzir um aspeto que até ao momento não tinha sido contemplado: a avaliação do mérito ou valor. A avaliação não podia limitar-se à descrição e aos avaliadores passou a ser requerido que fizessem um juízo/julgamento sobre o que estavam a avaliar. Assim sendo, e não obstante a dificuldade inicial dos avaliadores de responderem a este repto, estes rapidamente assumiram o desafio e incorporaram esta vertente no processo de avaliação. Por outro lado, também os próprios objetivos não estariam isentos de avaliação, pelo que não faria sentido avaliar se um determinado processo tinha atingido os seus objetivos se estes em si mesmos não fossem considerados “dignos” desse esforço.

É de referir que surge também nesta fase a já clássica distinção de Scriven entre avaliação formativa e sumativa, que data de 1967. Na avaliação começa então a surgir

58

com destaque a importância da avaliação dos processos e da sua regulação, não se centrando esta unicamente no produto final.

iv. Avaliação como negociação e construção (4ª geração)

À semelhança das anteriores gerações de avaliação que temos vindo a descrever, a quarta geração apontada por Guba & Lincoln vem também tentar responder a deficiências ou limitações que as anteriores teriam. Os autores identificam três aspetos essenciais que a quarta geração necessita ultrapassar: a tendência para o “managerialismo”; a impossibilidade de considerar diversos pontos de vista, e a excessiva dependência do método científico. Analisaremos com um pouco mais de pormenor cada um destes aspetos.

Fernandes (2005) traduz a tendência para o “managerialismo” como “Tendência para as avaliações de programas, de instituições, ou de sistemas educativos refletirem os pontos de vista de quem as encomenda ou as financia que, verdadeiramente, nunca são postos em causa ou considerados corresponsáveis, mesmo que também tenham responsabilidades diretas no objecto de avaliação” (p. 60). Neste caso, o gestor que encomenda a avaliação é excluído da mesma e ao avaliador compete encontrar as lacunas noutras pessoas ou processos que não o incluem. A somar a este aspeto temos o facto de não obstante o formato da avaliação poder ser negociado entre o avaliador e quem a encomenda, a decisão final é em última análise de quem a encomenda, deixando muitas vezes de fora outros stakeholders13, cujo contributo para a avaliação e as

implicações que esta pode ter nas suas vidas, é negligenciado. Há ainda a considerar que a informação resultante do processo avaliativo poderá não ser disponibilizada a todos os interessados/implicados mas apenas a quem os decisores entenderem que deve chegar e quando estes entenderem que é o momento oportuno.

Um outro aspeto negativo referido é a impossibilidade de ter em consideração a pluralidade de valores existente em todos os processos de avaliação. Aliás, a ideia de que a avaliação é um processo objetivo porque baseado no método científico, e que a

13

59

ciência é neutra no que se refere a valores, isentaria, portanto, a avaliação de se preocupar com esta questão. No entanto, se assim não for, os resultados da avaliação poderão ter diversas interpretações em função dos valores de quem os analisa, e os próprios factos relatados “(…) are determined in interaction with the value system the evaluator (probably unknowingly) brings to bear. Then the very act of evaluation becomes a political act” (Guba & Lincoln, 1989, p. 35). Adicionalmente, Guba e Lincoln (1989, p. 34) referem que não obstante a questão dos valores ter surgido como relevante na mesma altura em que se coloca a questão do juízo na avaliação, estes sempre estiveram presentes nestes processos:

(…) indeed, the very term evaluation is linguistically rooted in the term value. But it was easy to overlook the fact that even the development of an ‘objective’ instrument involved value judgments, or that the question of value differences was not raised. But once raised it could not be stuffed back into its container. The question of whose values would dominate in an evaluation, or, alternatively, how value differences might be negotiated, now emerged as the main problem.

A grande questão é, portanto, como “acomodar” os diferentes valores em jogo dado que estamos na presença de um processo que não é isento destes, e que é em si mesmo também um ato político, porque implica uma opção de valores ou uma negociação dos mesmos.

Por último, a excessiva dependência do método científico na sua visão positivista leva a preconizar uma visão objetiva da realidade, bem como uma posição neutra do avaliador. Assim sendo, o avaliador retrataria uma situação objetiva, de forma isenta. O recurso a esta perspetiva acarreta várias consequências, como sejam o não ter em consideração o contexto, uma vez que se pretende, supostamente, encontrar os fatores gerais do processo de avaliação, até com vista a uma eventual generalização dos resultados. Este objetivo poderá resultar, como em muitos casos se constata, em avaliações irrelevantes dado que assépticas em relação às circunstâncias concretas em que se desenvolveram. Por outro lado, esta “verdade” a que o avaliador teria acesso torná-lo-ia o mensageiro daquilo que são as constatações da avaliação, desresponsabilizando-o das boas ou más notícias. Acresce ainda a este estado de coisas

60

a ideia de que ao existir uma única verdade comprovada cientificamente, não existem versões alternativas nem forma de contradizer a mesma. Associado ao método científico e à sua versão positivista está igualmente uma dependência excessiva dos métodos quantitativos e, consequentemente, a noção de quantificação a que ligamos a já referida geração da medida.

Enunciadas que estão as três grandes limitações das prévias gerações Guba & Lincoln descrevem a sua proposta de uma quarta geração, supostamente apta a resolvê- las. Avançam então com uma avaliação em que a negociação e a construção são pilares essenciais. Os autores referem-se a uma avaliação construtivista recetiva (responsive

constructivist evaluation) em que a perspetiva de Stake (2000) seria a que mais se

aproximaria dos pressupostos desta quarta geração. A expressão receptiva (responsive) pretende evidenciar o facto de que as questões a serem respondidas pela avaliação e a informação que deve ser recolhida deverão ser identificadas pelos stakeholders, fruto de um processo interativo e negociado que os autores admitem consumir bastante tempo. Assim sendo, estamos perante um processo em que a visão dos que nele estão envolvidos terá que ser tida em conta não só na definição inicial da avaliação como também nas suas conclusões que poderão não reunir o consenso de todos e que, consequentemente, por imperativos de tempo ou outros, poderão não se resolver, tornando-se assim “(…) the core for next evaluation that may be undertaken when time, resources, and interest permit” (Guba & Lincoln, 1989, p. 42). A expressão receptiva reporta-se ainda à importância de colocar em confronto os diferentes pontos de vista dos

stakeholders, “forçando-os” desta forma a desenvolver uma nova construção, que

poderá aproximar-se, por negociação, de uma visão mais consensual. A dinamização da referida negociação é da responsabilidade do avaliador, sendo que a visão consensual que se procura nem sempre se consegue atingir; no entanto, apesar de não se atingir esse consenso ficam expressas e clarificadas as questões que não se assumem como consensuais. Por outro lado, a referência ao construtivismo prende-se com a metodologia a que recorre este tipo de avaliação, que os autores referem também se poder denominar interpretativa ou hermenêutica. Este tipo de avaliação assenta assim num paradigma oposto ao positivismo e, como tal, em pressupostos ontológicos, epistemológicos e metodológicos distintos. Nega-se portanto a existência de uma

61

realidade objetiva; a realidade é construída, e apesar de em teoria poderem existir tantas construções da realidade quanto pessoas, há muitas que serão partilhadas. A própria ciência seria igualmente uma construção social da mente. Os resultados de um estudo derivam da interação entre o observador e aquilo que se observa e não do estudo do objeto, o qual supostamente existiria de forma independente do sujeito que o analisa.

Ao efetuar o balanço desta nova geração os autores apontam aspetos que se perdem face às anteriores, como sejam o sentimento de certeza que deriva de se considerar que existe uma “verdade”, o que implica lidar com a ambiguidade a qual, para alguns, poderá ser intolerável. A perda de controlo por parte do avaliador é também algo que se deve ter em conta uma vez que os stakeholders desempenham um papel permanente no processo influenciando-o e até, prejudicando-o eventualmente, pelo facto de poderem estar menos preparados metodologicamente, e assim poderem vir a colocar em perigo a adequação técnica do estudo. Por último, a esperança de resultados generalizáveis, como é apanágio da ciência positivista, cai por terra, dado que as soluções são sempre locais e dependentes do contexto.

Os autores (Guba & Lincoln, 1989, p. 47) refutam, no entanto, as falhas enunciadas referindo:

But, answer the proponents of responsive constructivism evaluation, all these fears - about the loss of absolutes on which to pin our hopes, about intolerable ambiguity, about the loss of experimental and political control, about our inability to find widely and useful solutions to our pressing problems – are themselves only constructions in which their constructors are trapped because of their rigid adherence to assumptions that have patently outlived their utility and credibility. It is precisely because of our preoccupation with finding universal solutions that we fail to see how to devise solutions with local control that we fail to empower the very people whom we are putatively trying to serve.

Apesar de podermos sentir-nos atraídos por este desenvolvimento mais recente da avaliação, D. Fernandes (2005) adverte-nos da dificuldade que poderá existir na sua implementação, derivada de uma eventual incapacidade das pessoas envolvidas

62

“aguentarem” as modificações ou as rupturas que esta nova geração da avaliação poderá causar. A possibilidade de surgirem reações contraditórias e clivagens entre os diferentes sectores da sociedade são aspetos que não podem ser negligenciados.