Carácter e personalidade - Testes de produção

CLASSIFICAÇÃO E ESCOLHA DOS TESTES Resumo

B. Testes de produção

2. Carácter e personalidade

Os testes de carácter e de personalidades são concebidos para avaliar as características das pessoas como também um certo número de qualidades e para avaliar os sentimentos e as atitudes relativamente a si, aos outras e várias actividades, instituições e situações. A maioria dos testes de carácter e personalidade são instrumentos de auto - avaliação e vocês podem pedir as pessoas que respondam a uma série de questões ou enunciados. Nesta categoria, há instrumentos concebidos para avaliar a personalidade, as atitudes, a criatividade, e o interesse dos alunos. 3. Aptidão

Os testes de aptidão são as maneiras de medir o potencial. Eles são usados para predizer a produção provável de uma pessoa numa situação ulterior. Os testes de aptidão são também chamados de diferentes maneiras: testes de aptidão aos estudos, testes de inteligência e testes de eficiência intelectual. Os testes de aptidão permitem também predizer o nível de produção provável de uma pessoa depois que ela tenh recebido algumas instruções ou formações precisas. Eles se apresentam sob forma de baterias ou de teste individual sobre uma matéria ou um tópico preciso. Embora praticamente todos testes de aptidão sejam padronizados e dados no quadro de um programa de testes escolar, os resultados são úteis para os professores, os conselheiros e os administradores. Os teste de aptidão ao estado de preparação (ou testes prognósticos) são dados antes do ensino ou a formação num domínio preciso para determinar se um aluno está pronto receber um ensino ou beneficiar disto, e em que medida. Os testes de aptidão ao estado de preparação, que fazem parte dos testes de aptidão, geralmente compreendem a avaliação de variáveis como a discriminação auditiva, a discriminação visual e as habilidades motoras.

Normas de produção

As normas de produção são o critérios que permitem comparar os resultados da avaliação afim de se interpretar. Um resultado só não quer dizer nada. Se eu vos digo que Ahmed teve 18 respostas boas, o que é que isso vos diz em relação a sua produção? Absolutamente nada. Agora, se eu vos digo que a média é 15, pelo menos você sabe que teve mais alto que a média. Ao invés, se eu vos digo que tem uma nota de 17 é requerida para um objectivo de domínio, não sabe nada

sobre a produção do resto da turma, mas você sabe que Ahmed alcançou o objectivo de domínioo. Nós podemos interpretar o resultado a um teste de duas maneiras, uma sendo por comparação aos outros resultados dos alunos da turma (que é uma medida normativa) e o outro sendo por comparação do resultado a um critério predeterminado (que é a medida criterial). Padrões normativos

Todo o teste, padronizado ou concebido localemente, qui apresente e interpreta cada resultado de acordo com a sua posição relativa em relação às outras notas obtidas no mesmo teste, é normativo. Por exemplo, se alguém tiver um Q.I. total de 100, a interpretação que se pode fazer disso é que a inteligência medida é media quando se comparar aos resultados obtidos por um grupo de referência. As contagens brutas resultantes da administração são convertidas num outro indicador que mostra a posição relativa. O percentil, que vocês conhecem bem, se aparenta a uma tal técnica. Um determinado percentil indica a percentagem das notas que eram mais baixas que a nota correspondente do percentil. Por exemplo, o sr. Ahmed poderia ter obtido uma nota que équivale a um percentil de 42 num teste de matemática padronizada, o que significa que 42% dos alunos que fizeram o teste adquiriram um resultado mais baixo que o do Ahmed. Quando se comunica os resultados dos alunos deste modo, nada permite indicar o que o Ahmed sabe ou não sabe. As únicas interpretações que se pode disso tirar concerne a produção de Ahmed em relação a aquele dos outros.

Os testes normativos são fundados na idéia de que as características avaliadas concernem as propriedades da curva normal. A idéia da curva normal é que as características avaliadas existem em quantidades diferentes nas pessoas diferentes. Algumas pessoas têm muito disto, enquanto as outras têm pouco, e a maioria das pessoas possuem uma certa quantidade disto, o que é chamado a quantidade «média» . Por exemplo, se você dá um teste de matemática a 100 alunos, sendo dado que ele é de um nível adequado – quer dizer não muito fácil nem muito difícil - uma pequena parte da turma terá bons resultados e uma outra parte igual terá alguns resultados fracos, enquanto a maioria terá obtido uma nota média.

A curva normal é ilustrada abaixo. Insira o gráfico:

A maioria das notas são (a freqüência mais elevada) médias, e poucas notas estão acima ou debaixo da média, e muito pequeno extensivamente acima ou debaixo da média. O grupo que teve as notas médias compreende 65% dos resultados aproximadamente. A medida normativa usada nesta distribuição hipotética de notas é aplicada em situações verdadeiras na turma e de avaliação. Ou seja, quando os melhores 2-3% têm A (pouco importa as suas contagens), os próximos 15% adquirem B, os próximos 65% recebem C, os próximos 15% têm D, e os últimos 2-3% recebem o F. As notas em letras são atribuídas sem ter em conta a real produção do aluno.

Há um problema com os padrões normativos. Algumas pessoas podem adquirir boas notas (ou inversamente, más notas) sem necessariamente exibir o nível de produção correspondente. Um tam método pode estimular os alunos, mas também pode causar um problema particular quando a turma for mais homogênea.

Interpretações criteriais

Todo o teste que apresenta e interpreta cada resultado de acordo com um padrão absoluto é criterial. Em outras palavras, a interpretação do resultado de uma pessoa não tem nada a ver com o resultado de qualquer um. Uma contagem é comparada com uma norma ou uma produção, e não com as contagens dos outros. Quando o teste criterial é usado, cada pessoa que passa pode obtêr um resultado forte ou fraco. Neste contexto, um critério pode ser definido como sendo um domínio de comportamentos que medem um objectivo.

Características de um bom teste

Algumas características são desejáveis para todo o teste. Os testes padronizados, que são elaborados por peritos em suas matérias e em avaliação, são os mais susceptíveis de responder a estas normas. Estas características, que são abordadas mais em detalhes compreendem: a) a objectividade do teste

b) a discriminação c) a perspectiva global d) a validez

e) a fiabilidade

f) a especificação das condições nas quais o teste será submetido g) a orientação da cotação e a interpretação

Objectividade do teste

A objectividade do teste é o facto que, pouca importa o revisor, a nota do teste permanece sensivelmente o mesmo. Um teste é objectivo quando a opinião, a parcialidade ou o julgamento individual não constituíem factores determinantes na cotação. Os testes podem ser feitos por mais de uma pessoa, a um momento diferente ou simultaneamente. Em educação, nós nos perguntamos em que medida a cotação destes revisores individuais é a mesma. Se a diferença

possível entre as correcções de um mesmo teste é grande, este teste é pouco objectivo. Embora as pessoas podem discernir a informação de modo diferente, naturalmente, que nós presumimos que quanto mais um teste é objectivo, mais ele aspira a avaliação de alta qualidade que nós desejamos todos em educação. Isto não significa que os testes não possuem um nível elevado de objectividade (como os testes subjectivos) são de má qualidade. Até mesmo os testes subjectivos, embora eles sejam concebidos para avaliar as informações podendo ser abordadas de ângulos diferentes, uma certa parte de objectividade é necessária. O conceptor individual tem que ter algo em cabeça que constitui uma boa produção para um tal teste. Esta coisa pode ser múltipla, mas o critérios devem ser estabelecidos para garantir que toda a cotação seja bastante justa para contribuír para estabelecer uma discriminação entre os alunos sobre uma tal base. A objectividade, é relativa.

Discriminação

O teste deveria ser construído para descobrir ou avaliar as pequenas diferenças na produção ou no alcance; é essencial se o teste deve ser usado para classificar os alunos de acordo com a sua produção individual ou para atribuír notas. Por outro lado, não é um factor importante se o teste é usado para medir o nível da turma inteira tendo como meta principal o ensino de preferência que a avaliação. Como é verdade para a validez, a fiabilidade e a objectividade, o poder discriminativo de um teste é aumentado quando concentra em cada artigo de teste individual e o aperfeiçoa. Depois de ter dado o teste, uma análise de artigos pode ser realizada, o que mostrará a dificuldade relativa de cada artigo e em que medida cada um faz a distinção entre os bons e maus alunos. Frequentemente, como no caso da obtenção da fidelidade, é necessário prolongar o comprimento do teste para ter uma discriminação clara. Um teste descriminativo:

(1) produz uma grande variedade de resultados quando é dado aos alunos que têm produções apreciavelmente diferentes.

(2) incluirá os artigos que cobrem todos os níveis de dificuldade. Somente os melhores alunos responderão correctamente a alguns artigos; os outros serão relativamente fáceis e a maioria dos alunos responderá a isso correctamente. Se todos os alunos respondem a um artigo correctamente, o teste falta de discriminação.

Representatividade

Para que um teste seja representativo, ele deveria cobrir os principais objectivos das aulas. Não é necessário nem conveniente de avaliar cada objectivo ensinado na sala, mas um número suficiente de objectivos deveriam ser incluídos para assegurar uma medida válida da produção do aluno na aula completa.

A validez é a característica mais importante de um bom exame; isso significa que ela indica aquilo que um teste é suposto medir. É primordial que um teste seja válido de forma a que os resultados sejam aplicados e interpretados precisamente.

A validez não é determinada por uma única estatística, mas sim por uma pesquisa que demonstra a relação entre o teste e o comportamento que ela quer avaliar. Há três tipos de validez: a) Validez do conteúdo

Quando um teste tiver a validade do conteúdo, os artigos do teste representam a extensão completa de artigos possíveis que o teste deveria cobrir. As questões do teste individual podem ser tomadas de uma grande lista de artigos que incluem uma grande variedade de tópicos. Em certos casos onde um teste avaliado tem uma característica difícil a definir, um juíz especializado pode avaliar a relevância de cada artigo. Dois juízes independentes avaliam o teste separadamente, porque cada juiz funda sua avaliação sobre a opinião. Quando os dois juízes considerarem que alguns artigos são muito aplicáveis, eles serão incluídos no exame final.

b) Critério de validez

Diz-se que um teste tem a validade criterial quando é eficaz para predizer os critérios ou indicar uma construção. Existem dois tipos diferentes de validez criterial:

A validez concorrente é quando os critérios são adquiridos ao mesmo tempo que os resultados. Ela indica em que medida os resultados estimam com precisão o estado actual de uma pessoa para o que é de critérios. Por exemplo, se um teste avalia os níveis de depressão, teria-se dito que este teste que teve uma validez concorrente se tivesse avaliado os níveis de depressão actuais daquele que submeteu o teste.

A validez predictiva é quando os critérios são adquiridos depois do teste. Os testes de carreira ou de aptidão, que são úteis para determinar quem são os mais suscetíveis para ter sucesso ou não em certos assuntos ou matérias, são exemplos de testes que possuem a validade predictiva. c) Validez conceitual

Um teste possui a validez conceitual se houver uma associação entre os resultados e a predição de uma característica teórica. Os testes de inteligência são um exemplo de instrumentos de medida que deveriam possuir a validez conceitual. O professor pode se assegurar que os artigos de seu teste são válidos enquanto seguindo o procedimento aceite para a construção de teste que compreeende:

(1) A utilização de objectivos de aulas que servem de base para as exigências do teste. Um exame construído deste modo terá tendência a avaliar o que foi ensinado.

(2) Uma revisão dos artigos do teste e o exame completo pelos outros professores.

(3) A selecção da forma mais adequada de teste e o tipo de artigos de teste. Assim, se o professor desejar avaliar «a aptidão a fazer» , ele tem que escolher esta forma de teste que requererá que o aluno demonstre «aptidão para fazer» . Se uma outra forma menos desejável é usada, a pessoa tem que reconhecer que a validez desta avaliação esteve reduzida.

(4) As exigências do teste devem ser claramente apresentadas e sem equívoco. Se o material de exame não pode ser interpretado correctamente pelo aluno, este não entenderá o que é coberto; por isso, ele não será capaz responder como previsto. Um tal teste não é válido.

(5) A eliminação dos factores não ligados a a avaliação dos pontos a ensinar, na medida do possível. Um teste que está por cima dos meios dos alunos em relação ao tempo ou ao nível escolar não pode conseguir avaliar a sua real aprendizagem nas aulas.

Fiabilidade

A fiabilidade se assemelha à fidelidade de uma medida. Estima-se que um teste é fiável quando se obtêm o mesmo resultado repetidamente. Por exemplo, se um teste é concebido para avaliar uma característica (como a introversão), toda vez que é dado a um tópico, deveria dar apreciavelmente os mesmos resultados. Infelizmente, é impossível avaliar a fiabilidade com exactidão, mas existem várias maneiras de avaliar.

a) Fiabilidade do teste - reteste

Para avaliar a fiabilidade de teste – reteste, o teste é dado duas vezes em dois momentos diferentes. Este tipo de viabilidade é usada para avaliar a constância de um teste com o transcurso do tempo. Este tipo de fiabilidade supõe que não haverá uma mudança na qualidade ou no conceito avaliado. O melhor uso de fiabilidade teste - reteste é quando ela serve para as coisas que não mudam com o transcurso do tempo, como inteligência. Geralmente, confiança será melhor se pouco tempo se esgota entre os testes.

b) Coeficiente de objectividade

Este tipo de fiabilidade é avaliado por dois juízes independentes ou mais que corrigem o teste. Os resultados são comparados entre eles para determinar a constância das avaliações dos juízes. Uma maneira de avaliar o coeficiente de objectividade é pedir a cada juíz de conferir um resultado de cada artigo do teste. Por exemplo, cada juíz poderia corrigir os artigos usando uma escala indo de 1 a 10. Em seguida, poderia calcular a correlação entre as duas avaliações para

determinar o nível do coeficiente de objectividade. Um outro meio para avaliar o coeficiente de objectividade é de pedir aos juízes de determinar em que categoria cada observação se encontra e em seguida, de calcular a percentagem certa entre os juízes. Então, se os juízes se entendem 8 vezes sobre 10, o teste tem uma taxa de 80% de coeficiente de objectividade.

c) Fidelidade das formas paralelas

A fidelidade das formas paralelas é avaliada comparando os diferentes testes que foram concebidos com o mesmo conteúdo. Para se chegar lá, produz-se uma grande lista de artigos de teste que avaliam a mesma qualidade e depois, separa-se os artigos ao acaso em dois testes diferentes. Os dois testes deveriam em seguida ser administrados simultaneamente aos mesmos tópicos.

d) Fidelidade da coerência interna

Este tipo de fidelidade é usado para estimular a coerência dos resultados pelos artigos do mesmo teste. Essencialmente, compara-se os artigos dos testes que avaliam o mesmo conceito para determinar a coerência interna dos testes. Quando você ver uma pergunta que se parece muito a uma outra pergunta do teste, isto pode indicar que as duas perguntas são usadas para avaliar a fidelidade. As duas perguntas são semelhantes e elaboradas para avaliar a mesma coisa, aquele que submete o teste deveria responder as duas perguntas da mesma maneira, e isto indicaria que o teste possui uma coerência interna.

Os factores seguintes terão uma incidência na fidelidade de um teste:

(1) Administração. É primordial que todo aluno tenha o mesmo tempo, o mesmo equipamento, as mesmas instruções, a mesma assistência e o mesmo ambiente para efectuar o teste. As instruções dos testes deveriam ser aplicadas estreitamente.

(2) Anotação. A objectividade na anotação contribui à fidelidade. Todo o esforço deveria ser desdobrado para adquirir a uniformidade das normas e das práticas da cotação.

(3) Normas. As normas de produção estabelecidas para uma turma deveriam ser conforme a aquelas usadas em outras turmas. Uma mudança nas políticas de classificação não fundadas sobre os factos, das normas uniformes ed os factores de experiências adquiridas das outras turmas terá uma incidêcia na fidelidade dos resultados do teste.

(4) Instrução. A fiabilidade dos resultados dos testes será modificada se a instrução apresentada a turma tem tendência a conceder muita importância aos pontos a ensinar cumpridos no exame. Chama-se a este fenómeno «o ensino do teste» e não é desejável. Quando o professor fornece algumas indicações óbvias aos alunos sobre as exigências do teste, não só ele modifica a fiabilidade do teste mas ele insulta a inteligência de sua turma.

(5) comprimento. Quanto mais os alunos respondem as perguntas, mais o teste ou o dispositivo de medida serão fiáveis.

Especificação das condições de administração

Um bom teste tem que especificar as condições das quais o teste será dirigido. Eles têm que fornecer a todos os alunos uma boa oportunidade de demonstrar as suas competências, porque isso melhorará a fidelidade do teste. O teste padronizado tem que vir com a especificação das condições nas quais os alunos têm que realizar o teste. Dar o teste em condições muito variadas terão um impacto muito grande nos resultados do teste. Em geral, quando se administra um teste, deve-se guardar ao espírito os pontos seguintes:

- a disposição física

-a iluminação, ventilação, o silêncio, etc. - o estado psicológico

-evitar provocar a ansiedade ligada ao teste - tentar diminuir a ansiedade ligada ao teste

-não dar o teste quando outros eventos serão uma fonte de distração - as sugestões

-não falar inutilmente antes do teste -minimizar as interrupções

-não fornecer os sinais a pessoas que pedem informação sobre os artigos -desencorajar a trapaça

-alocar aos alunos o mesmo tempo fazer o teste

Indicações para a anotação e a interpretação dos resultados do teste

Um bom teste deve ser acompanhado de indicações que explicam como notar e interpretar os resultados do teste, e isto prevalece especialmente para os testes padronizados, que são usados por outras pessoas que aquelas que prepararam em primeiro. Tais indicações são também importantes para os testes concebidos localmente, porque outras pessoas podem tomar parte no processo de anotação e da interpretação do teste, por causa de circunstâncias imprevistas. As instruções seguintes permitem ter algumas indicações claras para os testes.

- Usar as descrições claras para o procedimento detalhado a seguir para administrar os testes de uma maneira padronizada.

-Fornecer as informações a aqueles que submetem ou usam o teste com respeito aos formatos das perguntas, o procedimento para responder as perguntas e o uso de todo o material ou equipamento requerido.

-Estabelecer e instituir um procedimento para garantir a segurança do material para o teste durante todas as fases de elaboração, a administração, a anotação e o boletim do teste.

-Dar o procedimento, o material e as indicações para a anotação dos testes e a vigilância da exactidão do processo de anotação. Se o inventor do teste é responsável pela anotação, dispensar a formação adequada aos revisores.

-Corrigir os enganos que têm uma incidência na interpretação dos resultados e transmitem imediatamente os resultados corrigidos.

-Definir e instaurar um procedimento para se assegurar da confidêncialidade dos resultados.

Escolha de um teste

Geralmente, quando nós falamos da escolha dos instrumentos de medida ou dos testes, nós fazemos referência aos instrumentos padronizados. Na maioria das situações, podem acontecer que você seja forçado a uma só opção. Contudo, em alguns casos, você poderá ser confrontado, para o desafio de comparar alguns instrumentos e escolher o que é muito satisfatório as suas necessidades e sua situação. Se tal é o caso, você deveria fundar sua decisão em factos objetivos e princípios sólidos de avaliação.

Acima de tudo, você tem que pensar na técnica de avaliação que responde a meta de testagem e aos objectivos devendo ser avaliados. Por exemplo, o plano de avaliação para um programa de estudos em leitura ao teste implicaria uma combinação de instrumentos concebidos localmente e padronizados. Este plano também pode implicar os formatos normativos e criteriais. Por outro lado, o programa de teste da escola requereria somente o uso dos testes padronizados.

No documento Avaliação e Testes em Pedagogia (páginas 56-65)