Desenvolvimento de instrumentos e evidências de validade de medidas

1.4. Formação de Professores

1.4.3 Desenvolvimento de instrumentos e evidências de validade de medidas

As descobertas científicas avançam de acordo com o desenvolvimento de estudos com percursos metodológicos e instrumentos de investigação selecionados pelos pesquisadores, tais instrumentos quando avaliados positivamente fornecem subsídios para testes empíricos, a fim de comprovar ou redirecionar teorias, como na Teoria Social Cognitiva, em que pesquisadores da área desenvolvem instrumentos para a avaliação de determinantes do comportamento humano (BANDURA, 2006; ALMEIDA et al., 2009; BZUNECK, BORUCHOVITCH; RUFINI, 2014; BZUNECK; GUIMARÃES, 2003).

Para que um instrumento possua relevância no meio científico é necessário que este possua precisão no que está proposto a medir, ou melhor, um instrumento possui validade quando sua construção e aplicabilidade são fidedignos ao que se pretende dimensionar, apresentando assim evidências de validade, requisito principal para a realização de pesquisas empíricas. As técnicas mais conhecidas para a validação de instrumentos são: validade de conteúdo, validade de critério e validade de construto, pode-se eleger essas técnicas para validar instrumentos, por exemplo, as escalas. (ALENCAR et al., 2012; BELLUCCI JÚNIOR; MISUE MATSUDA; 2012).

A validade de conteúdo se trata da comprobação de que os itens, que compõe o instrumento, são fiéis à perspectiva teórica, sendo capaz de quantificar o que se pretende. Para que isto ocorra é necessário realizar uma análise detalhada dos itens, contestando e comparando com pressuposto teórico, além da possibilidade de ser analisada por juízes especialistas da área. Como exemplo, tem-se um teste em que o autor pretende analisar a fala de um indivíduo, nele é necessário que os indivíduos sejam analisados por sua fala e não pela sua escrita, do contrário o teste não apresentaria evidências de validade. Nesta técnica de

validade não são utilizados tratamentos estatísticos para a avaliação e análise dos resultados (DA SILVA, 2007).

A validade de critério se dá quando a confirmação dos resultados obtidos pelo instrumento corrobora para a validade, apresentando algum índice de correlação significante frente a outra variável relevante. Existem dois tipos de validade de critério, a validação preditiva e validação concorrente, se outra variável apresenta natureza diferente da que se pretende validar, então a validação é nomeada de validação preditiva, porém, se esta outra variável apresentar medida diferente da mesma variável que se pretende medir, a validação se caracteriza como concorrente (DA SILVA, 2007).

Por último, a validade de construto se caracteriza por ser mais ampla, pois envolve as duas validades supracitadas. Um dos métodos para colocá-la em prática, é a realização da construção de hipóteses, fundamentadas de acordo com a teoria, afim de que sejam testadas para definir se há ou não correlação destas com as variáveis relacionadas ao construto. Outra metodologia se dá pela identificação empírica de grupos diferentes relacionados ao construto, neste caso a validade se dá pela confirmação de diferenças significativas nos resultados de cada grupo, caracterizado como método dos grupos conhecidos (DA SILVA, 2007).

Sendo assim, estudos que envolvem pesquisa de campo, tendo por finalidade o delineamento ou a análise de características de ocorrências ou fenômenos, exigem o uso de técnicas quantitativas, objetivando a coleta sistêmica de dados, sendo nomeadas pesquisas quantitativo-descritivas. Este tipo de pesquisa demanda o uso de instrumentos para medir o que se pretende, sendo formulados em forma de escalas e testes validados nacional e internacionalmente para viabilizar a coleta sistêmica de dados, avaliando quantitativamente os fenômenos envolvidos e ainda, a correlação entre as variáveis, por meio de testes estatísticos (MARCONI; LAKATOS, 2003).

Deste modo, de acordo com a metodologia de técnicas quantitativas surgem os instrumentos de avaliação, dentre eles as escalas são bastante utilizadas nas coletas sistêmicas de dados. Para que estas possam ser aplicadas a outros estudos deve-se submetê-las a um processo de validação, conforme explicado anteriormente. Segundo Bandura (1997; 2001; 2006) uma teoria que envolve a psicologia não deve ser utilizada apenas por suas contribuições explicativas e preditivas, e sim por sua operacionalidade para que possa mudar cursos e efetuar mudanças, e os instrumentos favorecem a aplicabilidade de mudanças e o surgimento de sugestões.

No processo de construção de uma escala para medir as crenças de autoeficácia, por exemplo, os participantes são expostos a itens que representam diferentes níveis de demandas

de tarefas e avaliam suas crenças em sua capacidade de executar suas tarefas, Bandura (2006) indicou que uma escala em que os indivíduos registram a força de suas crenças de eficácia em respostas de 100 pontos, com intervalos de 10 unidades a partir do 0. O “0” corresponde ao nível mais baixo, aumentando gradualmente, “50” corresponde à centralidade da escala e “100” ao nível mais alto de resposta.

Bandura (2006) afirma que escalas que apresentam menor número de respostas devem ser evitadas, por conta de sua menor sensibilidade e confiabilidade, pois as pessoas normalmente evitam posições extremas e as escalas com menores respostas limitam e encolhem as respostas. Este encolhimento das respostas oportuniza a perda de informações, mas caso as categorias de respostas intermediárias forem incluídas, os participantes têm a oportunidade de diferir o nível e sensibilidade de resposta. Ou um formato com respostas mais simples, preserva a estrutura da escala e descritores, utilizando formatos de resposta mais curtos, variando de 0 a 10. Deste modo, escalas que apresentam um maior leque de respostas são mais confiáveis e sensíveis às variações do comportamento humano (BANDURA, 2006).

Outro ponto fundamental é a exclusão de números negativos em um dos polos da escala, pois as variáveis estão relacionadas aos construtos de uma teoria comportamental e o autor entende que o indivíduo possui um limite de julgamento de incapacidade total que seria “0”, não havendo gradações inferiores. Em suma, as escalas bipolares que apresentam níveis de respostas abaixo de “0” com variáveis referentes a um determinado nível de realização de atividade, não fazem sentido (BANDURA, 2006).

As escalas podem ser adaptadas de acordo com seu público-alvo, para estudantes, trabalhadores, bem como para o contexto infantil. Como por exemplo, para crianças que ainda não possuem dimensão de escala ou níveis de intensidade, podem-se substituir os itens por uma tarefa que exija desempenho físico, pinturas, clima, numerações, no caso de uma escala de eficácia percebida, o desempenho físico segue a fim de familiarizar o seu esforço com a sua eficácia percebida (BANDURA, 2006).

Para evitar vieses no processo de aplicação e análise das respostas da escala, Bandura (2006), incentiva os pesquisadores a identifica-las por meio de códigos e não pelo nome dos participantes, conscientizando os entrevistados de que os dados são confidenciais, voluntários e da importância de sua contribuição para a pesquisa. O autor ressalta também, a importância de subtender os construtos para que não influencie nas respostas e incentive a respostas francas.

Vale ressaltar a importância da revisão das variáveis da escala por juízes adaptados ao tema; é aconselhável o descarte de itens ambíguos ou reescrevê-los; a eliminação de itens em que as pessoas pontuem com frequência, pois não diferenciam os participantes ou outra solução seria aumentar o nível de dificuldade do item (BANDURA, 2006). Os itens que utilizam os mesmos domínios do construto devem estar correlacionados entre si, apresentando pontuação total. No caso a técnica de Análise Fatorial verificará a homogeneidade dos itens, a confiabilidade limitará a correlação máxima que pode ser obtida entre as variáveis. Bandura (2006) sugere que a confiabilidade da consistência interna seja calculada utilizando medidas estatísticas como o alfa de Cronbach, se por ventura os coeficientes não apresentem índices de confiabilidades sólidos, os itens deverão ser descartados ou reformulados.

O processo de validação de um construto trata-se de um processo contínuo, em que a validade da estrutura causal construída a partir do esquema conceitual e as medidas do construto devem ser avaliadas a todo o momento. Esta avaliação auxilia na previsão e no fornecimento de diretrizes para adaptar a escala de acordo com a necessidade individual (BANDURA, 2006).

Deste modo propõe-se a construção de um instrumento norteado pelas diretrizes do construto da autorregulação. Entende-se que em algum momento de sua vida acadêmica, o estudante poderá desenvolver algum nível de autorregulação, porém alguns desenvolverão os padrões autorregulatórios de maneira mais tímida e menos eficiente, e se realizados de forma inadequada poderá interferir nos métodos desenvolvidos e seus resultados, nas crenças motivacionais e emotivas e no comportamento adotado culminando no surgimento de eventos prejudiciais e possivelmente na procrastinação acadêmica (ROSÁRIO, 2007; ZIMMERMAN; SCHUNK, 2004; ZIMMERMAN, 1998; SAMPAIO; POLYDORO; ROSÁRIO, 2012). Do contrário, alunos autorregulados tendem a estabelecer metas e adaptá-las se necessários, a fim de ter sucesso acadêmico em níveis motivacionais, metacognitivo e comportamental (ZIMMERMAN, 2001). Desta forma, tem-se como problema da pesquisa a seguinte questão: Quais as evidências de validade da “Escala de Autorregulação Acadêmica (EAA)” para medição da autorregulação da aprendizagem em estudantes universitários?

No documento Construção e validação da escala de autorregulação acadêmica (páginas 54-57)