• Nenhum resultado encontrado

6 A ANÁLISE FATORIAL EXPLORATÓRIA E SUAS TÉCNICAS

6.2 MATRIZ DE CORRELAÇÃO

Na medida em que os métodos psicométricos nasceram dos estudos sobre a correlação entre as variáveis psicológicas, este tópico descreverá exemplos de análises correlacionais. Em termos gerais, as correlações entre um conjunto de variáveis são postas em uma matriz, denominada de matriz de correlação. Essa matriz indica o grau de relacionamento entre variáveis. Nela, há um conjunto de números, chamados de coeficientes de correlação, e que variam desde –1 a +1, indicando a direção e a magnitude do relacionamento.

Sabe-se que há alguma relação entre a presença de nuvens escuras e a ocorrência de chuva. Uma correlação de +1,0 entre nuvens escuras e chuva implicaria que 100% das ocorrências de nuvem escura envolvessem a ocorrência de 100% dos casos de chuva. Em outras palavras, a variação de ocorrência da primeira variável seria

perfeitamente correlata à variação de ocorrência da segunda variável, de forma que as duas teriam uma variação comum perfeita.

Pode-se citar também um exemplo da psicometria. Se o desempenho de estudantes em um teste de compreensão de leitura apresentasse uma correlação de 1,00 com o desempenho desses mesmos estudantes em um teste de compreensão de vocabulário, isso significaria dizer que a variação da performance desses estudantes seria a mesma nos dois testes, de forma que os estudantes que tirassem um alto escore em compreensão de leitura, da mesma maneira também deveriam tirar um alto escore em compreensão de vocabulário, e vice-versa. O grau de associação do desempenho desses estudantes nos dois testes é total (100%), de forma que fazer um ou outro teste daria no mesmo.

Ao contrário de correlações +1,00, uma correlação zero (0,00) entre duas variáveis significa dizer que elas não possuem nenhuma relação, ou seja, nenhuma conexão. No exemplo dado, se o desempenho dos estudantes no teste de compreensão de leitura apresentasse uma correlação zero (0,00) com o desempenho dos mesmos estudantes no teste de compreensão de vocabulário, isso implicaria em dizer que o desempenho em vocabulário não teria relação alguma com o desempenho em compreensão de leitura.

Já uma correlação de –1,00 entre duas variáveis implicaria que ambas possuem uma relação total de inversão. No exemplo dado, uma correlação de –1,00 significaria que pessoas com uma baixa performance em compreensão de leitura deveriam ter uma alta performance em compreensão de vocabulário, e vice-versa.

Número de Porções de Batatas Fritas X Número

de Copos de Refrigerantes

0 10 20 30 40 0 10 20 30 40 Copos de Refrigerantes P o õ es d e Bat a tas Fr it a s Seqüência1 Linear (Seqüência1)

Figura 5. Grau de Correlação Razoavelmente Próxima de +1,00.

A Figura 5 demonstra graficamente como as correlações entre duas variáveis podem ocorrer. Neste exemplo, há uma correlação de 0,93 (quase +1,00) entre o número de porções de batatas fritas consumidas por um determinado número de pessoas, em um intervalo de um mês, e o número de copos de refrigerantes tomados no mesmo período, pelas mesmas pessoas. Cada ponto da Figura 5 representa a quantidade de porções de batatas e refrigerantes consumidos por um único indivíduo no intervalo de um mês, de modo que todos os pontos indicam todos os escores das pessoas nas duas variáveis. Dessa maneira, o número de pontos representa o número de pessoas mensuradas nas duas variáveis. Muito próximo à maioria dos pontos há uma linha que indica a melhor aproximação da variância comum entre as duas variáveis. Como a correlação entre as duas variáveis é muito alta, os pontos encontram-se muito próximos da linha, demonstrando a alta correlação envolvida.

Evidentemente, a maior parte das variáveis não apresenta nem uma correlação de +1,00, nem de –1,00, mas algo que varia entre esses valores máximos. De fato, não é

toda vez que se vê nuvens escuras que necessariamente ocorre a presença de chuva, de forma que correlações da ordem de +1,00 são muito difíceis de ocorrer.

Para compreender as correlações entre duas ou mais variáveis, é necessário considerar o nível de variação interna de cada variável envolvida, ou seja, o seu nível de dispersão. Mas o que seria em termos práticos a dispersão ou variação interna de uma variável? Pode-se responder a essa pergunta a partir de um exemplo. Quando um grande número de pessoas responde os itens de um teste cognitivo, há uma tendência da maioria de obter um escore médio, gerando uma curva normal (Figura 6). Em regra, se todas as pessoas obtivessem o escore da média não haveria nenhuma variação nos resultados. Todas as pessoas teriam o mesmo resultado. Essa situação hipotética é impossível, na medida em que os testes cognitivos buscam mensurar diferenças individuais entre as pessoas, elaborando itens fáceis, medianos e difíceis. Nesse sentido, as pessoas tendem a obter resultados diferentes e a diferença de cada resultado em relação à média dos resultados indica grosseiramente a variação ou a dispersão interna da variável.

A dispersão ou variação dos resultados é identificada através de distâncias em relação à média, denominadas de desvios-padrão. Cada desvio padrão, indicado pela letra P na Figura 6, demonstra o grau de dispersão dos escores em relação à média. Calculando a dispersão dos escores, tem-se o nível da variância interna de uma variável. Escores mais dispersos em relação à média indicam uma variável com ampla variância interna, enquanto escores bastante próximos da média indicam pouca variação interna.

Na medida em que cada variável varia na dispersão dos seus resultados, pode-se calcular se duas ou mais variáveis possuem uma variação comum, ou seja, se a dispersão encontrada nos resultados de uma variável possui uma relação de semelhança com a dispersão encontrada nos resultados de outra variável, e assim por diante.

Figura 6.Padrão de Uma Curva Normal (Gardner, Kornhaber & Wake, 1998, p. 57).

Assim, a correlação de duas ou mais variáveis é verificada através do cálculo de como essas variáveis variam juntas (covariam), a partir da variação interna de cada uma delas. Esse cálculo pode ser obtido através do coeficiente de correlação. Quando esse coeficiente é elevado ao quadrado obtém-se a proporção comum da variância (dispersão) entre as variáveis. Exemplificando, se alguém encontra um coeficiente de correlação de 0,80 entre um teste de compreensão de leitura e um teste de compreensão de vocabulário, elevando essa correlação ao quadrado, tem-se que esses dois testes possuem uma variância (dispersão) em comum de 64%. Pode-se dizer que 64% das variações (dispersão) encontradas no teste de compreensão de leitura são correlatas às variações encontradas no teste de compreensão de vocabulário. Como as correlações não são causais, pode-se também dizer o contrário, e afirmar que 64% das variações encontradas no teste de compreensão de vocabulário são correlatas com as variações encontradas no teste de compreensão de leitura.

O cálculo da variância comum é caro à psicometria, na medida em que é através dele que se pode fazer previsões e estabelecer relações entre variáveis. Se um

pesquisador encontra, por exemplo, uma variância comum de 64% entre a ocorrência de nuvem escura e chuva, ele pode dizer que a variável nuvem escura explica 64% das ocorrências de chuva. Como a correlação não é uma descrição causal dos fenômenos, não é tecnicamente incorreto dizer que a ocorrência de chuva explica 64% das ocorrências de nuvem escura. No entanto, por motivos pragmáticos ou teóricos, pode-se definir um caminho ou sentido para as variáveis nos estudos de correlação, assim como no exemplo citado é preferível dizer que as nuvens escuras explicam parte da variância da ocorrência das chuvas, do que dizer que as chuvas explicam a ocorrência de nuvens escuras.

6.3 ANÁLISE FATORIAL: REDUÇÃO DE VARIÁVEIS E IDENTIFICAÇÃO