• Nenhum resultado encontrado

Análise fatorial exploratória

No documento O perfil do enoturista: o caso português (páginas 164-168)

CAPÍTULO 5 METODOLOGIA

5.6. Análise de dados

5.6.1. Análise fatorial exploratória

Os métodos de análise de dados multivariados são eficazes no estudo de grandes massas de informação complexa. Entre outros objetivos, a estatística multivariada permite simplificar a estrutura dos dados bem como classificar e agrupar variáveis e/ou sujeitos. A análise fatorial exploratória (AFE) é uma técnica estatística que se insere na análise multivariada de dados63.

Sendo uma técnica de análise exploratória de dados, a AFE é usada para identificar um conjunto menor de novas variáveis, os chamados fatores, não correlacionadas entre si

63A análise fatorial exploratória é um procedimento psicométrico muito usada na construção e na revisão

e avaliação de instrumentos psicológicos. Tendo sido proposta por Spearman e Pearson (Zeller & Carmines, 1980), no início do século passado, foi usada inicialmente para perceber os problemas relacionados com a psicologia educacional, na tentativa de definir inteligência. A análise fatorial exploratória inclui a análise de componentes principais e a análise de fatores comuns.

5. METODOLOGIA

150

mas que, de alguma maneira, sumarizam as informações principais das variáveis originais, sem perda significativa de informação (Reis, 1997). Da aplicação do método resultam assim novas variáveis que mais não são do que funções das variáveis originais em função das suas correlações e cuja associação é importante identificar (Hair, Andreson, Tathan & Black, 2005; Pestana & Gageiro, 2008)

Mais importante do que o resumir da informação presente em muitas variáveis num número reduzido de fatores, ou seja, uma mera redução de dados, o objetivo principal da AFE é descobrir e identificar variáveis subjacentes não-observáveis, resultantes de um conjunto de variáveis observáveis (Marôco, 2003).

No presente estudo e a fim de identificar os determinantes que motivaram os enoturistas a visitar as quintas selecionadas, o conjunto de itens que integram a escala de motivos dessas visitas foi submetido a uma AFE64. Num segundo momento a construção das pontuações sumárias relativas a cada fator foi criada com base na média dos itens que compunham cada fator, mantendo-se assim a escala das variáveis originais. Este procedimento permite uma mais fácil interpretação e comparação dos fatores em análises subsequentes. Segue-se a descrição de alguns cuidados e procedimentos implicados na implementação deste método no presente trabalho.

Adequação da amostra

O agrupamento das variáveis originais realiza-se através dos padrões de correlação entre as respostas dadas pelos sujeitos que constituem a amostra. Deste modo, tem que haver

64Nas ciências sociais é frequente as variáveis medidas em escalas de likert serem tratadas como escalas

de avaliação com medida intervalar (e portanto métrica), muito embora, na realidade, sejam escalas ordinais. Neste contexto, e desde que não tenham uma distribuição demasiado assimétrica, costumam ser objeto da AFE. No entanto, existe uma outra técnica multivariada, a análise categórica em componentes principais (em inglês, Categorical Principal Components Analysis – CATPCA), também conhecida por análise de componentes principais não-lineares, que foi especialmente desenvolvida para variáveis mensuradas em escalas ordinais (Meulman, van der Kooij & Heiser, 2004; Manisera, van der Kooij & Dusseldorp, 2010). Esta técnica, todavia, não permite uma interpretação tão simples dos dados, comparativamente à AFE, e é de mais difícil aceitação no que respeita à publicação de trabalhos em revistas cientificas. Nesta tese, optou-se pela AFE dado o comportamento pouco assimétrico das variáveis a sumariar. No entanto, a titulo complementar, tentou-se também, e com fins exploratórios, a CATPCA. Os resultados desta última conduziam aos mesmos factores sugeridos pela AFE, ainda que mediante uma leitura menos clara. Esses resultados constarão então em anexo.

5. METODOLOGIA

151

correlação entre as variáveis de modo a poder aplicar-se o modelo fatorial. Se as correlações forem fracas então a probabilidade de partilharem fatores comuns é baixa.

Dois procedimentos são comummente utilizados para analisar a qualidade das correlações entre as variáveis de modo a permitir prosseguir com a AFE: a observação da estatística de Kaiser-Meyer-Olkin (KMO) e a implementação do teste de esfericidade de Bartlett. Ambos os métodos foram usados neste estudo.

A estatística de KMO é calculada com base nas correlações parciais e permite aferir a qualidade das relações entre as variáveis de modo a permitir prosseguir com a análise fatorial (Pestana & Gageiro, 2008; Marôco, 2003). A correlação parcial entre duas variáveis é a correlação que sobra depois de serem controlados os efeitos de outras variáveis.

O valor do KMO varia entre 0 e 1. Valores do KMO próximos de zero indicam uma correlação fraca entre as variáveis o que significaria que a AFE poderia não ser apropriada para este estudo; quanto mais próximo de 1 mais adequada é a aplicação da análise fatorial aos dados (Pestana & Gageiro, 2008). Para Kaiser (1974) um valor de 0,90 neste índice poderia ser considerado “excelente”, 0,80 “bom” e 0,70 ”médio”.

O teste de esfericidade de Bartlett testa a hipótese da matriz de correlações ser uma matriz identidade, o que implicaria ausência de correlações entre as variáveis. Neste caso pretende-se que o valor de p-value (p) esteja abaixo do nível de significância, neste caso 0,05, levando à rejeição da hipótese nula de ausência de correlações (Bartlett, 2005) e sugerindo assim a adequação da AFE. Este teste é sensível ao tamanho da amostra e requer que os dados provenham de uma população normal multivariada (Pestana & Gageiro, 2008).

Número de fatores a extrair

Há uma série de procedimentos destinados a determinar o número ideal de fatores a reter na AFE. Neste estudo usou-se como critério de retenção de fatores a regra do

eigenvalue, ou seja reter os fatores com valor próprio superior a 1 (Kaiser, 1960), em

consonância com a observação do scree plot, uma vez que a utilização de apenas um critério pode levar à retenção de mais/menos fatores do que aqueles relevantes para descrever a estrutura latente (Marôco, 2011).

5. METODOLOGIA

152

O scree plot foi descrito por Cattell em 1966 e consiste em representar graficamente os valores próprios dos fatores e reter o número de fatores que se posicionarem acima do ponto de inflexão da curva (Cattell, 1966). Os fatores com maiores eigenvalues serão os responsáveis pela explicação de uma maior variância. O objetivo do scree plot é determinar o ponto onde os eigenvalues apresentam uma tendência decrescente linear.

Método de extração

De entre os métodos de extração de fatores possíveis de usar numa AFE, este estudo recorreu ao método de extração das componentes principais (principal axis factoring). Este método é o procedimento mais usado na AFE porque não exige a suposição da normalidade multivariada, sendo a técnica que fornece melhores resultados quando a distribuição é não normal (Costello & Osborne, 2005).

Rotação de Fatores

Para qualquer solução com dois ou mais fatores, há um número alargado de orientações dos fatores que podem ser usados na interpretação dos dados. Com efeito, para ajudar a interpretar os fatores obtidos, é habitual o recurso à sua rotação com o objetivo de obter uma estrutura fatorial mais simples. Na rotação da matriz fatorial, a variância é redistribuída de modo a obter um padrão fatorial mais simples e mais significativo teoricamente. O método de rotação varimax, usado neste estudo, inclui-se nos métodos de rotação ortogonal mais aplicados, na medida em que conduz a um número reduzido de loadings elevados em cada fator, simplificando assim a interpretação da estrutura fatorial (Hair, Anderson, Tathan & Black,1995; Yela, 1997).

Comunalidades

As comunalidades são a medida em que o item em questão pode ser explicado pelos fatores. Se o valor da comunalidade for muito baixo, inferior a 0,2, pode indicar que a variável pode não estar correlacionada com qualquer outra das variáveis sendo necessário extrair mais fatores para explicar a variância comum (Stommel & Dontje, 2014).

5. METODOLOGIA

153

Saturações fatoriais – loadings

A saturação fatorial é a correlação entre o fator e o item (Stevens, 1986).

Tabachnick e Fidell (2007) sugerem 0,32 como uma boa regra de ouro para a saturação mínima de um item no fator, caso o estudo seja exploratório, o que significa que partilha aproximadamente 10% de variância (0,3220,10) com os outros itens que saturam no fator (Costello & Osborne, 2005).

Conforme geralmente praticado na literatura (Streiner & Norman, 2008), considerou-se que um item pertenceria a determinado fator quando a carga fatorial (saturação) do item com o fator era igual ou superior a 0,30 e a carga fatorial era a mais elevada das que cumpriam a condição anterior. Naturalmente, quanto mais elevada a carga fatorial de um item num fator, mais importante é esse item na formação desse fator.

No documento O perfil do enoturista: o caso português (páginas 164-168)