• Nenhum resultado encontrado

2. REVISÃO BIBLIOGRÁFICA

2.10. Análise Multivariada

2.10.1. Técnicas Multivariadas

Entre as técnicas multivariadas mais utilizadas, podem-se citar (Hair Jr et al., 2005): 1) Análise Fatorial: visa reduzir um grande número de variáveis em fatores, de modo que estes condensem as variáveis originais com a mínima perda de informação do problema a ser estudado. Segundo apresentações do tutorial do software

Statistica 7.0, o método de extração das variáveis possíveis de serem realizadas são os

componentes principais (define o número de fatores e sua forma de envolvimento), ou os fatores comuns (estabelece a estrutura desses fatores, relacionando-os entre si).

2) Regressão Múltipla: estabelece relação entre variáveis independentes a uma única variável dependente (desejada), de modo a prever as alterações causadas pelas variáveis independentes naquela dependente. Para isso, o critério estatístico empregado é o dos mínimos quadrados, pois, assim, pode-se prever a quantia ou magnitude da variável desejada. Pressupõem-se que as variáveis independentes sejam métricas.

3) Análise Discriminante Múltipla: análise empregada quando a única variável dependente é não-métrica, por exemplo, dicotômicas (aquela que se atribui codificação 0-1 à característica desejada, por exemplo, 1-feminino, 0-masculino ou inverso) ou multicotômicas (alto, médio, baixo ou outro). A análise discriminante é aplicável quando a amostra total pode ser dividida em grupos de variáveis dependentes não-métricas, de modo a facilitar o entendimento das diferenças entre grupos e prever a probabilidade de um objeto / indivíduo pertencer a uma classe ou grupo específico, cujas variáveis independentes sejam métricas. Exemplo: distinção dos consumidores de marcas nacionais e de internacionais, riscos de créditos bons e ruins, imposto de renda composto e normal para identificar restituições mais promissoras.

4) Análise Multivariada de Variância e Covariância: análise multivariada de covariância (Multivariate Analisys of Variance - MANOVA) visa interpretar relações entre diversas variáveis independentes categóricas (geralmente chamadas de tratamento) e duas ou mais variáveis dependentes métricas. Representa uma expansão da análise univariada de variância (Analisys of Variance - ANOVA). A MANOVA é útil quando se planeja uma situação experimental para testar hipóteses à variância dos grupos de duas ou mais variáveis dependentes métricas. Já a análise multivariada de covariância (Multivariate Analisys of

Covariance - MANCOVA) é utilizada, juntamente com a MANOVA, para remover os efeitos

dependentes. Processo similar à correlação parcial bivariada, em que o efeito de uma terceira variável é removido da correlação.

Fisher apresentou a ANOVA como método capaz de identificar se fatores, combinados ou não, interferem ou não no problema estudado, permitindo investigar as relações de causa e efeito entre as variáveis, considerando, inclusive, que outras causas desconhecidas podem interferir no problema (Paradine & Rivet, 1974). Segundo Soler (2006), a ANOVA determina a natureza de padrões envolvidos em uma grande quantidade de variáveis, por uma “simplificação ordenada” do número de variáveis inter-relacionadas.

5) Análise Conjunta: é uma técnica bem empregada para avaliar serviços, produtos ou ideias. O método emprega a avaliação de atributos relevantes e seus níveis de classificação no mercado, juntamente com a avaliação pelo consumidor de algumas outras variáveis relacionadas ao produto, para obter um planejamento adequado sobre o mesmo. Exemplo: avaliar produto quanto ao preço, qualidade e cor (vermelho, azul e amarelo), considerando as avaliações dos consumidores para verificar quais produtos que apresentam maior aceitação no mercado.

6) Correlação Canônica: pode ser entendida como uma extensão da regressão múltipla, porque correlaciona muitas variáveis de grupos inicialmente definidos (dependentes métricas e independentes métricas). Na regressão, tem-se apenas uma variável dependente, enquanto, na correlação canônica, há diversas variáveis dependentes. Essa técnica combina linearmente cada conjunto de variáveis (dependentes e independentes) para maximizar a correlação entre esses dois conjuntos. Assim, obtém-se uma combinação de pesos para todas variáveis por meio de uma correlação simples máxima entre o conjunto das dependentes e das independentes.

7) Análise de Agrupamentos: tem o objetivo de classificar uma amostra de entidades (indivíduos ou objetos) em um pequeno número de grupos mutuamente excludentes, com base em suas semelhanças e, assim, identificar os grupos relevantes. Os principais passos são: a) medir alguma forma de similaridade ou associação entre as variáveis e determinar os grupos existentes e b) agrupar tais variáveis e estabelecer o perfil delas para determinar sua composição.

8) Escalonamento Multidimensional: visa transformar o julgamento de consumidores quanto à preferência ou à similaridade em distâncias representadas em um espaço multidimensional. Os pares de objetos serão comparados com aqueles que

apresentarem menor distância nesse espaço. Com isso, são gerados mapas perceptuais que ilustram a posição relativa de todos os objetos, porém, esse método não aponta quais são os atributos relevantes para as posições de cada objeto, exigindo análises adicionais para investigar tal situação.

9) Análise de Correspondência: é uma técnica de interdependência que auxilia a redução dimensional da classificação de objetos (produtos, pessoas, entre outros) em um conjunto de atributos ou, ainda, facilita o mapeamento perceptual de objetos relativos a esses atributos. O método permite reunir variáveis não-métricas e relações não-lineares, por meio de uma tabela de contingência (tabela de duas variáveis categóricas). A análise de correspondência permite atribuir escala numérica às variáveis não-métricas e fazer a redução multidimensional (como análise fatorial) e mapeamento perceptual (como análise multidimensional). Exemplo: tabulação da preferência de marca por variável demográfica (sexo, renda, ocupação etc) indica o número de pessoas que preferem tal marca por categoria demográfica. Isto pode ser ilustrado em um mapa bi ou tridimensional de marcas e características dos respondentes. As marcas semelhantes são colocadas próximas entre si e as características de cada marca são determinadas pela proximidade das categorias demográficas. Portanto, o método permite representar a interdependência multivariada de dados não-métricos.

10) Modelos Lineares de Probabilidade: são os modelos que combinam a análise de regressão com a discriminante múltipla, ou seja, uma ou mais variáveis independentes são empregadas para prever uma única variável dependente. A diferença entre os modelos lineares de probabilidade da regressão é que a variável dependente é não-métrica (como na análise discriminante) e essa escala não-métrica requer diferenças no método de estimação e nas suposições sobre o tipo de distribuição. Com relação às diferenças da análise discriminante, os modelos de probabilidade aceitam qualquer tipo de variável (qualitativa ou quantitativa) e não exigem a suposição de normalidade multivariada.

11) Modelagem de Equações Estruturais: são chamadas de LISREL, devido ao nome do programa computacional. Essa técnica é mais apropriada quando há uma série de equações de regressão múltipla que precisam ser analisadas separadamente ao mesmo tempo. Por isso, é caracterizada pelo modelo estrutural (relaciona os “caminhos” existentes entre as variáveis independentes com dependentes) e modelo de mensuração (permite o uso de diversas variáveis em uma única variável independente ou dependente). Exemplificando o modelo de mensuração, a variável dependente não-métrica (conceito) tem uma escala múltipla

de opções em que cada item da escala mede tal conceito para estimar as relações entre as variáveis dependentes e independentes. “Esse procedimento é semelhante a executar a análise fatorial dos itens da escala e usar os escores fatoriais na regressão”.

12) Outras Técnicas Multivariadas: com o avanço computacional, sistemas multivariados têm sido desenvolvidos como a mineração de dados e redes neurais. A mineração de dados “[...] é a tentativa de quantificar relações entre grandes quantidades de informações com uma mínima pré-especificação da natureza das relações”. Essa técnica vem sendo utilizada conjuntamente com a de redes neurais, pois esta é capaz de identificar as relações (como regressão múltipla ou análise discriminante) ou reduzir dados quanto à estrutura dessas relações (por meio de análise fatorial ou análise de agrupamento). Além disso, a técnica de redes neurais permite a inclusão de relações mais complexas que nos modelos anteriormente discutidos. Uma outra técnica é a reamostragem ou bootstrapping que consiste na eliminação de suposições estatísticas para distribuição normal, gerando uma estimativa empírica da distribuição amostral.

Hair Jr et al. (2005) elaboraram um fluxograma para auxiliar o decisor na seleção da melhor técnica multivariada, conforme a relação definida entre as variáveis (dependentes e independentes) e as técnicas estatísticas disponíveis. A Figura 2.11 indica as decisões a serem tomadas, em função das condições iniciais estabelecidas para a análise do problema.

Figura 2.11 – Decisão do Uso da Técnica Multivariada. Fonte: Hair Jr et al. (2005).

Não-métrico relação está sendo examinada? Quantas variáveis estão sendo previstas? Dependência Interdependência Modelagem de equações estruturais Qual a escala de medida da variável dependente? Qual a escala de medida da variável preditora? Métrico Não-métrico A estrutura de relações ocorre entre: Análise de correlação canônica com variáveis dicotômicas Métrico Não-métrico Análise de

correlação canônica multivariada de Análise variância Qual a escala de medida da variável dependente? Como os atributos são medidos? Métrico Não-métrico Análise discriminante Modelos lineares de probabilidade Regressão múltipla Análise Conjunta Análise de agrupamento Análise fatorial

Múltiplas relações de variáveis

dependentes e independentes Diversas de variáveis dependentes em uma única relação Uma variável dependente em uma única relação

Métrico

Análise de correspondência Escalonamento

multidimensional

Variável Casos / Respondentes Objeto

Não-métrico Técnica multivariada escolhida Ponto de decisão LEGENDA

2.11. SELEÇÃO DO MODELO ADEQUADO PARA IDENTIFICAR OS