• Nenhum resultado encontrado

3.4 TRATAMENTO DOS DADOS

3.4.2 Análise de conglomerados

A análise de conglomerados também conhecida como análise de agrupamentos ou análise de classificação ou cluster analysis é o nome dado ao grupo de técnicas multivariadas cuja finalidade primária é agregar objetos com base nas características que eles possuem (HAIR et al., 2005, 2009; MINGOTI, 2007; CORRAR, PAULO, DIAS FILHO, 2014). Segundo os autores, o objetivo desta técnica é classificar uma amostra de indivíduos ou objetos em um pequeno número de grupos mutuamente excludentes, com base nas similaridades entre eles.

A finalidade da técnica é identificar a formação de grupos através da análise de semelhanças e diferenças existentes entre suas características, ou seja, que sejam homogêneos internamente, heterogêneos externamente e mutuamente exclusivos (FÁVERO et al., 2009).

Nessa perspectiva, a técnica foi empregada na presente pesquisa para agrupar os produtores conforme as diversas características/variáveis de ótica da competividade sistêmica da cadeia produtiva de soja de Moçambique. Para a realização da análise de agrupamentos Hair et al. (2009); Corrar; Paulo; Dias Filho (2017) sugerem os seguintes estágios:

i) Seleção das variáveis que serão utilizadas para formação dos grupos. Nesta pesquisa, utilizou-se as variáveis apresentadas no Quadro 10.

ii) Selecionar a medida de similaridade a ser empregada. A similaridade entre objetos é uma medida empírica de correspondência, ou semelhança, entre objetos a serem agrupados. Portanto, ela pode ser medida de diversas maneiras: medidas correlacionais, de distância e de associação. Conforme o foco da pesquisa e também por serem as mais utilizadas na análise de cluster, empregaram-se as medidas de distância (medidas de dissimilaridade), que indicam similaridade através da proximidade entre as observações, tendo como parâmetro as variáveis

selecionadas. Ademais, o tipo de medida de distância escolhida foi a distância quadrática euclidiana (ou absoluta).

A distância quadrática euclidiana (

d

ij2) mede o raio entre duas observações (i e j) para todas as p variáveis do modelo (FÁVERO et al., 2009):

d

2ij

=

∑𝑝𝑘=1(𝑋𝑖𝑘 − 𝑋𝑗𝑘

)

2

(6) Em que:

d

2ijé j-ésima característica do i-ésimo indivíduo;

x

iké a j-ésima característica do i-ésimo indivíduo;

x

jké a j-ésima característica do i-ésimo indivíduo.

iii) Selecionar o algoritmo ou método de agrupamento. Basicamente, os métodos de agrupamentos se dividem em dois grupos: os hierárquicos e os não hierárquicos. Na presente pesquisa, empregou-se ambos os métodos, de modo aproveitar os seus benefícios. O hierárquico serviu para estabelecer o número de grupos de produtores a serem formados, pois não houve uma predeterminação do número final de agrupamentos. Para tanto, a similaridade entre os agrupamentos foi definida pelo algoritmo ligação média (entre grupos). Depois disso, utilizou- se o método não hierárquico para agrupar os produtores. Este método tem vantagem por refinar os resultados, pela possibilidade de manobra dos membros do grupo, o que complementa a “fragilidade” do método hierárquico. O algoritmo utilizado foi K-médias.

No método hierárquico existem dois tipos de procedimentos para a formação dos agrupamentos: os aglomerativos e os divisivos, sendo que a diferença entre eles está na maneira como são formados os agrupamentos. Neste estudo foi utilizado o procedimento aglomerativo, em que primeiramente cada indivíduo forma um grupo próprio, e nos passos seguintes dois grupos (ou indivíduos, nesse caso os primeiros grupos individuais) são combinados para formar um outro grupo agregado, o processo se repetirá sucessivamente e a cada etapa, os elementos mais semelhantes serão reunidos para construírem um novo agrupamento. Esse procedimento se repetirá até que não haja nenhum elemento a ser classificado, estando todos reunidos no mesmo agrupamento (TIMM, 2002; HAIR et al., 2009; CORRAR; PAULO; DIAS FILHO, 2017).

O resultado do processo aglomerativo foi apresentado na forma gráfica, através de um dendrograma (diagrama bidimensional), que representa as uniões realizadas ao longo do

processo de formação dos agrupamentos. Além do número de agrupamentos formados, a análise através do dendrogram possibilita observar os seus integrantes.

Na ligação média, a similaridade é baseada em todos elementos dos agregados, e não em um único par de membros, e por isso é menos afetada por observações atípicas. Tende a gerar agregados com pouca variação interna, ou seja, com aproximadamente mesma variância interna.

Através do método não hierárquico realiza-se a análise de variância (ANOVA), que testa a hipótese nula de igualdade de médias e também testa as variações observadas, tanto entre os grupos, quanto dentro dos grupos (OLIVEIRA, 2007; MARTINS, 2011). Para isso, se utiliza o teste F para verificar a existência de diferenças significativas dos agrupamentos formados e também para atestar se estão corretamente classificados (POHLMANN, 2009).

iv) Interpretação dos resultados. Nomear os agrupamentos formados com base nas variáveis do agrupamento.

v) Validação e caracterização dos agrupamentos.

Portanto, as variáveis que serão utilizadas para análise multivariada encontram-se no Quadro 9:

Quadro 9 – Variáveis utilizadas para análise multivariada de dados

(continua)

Designação da

variável Descrição da variável

V1 Vantagem locacional inerente a Proximidade com os fornecedores de insumos V2 Vantagem locacional inerente a Proximidade com os clientes/consumidores

V3 Vantagem locacional inerente a Infraestrutura física (energia, transporte, comunicações) V4 Vantagem locacional inerente a Disponibilidade de serviços técnicos especializados V5 Vantagem locacional inerente a Existência de programas de apoio e promoção a produção

V6

A contribuição de associações, cooperativas locais e ONGs no tocante a Disponibilização de informações (referentes a matéria-prima, equipamento, assistência técnica, consultoria, etc.)

V7 A contribuição de associações, cooperativas locais e ONGs no tocante a Promoção de ações cooperativas

V8 A contribuição de associações, cooperativas locais e ONGs no tocante a Promoção de ações dirigidas a capacitação tecnológica de produtores

V9 Evolução da produtividade nos últimos 3 anos V10 Evolução do Custo de produção nos últimos 3 anos V11 Evolução do faturamento nos últimos 3 anos V12 O nível de ligação com o Governo

V13 A importância atribuída para o papel das ONGs V14 A importância atribuída para o papel do Governo

V15 A relevância do preço de insumo na seleção de fornecedores

Quadro 910 – Variáveis utilizadas para análise multivariada de dados

(conclusão)

V17 A importância atribuída para o Acesso ao crédito V18 A importância atribuída para o Escoamento de produto

V19 O grau de importância de Aumentar a área plantada de soja como principal objetivo V20 O grau de importância de Aumentar a produtividade da soja como principal objetivo