• Nenhum resultado encontrado

Agrupamento de Produtores Homogêneos do Arranjo Produtivo Local

No documento KILMER COELHO CAMPOS (páginas 55-59)

A análise de agrupamentos foi feita considerando os escores fatoriais obtidos pela análise fatorial, que utilizou os indicadores de perfil do produtor; de produção, mercados e empregos; e de inovação, cooperação e aprendizado citados anteriormente. O objetivo, com a utilização desta técnica, é identificar grupos distintos de produtores, quanto aos fatores produtivos e inovativos, dentro do arranjo produtivo, de forma a subsidiar o cálculo de um índice que represente o nível inovativo e a posterior caracterização destes grupos de produtores.

A análise de agrupamentos tem como objetivo a divisão dos elementos da amostra ou da população em grupos, de forma que elementos pertencentes a um mesmo grupo sejam similares entre si em relação às variáveis consideradas e medidas, e os elementos em grupos diferentes sejam heterogêneos em relação a estas mesmas características (MINGOTI, 2005).

O procedimento da análise de agrupamento dos elementos da amostra parte da decisão sobre qual medida de similaridade ou dessimilaridade será utilizada. As medidas de similaridade indicam que quanto maior o valor, maior a semelhança entre os elementos amostrais, e as medidas de dessimilaridade indicam que, quanto maior o valor, mais diferentes são os elementos amostrais.

A análise de agrupamento utiliza o conceito de distância entre as unidades de classificação. Dos métodos ou medidas utilizadas para a mensuração dessa distância, utilizou-se, neste estudo, a distância euclidiana quadrada, que representa a soma dos quadrados das diferenças dos valores de todas as variáveis consideradas, expressa algebricamente por:

=

=

p i ik il k l

X

X

X

X

d

1 2

]

)

(

[

)

,

(

em que os dois elementos amostrais Xl e Xk, l ≠ k, são comparados em cada variável pertencente ao vetor de observações. São medidas de dessimilaridade e, logo, quanto menores os seus valores, mais similares serão os elementos que estão sendo comparados (MINGOTI, 2005). Essas distâncias entre os elementos da amostra são inseridas numa matriz de distâncias (dimensão nxn), em que “dij” constitui a distância do elemento “i” ao elemento “j”.

Com as variáveis selecionadas e a constituição da matriz de similaridade, o pesquisador inicia o processo de partição das observações, escolhendo o algoritmo de agrupamento usado para formar os grupos e decidindo o número de agrupamentos a serem formados. A intenção dos algoritmos é maximizar as diferenças entre agrupamentos relativamente à variação dentro deles (HAIR JR. et al, 2005).

Há dois grupos de métodos para a combinação dos elementos nos agrupamentos - os hierárquicos e não hierárquicos. Nos métodos hierárquicos, os grupos são constituídos sobre níveis distintos de distância ou semelhança, podendo ser divisivos ou aglomerativos. Estes métodos são utilizados em análises exploratórias de dados, visando a identificar possíveis agrupamentos e o provável valor do número de grupos.

Os métodos hierárquicos divisivos partem da ideia de que se tem inicialmente um só conglomerado constituído de “n” elementos da amostra observados e que, em cada fase do agrupamento, esse conglomerado inicial vai sendo subdividido, formando novos conglomerados (DILLON; GOLDSTEIN, 1994).

Nos métodos divisivos, inicia-se com um grande agregado de observações, e, em passos posteriores, as observações mais diferentes entre si são separadas e transformadas em agrupamentos menores, de forma que, em fase final, cada observação constitua um agrupamento (HAIR JR. et al, 2005).

As técnicas hierárquicas aglomerativas partem da ideia de que, no início do processo de agrupamento (tem-se n conglomerados), cada elemento do conjunto de dados observado é considerado um conglomerado isolado. Em cada passo do processo, os elementos vão sendo agrupados, formando novos conglomerados, até o

Então, os passos podem ser descritos da seguinte forma: cada elemento constitui um cluster de tamanho um e tem-se n clusters; em cada estágio do algoritmo de agrupamento, pares de conglomerados mais similares são formados e passam a representar um só conglomerado (apenas um conglomerado é formado em cada passo); dois elementos amostrais, que aparecem juntos num mesmo cluster em algum estágio do procedimento, permanecerão juntos em todos os estágios subsequentes (propriedade de hierarquia); e por último, constrói-se o dendograma que representa um gráfico em forma de árvore no qual a escala vertical indica o nível de similaridade (ou dessimilaridade).

Os métodos não hieráquicos caracterizam-se pelo fato de que, no número de grupos dados, os elementos se agrupam simultaneamente, de tal forma que, partindo-se de uma divisão inicial, é possível deslocar os elementos, ou seja, é necessário que o número de grupos seja pré-especificado pelo pesquisador. Não existe critério pré-estabelecido para a determinação do número de grupos a serem considerados, sendo necessária a avaliação crítica dos pesquisadores em cada caso específico.

As técnicas de agrupamentos não hierárquicas objetivam encontrar diretamente uma partição, que atenda aos requisitos básicos de coesão interna e isolamento dos clusters formados, de n elementos em k grupos ou clusters. Dentre os métodos mais utilizados, tem-se o método das k-Médias (k-Means), o método Fuzzy c-Médias (Fuzzy c-Means) e as redes neurais artificiais.

Em cada fase do agrupamento, os novos grupos são formados mediante a divisão ou junção de grupos combinados em passos anteriores, ou seja, elementos colocados num mesmo conglomerado podem não necessariamente estar juntos na partição final e, assim, a elaboração dos dendrogramas não é possível.

Os algoritmos computacionais usados nos métodos não hierárquicos são iterativos e apresentam maior capacidade de análise de conjunto de dados de maior porte (grande número de observações).

Considerando o objetivo de identificar grupos distintos de produtores, quanto aos fatores produtivos e inovativos dentro do arranjo produtivo local, utilizou-se o Método das k-Médias, que constitui um dos métodos não hierárquicos mais utilizados e conhecidos, em que cada elemento da amostra é alocado àquele

cluster cujo centróide (vetor de médias da amostra) é o mais próximo do vetor de

No Método das k-Médias, primeiramente, escolhem-se k centróides (sementes ou protótipos), para se iniciar o processo de partição; em seguida, compara-se cada elemento da amostra com cada centróide inicial por uma medida de distância; posteriormente, recalculam-se os valores dos centróides para cada novo grupo formado e compara-se novamente cada elemento com cada novo centróide formado destes novos grupos; e, finalmente, repetem-se os dois passos anteriores até que todos os elementos amostrais estejam bem alocados em seus grupos.

O grande problema dos métodos não hierárquicos é como determinar ou selecionar as sementes de agrupamento, que representam o centro inicial de um agregado, pois a seleção aleatória das sementes produz diferentes resultados para cada conjunto de pontos-sementes aleatórios (HAIR JR. et al, 2005).

Conclui-se que a aplicação dos métodos hierárquicos consome menos tempo de computação pela rapidez, mas pode apresentar resultados enganosos, de forma que combinações iniciais apresentem resultados não verdadeiros durante toda a análise de agrupamentos, principalmente se ocorrem observações atípicas. Além disso, estes métodos não podem ser utilizados na análise de amostras muito grandes, pois as exigências de armazenamento de dados aumentam drasticamente (HAIR JR.

et al, 2005).

A aplicação dos métodos não hierárquicos produz resultados menos suscetíveis às observações atípicas nos dados, à medida de distância utilizada e à inclusão de variáveis irrelevantes para o caso de seleção de sementes não aleatórias pelo pesquisador, ou seja, a experiência do investigador para selecionar as sementes de agrupamento vai determinar a qualidade dos resultados.

Após a especificação dos grupos definidos na análise, o pesquisador deve examinar esta estrutura (tamanho) de grupos, observando os tamanhos de agrupamentos muito diferentes ou os agrupamentos com apenas uma ou duas observações, de forma a decidir, se for o caso, por uma reespecificação de grupos (HAIR JR. et al, 2005).

A interpretação dos agrupamentos relaciona-se ao exame de cada agrupamento em termos de variável estatística de agrupamento para nomear ou definir a natureza das observações agregadas num mesmo grupo.

A identificação do perfil e a interpretação dos agrupamentos avaliam a correspondência dos agregados ou grupos formados na presente análise com grupos

resultados. A identificação do perfil de cada agrupamento fornece uma base para se realizar avaliações de significância prática, ou seja, comparam-se os resultados de agrupamento com uma tipologia pré-definida (HAIR JR. et al, 2005).

A validação dos agrupamentos constitui a garantia de representatividade e generalidade da amostra utilizada para a população geral, e pode ser confirmada pela análise de agrupamentos de amostras separadas ou divisão da amostra em dois grupos, que compara soluções e avalia a correspondência dos resultados.

O pesquisador pode ainda estabelecer uma validade preditiva, selecionando variáveis não utilizadas na análise, de forte apoio teórico ou prático, e que apresentam variação ao longo dos grupos para formar agrupamentos.

O perfil dos agrupamentos representa a descrição das características de cada agrupamento para explicar suas diferenças relevantes, ou seja, concentra-se na descrição de características que diferem significativamente ao longo dos agrupamentos e naquelas relevantes ou particulares a um agrupamento (HAIR JR. et

al, 2005).

A escolha do número final de grupos ou clusters é subjetiva e pode depender dos objetivos do pesquisador. Após a especificação e validação dos agrupamentos, classificou-se os produtores em quatro grupos, de acordo com suas particularidades, com arrimo nos escores fatoriais. Dado que, pela análise fatorial, se identificou a presença de quatro fatores, se calculou o escore fatorial médio, obtido por meio da soma dos escores dos produtores de cada grupo, ponderado pela sua participação na renda bruta total anual (RBA) da atividade no grupo em que estão inseridos. Elaborou-se também um índice bruto4, que se refere à média aritmética dos escores fatoriais médios encontrados, representando o nível de desenvolvimento de cada grupo dentro do arranjo produtivo local.

No documento KILMER COELHO CAMPOS (páginas 55-59)