• Nenhum resultado encontrado

Agrupamento dos estados brasileiros visando identificar similaridades com a atual divisão do país em regiões / Grouping of Brazilian states aiming to identify similarities with the current division of the country into regions

N/A
N/A
Protected

Academic year: 2020

Share "Agrupamento dos estados brasileiros visando identificar similaridades com a atual divisão do país em regiões / Grouping of Brazilian states aiming to identify similarities with the current division of the country into regions"

Copied!
19
0
0

Texto

(1)

Braz. J. of Develop., Curitiba, v. 5, n. 7, p. 8150-8168 jul. 2019 ISSN 2525-8761

Agrupamento dos estados brasileiros visando identificar similaridades com

a atual divisão do país em regiões

Grouping of Brazilian states aiming to identify similarities with the

current division of the country into regions

DOI:10.34117/bjdv5n7-040

Recebimento dos originais:25/05/2019 Aceitação para publicação: 18/06/2019

Amanda Trojan Fenerich

Doutora em Engenharia de Produção e Sistemas pela Pontifícia Universidade Católica do Paraná

Instituição: Universidade Federal de Mato Grosso do Sul, Campus Três Lagoas Av. Ranulpho Marques Leal, 3484 - Distrito Industrial, Três Lagoas - MS

E-mail: amanda.fenerich@gmail.com

Maria Teresinha Arns Steiner

Doutora em Engenharia de Produção pela Universidade Federal de Santa Catarina Instituição: Pontifícia Universidade Católica do Paraná, Escola Politécnica – PPGEPS

PUCPR

R. Imaculada Conceição, 1155 .Bloco 2 - 2º Andar. Prado Velho, Curitiba - PR

E-mail: maria.steiner@pucpr.br

Diego Paolo Tsutsumi

Mestrando em Computação Aplicada pela Universidade Tecnológica Federal do Paraná Instituição: Universidade Tecnológica Federal do Paraná

Av. Sete de Setembro 3165, Bloco B - 1° andar. Rebouças, Curitiba - PR

E-mail: diegotsu@gmail.com

Mirian Batista Oliveira Bortoluzzi

Doutoranda em Engenharia de Produção pela Universidade Federal de Pernambuco Instituição: Universidade Federal de Mato Grosso do Sul, Campus Nova Andradina Av. Rosilene, R. Eugenia Oliveira Lima, 64 - Bairro Universitário, Nova Andradina - MS

E-mail: mirianbortoluzzi@gmail.com

Isaac Pergher

Doutor em Engenharia de Produção pela Universidade Federal de Pernambuco Instituição: Universidade Federal de Pernambuco

Av. da Arquitetura - Cidade Universitária, Recife - PE E-mail: eng.isaac@hotmail.com

RESUMO

O objetivo do artigo é realizar uma análise de cluster, identificando as similaridades entre os estados brasileiros no que tange os aspectos políticos, populacionais, educacionais, econômicos, de trabalho e de renda, e assim verificar se existe relação entre o resultado técnico da clusterização com os

(2)

Braz. J. of Develop., Curitiba, v. 5, n. 7, p. 8150-8168 jul. 2019 ISSN 2525-8761

fundamentos e ideais dos movimentos separatistas brasileiros. Os dados foram coletados de órgãos do governo nacional. Foram realizadas análises descritivas dos dados, e para a análise de cluster utilizou-se o algoritmo 𝑘-means, com 𝑘 variando de 2 a 5, por meio das distâncias Euclidiana e de Manhattan. Os resultados obtidos enfatizam as diferenças entre os estados brasileiros, já encontrados em outros estudos da área. Os clusters nos quais os estados foram alocados, em sua maioria, representam uma divisão entre os estados das regiões sul/sudeste/centro-oeste, dos estados das regiões norte/nordeste. Foi possível também verificar os clusters de maior ou menor desempenho.

Palavras-chave: clusterização, movimentos separatistas, regiões brasileiras.

ABSTRACT

The objective of the article is to perform a cluster analysis, identifying the similarities between Brazilian states in terms of political, population, educational, economic, labor and income aspects, and to verify if there is a relationship between the technical result of clustering the foundations and ideals of the Brazilian separatist movements. Data were collected from national government agencies. Descriptive analyzes of the data were performed, and for the cluster analysis the k-means algorithm was used, with k varying from 2 to 5, through Euclidian and Manhattan distances. The results obtained emphasize the differences between the Brazilian states, already found in other studies in the area. The clusters in which the states were allocated, for the most part, represent a division between the states of the south / southeast / center-west, the states of the north / northeast regions. It was also possible to verify clusters of higher or lower performance.

Key-words: clustering, separatist movements, Brazilian regions.

1 INTRODUÇÃO

Na busca por padrões de dados para a identificação de agrupamentos ou conglomerados, a análise de cluster, também chamada de clusterização, é uma das técnicas mais utilizadas, que tem como o objetivo principal agrupar as observações de forma que os elementos pertencentes a um mesmo grupo tenham alto grau de semelhança ou similaridade, enquanto que, quaisquer elementos pertencentes a grupos distintos tenham pouca semelhança entre si (Reddy, 2011).

Algumas técnicas multidisciplinares, que se enquadram tanto na área de Pesquisa Operacional, quanto na Estatística, têm sido utilizadas por pesquisadores na tarefa de identificar similaridades entre regiões, estados ou municípios brasileiros, dentre as quais destacam-se: a análise fatorial (Campana e Caliari, 2015; Marion Filho et al., 2017); análise de cluster com 𝑘-means (Silva Mello e Barroso, 2013; Campana e Caliari, 2015; Ribeiro e Lopes, 2015; Stensjö, Ferreira e Loura, 2017), clusterização hierárquica (Ribeiro e Lopes, 2015; Marion Filho et al., 2017; Carvalho, da Mata e Resende, 2007); método da ligação simples e completa (Silva Mello e Barroso, 2013); análise discriminante (Marion Filho et al., 2017) e Análise de Componentes Principais (Silva Mello e Barroso, 2013).

São diversos os padrões, ou características, considerados pelos autores nesta análise de similaridade de regiões, estados ou municípios, dentre os quais os mais frequentemente

(3)

Braz. J. of Develop., Curitiba, v. 5, n. 7, p. 8150-8168 jul. 2019 ISSN 2525-8761 utilizados são aqueles indicadores referentes ao desenvolvimento socioeconômico, tecnológico, científico, educacional, violência, saúde, arte e cultura, infraestrutura dos domicílios, e até mesmo a temperatura (graus-dia de aquecimento e resfriamento).

Uma conclusão importante obtida pelas pesquisas aqui relatadas, e também citados em outros trabalhos da área, é a constatação da existência de grupos distintos quando se trata de regiões brasileiras. Os autores afirmam que o resultado obtido pela clusterização “aponta níveis de desenvolvimento mais satisfatórios para os estados pertencentes ao eixo Centro-Sul do Brasil” (Campana e Caliari, 2015), e que “nas regiões Sul e Sudeste a transição demográfica está em fase mais adiantada, e segue avançando para os demais estados brasileiros” (Marion Filho et al. 2017), afirmações essas que são corroboradas por Carvalho, da Mata e Resende (2007): “os municípios das regiões Sudeste e Sul são os com os melhores indicadores”.

Devido a essas diferenças entre as regiões brasileiras, nos últimos anos, se tem registrado a emergência de movimentos separatistas. E não é só no Brasil que vem ocorrendo esse tipo de movimento, que é reflexo de distúrbios socioeconômicos, mas também das diferenças religiosas, culturais, étnicas, linguísticas e históricas que se tem em todo o mundo. Neste contexto, os movimentos existentes na Escócia, Catalunha e Mianmar, entre outros anseios separatistas, enfatizam que a questão da autodeterminação de estados independentes está muito presente nos dias atuais.

Desta forma, o objetivo deste artigo é realizar uma análise de cluster, identificando as similaridades entre os estados brasileiros no que tange aos aspectos políticos, populacionais, educacionais, econômicos, de trabalho e de renda, e assim verificar se existe relação entre o resultado técnico da clusterização com os fundamentos e ideais dos movimentos separatistas brasileiros. Ressalta-se, porém, que os autores deste artigo não possuem nenhum interesse, nem defendem nenhuma das partes, nos movimentos separatistas brasileiros.

Além desta apresentação introdutória do contexto e objetivo do artigo, também o compõe, na seção 2, um breve relato sobre os movimentos separatistas; em seguida, na seção 3 tem-se a metodologia, apresentando como se deu a coleta e análise dos dados e na seção 4 estão os resultados e devidas discussões. Por último, encontram-se as considerações finais e propostas de futuras pesquisas.

2 OS MOVIMENTOS SEPARATISTAS MUNDIAIS E BRASILEIROS: UMA BREVE VISÃO GERAL

(4)

Braz. J. of Develop., Curitiba, v. 5, n. 7, p. 8150-8168 jul. 2019 ISSN 2525-8761 Os movimentos separatistas, bem-sucedidos ou não, registrados no mundo ao longo dos dois últimos séculos têm obedecido a certos padrões bem definidos. Na grande maioria dos casos, eles se caracterizaram como movimentos "nacionalistas" ou de "libertação nacional": um grupo humano determinado, que habita uma certa área e possui uma identidade histórica e/ou cultural própria, passa a reivindicar o direito à autodeterminação e à soberania política (Beary, 2011; Sani e Todman, 2002; Mashuri e Leeuwen, 2017; Bandeira, 1993).

Esse foi o padrão separatista mais típico no passado, que levou à constituição de diversos estados nacionais nos dois últimos séculos, e que ainda pode ser usado para descrever vários processos atualmente em curso na Europa e em outras partes do mundo. Os casos dos países oriundos da desagregação dos Impérios Otomaho, no século XIX, e Austro-Húngaro, após a Primeira Guerra Mundial, além da Irlanda, são exemplos mais antigos de movimentos separatistas de caráter nacionalista (Beary, 2011; Bandeira, 1993).

Existe ainda um segundo padrão de movimento separatista, menos frequente, no qual as diferenças históricas e culturais não desempenham um papel proeminente, sendo que a tentativa de separação decorre de fatores estritamente políticos e/ou econômicos que levam a uma profunda cisão entre interesses baseados nas diferentes regiões. O exemplo clássico desse padrão é constituído pela tentativa de secessão do sul dos Estados Unidos, que levou a uma guerra civil entre 1861 e 1865, em que o principal motivo do acirramento das contradições inter-regionais foi a questão do trabalho escravo (Bandeira, 1993).

Independentemente do tipo de padrão, segundo Griffiths (2016), é significativo o aumento de estados independentes, principalmente após a segunda guerra mundial. O autor aponta que 131 novos países surgiram desde 1945 e afirma que, caso os movimentos separatistas continuem com mesmo padrão de crescimento, estima-se que o mundo será composto por 260 países em 2050.

Na América do Sul, assim como em todo o planeta, são registradas demandas por autonomia por parte de alguns povos. Hewitt e Cheetham (2000) observam que regiões da Bolívia hoje experimentam anseios separatistas, bem como, os Mapuche na Argentina e no Chile também reclamam autonomia.

No Brasil, encontram-se ao longo da história movimentos com características separatistas. Foi no período regencial que o colapso da união esteve mais eminente, com o surgimento de diversas revoltas seccionistas, tais como a revolução Farroupilha, no Rio Grande do Sul; a sabinada, na Bahia; a cabanada, no Grão Pará; a balaiada no Maranhão, entre outras. Minahan (2016) reconhece a existência de movimentos separatistas organizados

(5)

Braz. J. of Develop., Curitiba, v. 5, n. 7, p. 8150-8168 jul. 2019 ISSN 2525-8761 atualmente no Brasil e ainda identifica organizações que objetivam a independência dos Estados da região sul.

Por outro lado, para Hewitt e Cheetham (2000), a presença de ideologias multiculturais tem desencorajado a emergência das expressões de separatismo étnico, não existindo movimentos separatistas de expressão no país. Igualmente, Griffiths (2016), embora aponte a Revolução Farroupilha (1835-1845), a independência da República Juliana (1839) e a Revolução Federalista (1892-1894) como movimentos separatistas na história do sul do Brasil, não faz qualquer referência à busca por mais autonomia por parte de algumas regiões do país nos dias atuais.

Existem dois focos separatistas no Brasil. Um foco localizado no Nordeste e outro no Sul do país, mas é no Sul que o sentimento separatista é mais veemente, surgindo diversos movimentos separatistas, no qual se destacam o movimento “O Sul é Meu País” e o movimento “República do Pampa Gaúcho”. A injustiça na representação política e nas distribuições dos recursos federais são argumentos que movem os separatistas do sul do país, aumentando as tensões inter-regionais.

Ao se abordar os movimentos separatistas brasileiros, cabe indagar em qual dos dois padrões, anteriormente mencionados, estes casos se enquadram. O primeiro padrão, relacionado a diferenças históricas e culturais, parece ser inadequado, dada a sua evidente não-correspondência às características da nossa sociedade. O grau de padronização cultural no Brasil é bastante elevado em termos comparativos e não existem diferenças linguísticas dignas de nota no país, muito embora subsistam as diferenças regionais, e em alguns lugares há um forte apreço na preservação da cultura local.

A despeito disso, pode-se afirmar que o padrão de separatismo "nacionalista" tem pouca relevância para a análise do fenômeno no Brasil. A exploração de aspectos étnico-culturais ou históricos parece estar destinada a desempenhar um papel secundário em qualquer movimento separatista. Os fatores capazes de levar um movimento desse tipo a ganhar expressão, teriam de ser, necessariamente, de natureza estritamente política ou econômica (Bandeira, 1993).

3 METODOLOGIA

Para agrupar os estados brasileiros em termos das características políticas, populacionais, educacionais, econômicas, de trabalho e de renda, optou-se pela análise de clusters, cujas etapas realizadas para a pesquisa se resumem em: coleta de dados e definição

(6)

Braz. J. of Develop., Curitiba, v. 5, n. 7, p. 8150-8168 jul. 2019 ISSN 2525-8761 dos atributos; escolha e aplicação dos algoritmos de clustering; e, por fim, análise dos resultados.

3.1 COLETA DE DADOS E DEFINIÇÃO DOS ATRIBUTOS

Os dados utilizados na análise são oriundos das seguintes fontes: IBGE (Instituto Brasileiro de Geografia e Estatística), Censo Demográfico 2010 e Pesquisa Nacional por Amostra de Domicílios Contínua 2017; INEP (Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira), Censo Educacional 2015 e Censo da Educação Superior 2016; PNUD (Programa das Nações Unidas para o Desenvolvimento); SICONFI (Sistema de Informações Contábeis e Fiscais do Setor Público Brasileiro); e TSE (Tribunal Superior Eleitoral) Estatísticas do eleitorado 2010 e 2014.

Existem diversos indicadores de desenvolvimento nas dimensões social, cultural, ambiental, econômica e político-institucional. Uma única característica não pode ser suficiente para classificar ou agrupar corretamente as diversas instâncias de um problema. Por isso, leva-se em conta na composição de um índice, as diversas dimensões, dentro das quais estão os indicadores, com suas respectivas variáveis. No caso do presente estudo, foram consideradas algumas das variáveis que compõem os indicadores das dimensões: política; população; educação; trabalho e rendimento; economia. O Quadro 1 mostra essa relação entre as variáveis e indicadores em cada dimensão.

Dimensão Indicador (es) Variável (is)

Política

Preferência do eleitorado nas eleições presidenciais (segundo turno)

i) Candidato eleito em cada estado em 2010 ii) Candidato eleito em cada estado em 2014

População Demográfico

i) População estimada em 2017 (pessoas) ii) Densidade demográfica (hab/km²)

Educação Acesso escolar

i) Matrículas no Ensino Fundamental ii) Matrículas no Ensino Médio iii) Matrículas no Ensino Superior

(7)

Braz. J. of Develop., Curitiba, v. 5, n. 7, p. 8150-8168 jul. 2019 ISSN 2525-8761 Qualidade escolar

i) Docentes no Ensino Fundamental ii) Docentes no Ensino Médio iii) Concluintes no Ensino Superior

Infraestrutura escolar

i) Número de estabelecimentos de ensino fundamental

ii) Número de estabelecimentos de ensino médio iii) Número de estabelecimentos de ensino superior

Trabalho e Rendimento

Renda per capita i) Rendimento nominal mensal domiciliar per capita (R$)

Ocupação da população

i) Pessoas de 16 anos ou mais ocupadas

ii) Proporção de pessoas de 16 anos ou mais em trabalho formal (%)

Economia

Riqueza produzida pelas atividades econômicas

i) Produto Interno Bruto (PIB) total ii) Produto Interno Bruto (PIB) per capita

Grau Econômico i) Índice de Desenvolvimento Humano (IDH)

Orçamento

i) Receitas orçamentárias (R$∙1000) ii) Despesas orçamentárias (R$∙1000) iii) Saldo orçamentário (R$∙1000) Quadro 1 – Relação entre dimensão, indicadores e variáveis consideradas no estudo.

Para a aplicação, foram considerados como atributos, as 22 variáveis, nominais ou numéricas, enumeradas no Quadro 1. E os dados referente a estes atributos foram coletados para os 26 estados brasileiros, incluindo o Distrito Federal. Sendo assim, o modelo resultante para a análise consistiu em 22 atributos e 27 instâncias. Não foi necessária nenhuma transformação nos dados para a aplicação do algoritmo.

(8)

Braz. J. of Develop., Curitiba, v. 5, n. 7, p. 8150-8168 jul. 2019 ISSN 2525-8761 3.2 ALGORITMO DE CLUSTERING

Um dos algoritmos de clusterização mais clássicos é o 𝑘-means que, no contexto de aprendizagem de máquina, se enquadra na área de aprendizagem não-supervisionada (Jain, 2010). Dada uma base de dados, o objetivo do 𝑘-means é rotular cada instância da base de dados com o nome do cluster atribuído àquela instância, separando assim a base de dados em vários clusters com instâncias semelhantes entre si.

Mais formalmente, o algoritmo foi definido pela primeira vez por MacQueen (1967) da seguinte forma: seja 𝑦𝑖 o rótulo da 𝑖-ésima instância, 𝑘 a quantidade de clusters e 𝑛 o número de instâncias da base de dados, então o conjunto de rótulos é dado por (1) a seguir. {𝑦𝑖 | 𝑦𝑖 ∈ {1,2, … , 𝑘}}𝑖=1𝑛 (1)

A forma que o 𝑘-means utiliza para encontrar a disposição dos clusters em que os elementos são mais similares é minimizando a dispersão das instâncias em relação ao centroide do cluster, conforme (2). min 𝑦1,..,𝑦𝑛∈{1,..𝑘} ∑ ∑ ∥ 𝑥𝑖 − 𝜇𝑦 ∥2 𝑖:𝑦𝑖=𝑦 𝑘 𝑦=1 (2)

onde, ∑𝑖:𝑦𝑖=𝑦 significa o somatório em 𝑖 em que 𝑦𝑖 = 𝑦. Os centroides 𝜇𝑦 são definidos por (3).

𝜇𝑦 = 1

𝑛𝑦 ∑ 𝑥𝑖 𝑖:𝑦𝑖=𝑦

(3)

Um detalhe importante é que existem duas maneiras principais para o cálculo da distância entre dois pontos utilizado no cálculo da dispersão apresentado em (2). A primeira forma é calcular ∥ 𝑥𝑖− 𝜇𝑦 ∥ pela distância Euclidiana (Deza e Deza, 2009) ou, então, a segunda forma, é calcular pela distância de Manhattan (Krause, 1975).

A distância euclidiana de dois vetores com 𝑑 dimensões é definida por (4).

∥ 𝑥 − 𝑦 ∥ = √∑(𝑥𝑖− 𝑦𝑖)2 𝑑

𝑖=1

(4)

E, similarmente, a distância de Manhattan é definida por (5). ∥ 𝑥 − 𝑦 ∥ = ∑|𝑥𝑖− 𝑦𝑖|

𝑑

𝑖=1

(9)

Braz. J. of Develop., Curitiba, v. 5, n. 7, p. 8150-8168 jul. 2019 ISSN 2525-8761 Sendo assim, o algoritmo selecionado para a aplicação em pauta foi o 𝑘-means, e a função de distância utilizada foi calculada tanto pela distância euclidiana (em 4), quanto pela distância Manhattan (em 5).

Ambas as distâncias estão implementadas no algoritmo Simple k-means (Arthur e Vassilvitskii, 2007), do software WEKA® (Waikato Environment for Knowledge Analysis,

disponível em: <http://www.cs.waikato.ac.nz/ml/weka>) e os testes foram realizados com 𝑘 (número de clusters) sendo um número inteiro, variando no intervalo fechado [2, 5].

3.3 ANÁLISE DOS RESULTADOS

Os dados coletados foram analisados de forma descritiva, sendo representados com mapas de frequência em algumas das variáveis para uma melhor visualização. Também foram calculadas a média, como medida de tendência central, e as medidas de dispersão, como o desvio padrão e a amplitude, para descrever os dados numéricos e apresentá-los resumidamente em tabela.

Com relação aos resultados da clusterização, também foram representados em diagrama de mapa, indicando os estados que pertencem a cada um dos clusters. Para tanto, foi utilizado o software GeoDaTM, que possibilitou a geração de mapas de geovisualização dos clusters. Após a descrição completa dos dados e dos resultados, uma análise conceitual foi realizada.

4 OBTENÇÃO E DISCUSSÃO DOS RESULTADOS

Em uma etapa inicial de análise, os dados foram descritos de forma quantitativa e visual, fornecendo assim um resumo sobre a amostra coletada. Já em uma etapa mais elaborada de análise, os dados passaram por um algoritmo de clusterização, obtendo-se assim os resultados.

4.1 ANÁLISE DESCRITIVA DOS DADOS

Dos dados considerados para a análise, os únicos atributos do tipo nominal foram os da dimensão política, “candidato eleito em cada estado” em 2010, ano em que a candidata Dilma Rousseff venceu em 16 dos estados brasileiros, e em 2014, ano em que a referida candidata obteve maioria dos votos em 15 estados.

(10)

Braz. J. of Develop., Curitiba, v. 5, n. 7, p. 8150-8168 jul. 2019 ISSN 2525-8761 Os demais atributos considerados para a análise são todos do tipo numérico, sendo possível assim, obter as estatísticas descritivas de média, desvio padrão e amplitude, como mostra a Tabela 1.

Tabela 1 – Resumo das estatísticas dos atributos considerados na análise considerando todos os estados brasileiros

Atributo

Estatísticas Descritivas

Média Desvio Padrão Amplitude

População estimada em 2017 Densidade demográfica 7691145,519 68,041 9118981,033 105,91 44572230 442,65 Matrículas no Ensino Fundamental

Matriculas no Ensino Médio Matrículas no Ensino Superior

1030568,074 299069,667 298100,037 1086902,708 364850,444 385141,379 5239079 1827518 1926547 Docentes no Ensino Fundamental

Docentes no Ensino Médio Concluintes no Ensino Superior

57389,667 21101,259 43312,926 61688,979 26796,473 62261,713 288956 127981 317976 Estabelecimentos de ensino fundamental

Estabelecimentos de ensino médio Estabelecimentos de ensino superior 4965,815 1036,741 89,148 4247,448 1291,074 121,891 14894 6297 602

Rendimento per capita 1110,111 425,556 1951

Pessoas ocupadas

Proporção de pessoas em trabalho formal 3495,815 51,859 4322,219 13,676 21045 48,8

(11)

Braz. J. of Develop., Curitiba, v. 5, n. 7, p. 8150-8168 jul. 2019 ISSN 2525-8761 Produto Interno Bruto per capita 24593,507 13885,714 72604,82 Índice de Desenvolvimento Humano 0,705 0,049 0,193 Receitas orçamentárias Despesas orçamentárias Saldo orçamentário 32167352,72 28730098,269 3035697,84 42632195,758 41782537,794 270933,896 205637335 207050612 11036215

Observando os valores de desvio padrão e amplitude (Quadro 1), é possível perceber uma grande disparidade dos dados, enaltecendo assim as diferenças, principalmente nos atributos das dimensões educacionais e econômicas, que existem entre os estados brasileiros. Mas é somente com a visualização gráfica dos dados, organizados no mapa do Brasil pela frequência de cada atributo, que se pode notar que estas diferenças são evidentes e predominantes, na maioria das vezes, nos estados das regiões norte/nordeste com os estados das regiões sul/sudeste/centro-oeste. Observe-se, por exemplo, o atributo “candidato eleito em cada estado” nas eleições de 2002 a 2014 (Figura 1).

Figura 1 – Candidato à presidência eleito em cada estado nos anos de a) 2002; b) 2006; c) 2010 e; d) 2014. Fonte: imagens adaptadas de wikipedia.org

Pela Figura 1 percebe-se uma mudança no perfil do eleitorado, com relação a preferência dos candidatos e, consequentemente, dos partidos políticos, já a partir da eleição presidencial de 2006 até a última eleição realizada, em 2014, sendo possível notar claramente uma divisão dos estados brasileiros neste atributo. Em outros atributos também se observa essa diferença no desempenho dos estados, como mostra a Figura 2.

(12)

Braz. J. of Develop., Curitiba, v. 5, n. 7, p. 8150-8168 jul. 2019 ISSN 2525-8761 Figura 2 - Distribuição de frequência nos atributos, a) Proporção de pessoas de 16 anos ou mais em trabalho formal e; b) Índice de Desenvolvimento Humano, dos estados brasileiros.

Fonte: imagens adaptadas de cidades.ibge.gov.br.

Considerando o atributo “proporção de pessoas de 16 anos ou mais em trabalho formal”, o pior caso é o do estado do Maranhão, com apenas 26,8% da população ocupada em trabalho formal, sendo que o Estado de Santa Catarina lidera o ranking neste aspecto, com 75,6% da sua população de 16 anos ou mais em trabalho formal. Já a parte b) da Figura 2 mostra o IDH, no qual o estado de Alagoas ocupa o último lugar no ranking, com o valor de 0,631, enquanto o Distrito Federal, com um IDH de 0,824, ocupa o primeiro lugar.

Os demais atributos, embora não tenham sido mencionados tão profundamente, mas os respectivos mapas podem ser acessados na homepage do IBGE (disponível em: <https://cidades.ibge.gov.br>) e verificadas as profundas diferenças existentes nos estados brasileiros.

4.2 RESULTADOS DA CLUSTERIZAÇÃO

A seguir estão os resultados obtidos com a aplicação do algoritmo de clusterização, 𝑘-means, com o número de cluster 𝑘, variando de 2 a 5 e, também, com a variação na função de distância, sendo esta calculada tanto pela distância euclidiana, quanto pela distância de Manhattan. A Tabela 2 mostra o número de estados alocados em cada um dos clusters, considerando todas estas configurações indicadas.

(13)

Braz. J. of Develop., Curitiba, v. 5, n. 7, p. 8150-8168 jul. 2019 ISSN 2525-8761 Tabela 2 – Número de estados em cada cluster, com 𝑘 variando de 2 a 5

𝒌

Número de estados por cluster Distância Euclidiana Distância de Manhattan 𝑘 = 2 Cluster 1 Cluster 2 15 12 17 10 𝑘 = 3 Cluster 1 Cluster 2 Cluster 3 11 1 15 16 1 10 𝑘 = 4 Cluster 1 Cluster 2 Cluster 3 Cluster 4 10 1 15 1 12 11 3 1 𝑘 = 5 Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5 10 1 2 1 13 7 1 5 1 13

Percebe-se que, em ambas as distâncias utilizadas para o cálculo do 𝑘-means, a quantidade de cluster 𝑘 = 2 apresentou uma melhor divisão no número dos estados, isso porque a medida que a quantidade de clusters aumentou, o número de estado em cada cluster não ficou equilibrado, tendo clusters com apenas 1 ou 2 estados alocados.

A informação de qual estado pertence a qual cluster pode ser visualizada pelos mapas das Figuras 3 e 4, para a Distância Euclidiana e para a Distância de Manhattan, respectivamente.

(14)

Braz. J. of Develop., Curitiba, v. 5, n. 7, p. 8150-8168 jul. 2019 ISSN 2525-8761 Na configuração 𝑘 = 2 do algoritmo apresentados na Figura 3, percebe-se que há uma separação evidente entre os estados do sul/sudeste/centro-oeste dos estados do norte/nordeste, porém não em sua totalidade, uma vez que os estados Roraima, Acre e Rondônia pertencem ao Cluster 1, enquanto que os estados de Minas Gerais e Rio de Janeiro pertencem ao Cluster 2. Houveram poucas modificações na alocação dos estados com as demais configurações (k=3, k=4 e k=5), sendo que a mais evidente é a separação do Distrito Federal, São Paulo, Minas Gerais, e Rio de Janeiro dos demais estados, que permaneceram com a mesma alocação inicial.

Figura 3 – Alocação dos estados brasileiros nos clusters, com o algoritmo calculado pela distância euclidiana, com 𝑘 variando de 2 a 5.

Em comparação com a distância euclidiana, o resultado do algoritmo utilizando a distância de Manhattan com 𝑘 = 2 (Figura 4) produziu uma separação mais exata dos estados das regiões sul/sudeste/centro-oeste dos estados do norte/nordeste, e neste caso somente o Distrito Federal não correspondeu ao cluster da sua respectiva região. Porém, ao aumentar em um o número de clusters, verifica-se que esse estado saiu do Cluster 2 e foi alocado ao Cluster 3, sendo ele o único elemento desse cluster. Também, com a Distância de Manhattan, ocorreram mudanças mais significativa e evidente na alocação dos estados aos clusters, ao se aumentar o valor de 𝑘. Na configuração de k=5, percebe-se que os estados da região sul são alocados, pela primeira vez, a um cluster diferente do cluster comum aos estados da região centro-oeste.

(15)

Braz. J. of Develop., Curitiba, v. 5, n. 7, p. 8150-8168 jul. 2019 ISSN 2525-8761 Figura 4 – Alocação dos estados brasileiros nos clusters, com o algoritmo calculado pela distância de Manhattan, com 𝑘 variando de 2 a 5.

E, por fim, somente com a alocação dos estados nos clusters, ou com o número de estados alocado em cada cluster, não é possível afirmar qual(is) cluster(s) possui(em) um melhor desempenho. Isso só é possível analisando a informação do nível de desempenho de cada cluster, em cada um dos atributos. Observe a Figura 5, que mostra a disposição dos clusters (𝑘 = 2 e 𝑘 = 5) nos atributos “Índice de Desenvolvimento Humano” e “Proporção de Pessoas em trabalho formal”.

(16)

Braz. J. of Develop., Curitiba, v. 5, n. 7, p. 8150-8168 jul. 2019 ISSN 2525-8761

Figura 5 – Nível de desempenho dos clusters (𝑘 = 2 e 𝑘 = 5) nos atributos “Índice de Desenvolvimento Humano” e “Proporção de Pessoas em trabalho formal”.

Com o diagrama de dispersão apresentado na Figura 5, com 𝑘 = 2, é possível notar que o Cluster 1 possui maiores valores nos atributos “Índice de Desenvolvimento Humano” e “Proporção de Pessoas em trabalho formal”. E, portanto, é possível afirmar que este cluster e, consequentemente, os estados que pertencem a ele, possuem melhor desempenho nos atributos considerados. Já quando 𝑘 = 5, o Cluster 2 permanece com os estados de menor desempenho, enquanto que os demais clusters correspondem aos estados de melhor desempenho.

5 CONSIDERAÇÕES FINAIS E PROPOSTAS DE PESQUISAS FUTURAS

Esta pesquisa vem corroborar com os resultados de outros estudos da área, no qual também ficou evidente, com a análise de clusterização realizada, a desigualdade dos estados brasileiros no que tange características políticas, populacionais, educacionais, econômicas, de trabalho e de renda. Os clusters nos quais os estados foram alocados, em sua maioria, representam uma divisão entre os estados das regiões sul/sudeste/centro-oeste, dos estados das regiões norte/nordeste. Foi possível também verificar os clusters de maior ou menor desempenho, sendo que os estados pertencentes ao Cluster 2 (azul), geralmente, possuem os piores valores, principalmente, nos indicadores de cunho econômico, educacional, de trabalho e renda.

Novamente, enfatiza-se que os autores não defendem ou apoiam nenhum movimento de separatista e que as análises realizadas na pesquisa somente apontam as diferenças entre os estados brasileiros, o que pode embasar os argumentos de uma possível separação dos estados, mas que não são suficientes para tal ação, uma vez que inúmeros outros critérios devem ser considerados na pauta de uma ação separatista.

Como pesquisas futuras, os autores pretendem englobar um panorama mundial na busca por artigos e trabalhos correlatos, para identificar se, em outros países, principalmente onde os movimentos separatistas são mais fortes e evidentes, se estudos similares têm sido realizados. Em termos de outras possíveis análises de clusterização, as pretensões futuras são: a) fazer a análise considerando os municípios brasileiros, como no trabalho realizado por Carvalho, da Mata e Resende (2007), porém com o diferencial de não fazer a clusterização dos municípios por regiões brasileiras; b) fazer a análise separando os atributos, ou seja, para cada modelo considerar somente aqueles atributos que pertencem a uma determinada dimensão; c)

(17)

Braz. J. of Develop., Curitiba, v. 5, n. 7, p. 8150-8168 jul. 2019 ISSN 2525-8761 considerar outros atributos, ou indicadores, que englobem outras dimensões importantes que podem caracterizar as diferenças entre os estados e/ou municípios brasileiros, como a taxa de homicídios, as condições dos domicílios e as condições de saúde, utilizados por Carvalho, Da Mata e Resende (2007); d) utilizar outras técnicas de clusterização, como a hierárquica, ou também a Análise de Componentes Principais ou, até mesmo, técnicas mais elaboradas, como a fuzzy c-means, e também técnicas que considerem a geolocalização dos estados ou municípios.

REFERÊNCIAS

ARTHUR, D.; VASSILVITSKII, S. (2007). k-means++: The advantages of careful seeding. In: Proceedings of the eighteenth annual ACM-SIAM symposium on Discrete algorithms. Society for Industrial and Applied Mathematics. p. 1027-1035.

BANDEIRA, P.S. (1993). A ressurreição do separatismo no Brasil. Indicadores Econômicos FEE, v. 20, n. 4, p. 206-215.

BEARY, B. (2011). Separatist movements: A global reference. Washington, DC: CQ Press, a Division of SAGE.

CAMPANA, N.M.; CALIARI, T. (2015) Desenvolvimento econômico, tecnológico e científico dos estados brasileiros: um estudo para os anos de 2002 e 2010. Revista Brasileira de Estudos Regionais e Urbanos, v. 9, n. 1, p. 93-109.

CARVALHO, A.; DA MATA, D.; RESENDE, G.M. (2007). Clusterização dos municípios brasileiros. Dinâmica dos municípios. Brasília: Instituto de Pesquisa Econômica Aplicada, p. 181-207.

DEZA, M.M.; DEZA, E. (2009). Encyclopedia of distances. In: Encyclopedia of Distances. Springer, Berlin, Heidelberg. p. 1-583.

GRIFFITHS, R.D. (2016). Age of Secession: the international and domestic determinants of State birth. Cambridge University Press.

HEWITT, C.; CHEETHAM, T. (2000). Encyclopedia of modern separatist movements. Santa Barbara, CA, ABC-CLIO.

(18)

Braz. J. of Develop., Curitiba, v. 5, n. 7, p. 8150-8168 jul. 2019 ISSN 2525-8761 IBGE (Instituto Brasileiro de Geografia e Estatística). Censo Demográfico, 2010. Disponível em: <https://www.ibge.gov.br/estatisticas-novoportal/sociais/populacao/9662-censo-demografico-2010.html?&t=downloads>. Acesso em 20 de janeiro de 2018.

IBGE (Instituto Brasileiro de Geografia e Estatística). Pesquisa Nacional por Amostra de Domicílios Contínua, 2017. Disponível em: <https://www.ibge.gov.br/estatisticas-novoportal/sociais/trabalho/17270-pnad-continua.html?&t=downloads>. Acesso em 20 de janeiro de 2018.

INEP (Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira). Censo Educacional, 2015. Disponível em: < http://www.inep.gov.br/>. Acesso em 20 de janeiro de 2018.

INEP (Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira). Censo da Educação Superior, 2016. Disponível em: < http://portal.inep.gov.br/web/guest/educacao-superiorAcesso em 20 de janeiro de 2018.

JAIN, A. K. (2010). Data clustering: 50 years beyond K-means. Pattern recognition letters, v. 31, n. 8, p. 651-666.

KRAUSE, E.F. (1975). Taxicab geometry: An adventure in non-Euclidean geometry. Courier Corporation.

MACQUEEN, J. (1967). Some methods for classification and analysis of multivariate observations. In: Proceedings of the fifth Berkeley symposium on mathematical statistics and probability. p. 281-297.

MARION FILHO, P. J.; LAZARETTI, L. R.; BATISTELLA, P.; TEIXEIRA, F. O. (2017). Os estados brasileiros na transição demográfica: similaridades e características discriminantes. PRACS: Revista Eletrônica de Humanidades do Curso de Ciências Sociais da UNIFAP, v. 10, n. 2, p. 09-24.

MASHURI, A.; VAN LEEUWEN, E. (2017) Predicting Support for Reconciliation in Separatist Conflict. Personality and Social Psychology Bulletin. Personality and Social Psychology Bulletin, vol. 44(2) 173–185.

(19)

Braz. J. of Develop., Curitiba, v. 5, n. 7, p. 8150-8168 jul. 2019 ISSN 2525-8761 MINAHAN, J.B. (2016). Encyclopedia of Stateless Nations: Ethnic and National Groups around the World. Santa Barbara, CA, Greenwood.

PNUD (Programa das Nações Unidas para o Desenvolvimento). Índice de Desenvolvimento

Humano. Disponível em:

<http://www.br.undp.org/content/brazil/pt/home/idh0/rankings/idhm-uf-2010.html>. Acesso em 20 de janeiro de 2018.

REDDY, T.A. (2011). Applied data analysis and modeling for energy engineers and scientists. London: Springer Science & Business Media.

RIBEIRO, L.C.S.; LOPES, T.H.C.R. (2015). Características e similaridades do setor cultural nos municípios e regiões metropolitanas brasileiras. Revista de Economia Contemporânea, v. 19, n. 2, p. 307-330.

SANI, F.; TODMAN, J. (2002). Should we stay or should we go? A social psychological model of schisms in groups. Personality and Social Psychology Bulletin, v. 28, n. 12, p. 1647-1655.

SICONFI (Sistema de Informações Contábeis e Fiscais do Setor Público Brasileiro). Contas anuais: Receitas orçamentárias realizadas e Despesas orçamentárias empenhadas, 2014. Disponível em: <https://siconfi.tesouro.gov.br/siconfi/index.jsf>. Acesso em 20 de janeiro de 2018.

SILVA MELLO, N.C.; BARROSO, L.C. (2013). Hierarquia das cidades médias brasileiras: abordagem por meio de técnicas de agrupamento. e-xacta, v. 6, n. 2, p. 107-120.

STENSJÖ, I.P.; FERREIRA, C.C.; LOURA, R.M. (2017). Classificação e agrupamento das cidades brasileiras em graus-dia de aquecimento e resfriamento: 1960 a 2013. Revista Brasileira de Gestão Urbana, v. 9.

TSE (Tribunal Superior Eleitoral) Estatísticas do eleitorado 2010 e 2014. Disponível em: <http://www.tse.jus.br/eleitor-e-eleicoes/estatisticas/estatisticas-de-eleitorado/estatistica-do-eleitorado-por-sexo-e-grau-de-instrucao>. Acesso em 20 de janeiro de 2018.

Imagem

Tabela  1  –  Resumo  das  estatísticas  dos  atributos  considerados  na  análise  considerando  todos  os  estados  brasileiros
Figura 1 – Candidato à presidência eleito em cada estado nos anos de a) 2002; b) 2006; c) 2010 e; d) 2014
Figura 2 - Distribuição de frequência nos atributos, a) Proporção de pessoas de 16 anos ou mais em trabalho  formal e; b) Índice de Desenvolvimento Humano, dos estados brasileiros
Tabela 2 – Número de estados em cada cluster, com
+3

Referências

Documentos relacionados

dos registradores vetoriais, o compilador deve quebrar a operação vetorial em uma seqüência de operações com vetores de tamanho igual ou menor do que o dos

A partir de um conjunto de dados de informac¸˜oes volum´etricas previamente obtido, como em um scanner de tomografia por exemplo, calcula-se a cor e opacidade para todos os voxels

No Anexo A, inclui-se a estrutura da base de dados constru´ıda para a compilac¸˜ao das funcionalidades encontradas nos sistemas de informac¸˜ao universit´arios, bem como a

adquirentes como Stone e Cielo, mas também os grandes bancos. Vale mencionar que tal projeto nunca esteve em nossas estimativas para Alupar. Cabe recurso da união.. 4% valor de

Benlanson (2008) avaliou diferentes bioestimulantes, (produtos à base de hormônios, micronutrientes, aminoácidos e vitaminas), confirmando possuir capacidade

Os achados clínicos, macroscópicos, histopatológicos, sorológicos, imunoistoquímicos e moleculares foram carac- terísticos da infecção por Toxoplasma gondii.. Em geral, lesões

Por fim, partindo do ponto de vista pedagógico, cremos que o jogo só será possível quando meninos e meninas forem vistos dentro dos ambientes de ensino e aprendizagem

Este trabalho objetivou com auxílio da fotointerpretação e da análise multivariada analisar os parâmetros dimensionais da rede de drenagem através de 12 microbacias de 3 a ordem