• Nenhum resultado encontrado

IDENTIFICAÇÃO DAS ÁREAS DE PESQUISA NO IFTM USANDO TÉCNICA DE AGRUPAMENTO IDENTIFICATION OF RESEARCH AREAS IN IFTM USING GROUPING TECHNIQUE

N/A
N/A
Protected

Academic year: 2021

Share "IDENTIFICAÇÃO DAS ÁREAS DE PESQUISA NO IFTM USANDO TÉCNICA DE AGRUPAMENTO IDENTIFICATION OF RESEARCH AREAS IN IFTM USING GROUPING TECHNIQUE"

Copied!
17
0
0

Texto

(1)

149

IDENTIFICAÇÃO DAS ÁREAS DE PESQUISA NO IFTM

USANDO TÉCNICA DE AGRUPAMENTO

IDENTIFICATION OF RESEARCH AREAS IN IFTM USING

GROUPING TECHNIQUE

IDENTIFICACIÓN DE LAS ÁREAS DE INVESTIGACIÓN EN

EL IFTM USANDO TÉCNICA DE AGRUPACIÓN

Bruno Gutierrez Guimarães Ribeiro1

Daniela Resende Silva Orbolato2

Ernani Viriato de Melo3

Resumo: Este artigo propõe a análise de frequência de palavras-chave de resumos publicados no Seminário de Iniciação Científica (SIN) do Instituto Federal do Triangulo Mineiro (IFTM) para diagnosticar as áreas de pesquisa atuantes na instituição e em seus campi. Este artigo também tem como objetivo o agrupamento de docentes para facilitar possíveis pesquisas em conjunto. Como instrumento de coleta, utilizou-se 370 resumos do SIN 2017. O agrupamento foi realizado com Expectation Maximization e K-means. Os resultados mostraram que a iniciação científica do IFTM contempla 298 palavras-chave e que alguns docentes de campi distintos possuem áreas de pesquisa em comum.

Palavras-chave: Agrupamento. IFTM. Áreas de Pesquisa. Maximização de Expectativa.

Abstract: This paper proposes the analysis of frequency of keywords of abstracts published at the Seminário de Iniciação Científica (SIN) of the Instituto Federal do Triangulo Mineiro (IFTM) to diagnose the research areas in the institution and in its campuses. This article also aims to group teachers to facilitate possible joint research. As a collection instrument, 370 abstracts of the SIN 2017 were used. The grouping was performed with Expectation Maximization and K-means. The results showed that the scientific initiation of IFTM includes 298 keywords and that some professors from different campuses have joint research areas.

Keywords: Clustering. IFTM. Research Areas. Expectation Maximization.

Resumen: Este artículo propone el análisis de frecuencia de palabras clave de resúmenes publicados en el Seminário de Iniciação Científica (SIN) del Instituto Federal do Triangulo Mineiro (IFTM) para diagnosticar las áreas de investigación actuantes en la institución y en sus campus. En este artículo también tiene como objetivo la agrupación de profesores para facilitar posibles investigaciones en conjunto. Como instrumento de recolección, se utilizaron 370 resúmenes del SIN 2017. El agrupamiento fue realizado con Expectation Maximization y K-means. Los resultados mostraron que la iniciación científica del IFTM contempla 298 palabras clave y que algunos profesores de campus distintos poseen áreas de investigación en común.

Palabras-clave: Agrupación. IFTM. Áreas de Investigación. Maximización de Expectativa.

Envio 20/12/2018 Revisão 27/12/2018 Aceite 27/09/2019

1

Graduando em Engenharia da Computação. Instituto Federal do Triangulo Mineiro, IFTM. E-mail: brunoggr@outlook.com.

2 Mestre em Ciência da Computação. Professora no Instituto Federal do Triangulo Mineiro, IFTM. E-mail:

danielaorbolato@iftm.edu.br.

3 Doutor em Ciência da Computação. Professor no Instituto Federal do Triangulo Mineiro, IFTM. E-mail:

(2)

150

Introdução

A Rede Federal de Educação Profissional, Científica e Tecnológica (RFEPCT) obedece ao princípio de indissociabilidade entre ensino, pesquisa e extensão, conforme o cumprimento das finalidades e características dispostas no artigo 6º da Lei nº 11.892/2008. Suas ações são voltadas à socialização de saberes teóricos e práticos, visando ao desenvolvimento das potencialidades dos alunos para que se constituam cidadãos participativos e corresponsáveis nos processos de transformação da sociedade.

A pesquisa, entendida como atividade indissociável do ensino e da extensão, visa basicamente à geração e à ampliação do conhecimento, e busca a criação e a produção científica ou tecnológica. A pesquisa torna-se, na prática, a aplicação dos conhecimentos e saberes na forma de desenvolvimento de um produto, melhoria de um processo ou avanço no conhecimento técnico e científico (PDI-IFSC, 2014).

Nesse sentido, é notória a importância da pesquisa na RFEPCT e medir, conhecer e discutir as áreas de pesquisa atuantes em cada instituição torna-se fundamental para o seu desenvolvimento. Este artigo tem por finalidade auxiliar o Instituto Federal de Educação, Ciência e Tecnologia do Triângulo Mineiro (IFTM) a medir, conhecer e levantar possíveis discussões acerca de suas áreas de pesquisa atuantes, articulando a produção do conhecimento no âmbito do desenvolvimento científico, tecnológico e social.

O IFTM foi criado a partir da incorporação dos Centros Federais de Educação Tecnológicas, Escolas Técnicas e Agrotécnicas em 2008 (PDI-IFTM, 2014). Se tratando de uma instituição recente, um dos maiores desafios presentes no IFTM é solidificar a pesquisa científica e disseminar o conhecimento dos estudos já gerados entre os vários campi da instituição.

Desde 2011, acontece anualmente no IFTM o Seminário de Iniciação Científica e Inovação Tecnológica (SIN4), evento organizado pela Pró-reitoria de Pesquisa e Inovação, com

o objetivo de reunir trabalhos de pesquisa e inovação tecnológica desenvolvidos nos diversos

campi do IFTM. Os trabalhos incluem pesquisas desenvolvidas com apoio de agências de

fomento, como o CNPq e a FAPEMIG, pesquisas apoiadas pelos programas institucionais para

4 Os anais dos resumos de todas as edições do Seminário de Iniciação Científica e Inovação Tecnológica

(3)

151

concessão de bolsas e pesquisas desenvolvidas de forma voluntária (SIN, 2018). Todos os

resumos dos trabalhos de iniciação científica desenvolvidos nos campi do IFTM são publicados no SIN compulsoriamente.

Atualmente existem poucos projetos de integração entre docentes e discentes de diferentes campi do IFTM, e isso torna um fator limitante de possibilidades de novas pesquisas, pois dessa forma os alunos tendem a desenvolver projetos relacionados apenas aos interesses de seu campus.

Como o SIN contempla todos os projetos de iniciação científica desenvolvidos no IFTM, uma análise dos resumos publicados no SIN tende a fornecer um cenário das áreas de pesquisa do IFTM. Para tal análise, este trabalho faz uso de análise de frequência de palavras-chave e técnicas de agrupamento de docentes levando em consideração sua atuação na pesquisa.

Procedimentos Metodológicos

Para a realização deste trabalho, foi necessário o desenvolvimento de diversas atividades que estão organizadas em 5 etapas (conforme FIGURA 1): Coleta de artigos do SIN;

Identificação de palavras-chave e professores; Contagem de Frequência; Preparação dos dados para Agrupamento; e Agrupamento de Dados.

Figura 1. Etapas dos Procedimentos Metodológicos

Fonte: Elaborado pelos autores (2018).

Coleta de artigos do SIN

Foram coletados do site do SIN 370 resumos entre os meses de julho e agosto de 2018, tais resumos publicados na edição de 2017. Os resumos do SIN estão disponíveis no site do evento5 em formato PDF. 5 http://www.iftm.edu.br/sin Coleta de Artigos do SIN Identificação de Palavras-Chave e Professores Contagem de Frequência Preparação dos dados para Agrupamento Agrupamento

(4)

152

Identificação de Palavras-chave e Professores

Com o intuito de identificar as áreas de pesquisa atuantes no IFTM, foram coletadas as palavras-chave fornecidas pelos resumos e as que não representavam relevantemente o conteúdo do artigo e/ou que não eram tão específicas do seu campo de pesquisa não foram contabilizadas, por exemplo, “IFTM”, “exemplo” e “Paracatu”. Além das palavras-chave, foram coletadas informações sobre o professor orientador de cada resumo e o texto propriamente dito. Ao todo foram identificados 188 professores orientadores, 298 palavras-chave em um total de 370 resumos.

A fim de diminuir a propensão de erros da verificação manual, a coleta foi realizada pelo autor do artigo e com supervisão e conferência de um coautor do mesmo.

Contagem de Frequência

Após a coleta e registro das informações, a próxima etapa foi realizar a contagem das palavras-chave. Para isso, foi desenvolvido um algoritmo que percorre todo o texto de todos os resumos extraídos para contabilizar a frequência de cada chave. Para cada palavra-chave, calculou-se: o total da frequência por professor; o total de frequência por campus; e o total geral (IFTM).

Preparação dos Dados para Agrupamento

A análise de grupos, que também são chamados de clusters, envolve a organização de um conjunto de objetos físicos ou abstratos, comumente representado na forma de vetores de atributos ou pontos em um espaço multidimensional. A similaridade entre os objetos de um determinado grupo é calculada de acordo com uma medida de similaridade (Alam, 2014). A escolha da medida de similaridade depende da natureza do problema. A mais conhecida é a distância euclidiana. A distância euclidiana entre os objetos pi e pj para n atributos que

descrevem os objetos pi e pj é descrita na Equação 1. Equação 1. Distância euclidiana

(5)

153

Para a realização da análise de agrupamento, os dados devem estar organizados numa

matriz M de entrada de dados p x n, onde p é o número de objetos e n é o número de atributos. Cada linha representa as coordenadas de um objeto e cada coluna representa os valores de um atributo assumidos por cada um dos p objetos.

Diante da proposta deste trabalho se faz necessário o agrupamento de docentes com perfis de pesquisa semelhante. Então, cada grupo será representado pelos seus temas de pesquisa. A primeira etapa da preparação dos dados para o agrupamento é a produção da matriz de frequências, onde cada linha representa um objeto, no caso, um professor e cada coluna representa um atributo, no caso, uma palavra-chave. O valor de cada elemento da matriz representa a frequência da palavra-chave para um determinado professor. A segunda etapa é a normalização da matriz. Cada elemento da matriz agora será o percentual de utilização da palavra-chave pelo professor. Com isso, para cada linha (ou seja, professor) a soma dos atributos deve ser igual a 1 (um). A matriz normalizada então é utilizada como a matriz M de entrada de dados para os algoritmos de agrupamento.

Exemplo. Suponhamos que os objetos são docentes e os atributos são palavras-chave

que os docentes mais utilizam em suas pesquisas. A matriz M de entrada de dados é dada a seguir:

Café Plantas nativas Mineração de dados Redes Sociais

João 0,7 0,3 0 0

José 0,5 0,5 0 0

Joana 0 0 0,8 0,2

Maria 0 0 0,6 0,4

Neste exemplo hipotético, temos que 70% das palavras-chave utilizadas pelo João é a palavra “Café” e 30% das palavras-chave é “Plantas nativas”.

A distância euclidiana entre João e José é de:

( ã , é) = (0,7 0,5) + (0,3 0,5) + (0 0) + (0 0) = 0,28; A distância euclidiana entre João e Joana é de:

( ã , ) = (0,7 0) + (0,3 0) + (0 0,8) + (0 0,2) = 1,12; A distância euclidiana entre João e Maria é de:

(6)

154

Ou seja, de acordo com as palavras-chaves que os docentes utilizam nas suas pesquisas,

o João é mais próximo do José, pois tem a menor distância euclidiana.

Agrupamento de Dados

Após o cálculo da matriz M de entrada de dados, é possível executar o algoritmo de agrupamento. Existem diversos métodos de agrupamento descritos na literatura (Goldschmidt, 2015). Neste artigo, adotou-se o método baseado em particionamento Expectation

Maximization com o K-means (EM-Kmeans). K-means é um dos métodos mais utilizados e que

dependendo da natureza do problema reflete bons resultados de agrupamento (Júnior, 2018).

K-Means

O sistema de agrupamento por K-means com aprendizado não supervisionado é vastamente usado para agrupamento com alta correlação, sendo assim o método de preferência para a análise proposta neste trabalho. O método K-means recebe como entrada a matriz de dados e um número k que representa o número de grupos que se deseja formar entre os objetos do banco de dados (Macqueen, 1967). A ideia geral do k-means é a seguinte:

1. Escolhe-se arbitrariamente k objetos do banco de dados. Estes objetos serão os centros de k grupos;

2. Os outros objetos do banco de dados são colocados nos grupos de acordo com o cálculo de similaridade entre o objeto e o centro dos grupos;

3. Após este processo, calcula-se a média dos elementos de cada grupo, isto é, seu centro de gravidade. O ponto será o novo representante do grupo.

4. Volta-se para o passo 2. O processo se repete até que nenhuma mudança ocorra, ou seja, os grupos se estabilizam.

A vantagem do k-means é a sua eficiência em tratar grandes conjuntos de dados (Singh, 2015).

(7)

155

Expectation Maximization

O método de Maximização de Expectativas (do inglês Expectation Maximization - EM) é um método iterativo6 que permite a estimação de parâmetros em modelos probabilísticos com

dados incompletos (não observados). O EM é utilizado para estimar parâmetros de modelos probabilísticos em que existem variáveis não observadas (Dempster et al., 1977).

O método EM envolve dois passos que são repetidos até que haja convergência. Os dois passos são:

1. Passo E: estima-se os dados que faltam para completar a amostra de dados incompleta. Essa estimativa é feita usando os valores das variáveis que foram observadas (Bartlett, 2018).

2. Passo M: com as novas frequências esperadas obtidas anteriormente, aplica-se um algoritmo com dados completos. Sendo assim, esses novos parâmetros substituem os parâmetros anteriores. Neste passo, o K-Means pode ser utilizado (Paiva, 2013). Neste artigo, adotamos a nomenclatura EM-Kmeans.

Segundo Faria (2011, p.15) uma das principais aplicações do método EM é quando os dados estão incompletos devidos a limitações do processo ou problemas. Neste artigo, como os docentes podem definir palavras-chave não intuitivas e não representativas, adotamos o método EM-Kmeans.

Ferramenta e Parâmetros utilizados

Para o treinamento e análise dos grupos, utilizou-se a ferramenta Waikato Environment

for Knowledge Analysis (WEKA7) que consiste de uma coleção de métodos de mineração de

dados. Além disso, WEKA contém ferramentas para preparação de dados, classificação, regressão, agrupamento, regras de associação e visualização de dados (Weka, 2018). O método de agrupamento utilizado foi o EM-K-means. Como são aproximadamente 200 docentes, adotamos experimentos com k = 20 (10% dos docentes) na expectativa de identificar grupos de pesquisa; e k = 5 na expectativa de agrupar as grandes áreas de pesquisa do IFTM. Neste artigo,

6 O método iterativo é um procedimento que gera uma sequência de soluções aproximadas que vão

melhorando conforme iterações são executadas.

(8)

156

experimentou-se diversos valores para os principais parâmetros do EM-K-means. Os valores

dos parâmetros que obtivemos melhores resultados estão descritos no QUADRO 1.

Quadro 1. Valores dos parâmetros usados no EM e K-means.

Parâmetro Descrição Valor

doNotCheckCapabilities se ativado desativa o pré-cálculo de aptidão para os clusters (diminui o tempo de execução, porém pode prejudicar o desempenho)

Falso

maxIterations funciona como critério de parada, caso o algoritmo não alcance um erro mínimo desejado.

100

maximumNumberOfClusters determina um limite de clusters (grupos)

durante a validação cruzada para escolher apenas os melhores clusters.

-

numClusters determina a quantidade de clusters. Caso -1 o software escolhe através de validação cruzada a quantidade de clusters gerados.

5 e 20

numFolds determina a quantidade de dobras usada durante a validação cruzada para encontrar o melhor número de clusters.

10

numKmeansRuns determina a quantidade de vezes que o algoritmo k-Means será executado.

10

seed Número que determina o pseudoaleatório gerador de números.

100

Resultados e Análise

O foco deste artigo é obter os temas mais pesquisados pelos docentes e discentes do IFTM e identificar grupos de docentes com temas de pesquisa semelhantes. Para isso, os experimentos foram divididos em duas etapas: análise de frequência de palavras-chave; e

agrupamento de docentes.

Análise de frequência de palavras-chave

Nesta primeira etapa, analisou-se a frequência de palavras-chave de acordo com os

campi da instituição. A TABELA 1 mostra as frequências das palavras-chave mais citadas de

(9)

157

o maior número de pesquisas está nas áreas de agrárias e alimentos. Podemos citar trabalhos

como: Produção de Geleia de Pequi, Análise Econômica da Produção de Soja, Avaliação da

Produção de Cachaça, Avaliação da Qualidade da Água, Avaliação da Qualidade dos Frutos de Maracujazeiro, etc. A palavra Tecnologia também se fez muito presente, demonstrando a

busca da instituição por inovações. Podemos citar trabalhos como: O uso da Tecnologia em

Arduíno como Ferramenta para o Controle na Indústria de Reciclagem de Plástico, Compostos Bioativos de Especiarias visando o uso na Tecnologia de Alimentos, etc.

Tabela 1 – Palavras-chave mais citadas nos resumos do SIN 2017 (IFTM).

Palavra-Chave Frequência Palavra-Chave Frequência Palavra-Chave Frequência

Produção 187 Software 69 Família 54

Solo 137 Saúde 66 Óleo 53

Ciência 129 Alimentos 63 Leite 50

Qualidade 128 Consumidor 62 Resíduos 48

Produtividade 125 Irrigação 60 Umidade 50

Química 120 Laboratório 59 Plataforma 48

Tecnologia 116 Aprendizagem 58 Placa 47

pH 113 Doenças 56 Nitrogênio 47

Semeadura 73 Adubação 55 Mercado 47

Fonte: Dados da pesquisa (2018).

Figura 2 – Nuvem representando as palavras mais citadas nos resumos do SIN 2017 (IFTM).

Fonte: Elaborado pelos autores (2018).

Em seguida, analisamos os temas de pesquisa em cada campus do IFTM. A TABELA 2 mostra o resultado das 10 palavras-chave mais usadas nos campi Patos de Minas, Paracatu e

(10)

158

Uberlândia Centro. Note que em Patos de Minas, os assuntos mais discutidos estão ligados à

área de humanas, tais como Aprendizagem, Política e Redes Sociais. Em Paracatu, as pesquisas na área de humanas e computação estão bastante presentes. No campus Uberlândia Centro as palavras Tecnologia e Computação são muito utilizadas, nos levando a acreditar em assuntos relacionados a inovação, além de assuntos também na área de educação relacionados a Família. A FIGURA 3 ilustra a nuvem de palavras-chave destes três campi.

Tabela 2 - As 10 Palavras-chave mais citadas nos resumos do SIN 2017 nos campi Patos de Minas, Paracatu e Uberlândia Centro.

Patos de Minas Paracatu Uberlândia Centro

Palavra-chave Frequência Palavra-chave Frequência Palavra-chave Frequência

Aprendizagem 15 Ética 19 Tecnologia 22

Política 12 Heurísticas 12 Plataforma Pais e

Filhos

17

Leitura 12 Política 11 Família 17

Redes sociais 10 Aprendizagem 11 marketing 13

Comunicação 8 Moral 11 História 11

Placa 8 Algoritmos 11 consumidor 11

Dengue 7 Otimização 9 Computação 10

Robô 7 Mapas Mentais 9 Comunicação 10

Estágio 7 Comunidade 9 Óleo 10

Peneiramento 6 Métodos 8 Métodos 10

Fonte: Dados da pesquisa (2018).

Figura 3 – Nuvens representando as palavras mais citadas nos resumos do SIN 2017 nos campi Patos de Minas, Paracatu e Uberlândia Centro.

Patos de Minas Paracatu Uberlândia Centro

Fonte: Elaborado pelos autores (2018).

A TABELA 3 mostra o resultado das 10 palavras-chave mais usadas nos campi Ituiutaba, Uberlândia e Uberaba. Note que nestes três campi as pesquisas na área de agrárias e

(11)

159

alimentos são predominantes. A FIGURA 4 ilustra a nuvem de palavras-chave destes três

campi.

Tabela 3 - As 10 Palavras-chave mais citadas nos resumos do SIN 2017 nos campi Ituiutaba, Uberlândia e Uberaba.

Ituiutaba Uberlândia Uberaba

Palavra-chave Frequência Palavra-chave Frequência Palavra-chave Frequência

Leite 35 Produção 69 Produção 81

Produção 24 Frutos 67 Produtividade 72

Software 20 pH 61 tratamentos 72

Química 19 Química 50 Solo 71

Solo 16 Qualidade 49 Semeadura 69

Resíduos 16 Produtividade 48 ciência 57

Qualidade 15 Solo 42 irrigação 48

História 14 Alimentos 41 química 40

óleo 13 Efluente 37 Qualidade 38

Ciência 13 Tratamentos 37 adubação 33

Fonte: Dados da pesquisa (2018).

Figura 4 – Nuvens representando as palavras mais citadas nos resumos do SIN 2017 nos campi Patos de Minas, Paracatu e Uberlândia Centro.

Ituiutaba Uberlândia Uberaba

Fonte: Elaborado pelos autores (2018).

A TABELA 4 mostra o resultado das 10 palavras-chave mais usadas nos campi Uberlândia Parque Tecnológico e Patrocínio. Note que nos dois campi, palavras como Tecnologia, Placa e Arduino mostram que as pesquisas são voltadas para tecnologia e inovação. Vale ressaltar que em Patrocínio são realizadas muitas pesquisas relacionadas com café (que é uma das principais atividades econômicas da cidade de Patrocínio), mostrando que a pesquisa aplicada se encontra presente em Patrocínio. A FIGURA 5 ilustra a nuvem de palavras-chave destes dois campi.

(12)

160

Tabela 4 - As 10 Palavras-chave mais citadas nos resumos do SIN 2017 nos campi Uberaba

Parque Tecnológico e Patrocínio.

Uberaba Parque Tecnológico Patrocínio

Palavra-chave Frequência Palavra-chave Frequência

Tecnologia 27 Café 22

Placa 22 Tecnologia 21

Ciência 17 Saúde 19

Lixo eletrônico 16 Arduino 14

Plataforma 14 Qualidade 14

Microcomputadores 12 Febre Amarela 13

Corrosão 12 Filosofia 12

Jogos 11 Leishmaniose 12

Aprendizagem 11 Jogos 11

Identificação 10 Protótipo 11

Fonte: Dados da pesquisa (2018).

Figura 5 – Nuvens representando as palavras mais citadas nos resumos do SIN 2017 nos campi Uberaba Parque Tecnológico e Patrocínio.

Uberaba Parque Tecnológico Patrocínio

Fonte: Elaborado pelos autores (2018).

Agrupamento de docentes

Nesta segunda etapa, inicialmente tentou-se agrupar os docentes em 5 grandes grupos de acordo com os temas pesquisados pelos docentes. O intuito é identificar e categorizar as grandes áreas de pesquisa do IFTM. A TABELA 5 mostra o resultado do agrupamento. Nota-se que foram identificados apenas 4 grupos significativos.

(13)

161

Tabela 5– Resultado do agrupamento de docentes com k = 5.

Grupos Quantidade de docentes

1 38 (20%)

2 90 (48%)

3 26 (14%)

4 32 (17%)

5 2 (1%)

Fonte: Dados da pesquisa (2018).

Após o agrupamento, identificamos 4 grandes grupos de docentes (Grupos de 1 a 4) e o Grupo 5 foi descartado por contemplar apenas 2 docentes. Em seguida, utilizando a nuvem de palavras conforme FIGURA 6, foi realizada uma análise das palavras-chave para categorizar as grandes áreas de pesquisa do IFTM. O grupo 1 foi categorizado como das áreas de Ciência da Computação e Engenharias, o grupo 2 foi categorizado como das áreas de Ciências Agrárias, Zootecnia e Ambientais, o grupo 3 foi categorizado como da área de Ciência de Alimentos, por fim o grupo 4 foi categorizado como das áreas de Educação, Ensino, História e Letras.

Figura 6 – Nuvens representando as palavras mais citadas no agrupamento com k = 5.

(14)

162

Visando identificar potenciais grupos de pesquisa onde docentes possam realizar

trabalhos em conjunto, adotou-se o número de grupos igual a 20 (aproximadamente 10% dos docentes da base de dados do SIN). A TABELA 6 mostra o resultado do agrupamento. Note que 7 grupos tiveram o número de docentes maior ou igual a 10.

Tabela 6 – Resultado do agrupamento de docentes com k = 20.

Grupo Quantidade de docentes Grupo Quantidade de docentes

1 14(7%) 11 2(1%) 2 23(12%) 12 2(1%) 3 20(11%) 13 7(4%) 4 3(2%) 14 10(5%) 5 1(1%) 15 4(2%) 6 26(14%) 16 3(2%) 7 9(5%) 17 27(14%) 8 7(4%) 18 1(1%) 9 2(1%) 19 15(8%) 10 5(3%) 20 7(4%)

Fonte: Dados da pesquisa (2018).

Após o agrupamento de docentes nos 20 grupos, realizou-se um estudo sobre o campus de lotação dos docentes de cada grupo. O objetivo deste experimento é investigar se estes grupos poderiam formar grupos de pesquisa com docentes de campus distintos. Para exemplificar este estudo, analisamos dois grupos escolhidos aleatoriamente: o grupo 6 com 26 docentes e o grupo 10 com 5 docentes.

Ao analisar o grupo 6, percebe-se que os docentes estão distribuídos em 5 dos 8 campi do IFTM, como mostra a TABELA 7 e os temas de pesquisa deste grupo são voltados para a irrigação, doenças em lavouras, plantação de café, dentre outros, como mostra a FIGURA 7. Estes dados nos mostram que atualmente existem algumas pesquisas que estão sendo realizadas separadamente em campi distintos, e que se unidas poderiam fortalecer e agregar conhecimento para os docentes dos campi envolvidos.

(15)

163

Tabela 7 – Distribuição de docentes presentes no grupo 6 do agrupamento da TABELA 6.

Campus Número de docentes

CAMPUS PATOS DE MINAS 1(4%)

CAMPUS PARACATU 0(0%)

CAMPUS UBERLÂNDIA CENTRO 0(0%)

CAMPUS ITUIUTABA 4(15%)

CAMPUS UBERLÂNDIA 9(35%)

CAMPUS UBERABA 11(42%)

CAMPUS AVANÇADO UBERABA PARQUE TECNOLÓGICO 0(0%)

CAMPUS PATROCÍNIO 1(4%)

Fonte: Dados da pesquisa (2018).

Figura 7 – Nuvem representando as palavras mais citadas do grupo 6 da TABELA 6.

Fonte: Elaborado pelos autores (2018).

Já o grupo 10, que contempla 2 docentes de Patos de Minas, 1 professor de Ituiutaba, 1 professor de Patrocínio e 1 professor do campus Uberlândia Centro, o foco principal é a área de eletrônica com trabalhos relacionados com programação Arduino, como mostra a FIGURA 8. Percebe-se neste grupo que, por mais que ele tenha apenas 5 docentes, os mesmos estão distribuídos em 4 campi distintos realizando pesquisas semelhantes, mas completamente separadas. Estes docentes possuem um grande potencial para formar um grupo de pesquisa e realizar pesquisas em conjunto, fortalecendo o conhecimento dos alunos de iniciação científica.

(16)

164

Figura 8 – Nuvem representando as palavras mais citadas do grupo 10 da TABELA 6.

Fonte: Elaborado pelos autores (2018).

Considerações Finais

Com os resultados apresentados neste trabalho, verificou-se que os resumos publicados no SIN podem ser usados para encontrar os temas de pesquisa mas discutidos em cada campi do IFTM e identificar docentes com similaridade no âmbito da pesquisa.

Este trabalho demonstrou a riqueza do banco de dados do SIN e a possibilidade de docentes de campus distintos trabalharem em um mesmo grupo de pesquisa. Como exemplo, temos dois grupos de pesquisa no campus avançado Uberaba Parque Tecnológico com apenas professores do próprio campus e que poderiam receber contribuições de professores de Patos de Minas: o MiDI (Grupo de Pesquisa de Mineração de Dados e Imagens) que possui pesquisas na área de Redes Sociais e o GETE (Grupo de Pesquisa em Educação, Tecnologias e Práticas de Ensino) que possui pesquisas na área de Ensino e Aprendizagem. Desta maneira, os alunos poderiam ser contemplados com orientações de docentes de diferentes campi em um mesmo trabalho científico.

Considerando o total de 188 docentes pesquisadores, percebeu-se durante os experimentos na etapa de agrupamento que aumentando a quantidade de grupos, na maioria dos grupos resultantes ocorreram uma diminuição na quantidade de docentes por grupo e a representatividade de cada grupo em relação aos temas de pesquisa se tornava mais específica.

O SIN acontece no IFTM desde 2011, entretanto a base de dados utilizada neste trabalho foi a edição de 2017. Como trabalhos futuros, sugerimos a utilização de todos os resumos de todas as edições do SIN, podendo assim aumentar a representatividade dos grupos de pesquisa encontrados. Outra sugestão para trabalhos futuros é automatizar a coleta de dados integrando o sistema de gerenciamento do SIN com o trabalho descrito neste artigo.

(17)

165

Referências

ALAM, Shafiq et al. Research on particle swarm optimization based clustering: a systematic review of literature and techniques. Swarm and Evolutionary Computation, v. 17, p. 1-13, 2014.

BARTLETT, Jonny Brooks. Probability concepts explained: Maximum likelihood estimation. Disponível em https://towardsdatascience.com/probability-concepts-explained-maximum-likelihood-estimation-c7b4342fdbb1 [visitado em outubro de 2018].

DEMPSTER, A. P.; Laird, N. M. & Rubin, D. B. Maximum likelihood from incomplete data via the em em algorithm. pp. 1—21, 1977.

FARIA, Victor Basílio. Estimação de Máxima Verossimilhança via Algoritmo EM. 2011. 14 p. Monografia (Bacharelado em Estatística) - Universidade Federal de Juiz de Fora, [S.I.], 2011. Disponível em: <http://www.ufjf.br/cursoestatistica/files/2011/11/monografia_victor.pdf>. Acesso em: 20 out. 2018.

GOLDSCHMIDT, Ronaldo; PASSOS, Emmanuel. Data Mining. Elsevier Brasil, 2015.

JÚNIOR, Armando Pereira Pontes; JÚNIOR, Clodomir Joaquim Santana; BASTOS FILHO, Carmelo José Albanez. Uso de Técnicas de Clusterização em uma Base de Dados Financeira. Revista de Engenharia e Pesquisa Aplicada, v. 3, n. 3, 2018.

MACQUEEN, James, "Some methods for classification and analysis of multivariate observations", Proceedings of the Fifth Berkeley Symposium on Mathematical Statistics and Probability Volume 1: Statistics, pp. 281-297, 1967.

PAIVA, Raphael de Oliveira. Análise Comparativa de Métodos de Agrupamentos. 2013. 42 p. Monografia (Bacharelado em Ciência da Computação) - Universidade Federal de Juiz de Fora, [S.I.], 2013. Disponível em http://monografias.nrc.ice.ufjf.br/tcc-web/downloadPdf?id=69 [visitado em outubro de 2018].

PDI-IFSC. PDI Plano de desenvolvimento Institucional (2014). Disponível em https://pdi.ifsc.edu.br/ [visitado em setembro de 2019].

PDI-IFTM. PDI Plano de desenvolvimento Institucional (2014). Disponível em http://www.iftm.edu.br/pdi/ [visitado em maio de 2018].

SIN. Seminario de iniciação cientifica e inovação tecnológica do IFTM. Disponível em http://www.iftm.edu.br/sin/ [visitado em maio de 2018].

SINGH, Dilpreet; REDDY, Chandan K. A survey on platforms for big data analytics. Journal of big data, v. 2, n. 1, p. 8, 2015.

WEKA. WEKA 3: Data Mining Software in Java. Disponível em: https://www.cs.waikato.ac.nz/ml/weka/ [visitado em maio de 2018].

Referências

Documentos relacionados

Para além do apoio ao nível da alimentação e dos cuidados médico-veterinários, assegurar a revisão dos Planos de Contingência Municipal, nomeadamente contra o frio, de

Com objetivo de avaliar e indicar grupos de espécies arbóreas para a implementação de modelos agroflorestais em um fragmento de floresta atlântica, no

7.    Aumentos  de  Capital  –  O  capital  do  FUNDO  pode  ser  aumentado,  por  uma  ou  mais  vezes,  por  deliberação  da  Assembleia  de 

acima descrita encontra-se situada dentro dos limites da Ocupação Urbana Consorciada do Córrego Santo Antônio, instituída pela Lei Municipal n º: 5.254 de 25 de janeiro de 2012 e é

O Relatório de Gestão tornam públicas as ações desenvolvidas no INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA DO TRIANGULO MINEIRO (IFTM), durante o exercício

Por sua vez, a complementação da geração utilizando madeira, apesar de requerer pequenas adaptações do sistema, baseia-se em um combustível cujas origens são mais diversifi

(Forma de número irracional) Quando &#34;Mthlo&#34; é selecionado como o formato de entrada/ saída, é possível especificar se os resultados de cálculo serão exibidos de forma a

Saque todas las piezas del paquete y extiéndalas en el suelo | Se recomienda usar una superficie de trabajo limpia para diseminar las partes y para realizar los pasos de prearmado |