• Nenhum resultado encontrado

APLICAÇÃO DA TÉCNICA DE DATA MINING NA BASE DE DADOS DO AMBIENTE DE GESTÃO EDUCACIONAL: UM

N/A
N/A
Protected

Academic year: 2023

Share "APLICAÇÃO DA TÉCNICA DE DATA MINING NA BASE DE DADOS DO AMBIENTE DE GESTÃO EDUCACIONAL: UM "

Copied!
153
0
0

Texto

Fórmula do cálculo do suporte

Cálculo da Confiança

PROBLEMA DE PESQUISA

  • Solução Proposta
  • Delimitação de Escopo
  • Justificativa

Uma dessas técnicas é a Knowledge Discovery in Database (KDD, abreviatura do termo inglês Knowledge Discovery in Database), que utiliza a técnica de extração de informações conhecida como Data Mining. A aplicação de técnicas de mineração de dados no ensino superior fortalece o seu ‘arsenal’ de estratégias para fazer frente ao mercado.

Gráfico 1 - Número de IES no Brasil  Fonte: Adaptado de INEP (2010).
Gráfico 1 - Número de IES no Brasil Fonte: Adaptado de INEP (2010).

OBJETIVOS

  • Objetivo Geral
  • Objetivos Específicos

Várias técnicas de mineração de dados foram aplicadas com sucesso a vários tipos de dados educacionais e ajudaram a resolver muitos problemas usando classificação tradicional, técnicas de agrupamento e análise de associação. O objetivo geral deste projeto visa o estudo e aplicabilidade da técnica de Mineração de Dados no banco de dados do Ambiente de Gestão Educacional de uma IES de Blumenau-SC, para auxiliar gestores na descoberta de informações e conhecimento.

METODOLOGIA

  • Metodologia da Pesquisa
  • Procedimentos Metodológicos

Para o estudo em questão, a metodologia adotada pode ser desenhada, conforme sugerido por Roesch (1999) e Vergara (2003), como um estudo de caso, pois trata da utilização de técnicas de mineração de dados na EA de uma determinada instituição de ensino superior . Durante a revisão da literatura, a busca por uma solução para o problema envolveu a seleção de uma técnica de mineração de dados que melhor se adequasse ao objetivo traçado.

ESTRUTURA DA DISSERTAÇÃO

A base teórica serve de base para a pesquisa, tanto teórica quanto empiricamente, servindo também de auxílio aos instrumentos de coleta de dados utilizados na pesquisa realizada. Este artigo apresenta o estado da arte como base para Sistemas e Informação, Mineração de Dados com suas técnicas e tarefas, Ferramentas de Mineração de Dados, Gestão de IES e concluindo com Ferramentas de Gestão.

SISTEMAS E INFORMAÇÃO

  • Informação
    • A importância da informação

O uso eficaz da informação nas organizações torna-se uma mais-valia, considerada um fator chave para o sucesso das organizações. Stair e Reynolds (2008, p.6) enfatizam as qualidades da informação para que ela seja considerada útil na tomada de decisões.

Figura 2 - Transformação de dado em informação  Fonte: Adaptado de Stair e Reynolds (2008)
Figura 2 - Transformação de dado em informação Fonte: Adaptado de Stair e Reynolds (2008)

SISTEMAS DE INFORMAÇÃO

  • Sistemas de Informação e seus tipos
    • Sistema de Processamento de Transações (SPT)
    • Sistema de Automação de Escritórios (SAE)
    • Sistema de Informação Gerencial (SIG)
    • Sistema de Informação de Suporte à Tomada de Decisão (SSTD)
    • Sistema de Informação para Executivos (SIE)

Fialho (2001, p.68) menciona que neste nível “os sistemas de informação de gestão servem as funções de planeamento e tomada de decisão. Os sistemas de nível estratégico são sistemas de informação utilizados no nível de decisão e contribuem para o planejamento estratégico da organização.

Figura 4 - Integração dos Sistemas de Informação  Fonte: Adaptado de Stair e Reynolds (2008, p
Figura 4 - Integração dos Sistemas de Informação Fonte: Adaptado de Stair e Reynolds (2008, p

GESTÃO DA INFORMAÇÃO

O filósofo Aristóteles já afirmava que a necessidade de informação deriva do desejo de saber, da curiosidade humana, portanto determinada de acordo com o conhecimento já adquirido. São justamente essas técnicas que visam aprimorar conceitos relativos à aquisição, assimilação e disseminação de informações em ambientes educacionais, comerciais e empresariais. O desconhecimento dos conceitos causa dificuldade na definição das informações corretas para o desenvolvimento das funções, excesso de trabalho e falta de compreensão para com os demais usuários.

Nota-se que muitos dos processos básicos utilizados em uma ação organizacional dependem das informações que são processadas por esses processos.

A IMPORTÂNCIA DOS SIG NA GESTÃO ESTRATÉGICA

Conhecer as informações que a empresa possui proporciona flexibilidade na tomada de decisões e evita perder o foco. Por serem utilizados especificamente para a tomada de decisão, devem ser reconhecidos, principalmente no nível estratégico da organização (Decisores). A qualidade, o valor e a segurança da informação tornam-se essenciais para as IES nos processos de tomada de decisão.

O processo administrativo oferece a tomada de decisão como elemento básico e, para que esse processo seja adequado, é necessário contar com um sistema de informação eficiente.

EXTRAÇÃO DA INFORMAÇÃO

Para os autores, os recursos de TI, incluindo o SIG, merecem maior atenção dos gestores, pois é por meio desses recursos que são geradas e gerenciadas as informações que serão utilizadas para a tomada de decisões. Os elementos relevantes extraídos serão então armazenados numa estrutura previamente definida, por exemplo numa tabela de base de dados. A EI presta um ótimo serviço de mineração de dados, pois as informações extraídas de um banco de dados por meio da EI são consideradas mais relevantes para o usuário.

Os dois conceitos devem ser separados pois o SGBD trata de tabelas e a forma de interação, consulta, é feita através de uma linguagem específica para isso, Data Manipulation Language (DML), Linguagem de Manipulação de Dados, que como resultado dá apenas duas respostas possíveis, pode haver ou não um conjunto de dados que atenda à demanda.

MINERAÇÃO DE DADOS

As etapas de mineração de dados podem ser vistas como um subprocesso dentro do KDD. Normalmente existem vários métodos para o mesmo propósito do KDD e a fase de Data Mining envolve a aplicação de diferentes técnicas, bem como a avaliação e comparação dos resultados obtidos. A descoberta de conhecimento em bancos de dados também é vista como um processo interativo, exigindo conhecimento de domínio.

A escolha de quais técnicas de mineração de dados aplicar depende da tarefa de mineração a ser executada.

Figura 6 - Interrelação entre MD, SI e nível operacional  Fonte: Adaptado de Santos (2008)
Figura 6 - Interrelação entre MD, SI e nível operacional Fonte: Adaptado de Santos (2008)

METODOLOGIA DE MINERAÇÃO DE DADOS

O atual modelo de processo de mineração de dados fornece uma visão geral do ciclo de vida de um projeto de mineração de dados. No início, temos que escolher a tarefa de mineração de dados a utilizar, sempre com base no domínio de conhecimento e nos tipos de dados. Nesta fase, deve ser tomada uma decisão sobre a utilização dos resultados da mineração de dados.

Avaliar os resultados da mineração de dados em relação aos critérios de sucesso do negócio;

Figura 8 - Fases do modelo de referência CRISP-DM  Fonte: Adaptado de CRISP-DM (2010)
Figura 8 - Fases do modelo de referência CRISP-DM Fonte: Adaptado de CRISP-DM (2010)

TAREFAS DE MINERAÇÃO DE DADOS

  • Classificação
  • Regressão
  • Associação
  • Clusterização ou Segmentação
  • Sumarização

A tarefa de regressão é semelhante à tarefa de classificação: busca características que mapeiem os registros em um banco de dados. Barioni (2001, p. 17) define que “a tarefa desta técnica é descobrir regras de associação que indiquem correlações interessantes entre objetos em um determinado banco de dados”. Segundo Fayyad (1996 apud DIAS, 2001, p. 10), a tarefa de sumarização envolve métodos para encontrar uma descrição compacta para um subconjunto de dados.

Um exemplo simples desta tarefa pode ser tabular o significado e os desvios padrão de todos os itens de dados.

Figura 10 - Ligação entre dados e classes  Fonte: Rabelo (2007, p. 27)
Figura 10 - Ligação entre dados e classes Fonte: Rabelo (2007, p. 27)

TÉCNICAS DE MINERAÇÃO DE DADOS

  • Técnicas Estatísticas
    • Análise de componentes principais (ACP)
  • Exemplo de utilização de ACP na Mineração de Dados
  • Algoritmos Genéticos (AG)
  • Árvore de Decisões (AD)
  • Redes Neurais Artificiais (RNA)

Segundo Johnson e Wichern (2002), a técnica dos componentes principais busca reduzir a dimensionalidade e a interpretabilidade do conjunto de dados. Considerando um conjunto de dados onde foram estudadas 3 variáveis ​​(peso, altura e idade) em relação a 8 pessoas. Mais detalhes sobre as tarefas de Data Mining podem ser encontrados na subseção 2.2.2 deste trabalho.

Abaixo segue um breve levantamento das principais ferramentas de Data Mining disponíveis no mercado.

Tabela 3. Conjunto de dados com 8 observações e 3 variáveis  Observação  Peso ( )  Altura ( )  Idade ( )
Tabela 3. Conjunto de dados com 8 observações e 3 variáveis Observação Peso ( ) Altura ( ) Idade ( )

FERRAMENTAS DE MINERAÇÃO DE DADOS

Portanto, os critérios que levaram à seleção da ferramenta foram: a utilidade da tarefa Descoberta de regras de associação, a utilização da técnica de associação aliada ao fato da ferramenta ser licenciada gratuitamente.

WEKA

O software WEKA é composto por dois pacotes: um pacote autônomo, para manipulação direta dos algoritmos, utilizando formato de dados próprio, e um pacote de classes Java que implementam esses algoritmos. Você pode aplicar os algoritmos diretamente a um conjunto de dados ou fazer uma chamada a partir do seu próprio código Java. O software possui as seguintes tarefas e técnicas de DM implementadas (MORATE 2010): . a) Tarefas: Pré-processamento de dados e aplicação de filtros, associação, classificação, clusterização, seleção de atributos e visualização de dados;

Essa interface é útil para aplicar uma ou mais técnicas de classificação a um grande banco de dados e depois fazer comparações estatísticas sobre elas.

Figura 18 - Tela inicial do software WEKA  Fonte: WEKA (2010).
Figura 18 - Tela inicial do software WEKA Fonte: WEKA (2010).

GESTÃO DE IES

  • Ferramentas de Gestão

O funcionamento das instituições de ensino superior é afetado direta ou indiretamente pelas mudanças sofridas pelo contexto externo em que estão inseridas, e o controle dessas mudanças afeta a sua gestão, o que pode ser minimizado pela utilização de boas ferramentas de gestão e pelo uso correto da informação . Existem no mercado programas de gestão de tecnologia que têm como princípio conectar todas as informações relacionadas à escola. A tese apresenta a aplicação de técnicas de mineração de dados em ambientes de gestão educacional com o objetivo de auxiliar os gestores desses ambientes na tomada de decisões quanto à sua utilização.

Diante disso, as seções seguintes apresentam trabalhos focados na gestão da informação no ensino superior e suas ferramentas associadas, no uso da mineração de dados em diferentes ambientes e especificamente em ambientes de gestão educacional, na aplicação de tarefas de associação, classificação e agrupamento, juntamente com suas respectivas técnicas.

GESTÃO DA TECNOLOGIA DA INFORMAÇÃO EM IES

A integração entre as áreas de Text Mining com Inteligência Competitiva é possível e necessária, pois as empresas possuem uma grande quantidade de informações disponíveis para análise e esta análise torna-se inviável se não for realizada com auxílio de técnicas e ferramentas computacionais. Observou-se que a aplicação de técnicas de Text Mining auxiliou no processo de tomada de decisão, através das informações escondidas nos documentos armazenados, possibilitando à IES obter vantagem competitiva.

UTILIZAÇÃO DE MINERAÇÃO DE DADOS EM GERAL

Na etapa de mineração de dados foi preparado o ambiente de análise de dados, o problema apresentado foi tomado como problema e em seguida foi selecionada a técnica de Data Mining. O trabalho investigou a aplicabilidade de um modelo de extração de conhecimento utilizando técnicas de DM, aplicado a um grupo de clientes para verificar ações de retenção. Outro trabalho foi desenvolvido por Machado Filho (2006) no qual o autor propôs o desenvolvimento de um ambiente MD, utilizando dois modelos de redes neurais artificiais, Multi Layer Perceptron (MLP) e Radial Basis Function (RBF), na classificação e predição de dados.

A utilização de técnicas de Data Mining para detecção de outliers para auxiliar a auditoria operacional com estudo de caso com dados do sistema de informação hospitalar é trabalho de Bodini Junior (2009) que propõe a utilização de algoritmos Fuzzy e Machine clustering Vector Support para destacar Outliers, que são registros encontrados em bases de dados que se destacam dos demais pela falta de similaridade.

MINERAÇÃO DE DADOS EM AMBIENTES EDUCACIONAIS

Os dados armazenados no banco de dados do ambiente foram utilizados para aplicação de tarefas de Data Mining: Árvore de Decisão e Redes Bayesianas. A descoberta do conhecimento em bases de dados é o tema de Scoss (2006) em seu trabalho de especialização. Na tarefa de associação, o autor utilizou o algoritmo ZeroR, que caracteriza o contorno de uma única linha, com base no item mais frequente da base de dados.

Após extrair os dados da base de dados da IES, os autores selecionaram os classificadores utilizados.

Figura 21 - Rede Bayesiana para Análise da Demora para Inscrição  Fonte: Dias et al ( 2008, p
Figura 21 - Rede Bayesiana para Análise da Demora para Inscrição Fonte: Dias et al ( 2008, p

CARACTERÍSTICAS DO PROBLEMA A SER TRATADO

  • Seleção, limpeza e transformação dos dados
  • Aplicação das técnicas de Mineração de Dados
  • Tipos de aprendizado
  • Aprendizagem Não Supervisionada (ANS)
    • Associação
    • Análise de Componentes Principais
    • Clusterização
  • Aprendizagem Supervisionada
    • Classificação

A tarefa de classificação visa encontrar características comuns entre um conjunto de objetos de um banco de dados e classificá-los em diferentes classes. A aplicação de técnicas de Data Mining com o objetivo de descobrir novos conhecimentos auxilia no processo de exploração de um banco de dados, o que permite a geração de informações úteis aos gestores, auxiliando-os na tomada de decisões. A pesquisa apresentou análises importantes sobre o perfil dos alunos ingressantes e egressos das IES, por meio da aplicação de técnicas de Mineração de Dados implementadas na ferramenta WEKA, Associação, Classificação e Clusterização.

A utilização de técnicas de Data Mining foi útil na descoberta de conhecimentos que estavam ocultos na base de dados do ambiente de gestão da IES.

Figura 23 - Dados para mineração em Excel  Fonte: Da pesquisa (2010)
Figura 23 - Dados para mineração em Excel Fonte: Da pesquisa (2010)

CONTRIBUIÇÕES

Nesta pesquisa foi demonstrada a relevância do processo de mineração de dados para obtenção de informações no que diz respeito à análise das informações contidas nos questionários socioeconômicos utilizados na entrada e saída da IES. No segmento de Ensino Superior, cada vez mais competitivo, o uso de técnicas de mineração de dados está se tornando obrigatório. A dificuldade inicial deste trabalho foi liberar o banco de dados da instituição, pois se trata dos dados pessoais dos acadêmicos ali cadastrados e matriculados;

Dificuldade na definição de atributos pelos gestores que estavam construindo a base de dados de mineração;

SUGESTÕES PARA TRABALHOS FUTUROS

Tese (Doutorado em Engenharia Civil) – Universidade Federal do Rio de Janeiro – UFRJ, Rio de Janeiro, 2009. Dissertação (Mestrado em Engenharia Civil) – Universidade Federal do Rio de Janeiro – UFRJ, Rio de Janeiro, 2010. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal do Rio de Janeiro, Rio de Janeiro, 1998.

Dissertação (Mestrado em Ciência da Computação) - Universidade Federal do Rio Grande do Sul - UFRG, Porto Alegre, 1997.

Imagem

Figura 1 - Distribuição da informação
Gráfico 1 - Número de IES no Brasil  Fonte: Adaptado de INEP (2010).
Gráfico 2 - Relação de alunos ingressantes no Ensino Superior  Fonte: Adaptado de INEP (2010)
Gráfico 3 - Alunos ingressantes na Educação superior à Distância  Fonte: Adaptado de INEP (2010)
+7

Referências

Documentos relacionados

A fim de se atingir o objetivo geral, os seguintes objetivos específicos serão desenvolvidos nesse trabalho: medir a lealdade dos estudantes e dos gestores