• Nenhum resultado encontrado

4 RESULTADOS DA PESQUISA

4.3 APLICABILIDADE DAS TÉCNICAS DE MINERAÇÃO DE DADOS E

A literatura sobre a possibilidade e limites de utilização de mineração de dados para mapear especialistas e especialidades é muito pouco.

A análise ocorreu a partir da análise da literatura encontrada na internet de autores como: Cardoso (2005), com o tema Gestão do conhecimento usando Data Mining: estudo de caso na UFLA; Gonçalves (2000), que utilizou de técnicas de mineração de dados em bases

de Ciência & Tecnologia, analisando os grupos de pesquisa no Brasil; Lima (2006), com a dissertação de mestrado abordando a utilização de data Warehouse e Data Mining no acompanhamento das atividades de pesquisa do Ceulp/Ulbra; e Marcelo de Paula (2004), através da dissertação retratando a exploração da plataforma Lattes como fonte de Conhecimento Organizacional em Ciência e Tecnologia.

4.3.1 Possibilidades da mineração de dados

De acordo com autores como Paiva (2007), Paula (2004), Gonçalves (2000), e Cardoso (2005), existem várias possibilidades para a exploração de base de dados sobre cadastro de pesquisas nas IES através das técnicas de mineração de dados.

Alguns exemplos práticos da aplicabilidade destes resultados na UFG poderiam ser:

a) formação do corpo docente através da identificação de competências e especialidades: a mineração de dados permitiria um melhor gerenciamento de competências e especialidades de seu corpo docente, através das análises dos dados sobre atividades de pesquisa e extensão cadastrados no banco de dados da instituição. Estes dados seriam obtidos através da comparação entre o nome do orientador e especialidades, facilitando a formação do corpo docente de acordo com a afinidade, formação e atividades correlatas desenvolvidas;

b) identificar pesquisas com potencial de geração de patentes: através da análise quantitativa, permitiria resultados quantitativos de patentes por área de conhecimento; e da análise qualitativa, através da analisa de donos das patentes, localização/ país, assunto, domínio, etc.) (OLIVEIRA, 2005);

c) identificar linhas de pesquisa em publicações científicas: a mineração de dados permitiria obter dados estatísticos importantes neste quesito, através da comparação das principais linhas de pesquisa com as publicações de um determinado conjunto de docentes e pesquisadores. Através destes dados, a instituição conheceria as linhas de pesquisas mais relevantes para cada unidade acadêmica;

d) identificar interdisciplinaridade e intercessão entre as áreas: através da mineração de dados, ocorreria o mapeamento das áreas e especialidades diferentes mais que

poderiam contribuir com suas experiências em projetos mais complexos e técnicos. Como exemplo, uma intercessão entre as áreas de Engenharia da Computação, Ciência da Computação com as áreas de Ciência da Informação e Biblioteconomia.

4.3.2 Limites da mineração de dados

Apesar de toda sua capacidade de transformar dados abstratos em informações, o uso de mineração de dados em base de dados sobre grupos de pesquisa científica pode barrar em algumas limitações:

a) limites humanos na análise dos dados: assim como outras metodologias, a utilização das técnicas de mineração de dados deve ser cautelosa, pois muitos resultados emitidos pelos softwares são analisados na maioria de forma subjetiva, e muitas vezes uma situação pode ser interpretado como uma regra. Na análise dos dados pode ocorrer uma dificuldade em perceber e interpretar inúmeros fatos observáveis ao longo de processos de mineração (GOLDSCHMIDT; PASSOS, 2005). Berry e Linoff (2000 apud FERNANDES, 2007) atribuem a importância à etapa de entendimento da mineração de dados a comunicação entre as pessoas que entendem o negócio da empresa e pessoas com habilidades quantitativas para transformar dados em conhecimento útil para a tomada de decisão;

b) softwares e tecnologias: os softwares utilizados para a mineração dos dados devem

estar prontos para muitos processos: agregar valor, efetuar conversão, filtrar variáveis, possuir formato de exportação de dados, entre outros. As técnicas de mineração ou mecanismos de busca são usualmente programas ou agentes automatizados inteligentes, incorporando alguma forma de inteligência artificial em bancos de dados relacionais (GOLDSCHMIDT; PASSOS, 2005). Muitas vezes, as técnicas adotadas pelo fornecedor são diferentes e, em conseqüência, as suas aplicabilidades também não são as mesmas (TAURION, 2008);

c) diversidade de formato dos dados: com base em Braga (2004), pode-se afirmar que em muitos casos, nas instituições como a UFG, as fontes de dados poderão estar em formatos diferentes, como planilhas eletrônicas, bancos de dados. Esta diversidade de

formato dos dados poderá tornar o início da mineração de dados mais trabalhosa, pois, todas as fontes deverão estar reunidas em uma única base de dados ou arquivo, como um Data Warehouse. Junta-se a isso, o grande número de dados repetidos, fazendo com que se tenha mais tempo na limpeza dos dados do que na seleção;

d) necessidades de testes: o processo de Data mining é cíclico, várias tarefas devem ser executadas alternando-se entre testes de hipóteses e descoberta de conhecimentos (GOLDSCHMIDT; PASSOS, 2005). Embora a ferramenta de mineração de dados seja um importante instrumento para extração de informações úteis perdidas em grandes quantidades de dados aparentemente sem relacionamentos entre si; por outro lado, um uso incorreto desta tecnologia pode gerar muito mais confusão, levando a empresa a tomar decisões erradas (TAURION, 2008);

e) escolha de algoritmos: a dificuldade na escolha de algoritmos de mineração de dados pode gerar resultados insatisfatórios. Os principais produtos de mineração de dados são apenas ferramentas que empregam potentes algoritmos, visando assuntos de negócios e técnicos (GOLDSCHMIDT; PASSOS, 2005);

f) necessidade de grande base de dados: o processo fundamental do Data Mining é o de seleção de dados. Sem uma grande base de dados, não será possível a análise que se pretende realizar, e todo o êxito do processo será frustrado (CARVALHO, 2005);

g) equipe multidisciplinar: A mineração de dados é multidisciplinar e origina de diversas áreas, como: Estatística, Inteligência computacional e Aprendizado de máquina, Reconhecimento de padrões, Banco de dados, podendo incluir a Ciência da Informação (GOLDSCHMIDT; PASSOS, 2005). A mineração de dados é uma área de pesquisa que necessita de uma equipe multidisciplinar, incluindo principalmente áreas de tecnologias de bancos de dados, inteligência artificial, estatística, reconhecimento de padrões, sistemas baseados em conhecimento, recuperação da informação, computação de alto desempenho e visualização de dado (CARDOSO, 2005).

O estudo verificou que as ferramentas de mineração de dados ainda não está sendo utilizada de forma bem ampla no contexto das IES, devido ser uma tecnologia nova. De acordo com Carvalho (2005), para ser eficiente, o Data Mining precisa ser incorporado à organização e passar a ser uma etapa natural dos outros processos empresariais como o

marketing, as vendas, o suporte ao cliente, o controle de estoque, o planejamento e o projeto do produto.