Desenho e implementação de um sistema computacional para apoiar a gestão de projectos utilizando técnicas de data mining Por

(1)

Universidade Nova de Lisboa

Faculdade de Ciências e Tecnologia

Departamento de Engenharia Electrotécnica

Desenho e implementação de um sistema computacional para apoiar a

gestão de projectos utilizando técnicas de data mining

Por

Vitor Miguel Marques Parada

Dissertação apresentada na Faculdade de Ciências e Tecnologia da

Universidade Nova de Lisboa para obtenção do grau de Mestre em

Engenharia Electrotécnica e de Computadores

Orientador: Professor Celson Lima

(2)

(3)

Agradecimentos

Gostaria de agradecer a todas as pessoas que directa ou indirectamente contribuíram para a concretização deste projecto/dissertação.

Ao Professor Celson Lima, meu orientador, pelo sentido crítico que me soube incutir e pela partilha constante de ideias e conhecimento que me ajudaram a desenvolver o presente trabalho.

Aos membros do grupo de trabalho, destacando a colaboração do João Antunes.

Também não posso deixar de agradecer a disponibilidade do João Pinto, em vários momentos complicados de programação.

Gostaria também de agradecer a toda a minha família, nomeadamente aos meus pais pelo apoio incondicional e por estarem sempre presentes.

Por último, agradeço à Ana, o apoio, a paciência, a dedicação, a presença, enfim um sem número de atributos, os quais não consigo descrever por palavras. Sem ti a realização desta dissertação e respectivo mestrado não seria possível.

(4)

(5)

Resumo

A colaboração tem sido uma mais-valia nas empresas baseadas em conhecimento pois permite a partilha de conhecimento entre funcionários, proporcionando melhorias ao nível do seu desempenho. De facto, os funcionários que utilizam as informações partilhadas podem elaborar estratégias mais eficazes e criativas, o que se traduz em vantagens competitivas.

Neste sentido, estas empresas têm suportado a ideia da criação de ambientes de trabalho colaborativos capazes de estimular os indivíduos a partilhar conhecimento. Os ambientes de trabalho colaborativos visam não só promover a partilha de conhecimento mas também aumentar o conhecimento existente, nomeadamente pela descoberta de novo conhecimento a partir de dados armazenados.

O rápido avanço das Tecnologias de Informação deu um grande contributo à área de descoberta de conhecimento em bases de dados, pois permitiu o armazenamento de quantidades consideráveis de dados em computadores. Pelo facto da análise humana do conteúdo destes dados ser limitada, falhando na detecção de detalhes importantes, foram desenvolvidas ferramentas de data mining para descoberta automática de nova informação a partir de dados armazenados.

Assim, o propósito deste trabalho é desenhar e implementar uma infra-estrutura de software que permita descobrir, a partir de bases de dados, informação não acessível pelos métodos tradicionais de análise, recorrendo para isso a conceitos e técnicas de data mining.

(6)

(7)

Abstract

Collaboration has been seen as an asset in knowledge based-organizations allowing the share of knowledge among employees and providing them better performances. Indeed, the employees are able to use the collected information in order to develop effective and creative strategies yielding competitive advantages.

Accordingly, the creation of collaborative workplaces to stimulate employees to share knowledge has been supported by these organizations. Collaborative workplaces are intended not only to promote the sharing of knowledge but also to improve the existing knowledge, namely the discovery of knowledge from stored data.

The quick progress on information technologies was fundamental to the field of knowledge discovery in databases as it allowed the storage of large amounts of data in computers. Given the fact that the human analysis of this data is limited, failing to detect important details, data mining tools were developed in order to allow automatic discovery of new information using stored data.

Thus, the main purpose of this study is to design and implement a software infrastructure to help of discovering new information from databases using data mining tools.

(8)

(9)

Lista de acrónimos

API - Application Programming Interface

BSCW - Basic Support for Cooperative Work

CoSKS - CoSpaces Knowledge Support

CSF - CoSpaces Software Framework

DER– Diagrama de Entidade Relação

DM - Data Mining

HTML - HyperText Markup Language

ICE - Interface Controlo e Entidade

IDE - Integrated Development Environment

JDBC - Java Database Connectivity

JSP - Java Server Pages

MVC - Model View Controller

ORM - Object Relational Mapping

SQL - Structured Query Language

TM - Text Mining

UML - Unified Modeling Language

(10)

Lista de termos e expressões da língua inglesa

Case Based Reasoning Clustering

Data mining Framework Fuzzy Groupware

Knowledge discovery in databases Marketing

Project post-mortem Ranking

Similar Time Series Software

(11)

Índice geral

1. Introdução ... 1

1.1 Objectivo ... 2

1.2 Contexto de desenvolvimento do trabalho. ... 2

1.3 Estrutura ... 3

2. Estado da arte ... 5

2.1 Gestão do conhecimento... 5

2.1.1 Definição de gestão do conhecimento ... 5

2.1.2 Tipos de conhecimento ... 6

2.1.3 O conhecimento como recurso das empresas ... 9

2.2 Gestão do conhecimento colaborativa ... 11

2.2.1 O conceito de mercados de conhecimento ... 11

2.2.2 Tecnologias que suportam a colaboração em projectos de gestão do conhecimento ... 13

2.2.3 Ineficiências da gestão do conhecimento colaborativa ... 15

2.3 DM como ferramenta no processo de gestão do conhecimento ... 16

2.3.1 Etapas do processo de descoberta de conhecimento ... 16

2.3.2 Tarefas de DM ... 17

2.3.3 Técnicas de DM ... 19

2.3.4 Aplicações do DM ... 21

2.3.5 Text Mining... 22

2.3.6 Análise de ferramentas de DM ... 23

2.4 Síntese ... 25

3. Requisitos e modelo conceptual ... 27

3.1 Termos ... 27

3.2 Os requisitos do projecto CoSpaces ... 29

3.3 Bases Conceptuais ... 33

3.4 DM como suporte à tomada de decisão ... 36

3.5 Fundamentos técnicos do CoSKS ... 38

3.6 O Miner ... 40

(12)

3.6.2 Os serviços do Miner ... 42

4. Implementação ... 47

4.1 Tecnologias adoptadas no trabalho ... 47

4.2 A infra-estrutura do software Miner ... 50

4.2.1 Formalização do Miner ... 51

4.2.2 Visão estrutural do Miner ... 56

4.2.2.1 O nível interface ... 57

4.2.2.2 O nível controlo ... 59

4.2.2.3 O nível entidade ... 61

4.2.2.4 Correspondência entre serviços Miner, métodos e tabelas ... 65

4.3 Descrição do contributo das ferramentas mais importantes na implementação do Miner ... 67

4.3.1 Utilização do BSCW ... 67

4.3.2 Utilização do RapidMiner ... 68

4.4 Pequeno exemplo de validação do sistema ... 70

5. Conclusões ... 77

5.1 Síntese do trabalho ... 77

5.2 Contribuição da pesquisa ... 78

5.3 Trabalhos futuros ... 79

Referências bibliográficas ... 81

ANEXO A - Diagrama de entidade relação ... 87

ANEXO B - BSCW ... 88

(13)

Índice de figuras

Figura 2.1 - Quatro modos de conversão do conhecimento 8 Figura 2.2 - A espiral do conhecimento de Nonaka e Takeuchi 9 Figura 2.3 - Modelo para mercado do conhecimento proposto por Simard 12 Figura 2.4 - Categorização de ferramentas para conhecimento 14 Figura 2.5 - Data mining e o processo knowledge discovery in database 17 Figura 3.1 - Visão geral da arquitectura do CSF 30

Figura 3.2 - Requisitos do CoSKS 31

Figura 3.3 - Bases conceptuais do trabalho 33 Figura 3.4 - Ponto de decisões do projecto 34 Figura 3.5 - Níveis do conhecimento CoSpaces 35 Figura 3.6 - Fases do processo de colaboração 37

Figura 3.7 - Níveis técnicos do CoSKS 38

Figura 3.8 - Interfaces do Miner 41

Figura 3.9 - Serviços do Miner 43

Figura 4.1 - Interacções entre as tecnologias adoptadas 50 Figura 4.2 - Diagrama de casos de uso dos projectos 52 Figura 4.3 - Diagrama de casos de uso das reuniões 53 Figura 4.4 - Diagrama de casos de uso das tarefas 54 Figura 4.5 - Diagrama de casos de uso das questões 55 Figura 4.6 - Diagrama de casos de uso dos documentos 55

Figura 4.7 - Diagrama de classes ICE 57

Figura 4.8 - Interface projecto 57

Figura 4.9 - Interface reunião 58

Figura 4.10 - Interface questão 58

(14)

Figura 4.12 - Interface documento 59

Figura 4.13 - Controlo projecto 60

Figura 4.14 - Controlo reunião 60

Figura 4.15 - Controlo questão 60

Figura 4.16 - Controlo tarefa 60

Figura 4.17 - Controlo documento 60

Figura 4.18 - Entidade projecto 61

Figura 4.19 - Excerto do DER (Ligações dos projectos) 62

Figura 4.20 - Entidade reunião 62

Figura 4.21 - Excerto do DER (Ligações das reuniões) 63

Figura 4.22 - Entidade questão 63

Figura 4.23 - Entidade tarefa 63

Figura 4.24 - Excerto do DER (Ligações das tarefas e questões) 64

Figura 4.25 - Entidade documento 64

Figura 4.26 - Excerto do DER (Ligações dos documentos) 65

Figura 4.27 - Estrutura do BSCW 67

(15)

Índice de tabelas

Tabela 2.1 - Dois tipos de conhecimento 7

Tabela 2.2 - Ferramentas DM 25

Tabela 3.1 - Termos básicos e definições 27

Tabela 4.1 - Tecnologias adoptadas 47

(16)

(17)

1. Introdução

A gestão do conhecimento tem vindo a impor-se como uma área em crescimento em vários domínios. Em grande parte, este crescimento deve-se à consciencialização de que os dados armazenados pelas empresas têm de ser necessariamente valorizados. Actualmente, o conhecimento constitui um componente crítico para o sucesso de uma empresa. Neste sentido, o principal objectivo da gestão do conhecimento é melhorar a performance das empresas, permitindo que os indivíduos, no seio dessas empresas, possam capturar, partilhar e aplicar o seu conhecimento para tomar decisões, ao mesmo tempo em que promovem inovações em termos de processos, produtos, estratégias de negócio, etc..

Por outro lado, o facto de as empresas estarem cada vez mais distribuídas geograficamente, obriga os funcionários a trabalharem com colegas distantes e esta foi uma das razões responsáveis pelo desenvolvimento de sistemas de colaboração. Estes sistemas são concebidos para melhorar os processos de tomadas de decisão em grupo, para facilitar a partilha de conhecimento e estimular a interacção entre os indivíduos, reduzindo as actividades desorganizadas. Deste modo, a gestão do conhecimento é inerentemente colaborativa e, na realidade, o que pretende é somar esforços e competências no sentido de atingir uma determinada meta que seria muito difícil de atingir individualmente.

O desenvolvimento de novas metodologias colaborativas permitirá criar um ambiente em que os indivíduos possam expressar a sua criatividade, o que constitui sem dúvida uma mais-valia para a gestão do conhecimento e logo para a organização e sucesso das empresas.

(18)

1.1 Objectivo

No presente trabalho pretende-se desenvolver uma ferramenta de software capaz de melhorar o processo de gestão de projectos, baseando-se em conceitos e técnicas de data mining (DM), que permita capitalizar o conhecimento histórico criado em projectos semelhantes.

Esta ferramenta deve fornecer informações sobre casos históricos de projectos anteriores que facilitem o processo de tomada de decisões, nomeadamente:

 Oferecer um conjunto de soluções para auxiliar a resolução de um problema particular ou geral;

 Seleccionar participantes para uma tarefa ou projecto específico, de acordo com as suas características;

 Facultar informação relativa a custos e tempo de execução médios de projectos de uma determinada área; e

 Disponibilizar um conjunto de documentos relacionados com determinado assunto.

1.2 Contexto de desenvolvimento do trabalho.

Este trabalho foi desenvolvido no âmbito do projecto CoSpaces, um projecto integrado financiado pelo programa de Tecnologias de Informação da Sociedade (IST – Information Society Technologies) da Comissão europeia (EC-IST FP6), que pretende dar resposta às necessidades colaborativas, actualmente sentidas pelas grandes indústrias.

(19)

produtividade e reduzir a duração dos ciclos de produção. Assim, o sucesso deste projecto dependerá inevitavelmente de uma actuação a vários níveis e que deverá incluir uma melhoria das técnicas para comunicação humana, o desenvolvimento de processos de visualização inovadores e um maior apoio ao conhecimento assim como interacção natural.

O componente do projecto CoSpaces que se relaciona directamente com o presente trabalho é o componente de conhecimento do CoSpaces (CoSpaces Knowledge Component). Este componente é constituído por um conjunto de serviços semânticos, direccionados para o conhecimento (CoSKS). Por sua vez, estes serviços devem possuir funcionalidades para apoiar as necessidades de conhecimento identificadas no projecto CoSpaces.

Este trabalho usa o modelo conceptual proposto para o CoSKS e explora a implementação de um novo módulo, responsável pela realização de data mining, de modo a contribuir para um melhor aproveitamento de conhecimento, no seio do modelo proposto pelo projecto CoSpaces.

1.3 Estrutura

O presente documento encontra-se organizado em cinco capítulos, conforme se descreve em seguida.

O Capítulo II aborda os fundamentos teóricos que suportam o tema do trabalho. Assim, descrevem-se algumas das definições mais importantes no contexto da gestão do conhecimento e dos processos de colaboração. Por outro lado, apresenta-se também uma descrição das principais técnicas e aplicações de DM.

(20)

modo a contribuir para a colaboração no desenvolvimento de projectos de engenharia.

O Capítulo IV analisa a implementação do Miner e mostra as possíveis aplicações dos seus serviços no contexto da ferramenta criada para gestão de projectos.

(21)

2. Estado da arte

2.1 Gestão do conhecimento

Foi em 1960 que o filósofo e economista austríaco, Peter Drucker, introduziu o termo

“knowledge worker” [1] e a ele viria mais tarde a ser atribuída a paternidade da

disciplina de Gestão do Conhecimento. No entanto, só na década de 90 é que se observa um desenvolvimento significativo deste conceito. Autores como Nonaka e Takeuchi [2] estudaram como o conhecimento é produzido, utilizado e difundido no seio das empresas japonesas e de que modo pode contribuir para a difusão de inovação. Vários outros estudiosos, reconhecendo o potencial do conhecimento dentro das empresas, começaram a explorar o melhor modo de gerir o conhecimento, originando assim o aparecimento de vários sistemas computacionais e modelos para gerir o conhecimento produzido.

2.1.1 Definição de gestão do conhecimento

De acordo com a área de trabalho em que o conceito gestão do conhecimento foi aplicado, surgiram diferentes definições. Por exemplo, segundo o empresário Grey a gestão do conhecimento é uma abordagem colaborativa e integrada para a criação, captura, organização, acesso e utilização dos activos intelectuais de uma empresa [3]. Por sua vez, Carl Frappaolo um homem da ciência, propôs que a gestão do conhecimento consiste num aproveitamento da sabedoria colectiva para aumentar a capacidade de resposta e de inovação das empresas [4].

A gestão do conhecimento também foi definida como o conceito segundo o qual a informação é transformada em conhecimento facilmente aplicado pelos indivíduos [5].

(22)

sinérgica que permite obter vantagens estratégicas para uma determinada tarefa, num determinado contexto [6].

Uma das definições mais utilizadas para gestão do conhecimento é a elaborada por Nonaka e Takeuchi. Estes autores definiram gestão do conhecimento como um processo para aplicação de uma abordagem sistemática de aquisição, estruturação, gestão e difusão de conhecimento dentro de uma empresa, de modo a permitir práticas de trabalho melhores e mais rápidas, assim como reduzir os custos financeiros [2]. Esta definição é também convergente com a definição utilizada por Davenport e Prusak, sendo que os autores adoptam os mesmos termos e ideias. No entanto, note-se que a definição de Nonaka e Takeuchi prima mais pelo indivíduo, enquanto a de Davenport e Prusak pelo ambiente social [7].

Por ser uma compilação de muitas estratégias, ferramentas e técnicas, é difícil encontrar uma definição simples de gestão do conhecimento. Actualmente considera-se que a gestão do conhecimento engloba tudo o que tem a ver com o conhecimento, deste modo uma boa definição deve incluir todas as perspectivas de criação, representação, armazenamento, distribuição e gestão do conhecimento [8].

2.1.2 Tipos de conhecimento

De acordo com o descrito na secção anterior, verifica-se que não é trivial definir gestão do conhecimento. No que respeita ao conhecimento em si, também muitas teorias surgiram ao longo dos anos, propondo classificações para o conhecimento. Wiig, por exemplo, considerou que existem quatro tipos principais de classificação de conhecimento, factual, conceptual, expectante e metodológico [9].

(23)

Na década de 60, Michael Polanyi classificou o conhecimento em apenas dois tipos, tácito e explícito [11], tendo sido seguido por outros autores, nomeadamente Nonaka e Takeuchi [2]. A tabela 2.1 apresenta uma comparação entre os dois tipos de conhecimento supracitados.

Tabela 2.1: Dois tipos de conhecimento [2]

Conhecimento Tácito (Subjectivo) Conhecimento Explicito (Objectivo)

Conhecimento de experiência (Corpo) Conhecimento racional (Mente) Conhecimento simultâneo (Aqui e

Agora)

Conhecimento sequencial (Além)

Nonaka considera que o conhecimento tácito é difícil de articular e também difícil de colocar em palavras ou desenhos, sendo por isso altamente pessoal. É difícil de formalizar, tornando-o difícil de comunicar aos outros, estando também muito dependente das acções individuais e do contexto. Quanto ao conhecimento explícito, segundo o mesmo autor, este conhecimento representa o conteúdo que é capturado, como palavras ou imagens, é um conhecimento formal e sistemático. Deste modo, pode ser facilmente comunicado e partilhado, através das especificações de um produto, de uma fórmula científica ou de um programa de computador. Assim, Nonaka deduz que o potencial do conhecimento está na interacção entre o conhecimento tácito e explícito [12].

Juntamente com Takeuchi, Nonaka apresentou um modelo dinâmico de criação de conhecimento que se apoia no facto do conhecimento humano ser criado e expandido através de interacções sociais entre conhecimento tácito e conhecimento explícito [2]. Os autores chamam a esta interacção “conversão de conhecimento”. A

(24)

geração de conhecimento, como Modelo SECI – Socialização, Exteriorização, Combinação e Interiorização, onde:

 Socialização: conversão de conhecimento tácito em conhecimento tácito. Partilha de experiências, modelos mentais e habilidades técnicas. A chave para adquirir conhecimento tácito é a experiência.

 Exteriorização: conversão de conhecimento tácito em conhecimento explícito. Processo de articulação de conhecimento tácito em conceitos explícitos, em que o conhecimento tácito faz uso de metáforas, analogias, conceitos, hipóteses ou modelos, passando a conhecimento explícito.

 Combinação: conversão de conhecimento explícito em conhecimento explícito. Processo se sistematização de conceitos dentro do sistema de conhecimento. Os indivíduos trocam e combinam conhecimento através de diversos meios, tais como, documentos, reuniões, redes de computadores.

 Interiorização: conversão de conhecimento explícito em conhecimento tácito. Está relacionada com a prática, para o conhecimento explícito se tornar tácito, é útil que o conhecimento seja verbalizado ou esquematizado em documentos.

Figura 2.1: Quatro modos de conversão do conhecimento [2]

(25)

um processo em espiral, começando no nível individual e movendo-se para cima, por intermédio da expansão de comunidades interactivas, que vão abrangendo outros sectores e departamentos da empresa.

Figura 2.2 - A espiral do conhecimento de Nonaka e Takeuchi [2]

2.1.3 O conhecimento como recurso das empresas

Desde sempre, o capital foi considerado o principal recurso estratégico das empresas. No entanto, com a introdução do conceito de gestão do conhecimento, o conhecimento passou a ser encarado como um recurso de elevado potencial, nomeadamente no sentido de vir a proporcionar vantagens competitivas [13].

Esta visão de organizações baseadas em conhecimento tem sido amplamente explorada e levou à classificação dos recursos de conhecimento disponíveis e que devem ser considerados na implementação de iniciativas de gestão do conhecimento, numa organização. Leonard-Bartion identificou dois tipos de recursos de conhecimento: o conhecimento dos empregados e os sistemas físicos constituídos pelas bases de dados físicas. [14]. Por sua vez, Petrach identificou outros recursos de conhecimento. Para além de reconhecer os empregados como capital humano, adicionou os clientes (capital dos clientes), processos da organização, estruturas da organização e a cultura da organização, referindo-se a estes três últimos como capital da organização [15].

Aquisição

Implementação

Optimização

Conceptualização Criação

Inter-Organização

Organização

Grupo

(26)

No processo de gestão do conhecimento, os dados das organizações são operados por processadores humanos ou computadores, na realização de actividades de manipulação de dados de modo a criar conhecimento, sob a forma de aprendizagem ou projecções. O processo de gestão do conhecimento é influenciado por uma variedade de factores. Holsapple e Joshi consideram que, para além da criação de conhecimento por processadores de conhecimento, as organizações apresentam outras actividades a operar nos recursos de conhecimento e que também devem ser consideradas, nomeadamente a aquisição, internacionalização, selecção e partilha de conhecimento [16].

Dada a complexidade do processo, vários autores têm vindo a desenvolver modelos e programas que visam a introdução da gestão do conhecimento no seio das organizações.

Skryme admite que um programa de gestão do conhecimento deve ser explícito, sistemático, vital e processual. Portanto, tem de ser um conjunto de actividades com ferramentas e técnicas próprias, que actuam sobre conjunto de dados conhecidos (explícitos e vitais), de uma forma sistemática [17].

(27)

Finalmente, na quarta estratégia, direccionada principalmente a serviços financeiros e indústrias de manufactura em geral, a gestão do conhecimento deve permitir realçar os processos de negócios e gestão, identificando o conhecimento e tornando-o acessível sempre que necessário [18].

Elliot e O’Dell, em 1999, sugeriram que os quatro elementos chave, imprescindíveis

para o sucesso da gestão do conhecimento numa empresa, são a cultura, a tecnologia, as infra-estruturas e avaliação do desempenho. Actualmente, estes elementos são admitidos como peças fundamentais na gestão do conhecimento. A cultura influencia todos os comportamentos dos indivíduos e a tecnologia promove as ferramentas que possibilitam o desenvolvimento das comunicações. Por sua vez, as infra-estruturas constituem as regras de suporte aos processos da empresa. Por último, a avaliação, é fundamental porque permite avaliar os desempenhos e decidir a necessidade de corrigir estratégias [19].

2.2 Gestão do conhecimento colaborativa

Da discussão apresentada na secção anterior, resulta a ideia de que a gestão do conhecimento depende, inevitavelmente, das capacidades colectivas dos indivíduos que partilham o conhecimento, durante o processo. Actualmente, a colaboração tem vindo a ser definida, por vários autores, como um dos três pilares da gestão do conhecimento, a par das etapas de consulta e partilha de dados [20].

2.2.1 O conceito de mercados de conhecimento

Em 1998, os autores Davenport e Prusak, reconhecendo a importância de estudar a etapa de colaboração, nos processos de gestão do conhecimento, introduziram o

(28)

eficientes. Assim, identificaram como participantes no mercado os vendedores, os compradores e os correctores. Os compradores foram definidos como indivíduos que pretendem resolver uma determinada situação complexa, para a qual não há uma solução simples, enquanto os vendedores são indivíduos na posse de conhecimento substancial sobre um determinado processo ou área, passível de ser partilhado. Por último, os correctores são os moderadores do processo de partilha de conhecimento, responsáveis por realizar contactos entre compradores e vendedores.

Outro aspecto dos mercados do conhecimento estudado pelos autores, é a questão do sistema de preços a praticar, ou seja, como as empresas podem trocar o seu capital intelectual. Davenport e Prusak consideram que para o mercado operar eficientemente é necessário que factores como a reciprocidade, o respeito, o altruísmo e a confiança, sejam apresentados pelos intervenientes do mercado.

Para facilitar esta questão do pagamento, Simard propôs um modelo de mercado com uma natureza sequencial, cíclico e composto por nove estágios (figura 2.3).

Figura 2.3 - Modelo para mercado do conhecimento proposto por Simard [21]

(Performance / Fornecimento) 1.Criar 2.Transformar 3.Permitir 4. Usar internamente 5. Transferir 6. Adicionar valores 7. Usar profissionalmente 8. Usar personalizadamente 8. Avaliar

(Mercado / Procura)

Organização

Ciências da Terra

Energia Silvicultura Metais &

(29)

Os primeiros cinco estágios (produção e transferência de conhecimento) ocorrem no interior da empresa e os últimos quatro estágios são externos à empresa (intermediários e clientes). Neste tipo de mercado cíclico, ambos os processos de pedido e fornecimento de informação estão contemplados para cada membro do mercado (compradores e vendedores), garantindo assim que todos os membros disponibilizem e recebam conhecimento [21].

2.2.2 Tecnologias que suportam a colaboração em projectos de gestão do

conhecimento

A necessidade das empresas actuarem em locais geograficamente dispersos e de poder utilizar todos os participantes, levou à procura de meios eficientes para facilitar o contacto a longa distância. Este tem sido um grande desafio para as empresas e neste sentido, a busca de novas ferramentas e sistemas tecnológicos que facilitem o trabalho colaborativo tem sido vital [22].

Para facilitar o processo colaborativo, a gestão do conhecimento suporta a ideia de um ambiente de trabalho de elevado desempenho, um modo de trabalho que permita estimular os empregados, parceiros ou clientes de uma empresa a criar, obter e organizar o conhecimento e tornarem-se mais colaborativos e inovadores [12]. A implementação destes ambientes de trabalho tem sido facilitada pelo aumento da velocidade das redes e as inovações dos computadores actuais também têm facilitado a utilização de ferramentas e sistemas de capacidade elevada.

(30)

sistemas de armazenamento de dados, sistemas de DM, videoconferência [25]. Muitas destas tecnologias são utilizadas tanto em gestão do conhecimento individual como em trabalhos colaborativos. Por outro lado, existem outras que constituem plataformas exclusivamente de colaboração e comunicação entre profissionais, como é o caso do Groupware (aplicações de trabalho em grupo ou entre grupos) [24].

Os autores Bafoutsu e Mentzas propuseram uma classificação das ferramentas de gestão do conhecimento e a sua relação com o nível de funcionalidade para colaboração [26]. As quatro categorias, de acordo com os autores, estão distribuídas num gráfico a duas dimensões (figura 2.4), com o eixo dos X a representar os níveis de colaboração, começando com os serviços que promovem a simples comunicação e terminando nos serviços que promovem a colaboração e interacção humana. Por outro lado, o eixo dos Y representa a capacidade de gestão de documentos, começando na simples partilha de documentos e terminando no trabalho síncrono num documento.

Figura 2.4 - Categorização de ferramentas para conhecimento [26]

Trabalho sincronizado em documentos Gestão de documentos agement Partilha de ficheiros e documentos

Agrupar ficheiros e manuseamento de documentos Conferência por computador Ambiente de trabalho electrónico Sistemas electrónicos de reunião Quadro

de avisos E-mail Notificação de E-mail Chat Quadro _branco Discussões Multimédia Ecrã partilhado

Agenda

Votação Minuta Capacidade de apresentação

Gestão de documentos

(31)

Ainda neste estudo, os autores elaboraram uma lista de serviços colaborativos constituída por 47 sistemas, alguns deles disponíveis comercialmente, outros permanecendo como protótipos. Estes sistemas disponibilizam vários serviços colaborativos tais como bulletin board, e-mails, chat e videoconferência.

2.2.3 Ineficiências da gestão do conhecimento colaborativa

São cada vez mais frequentes os projectos sobre gestão do conhecimento descritos na literatura, sendo que nem todos têm sido bem sucedidos. De acordo com Davenport e Prusak, há vários factores que podem estar na origem destes projectos falhados. O facto de existir informação incompleta sobre um determinado assunto ou de não ser possível encontrar a informação pretendida, a assimetria de conhecimento, nomeadamente por uma das partes ter mais informação a partilhar do que outra, têm constituído entraves para o processo de colaboração.

(32)

processado. Segundo os autores, a identificação destes factores culturais como barreiras para o processo de gestão do conhecimento, é o primeiro passo para o desenvolvimento de uma estratégia que permita uma gestão do conhecimento muito mais eficaz.

Segundo os mesmos autores, a identificação destes factores é um grande passo para a resolução dos problemas encontrados nos projectos colaborativos e pode contribuir para o desenvolvimento de projectos colaborativos de gestão do conhecimento mais eficientes.

2.3 DM como ferramenta no processo de gestão do conhecimento

O processo de gestão do conhecimento é interactivo, envolvendo várias ferramentas que permitem adquirir conhecimento. Uma dessas ferramentas é o DM, que permite analisar grandes quantidades de dados e identificar padrões válidos nos dados originais.

2.3.1 Etapas do processo de descoberta de conhecimento

Em 1996, Fayyad e colaboradores identificaram várias etapas no processo de descoberta de conhecimento (figura 2.5) [28]:

1. Reconhecimento do domínio da aplicação e o conhecimento que será relevante, ou seja, identificação do objectivo do processo.

2. Selecção de um conjunto de dados alvo, nos quais o processo de gestão do conhecimento será aplicado.

3. Limpeza e processamento dos dados, sendo que nesta etapa, as operações incluem por exemplo a remoção de ruídos, a escolha de estratégias para lidar com campos em falha ou contabilizar as alterações que possam ser realizadas. 4. Redução e projecção de dados, utilizando técnicas que representem os dados

(33)

5. Adequação dos objectivos em questão a um método de DM (sumarização, classificação, regressão, clustering).

6. Realização da análise exploratória, escolhendo um algoritmo de DM, assim como os parâmetros que serão adaptados.

7. Aplicação do DM, em busca de padrões de interesse em representações particulares, tais como diagramas em árvore, regressões ou clustering.

8. Interpretação dos padrões obtidos e eventualmente repetir o processo até esta etapa.

9. Actuação sobre o conhecimento descoberto, incorporação noutro sistema para posterior acção ou simplesmente documentação.

Figura 2.5 - Data mining e o processo knowledge discovery in databases [28]

Não se deve confundir DM e knowledge discovery in databases (KDD). Enquanto este último trata-se do processo de encontrar informações úteis e padrões nos dados, o DM utiliza algoritmos para extrair informação e padrões determinados pelo processo de KDD.

2.3.2 Tarefas de DM

À medida que o conceito de gestão do conhecimento ganhou importância, a criação de ferramentas de DM sofisticadas para a realização das análises de dados

Selecção

Processamento

Transformação

Data Mining

Interpretação

Dados

Conhecimento

Dados alvo

Processamento dos dados

Transformação dos dados

Padrões …

…

(34)

tornou-se cada vez mais uma necessidade. Actualmente, com o desenvolvimento destas ferramentas, é possível realizar algumas tarefas, a partir dos dados existentes, das quais se destacam [29, 30]:

1. Processamento de dados: de acordo com os objectivos pretendidos no processo KDD, a análise dos dados pode incluir a selecção, filtração, agregação, amostragem, limpeza ou transformação dos dados.

2. Predição: dado o valor de um determinado dado e um modelo de predição, é previsto o valor de um atributo específico.

3. Regressão: na presença de um conjunto de dados, é efectuada a análise da dependência de alguns dos valores em função de outros.

4. Regras de classificação: dado um conjunto de classes predefinidas, é determinado a qual dessas classes um conjunto de dados específico pertence. 5. Regras de clustering: dado um conjunto de dados, estes são agrupados de

acordo com o seu grau de semelhança, permitindo uma melhor identificação dos mesmos.

6. Regras de associação (sumarização): dado um conjunto de dados, são identificadas as relações e padrões existentes entre atributos.

7. Visualização dos dados: a visualização desempenha um papel importante na descoberta de conhecimento compreensível e interpretável pelos seres humanos.

8. Análise exploratória de dados: é a exploração interactiva de um conjunto de dados que não revelam relações evidentes, de modo a identificar padrões interessantes.

(35)

2.3.3 Técnicas de DM

De modo a possibilitar a execução do conjunto de tarefas descritas anteriormente, têm sido desenvolvidas técnicas de DM. Cada técnica poderá realizar uma ou mais tarefas. Contudo, em qualquer uma das técnicas, a existência de algoritmos tem como principal objectivo extrair informação e encontrar padrões semelhantes nos dados.

Inicialmente, as técnicas de DM baseavam-se em métodos estatísticos, tais como regressões não paramétricas e ferramentas como validação-cruzada. No entanto, em paralelo com o crescimento dos processos de DM, a ciência computacional experimentou um avanço nos modelos de redes neuronais e novos algoritmos, tais como o clustering, que permitiram executar rapidamente as análises estatísticas tradicionais em conjuntos grandes de dados [31]. De entre as muitas técnicas existentes que realizam DM, destacam-se as seguintes [29]:

(36)

semelhante não pode ser aplicado como sendo solução para o novo caso, há necessidade de verificar e aplicar apenas as características da solução que sejam úteis para resolução do novo caso); e (iv) retenção (armazenar o novo caso e respectiva solução para futuras recuperações).

 Redes Neuronais: Trata-se de uma técnica que utiliza uma abordagem computacional com o desenvolvimento de estruturas matemáticas com capacidade de aprendizagem. Uma rede neuronal consiste num número de elementos interligados (neurónios) que possuem entrada, saída e processamento. De modo a construir um modelo com redes neuronais é necessário, inicialmente realizar um treino da rede recorrendo a um conjunto de dados e, nesse caso é utilizada esta rede para realizar predições. Existem alguns problemas quando se pretendem usar redes neuronais, nomeadamente pelo facto de serem difíceis de compreender e só aceitarem dados numéricos, pelo que todos os dados têm de ser convertidos em dados numéricos.

 Árvores de decisão: uma árvore de decisão utiliza uma estratégia de “dividir para conquistar”. Tenta decompor um problema complexo em problemas mais simples e, isso é feito recursivamente até se chegar a uma resposta/solução. As árvores de decisão são constituídas por nós (que representam os atributos dos dados) e por ramos (que representam os possíveis caminhos ao longo da árvore). Em cada nó da árvore é colocada uma questão e, dependendo da resposta, segue-se um ramo da árvore até se chegar a uma resposta pretendida.

 Regras de Indução: esta técnica refere-se à detecção de tendências que se verificam dentro de grupos de dados.

(37)

das espécies. De um conjunto de soluções existentes para um determinado problema, que competem umas com as outras, as melhores soluções são seleccionadas e combinadas entre si. O objectivo passa por encontrar a melhor solução para o problema, de um modo semelhante ao processo de evolução de uma população de organismos. Os algoritmos genéticos são usados no processo DM para formular hipóteses sobre dependência entre variáveis, na forma de regras de associação

 Conjuntos Fuzzy: os conjuntos Fuzzy são a chave para a representação e processamento de incertezas (imprecisão, inespecificidade, inconsistência, etc) existentes nas bases de dados. Por outro lado, a lógica Fuzzy constitui uma ferramenta poderosa para lidar não só com incertezas, podendo também ser útil no desenvolvimento de modelos de incerteza dos dados.

2.3.4 Aplicações do DM

Actualmente encontram-se descritos vários exemplos concretos da sua utilização nas mais diversas áreas. Nomeadamente, ao nível do marketing, o DM pode ser utilizado para identificar diferentes grupos de clientes e prever o seu comportamento. Por exemplo, em 1996, Agrawal aplicou um sistema de modo encontrar padrões de associação na venda de produtos num supermercado, ou seja, tentou avaliar se a compra de determinado produto implica a compra de outro produto [32].Também ao nível da indústria, o DM tem permitido encontrar respostas importantes. Um destes exemplos é o sistema de solução de problemas Cassiopée, desenvolvido, pela General Electric e a SNECMA, o qual foi aplicado por três grandes companhias aéreas europeias para diagnosticar e prever problemas para o Boeing 737.

(38)

económicos ou não, associados principalmente a testes médicos. Neste estudo, obtiveram-se “novos conhecimentos” tais como, a diminuição de internamentos de

longa duração, o aumento do número de diagnósticos secundários. Segundo o autor, os conhecimentos obtidos podem ser indicadores importantes para a análise de gestão e de planeamento hospitalar [33].

Por outro lado, Luan, na área da educação, propôs a utilização de técnicas de clustering para a análise compreensiva de características de estudantes e de técnicas de predição para estimativa de probabilidades de comportamentos, tais como a persistência, retenção e sucesso escolar [34]. Um exemplo de aplicação proposto, neste projecto, inclui a utilização de DM para prever a possibilidade de cada estudante matriculado num determinado colégio (College of Silicon Valley) voltar a estudar. A lista obtida, com os nomes de estudantes com probabilidade reduzida de voltar a estudar, é utilizada para permitir gerir/intervir na situação destes alunos. Neste artigo também se discute a aplicação de DM em educação superior.

2.3.5 Text Mining

O text mining (TM), à semelhança do processo de DM, identifica relações entre conjuntos de dados. No caso do TM o que se pretende é a descoberta de informação nova, pela extracção automática de informação de várias fontes de texto escrito [35].

(39)

1. Propriedades das palavras: deve-se estudar a relação entre a forma das palavras e o seu significado. Por exemplo, a palavra “banco” pode representar

uma instituição financeira, ou um assento.

2. Remoção de stop words: palavras que não contém informação relevante na aplicação do TM, por exemplo na língua portuguesa temos: a, à, de, e, ou, com, etc..

3. Stemming: processo de redução de todas as palavras a um termo mínimo,

possível de comparação. Por exemplo a palavra “informação” poderá ser

reduzida a “info”, deste modo, quando se analisa o texto, as palavras informar,

informador, também serão reconhecidas.

4. Frequência de palavras: determinação da frequência de uma palavra ou uma sequência de palavras existentes no texto.

Os procedimentos descritos anteriormente fazem parte da etapa de preparação do processo de TM. Segundo Liddy, o processo de TM é constituído por três fases: preparação (limpeza do dados), processamento (utilização de um algoritmo de TM para processar os dados preparados) e análise (avaliação do conhecimento descoberto e avaliação da sua importância) [37].

De acordo com Cios e colaboradores, se os processos de TM forem bem implementados, podem constituir uma mais-valia principalmente no que respeita a recuperação de informação [38].

2.3.6 Análise de ferramentas de DM

(40)

Dada a impossibilidade de analisar todas as ferramentas de DM actualmente disponíveis, optou-se por analisar cinco destas ferramentas, todas de licença pública e que se encontram entre as mais populares devido às suas qualidades:

 MiningMart: ferramenta gráfica para pré-processamento de dados e DM em bases de dados desenvolvida com o objectivo de realizar o pré-processamento de grandes volumes de dados [39].

 Orange: ferramenta que inclui uma grande variedade de padrões e algoritmos de DM, além de rotinas para entrada e manipulação de dados [40].

 Tanagra: ferramenta de DM com propósitos académicos e de investigação que permite a utilização de várias técnicas de DM tais como a análise exploratória e visualização de dados [41].

 Weka: ferramenta de software mais utilizada para efectuar tarefas de DM. Os seus algoritmos podem ser aplicados directamente a um conjunto de dados a partir da sua própria interface ou utilizando o próprio código Java. Contém ferramentas de pré-processamento, classificação, regressão, clustering, regras de associação e visualização [42].

 RapidMiner: consiste num ambiente de KDD que fornece uma rica variedade

de métodos. O RapidMiner é reconhecido como uma versão melhorada do Weka, incluindo todas as suas funcionalidades [43].

Vários autores têm estudado os factores de decisão que devem ser considerados para seleccionar as ferramentas mais adequadas para determinado projecto de software [44, 45].

(41)

capacidade de realizar TM, assim como as tarefas de DM permitidas. Na interface gráfica consideraram-se três características principais, a representação gráfica

uma vez que esta permite uma melhor interpretação assim como um aparência mais user-friendly dos dados, a visualização de dados que avalia a capacidade de representar dados por intermédio de gráficos, tabelas ou outras estruturas semelhantes e a gestão de dados, nomeadamente a capacidade da ferramenta disponibilizar opções que permitem a realização de operações de manipulação de dados tais como remover ou alterar linhas, colunas, etc..

Tabela 2.2: Ferramentas DM (adaptado de [46])

Repre se nt aç ão grá fica V is ual iza çã o de dados Ge stão de da dos Cla ss ifi ca çã o Regre ss ão Clus teri ng Regra s de as soc ia çã o

Ferramenta Linguagem

Conectividade a base de

dados

TM Interface

Gráfica Tarefas DM

MiningMart Java S S B A B B N N

Orange C++ N  S A A M N M M

Tanagra C++ N N A A A M A A

Weka Java S  S A A A A A A

RapidMiner Java S  S A A A A A A Legenda: N - não suporta B - suporte básico M - suporte médio A - suporte avançado

2.4 Síntese

(42)

utilização de DM para explorar o conteúdo dos dados armazenados podem aumentar o desempenho de empresas e instituições em várias áreas.

(43)

3. Requisitos e modelo conceptual

Este capítulo apresenta os requisitos que conduziram o desenvolvimento do Miner e o respectivo modelo conceptual que suportou a sua implementação. Numa primeira fase são discutidos os requisitos mínimos e necessários para que o Miner funcione em harmonia com a arquitectura CoSKS. Em seguida relacionam-se três conceitos fundamentais e que de algum modo contribuem para o desenvolvimento de projectos de engenharia: colaboração, conhecimento e raciocínio e discute-se o modo como cada um dos elementos é importante para o Miner. Por último descreve-se o conceito Miner, a interacção do Miner dentro do CoSKS, os respectivos serviços do Miner e sua contribuição no desenvolvimento dos projectos.

3.1 Termos

Os termos mais utilizados neste trabalho encontram-se definidos na tabela 3.1.

Tabela 3.1: Termos básicos e definições

Termo Definição

Projecto

Conjunto de questões, tarefas, reuniões realizado por um conjunto de pessoas/empresas, de um modo organizado e colaborativo, num determinado período de tempo, com o objectivo de produzir/realizar/atingir alguma coisa.

Questão

Qualquer desvio, problema ou assunto que possa surgir ao longo do tempo de vida de um projecto. Cada questão será analisada e discutida nas reuniões de projecto. Para cada questão uma ou mais tarefas são realizadas de modo a resolver a mesma.

Tarefa

Acto que permite resolver um ou mais problemas (questões) dos projectos. Cada tarefa terá uma pessoa como responsável principal e um conjunto de pessoas capazes de efectuar a tarefa. Actor Pessoa participante no projecto.

(44)

Reunião

Acto colaborativo que ocorre durante o período de vida do projecto. As reuniões são efectuadas com o intuito de discutir as fases do projecto, problemas que surgem ao longo do projecto e encontrar as respectivas soluções. Qualquer actor do projecto pode participar nas reuniões. É necessário que exista pelo menos um elemento, em cada reunião, capaz de elaborar um relatório sobre os assuntos discutidos na mesma (documento).

Minuta Rascunho inicial descrevendo os assuntos discutidos durante uma reunião.

Elemento de conhecimento

Peça de conhecimento focada em tópicos específicos. Inclui documentos sobre experiências adquiridas, melhores práticas, manuais. No contexto do CoSpaces, os projectos, agendas, reuniões, tarefas, questões são também considerados elementos de conhecimento.

Ponto de decisão

Ponto de controlo em determinado momento do projecto, no qual se tentam encontrar soluções para os problemas que possam estar a ocorrer nesse mesmo momento.

Documento Relatório de tarefas, reuniões ou qualquer ficheiro que contribua para o projecto.

Dados Conjunto de registos que podem ser processados em informação (e.g. atributos de base de dados).

Informação Conjunto de dados processados que adquirem significado num determinado contexto.

Conhecimento Conjunto de informações que, aliadas a experiências, facilitam o processo de tomada de decisão.

Miner

Componente responsável pelo processo de DM, também conhecido como extracção de informação de bases de dados, sendo um processo complexo de identificação de padrões válidos, existentes nos dados. Este tenta contribuir de algum modo para o processo de colaboração ao longo do desenvolvimento de um projecto.

Companion

(45)

3.2 Os requisitos do projecto CoSpaces

O presente trabalho é desenvolvido no contexto do projecto CoSpaces, especificamente no componente de suporte ao conhecimento, denominado CoSKS. O CoSKS faz parte da CoSpaces Software Framewok (CSF), um ambiente de engenharia colaborativo capaz de suportar a colaboração em tempo real entre equipas dispersas geograficamente. O CSF faz uso de tecnologias avançadas, tais como realidade virtual, tecnologias móveis e serviços Web de modo a criar espaços colaborativos de apoio à decisão humana. As funcionalidades ligadas ao conhecimento devem estar habilitadas para as ontologias e para a realização de técnicas de DM, de modo a permitir o apoio ao desenvolvimento dos projectos.

A abordagem utilizada pelo CoSKS centra-se em dois conceitos: questões/problemas e decisões. Com esta abordagem pretende-se acompanhar todas as questões que surgem durante o desenvolvimento de um projecto, assim como as respectivas decisões que forem tomadas a fim de resolvê-las. O objectivo é fornecer às equipas do projecto uma melhor compreensão dos problemas comuns, que ocorrem com frequência, em projectos e também indicar estratégias (tarefas e acções) para superá-los. Deste modo, é possível melhorar o desempenho diário das equipas do projecto, fornecendo casos históricos de projectos anteriores e informação sobre o modo como estes casos foram resolvidos, reduzindo assim o tempo dispendido na procurando de boas opções em situações específicas.

(46)

controlo de decisões importantes tomadas durante as reuniões. Este controlo é realizado pela elaboração de agendas que incluem os temas a serem discutidos e de minutas onde são registadas as questões levantadas assim como as soluções propostas e decisões tomadas durante a reunião.

A figura 3.1 mostra o CoSKS inserido na arquitectura CSF, evidenciando os componentes mais importantes para o CoSKS, o BSCW (Basic Support for Cooperative Work) e o portal. O BSCW é uma tecnologia que gere e armazena ficheiros e elementos de conhecimento. O portal permite aos utilizadores aceder às funcionalidades disponibilizadas pelo CoSKS.

Figura 3.1: Visão geral da arquitectura do CSF

Como se observa na figura 3.1, o CoSKS é constituído por três módulos: instalação e configuração, serviços básicos e serviços avançados.

O módulo de instalação e configuração manipula as necessidades relacionadas com a instalação e configuração do componente CoSKS (por exemplo, criação de utilizadores/senhas/endereços de servidores, etc.).

O módulo de serviços básicos constitui o suporte para o funcionamento normal do CoSKS. Neste módulo estão incluídos, por exemplo, serviços de indexação de elementos de conhecimento, pesquisa na base ontológica, armazenamento/ recuperação de objectos de conhecimento, etc..

CoSKS

Instalação e configuração

Serviços avançados Miner Companion

CSF

Portal

(47)

Por último, o módulo de serviços avançados do CoSKS, do qual fazem parte o Miner e Companion, tem como objectivo alargar e enriquecer as capacidades do CoSKS. De facto, os serviços destes dois módulos tem como objectivos gerir, apoiar, captar e capitalizar conhecimento proveniente de uma série de reuniões colaborativas. Neste trabalho foi desenvolvido o módulo Miner, que integra os serviços avançados do CoSKS. Neste sentido, será necessário, inicialmente, analisar o funcionamento do CoSKS, assim como as suas principais necessidades, de modo a enquadrar a implementação Miner.

Os principais requisitos que devem ser considerados para o CoSKS podem ser divididos em três categorias: requisitos funcionais, arquitecturais e técnicos (figura 3.2).

Figura 3.2: Requisitos do CoSKS (adaptado de [47])

Todos os requisitos apresentados são importantes para o desenvolvimento e bom funcionamento do CoSKS. Contudo, no que respeita ao Miner, alguns requisitos adquirem maior importância. O Miner é um módulo que necessita de grande quantidade de dados para produzir informação relevante. Assim, qualquer requisito

 Compatibilidade com o

CSF

 Uso de ontologias

 Mecanismos e processos

autónomos . Disponibilidade

 Configurável

 Interdependência entre

serviços de conhecimento

 Colaboração em

reuniões

 Decisão humana

 Omnipresente

. Fácil de usar

 Configurável

 Autenticidade dos

resultados/soluções

 Disponibilidade

 Autonomia

 Flexibilidade

 Integrado no ambiente

CSF

 Interoperabilidade e

integração

 Escalabilidade

. Sustentabilidade

 Relação de diferentes

fontes de conhecimento

 Criação de grandes

fontes de conhecimento Requisitos CoSKS

(48)

que contribua de algum modo para gerar, captar, gerir ou capitalizar dados será inevitavelmente um requisito do Miner. Neste sentido, alguns requisitos mínimos necessários incluem a colaboração, a integração assim como todos os que

envolvam a obtenção de dados que possa originar informação, tais como, a

interdependência entre os vários serviços de conhecimento, a relação entre diferentes fontes de conhecimento e a aquisição e gestão de grandes fontes de conhecimento.

No que respeita à colaboração, é importante que, numa série de reuniões colaborativas, o CoSKS seja capaz de registar, classificar e integrar os dados resultantes dessas reuniões. Por sua vez, os dados adquiridos ao longo das reuniões colaborativas poderão ser utilizados pelo Miner para criar informação, de modo a responder a eventuais problemas que possam surgir em futuros projectos, ou simplesmente para encontrar padrões nos diferentes projectos existentes.

(49)

Colaboração

Raciocínio Conhecimento

ter a capacidade de adquirir e indexar tais dados, de modo a torná-los disponíveis para o Miner. Por último, também é importante que os dados utilizados pelo Miner sejam fiáveis, de modo que as soluções encontradas para um determinado problema apresentem um grau de confiança considerável. Assim, um dos requisitos fundamentais para o correcto funcionamento do Miner é a autenticidade dos dados presente no CoSKS.

3.3 Bases Conceptuais

São três os conceitos fundamentais, nos quais este trabalho se centra: colaboração, conhecimento e raciocínio (figura 3.3).

Figura 3.3: Bases conceptuais do trabalho (adaptado de [47])

A colaboração é um conceito fundamental em gestão do conhecimento pois permite gerar conhecimento e incentivar a criatividade dos indivíduos. Para a colaboração ser eficaz é necessário que todos os indivíduos no seio de um processo colaborativo, consigam lucrar com a partilha de experiências que são traduzidas em

(50)

lógicas e padrões comportamentais que possam de algum modo, melhorar o desempenho das empresas e evitar situações problemáticas. De facto, este tipo de informações pode constituir uma ferramenta valiosa para as empresas, contribuindo para a elaboração de planos de trabalho e estratégias inovadoras.

Fica assim claro que, para que a colaboração seja de facto uma mais-valia no processo de gestão do conhecimento, é necessário aplicar raciocínio sobre os dados recolhidos de modo a criar informação que poderá traduzir-se em conhecimento. As empresas são responsáveis pela introdução de dados relativos a projectos que desenvolvem. Estes projectos são conduzidos através de um conjunto de reuniões, sendo cada uma destas reuniões considerada um ponto de decisão. Num ponto de decisão discutem-se questões e são tomadas decisões no sentido de encontrar soluções adequadas para as questões levantadas durante o desenvolvimento de um projecto (figura 3.4).

Figura 3.4: Ponto de decisões do projecto (adaptado de [48])

Eventualmente, as decisões podem traduzir-se num conjunto de tarefas a realizar. Cada ponto de decisão deve ser cuidadosamente planeado, através da elaboração prévia de agendas e os acontecimentos que ocorrem durante a reunião têm de ser

Ponto de decisão Ponto de decisão Ponto de decisão Ponto de decisão Ponto de decisão

(51)

registados. Entre pontos de decisão existe uma monitorização permanente para avaliar a execução das tarefas definidas.

O contexto no qual o conhecimento é criado e usado influencia fortemente o processo. Deste modo, é necessário definir com precisão os contextos considerados neste trabalho. Isto porque cada profissional a trabalhar colaborativamente num determinado projecto, tem necessidades e visões próprias acerca das informações a usar. Por outro lado, diferentes tipos de projecto podem usar as mesmas informações de maneiras diferentes, nomeadamente pelo facto destas informações poderem ser tratadas de modo diferente dependendo de diversos factores, por exemplo, a fase do projecto ou o tipo do problema em discussão. Também, em diferentes tarefas as mesmas informações podem ter utilizações diferentes e é a questão a ser resolvida que define a relevância de uma informação.

O elemento de conhecimento constitui outro conceito básico adoptado neste trabalho. Representa peças de conhecimento que podem ser capturadas, armazenadas, publicadas, partilhadas e reutilizadas pelas equipas do projecto. Os elementos de conhecimento são de extrema relevância para o suporte da colaboração electrónica num determinado projecto. Alguns exemplos são: documentos comuns, projectos, soluções, agendas, tarefas e participantes (figura 3.5).

Figura 3.5: Níveis do conhecimento CoSpaces (adaptado de [47])

CoSpaces Knowledge Support

E le m ent os de conhec im ent o Que st ões R egra s P roj ec tos R euni ões Tar ef as

CoSpaces Knowledge Support

(52)

Os ficheiros, elementos de conhecimento comuns, são suportados e geridos por uma entidade conceptual que disponibiliza serviços para armazenamento, agrupamento, pesquisa e devolução de ficheiros.

3.4 DM como suporte à tomada de decisão

As sessões activas de colaboração de apoio à tomada de decisão seguem um fluxo de trabalho composto por quatro fases, nomeadamente, fase de trabalho

individual, fase de inicialização, fase de colaboração e fase de

finalização/arquivo, como mostra a figura 3.6.

A fase de trabalho individual constitui a identificação de um problema, sendo então elaborada uma descrição deste problema. Nesta fase, os indivíduos participantes no projecto colaboram assincronamente, sugerindo tarefas que possam resolver um problema.

A fase de inicialização, previamente à reunião, inclui a preparação da agenda e a selecção dos participantes da reunião. O responsável pela organização da reunião (e.g. gestor do projecto) pode identificar as principais questões a serem discutidas, assim como o melhor modo de as discutir.

A fase de colaboração consiste na reunião propriamente dita, na qual os participantes tentam chegar a um consenso relativamente às questões em agenda, utilizando os recursos apropriados. Esta fase também compreende o registo das decisões tomadas, incluindo novas tarefas e atribuição de responsabilidades. As decisões aqui tomadas devem ser suportadas pelo processo de tomada de decisão, de acordo com o contexto da questão discutida.

(53)

Sempre que um projecto é concluído, o gestor deve elaborar o project post-mortem, um documento que resume todos os indicadores relevantes (questões/decisões, desvios, participantes envolvidos, etc.). O project post-mortem representa um elemento de conhecimento que pode ser utilizado em projectos futuros, com o propósito de melhorar as performances, facilitar as boas práticas e eliminar erros conhecidos.

Cada uma das fases de uma sessão colaborativa contribui significativamente para o processo de tomada de decisão. Principalmente na fase de colaboração, o recurso a DM ganha importância e torna-se um elemento fundamental na tomada de decisão. Durante as reuniões, pelo facto de se disporem de dados manipulados por DM (existentes na base de dados e documentos de projectos anteriores), a informação relevante é identificada de uma forma rápida e ágil, facilitando o processo de tomada de decisão. Assim, para cada questão discutida durante a reunião, o recurso a DM pode ser a chave que permite encontrar a solução desejada de modo a resolver a questão.

Figura 3.6: Fases do processo de colaboração (adaptado de [48])

In ic ia liz aç ão Fi na liz aç ão /Arq ui vo Partilhar e divulgar conhecimento Adquirir e aplicar conhecimento Capturar e/ou criar conhecimento conhecimento Trabalho individual Trabalho individual Reunião/ Colaboração Questões Problemas

Actores Soluções

Activos de conhecimento

(54)

3.5 Fundamentos técnicos do CoSKS

A estrutura CoSKS divide-se em quatro níveis: apresentação, comportamento, serviços e conhecimento (figura 3.7).

Figura 3.7: Níveis técnicos do CoSKS (adaptado de [48])

O nível de apresentação representa as interacções do CoSKS com as aplicações externas, representadas pelo portal do CSF na figura 3.1. Estas interacções possibilitam a colaboração entre as equipas de trabalho, envolvendo troca de conhecimento, actualização dos dados dos projectos, actores, tarefas, reuniões, etc.. Neste nível também ocorre a troca de ficheiros entre o CoSKS e uma entidade conceptual que gere os ficheiros e directorias, representada pelo BSCW na figura 3.1. Aqui são adicionados, removidos e actualizados documentos sobre os projectos, que podem ser consultados e eventualmente facilitar a resolução de problemas encontrados em projectos semelhantes.

No nível de comportamento encontra-se o Companion que é um componente proactivo, reactivo e autónomo responsável por alertar, monitorar e apoiar a tomada

Interface do utilizador

Companion

Serviços

semânticos Miner

Ontologia Repositório de conhecimento

Nível de apresentação

Nível de comportamento

Nível de serviços

(55)

de decisão em projectos. Algumas das funcionalidades oferecidas pelo Companion são:

 acompanhar constantemente o desenvolvimento de um projecto de modo a apresentar as melhores soluções para as questões/problemas que possam surgir;

 alertar para os prazos de execução de tarefas, desvios, datas de reuniões e respectivos participantes;

 responder a questões dos utilizadores; e

 coleccionar, organizar e filtrar informações e decisões; fazer um ponto da situação do projecto (prazos, custos).

O nível de serviços contém os serviços semânticos e o Miner. O Miner será abordado no próximo ponto do trabalho. Os serviços semânticos disponibilizam um conjunto de funcionalidades suportadas por uma ontologia. As funcionalidades principais são três: (i) filtrar e definir o contexto semântico; (ii) criar vectores semânticos; e (iii) indexar e pesquisar semanticamente.

A funcionalidade filtrar e definir o contexto semântico é responsável por representar cada elemento de conhecimento por um conjunto de palavras-chave, filtradas semanticamente de modo a definir o contexto semântico em que se enquadra. O contexto semântico constrói-se com base no tipo de dados envolvidos, por exemplo, tipo de projecto, fase de projecto, tarefa, problema, actor, etc..

(56)

recuperar os elementos de conhecimento que permitem encontrar a melhor solução possível para determinado problema.

Em indexar e pesquisar semanticamente, os novos elementos de conhecimento são indexados semanticamente através da criação dos respectivos vectores semânticos. Quando uma nova questão/problema é introduzida no sistema, tendo em conta que a consulta é tratada pelo sistema como um elemento de conhecimento, o respectivo vector semântico é usado para procurar a semelhança semântica com outros vectores e dar uma resposta/solução para a questão/problema em curso.

Finalmente tem-se o nível de conhecimento composto pela ontologia e pelo repositório de conhecimento. A ontologia suporta o uso de expressões que contextualizam os elementos de conhecimento no repositório. A ontologia acrescenta um peso semântico nas relações entre os elementos de conhecimento armazenados. Cada conceito ontológico apresenta uma lista de termos equivalentes que podem ser usados para representá-lo semanticamente. Estes termos são tratados estatística e semanticamente de modo a criar o vector semântico dos elementos de conhecimento.

O repositório de conhecimento armazena todos os elementos de conhecimento usados no CoSKS, dos quais faz parte uma base de dados constituída pelos projectos, tarefas, actores, reuniões, questões, etc..