• Nenhum resultado encontrado

As fases do modelo proposto discutidas anteriormente, principalmente a extração e a correlação de entidades e expansão do modelo de espaço vetorial, promovem suporte a aplicações de recuperação de informação e à análise de agrupamentos verificando como

entidades e/ou unidade da análise se interconectam, bem como promovem suporte a aplicações de Engenharia e Gestão do Conhecimento.

No âmbito da recuperação de informação, modelos de espaço vetorial são tradicionalmente utilizados na indexação de documentos e na recuperação desses documentos através de consultas baseadas em termos. A expansão vetorial proposta neste trabalho modifica o espaço vetorial com novos termos, ou seja, termos que não estavam no documento original, mas que são relacionados aos existentes. Considerando-se que consultas baseadas em termos são freqüentemente uma aproximação para a informação que se está buscando, os vetores expandidos podem conduzir ao aumento da precisão durante a recuperação de documentos. Nesse sentido, documentos que normalmente não seriam recuperados por um determinado termo ou conjunto de termos, pelo fato de não pertencerem ao espaço vetorial original, passam a ser retornados. Por exemplo, seja o termo T1=”Inteligência Artificial” pertencente ao documento D1 e o termo T2=”Fuzzy” adicionado ao documento D1 pelo processo de expansão, uma pesquisa pelo termo T2 irá recuperar o documento D1, que pode ser útil para a consulta executada pelo usuário.

No contexto de aplicações de agrupamentos, o modelo proposto pode conduzir a análises mais avançadas de como elementos textuais, por exemplo, entidades e conceitos, e mesmo documentos, estão interconectados. A análise desses relacionamentos pode conduzir à identificação de conhecimentos latentes e auxiliar na construção de aplicações de gestão do conhecimento, tornando possível, por exemplo, a apresentação de mapas de conhecimento de uma determinada área de interesse e mesmo promovendo suporte ao estabelecimento de relações diretas e indiretas.

Essas entidades e suas relações representam a base para aplicações de Engenharia e Gestão do Conhecimento, tais como manutenção de ontologias, comunidades de prática, redes sociais, localização de especialistas e gestão por competências. Essas aplicações representam

importantes ferramentas no auxílio ao entendimento das relações que se estabelecem entre entidades, seja de maneira induzida ou espontânea, tais como quem trabalha com quem, em quais projetos, com quais organizações.

No contexto da Engenharia do Conhecimento, ontologias e conseqüentemente sistemas baseados em ontologias e sistemas voltados à manutenção de ontologias desempenham um importante papel (CORCHO et al., 2003; POLI, 2002; LAMMARI; METAIS, 2004). Nesse sentido, entidades e seus relacionamentos servem de insumo, ou seja, provêem instâncias a ontologias. De acordo com Broekstra et al. (2002), ontologia possui papel-chave nos processos de troca de informação. Adicionalmente, ontologia é apresentada como uma possível solução para problemas de compartilhamento de conhecimento (SILVA et al., 2002) ou, como sugerem Uschold e Gruninger (1996), uma ontologia possibilita ainda o mapeamento/integração de modelos de diferentes domínios em uma estrutura coerente.

Muitas definições sobre ontologia têm sido propostas. Russel e Norvig (1995) definem ontologia como uma lista informal de conceitos em um determinado domínio de aplicação. Para Broekstra et al. (2002), ontologia é uma especificação formal e explícita de uma conceitualização compartilhada. Por “conceitualização” entende-se um modelo abstrato de determinado fenômeno que ocorre no mundo real, em que fatos relevantes desse fenômeno são identificados e devem ser explicitamente definidos (BROEKSTRA et al., 2002; GRUBER, 1993; GUARINO; GIARETTA, 1995). O conceito de “formal” refere-se ao fato de que uma ontologia deve ser entendível por agentes de hardware ou software. Por último, o conceito de “compartilhado” reflete a idéia de que uma ontologia captura conhecimento consensual, ou seja, não é restrita a um indivíduo, mas aceita dentro de um grupo.

Finalmente, no contexto da Gestão do Conhecimento, comunidades de prática, localização de especialistas e gestão por competência constituem-se em importantes ferramentas voltadas ao entendimento das relações entre as organizações e os seus

colaboradores e a tomada de decisão. Questões típicas de interesse dos gestores de conhecimento são, por exemplo: (a) quais conhecimentos seus colaboradores possuem; (b) com quais clientes eles têm contato; e (c) quais colaboradores possuem determinados perfis/competências para um projeto em particular. Muitas dessas respostas residem em bases textuais compostas de relatórios técnicos, projetos, e-mails, mensagens instantâneas, etc. e em bases estruturadas ou ontologias organizacionais, que mantêm registradas as interações entre os membros da comunidade nas suas atividades diárias (WENGER, 1998).

De acordo com Alani et al. (2003a), as comunidades de prática (CP) são constituídas por grupos de pessoas com interesses em comum, seja um trabalho ou uma atividade em particular, procedimentos ou domínio de aplicação. Lesser e Stock (2001) ainda definem comunidades de prática como grupos engajados no compartilhamento de experiências e aprendizado através dessas experiências.

Outro exemplo de aplicação são os sistemas de Gestão por Competência. Cada vez mais as organizações estão atentas aos conhecimentos e às habilidades de seus colaboradores por considerarem esses recursos valiosos, isto é, conhecer quem conhece o quê tem se tornado uma atividade crítica, por exemplo, na gerência e na definição de equipes de projetos. A Gestão por Competência objetiva assim o desenvolvimento e a disseminação de competências-chave entre os colaboradores da organização. Como declarado por Hamel e Prahalad (1994), “competências-chave transcendem produtos ou serviços em particular e de fato, podem transcender qualquer departamento dentro de uma organização”. De acordo com Dawson (1991), competências-chave constituem-se na combinação de habilidades já aprendidas ou em desenvolvimento, podendo ainda fomentar ou determinar estratégias de negócio (HAFEEZ et al., 2002). Assim, métodos utilizados na descoberta ou na avaliação de competências-chave têm se mostrado relevantes para as organizações.

As aplicações discutidas acima são exemplos de onde o trabalho se insere, pois possuem como fonte elementos textuais e seus relacionamentos. Tal informação pode ser adquirida através de sistemas específicos com o objetivo de coletar e sumarizar informações pessoais. Um exemplo disso é a coleção de currículos de pesquisadores brasileiros mantidos através da Plataforma Lattes (CNPq, 2005). Podem, entidade e seus relacionamentos, igualmente advir de documentos em geral, tais como páginas Web e relatórios, que refletem atividades diárias dentro de uma organização, ou mesmo comunicações persistentes, compostas de mensagens eletrônicas ou registros de comunicações entre os colaboradores.

Com o intuito de explorar e auxiliar no entendimento dos relacionamentos estabelecidos entre entidades em determinado contexto, como, por exemplo, em uma organização, uma coleção de documentos ou um domínio Web, apresenta-se uma ferramenta com esse propósito.

A Figura 19 mostra a ferramenta por meio da qual, a partir de uma entidade utilizada na consulta, são recuperadas as entidades mais relacionadas, considerando-se algumas classes, entre elas, Organização, Pessoa, Projeto e Área de pesquisa. As entidades recuperadas são classificadas/ordenadas levando-se em conta o grau de relacionamento com a entidade de origem. Essa abordagem possibilita rapidamente a inspeção das relações mais importantes de cada entidade em cada classe e atende de maneira prática à investigação de competências associadas a determinada pessoa ou mesmo à localização de pessoas em um determinado assunto (área de pesquisa).

Figura 19 - Aplicação responsável pela apresentação de entidades e seus relacionamentos

Essa abordagem pode ser incrementada apresentando-se diferentes níveis de relacionamentos. Isso ocorre através da utilização de agrupamentos com o objetivo de explicitar relações latentes entre entidades. Nesse processo utilizam-se os vetores extraídos a partir da matriz de correlação, similar à matriz apresentada na Tabela 22. Cada vetor representa uma determinada entidade. Ao final do processo, descrito na Seção 3.5, a entidade que melhor se adere ao agrupamento irá indicar o centro dele e as demais entidades do agrupamento serão relacionadas à entidade principal, formando um mapa de relacionamentos.

Isso é demonstrado através da utilização de representação gráfica (Figura 20), possibilitando assim um melhor entendimento dos relacionamentos entre entidades. De maneira similar à versão textual, diferentes classes são utilizadas e identificadas com diferentes cores. Na figura a seguir a forma retangular indica a entidade que melhor representa o centro de um determinado agrupamento, enquanto que a forma circular indica as entidades relacionadas. Como mencionado anteriormente, entidades são identificadas através do processo chamado NER, que se utiliza de uma base de conhecimento para nomear/atribuir um

determinado elemento textual para uma classe de entidade específica. Essa base de conhecimento possui, para cada classe do sistema, por exemplo, pessoa, organização, projeto, uma tabela de nomes associada, permitindo assim a classificação desses elementos textuais.

Figura 20 - Aplicação responsável pela apresentação gráfica de agrupamentos de entidades e seus relacionamentos

4.3 CONSIDERAÇÕES FINAIS

Este capítulo discutiu a validação do modelo proposto (LRD), aplicando-se a ele as tarefas de recuperação de informação e agrupamentos, bem como a avaliação da capacidade de identificação de relacionamentos relevantes entre elementos textuais. No contexto da recuperação de informação, foram empregadas as medidas de precisão e lembrança, tradicionalmente utilizadas na mensuração do desempenho de sistemas dessa natureza. Para agrupamentos utilizou-se o erro quadrático com o objetivo de determinar o desempenho do

modelo nessas tarefas. No último conjunto de avaliações empregou-se um coeficiente de correlação, visando estabelecer a habilidade do modelo em informar relevantes listas de entidades relacionadas a determinado elemento textual (entidade ou conceito). Por fim, discutiu-se a aplicabilidade do modelo nos cenários de recuperação de informação, agrupamento e aplicações de Engenharia e Gestão do conhecimento. De modo geral entidades e suas relações formam vetores de conhecimento e oferecem suporte a aplicações de análises de comunidades de prática, redes sociais, gestão por competências, localização de especialistas, manutenção de ontologias, entre outras.

5 CONCLUSÕES E TRABALHOS FUTUROS

A descoberta de que o universo está em expansão foi uma das grandes revoluções intelectuais do século XX. Depois dela torna-se fácil perguntar por que ninguém pensou nisso antes.

Stephen W. Hawking

Documentos relacionados