Inteligência competitiva: aplicação de agentes inteligentes na coleta de informações na web

Texto

(1)

ANDRÉ RIBEIRO DE MAGALHÃES

INTELIGÊNCIA COMPETITIVA: APLICAÇÃO DE AGENTES

INTELIGENTES NA COLETA DE INFORMAÇÕES NA WEB

Dissertação apresentada ao Programa de Pós-Graduação Stricto Sensu em Gestão do Conhe-cimento e da Tecnologia da Informação, da Universidade Católica de Brasília, como requi-sito parcial para obtenção do Título de Mestre em Gestão do Conhecimento e Tecnologia da Informação.

Orientador: Prof Dr. Hércules Antonio do Prado

Co-orientador: Prof. Dr. Edilson Ferneda

(2)

Ficha elaborada pela Coordenação de Processamento do Acervo do SIBI – UCB. M188i Magalhães, André Ribeiro de

Inteligência competitiva: aplicação de agentes inteligentes na coleta de informações na web / André Ribeiro de Magalhães. – 2008.

60 f. : il. ; 30 cm

Dissertação (mestrado) – Universidade Católica de Brasília, 2008. Orientação: Hércules Antonio do Prado

Co-orientador: Edilson Ferneda

1. Inteligência competitiva (Administração). 2. Agentes inteligentes (Software). I. Prado, Hércules Antonio do, orient. II. Ferneda, Edilson, co-orient. III.Título.

(3)

TERMO DE APROVAÇÃO

Dissertação de autoria de André Ribeiro de Magalhães, intitulada “Inteligência Competitiva: Aplicação de Agentes Inteligentes na coleta de informações na Web”, requisito parcial para obtenção do grau de Mestre em Gestão do Conhecimento e da Tecnologia da Informação, defendida e aprovada, em 21 de novembro de 2008, pela banca examinadora constituída por:

Prof. Dr. Hércules Antonio de Prado Dr Orientador

Prof. Dr. Edilson Ferneda Co-orientador

Prof. Dr. Stanley Loh Examinador Externo

Prof. Dr. Claudio Chauke Nehme Examinador Interno

(4)
(5)

Agradeço ao meu pai e minha irmã, pelo incondicional apoio e orientação.

Agradeço aos orientadores, Prof. Dr. Hércules Antonio do Prado e Prof. Dr. Edilson Ferneda pela extraordinária dedicação e direção em todos os momentos.

Agradeço a Prof. Dr. Eduardo Amadeu Moresi pelas importantes sugestões ao trabalho.

(6)

RESUMO

A maior parte das organizações responde a desafios internos e externos com um grau variado de efetividade. Um dos seus maiores desafios é a capacidade de identificar e responder adequadamente às mudanças de seu ambiente externo. Es-sas mudanças não só afetam suas escolhas tecnológicas, mas também sua estrutu-ra interna e cultuestrutu-ral. Hoje, alguns dos maiores desafios das organizações estão rela-cionados à questão de como conceber e construir ferramentas computacionais ca-pazes não só de prestar suporte ao armazenamento de informação, mas também de intervir de maneira ativa no ambiente organizacional. Em particular, observa-se que a publicação de informações na Web oferece uma oportunidade sem precedentes para a aprendizagem sobre o ambiente externo da organização. Entretanto, a aqui-sição de informação relevante neste contexto é uma tarefa trabalhosa na ausência de mecanismos de suporte. Nesse sentido, faz-se necessário o desenvolvimento de métodos, técnicas e ferramentas que possibilitem a utilização do enorme acervo de informações de interesse das organizações, disponíveis na Web, para subsidiar a prática da Inteligência Competitiva. Propõe-se, neste trabalho, um ambiente de mo-nitoramento de páginas Web, denominado W3EnvScan, que permita ao analista de inteligência assinalar, qualificar e explorar, por meio de técnicas de mineração de dados e de texto, variáveis de interesse da organização. Um protótipo foi desenvol-vido implementando as principais funções de tal ferramenta.

(7)

ABSTRACT

Organizations respond to internal and external challenges with a varied de-gree of effectiveness. One of the necessary conditions for success is the ability to identify and respond appropriately to changes in their environments. These changes not only affect technological choices, but also its internal structure and culture. Nowadays, some of the biggest challenges faced by organizations are related to the question of how to design and build computational tools capable not only to support the storage of information, but also to cooperate in an active way in an organizational environment. In particular, it has been observed that the availability of information on the Web offers an unprecedented opportunity for learning about the organization en-vironment. However, the acquisition of relevant information in this context is an ardu-ous task in the absence of support mechanisms. Accordingly, the application of multi-agent systems represents an attractive solution. This work refers to tools that enable an analyst to access the enormous body of information of interest to organizations, available on the Web, to subsidize the practice of Competitive Intelligence. An envi-ronment for Web pages tracking is proposed, where the variables to be monitored will be marked and assigned by the analyst by means of data and text mining tools.

(8)

LISTA DE ABREVIATURAS

ACL - Agent Comunication Language BI - Business Intelligence

DCDB - Descoberta de Conhecimento em Base de Dados DM - Data Mining

DW - Data Warehouse

FIPA - Foundation for Intelligent Physical Agents GC - Gestão do Conhecimento

IBICT - Instituto Brasileiro de Informação em Ciência e Tecnologia IC - Inteligência Competitiva

JADE - Java Agents Development Framework MA - Monitoramento Ambiental

MIX - Mediation of Information usingXML

RETSINA - Reusable Environment for Task-Structured Intelligent Networked Agents

RNA - Redes Neurais Artificiais RSS - Really Simple Syndication RUP - Rational Unified Process

SIC - Sistema de Inteligência Competitiva SMA - Sistemas Multiagentes

(9)

LISTA DE FIGURAS

Figura 1: Sistema de Inteligência Competitiva ...19

Figura 2: Processo de inteligência competitiva ...20

Figura 3: Processo de monitoramento ambiental ...26

Figura 4: Arquitetura básica de um agente...31

Figura 5: Modelo de contextualização do W3EnvScan ...40

Figura 6: Estrutura de coleta e monitoramento doW3EnvScan...42

Figura 7: Sistema monitor de serviços do W3EnvScan...43

Figura 8: Cadastrode Serviços no W3EnvScan ...44

Figura 9: Browser do W3EnvScan ...45

Figura 10: Cadastro de serviços pelo browser do W3EnvScan...49

Figura 11: Exemplo de cadastramento com o W3EnvScan ...49

Figura 12: Exemplo de monitoramento com o W3EnvScan ...50

(10)

SUMÁRIO

1. INTRODUÇÃO ... 11

1.1. Tema... 12

1.2. Revisão da literatura... 12

1.3. Relevância do estudo... 15

1.4. Formulação do problema... 15

1.5. Objetivos... 16

1.6. Organização da dissertação... 16

2. REFERENCIAL TEÓRICO... 18

2.1. Inteligência competitiva ... 18

2.1.1. Um sistema de inteligência competitiva ... 19

2.1.2. Fatores importantes para a construção do SIC ... 24

2.1.3. Monitoramento ambiental na Web ... 26

2.2. Tecnologia de agentes ... 28

2.2.1. Definição de agentes... 28

2.2.2. Arquitetura de um agente ... 31

2.3. Sistemas multiagentes ... 33

2.4. Técnicas para o tratamento das informações ... 35

2.5. Discussão... 37

3. ASPECTOS METODOLÓGICOS ... 38

3.1. Classificação da pesquisa ... 38

3.2. Delimitação do estudo e plataforma de trabalho... 38

3.3. Metodologia de desenvolvimento do protótipo ... 39

4. MODELO PROPOSTO E PROTÓTIPO ... 40

4.1. Contexto ... 40

4.2. Descrição do modelo... 42

4.3. Interações com o usuário ... 44

4.4. Mapeamento dos agentes... 46

4.5. Ambiente de trabalho ... 47

4.6. Limitações do modelo ... 48

4.7. Estudo de caso... 49

5. CONCLUSÃO E TRABALHOS FUTUROS ... 53

(11)

1. INTRODUÇÃO

O cenário econômico cada vez mais competitivo e os crescentes avanços tecnológicos exigem que as empresas sistematizem o acompanhamento da concor-rência e busquem novas formas de obter as informações estratégicas a respeito do ambiente nas quais estão inseridas. Esta tendência tem sido observada no compor-tamento e nas formas de gerenciamento da organização. A revolução social causa-da pela popularização causa-da Web tem provocado um aumento expressivo do número de organizações e indivíduos que disponibilizam suas informações na Web. Ao disponi-bilizar tais informações, as organizações falam de si, abrindo para a concorrência uma oportunidade sem precedentes de conhecer o seu mercado.

Neste mercado extremamente dinâmico, é muito improvável que uma empre-sa consiga informações estratégicas sem um sistema de informação eficaz para se adequar à velocidade com que as mudanças ocorrem. Vale ressaltar que os dados, tanto internos quanto externos, de uma organização podem trazer vantagens com-petitivas frente a fatores que a organização e seus gestores desconheçam. A busca pela identificação das mudanças do ambiente externo, com o objetivo de planejar as intervenções necessárias ao ambiente interno é conhecida como Inteligência Com-petitiva (IC).

Nesse contexto, acompanhar a velocidade das mudanças do mercado torna-se um fator estratégico importante para as organizações. Estas mudanças fazem com que as organizações sofram fortes influências do ambiente externo, notada-mente em seus processos de tomada de decisões. No entanto, muitas organizações se vêem obrigadas a obter dados estratégicos do meio externo, mas eles de nada valem se não puderem ser transformados em informações e conhecimento. Esta transformação se dá por meio de sistemas e de uma equipe capacitada para coletar, analisar e aplicar as informações sobre o ambiente externo nas diversas áreas da organização.

(12)

por não conseguirem acompanhar a evolução da Web ou por não proverem funções suficientes para os usuários na ação de busca, filtragem e tratamento das informa-ções relevantes. Ou seja, o monitoramento de mudanças no ambiente externo da organização a partir da Web deve ter suas ferramentas constantemente adequadas às novas tecnologias e, dentro do possível, se antecipar às suas tendências. Este monitoramento é conhecido como Monitoramento Ambiental (MA) e é um dos princi-pais provedores de insumos para IC.

Diante das atuais tecnologias disponíveis para MA, a de Agentes está entre as mais promissoras por permitirem o tratamento da informação coletada no ambien-te exambien-terno de forma autônoma.

1.1. Tema

O tema abordado neste trabalho é a coleta e tratamento de informações dis-poníveis na Web para suporte à atividade de Inteligência Competitiva, com base na tecnologia de sistemas multiagentes.

1.2. Revisão da literatura

Nesta seção, são apresentados os resultados da busca por trabalhos científi-cos relacionados ao tema proposto, realizada em diversas fontes de pesquisa. Como palavras-chave foram utilizadas as expressões: “Inteligência Competitiva” ( Competi-tive Intelligence), “Agentes Inteligentes” (Intelligent Agents), “Sistemas multiagentes” (Multiagent Systems), Web e Internet. Com o objetivo de evidenciar a importância do problema abordado, bem como a originalidade da proposta, foi realizada uma busca por trabalhos científicos relacionados ao tema proposto nas seguintes bases biblio-gráficas Science Direct1 e Scirus2.

A partir dos resultados alcançados com essas bases, e buscando enriquecer o levantamento de literatura, foi realizada uma consulta nas bases de dissertações e teses do IBICT3 e das seguintes Universidades: UnB (Universidade de Brasília)4,

UFSC (Universidade Federal de Santa Catarina)5, UFRJ (Universidade Federal do

(13)

Rio de Janeiro)6 e da própria UCB (Universidade Católica de Brasília)7.

Algumas das teses e dissertações consultadas abordam a necessidade de se utilizar novas ferramentas de coleta e suporte à IC pelas organizações assim como o aprimoramento das ferramentas existentes.

Guimarães (2006) enfatiza que:

[...] o ambiente externo é uma fonte de recursos e oportunidades de infor-mações, de onde as organizações extraem os insumos necessários para in-teragir, provocando mudanças e influências positivas [...] e amortecendo e absorvendo as influências negativas ou adaptar-se a elas.”

O autor realizou um estudo qualitativo sobre doze empresas de Informática e Telecomunicações de Belo Horizonte envolvidas com MA nos processos de IC. Veri-ficaram-se diversas divergências quanto às técnicas e ferramentas empregadas para identificação das tendências de mercado. O autor observa que: (i) a Internet eviden-cia-se como fonte primária externa à organização, motivando o crescente uso de fer-ramentas de MA aplicadas ao processo de IC nesse ambiente, e (ii) apesar de mui-tas empresas não seguirem os preceitos de IC preconizados pela literatura8, em

al-gum momento elas implementam alal-gumas das fases desse processo.

Thomé (2006) estudou ferramentas de suporte para IC com foco em uma em-presa de pesquisa agropecuária. A autora comparou duas ferramentas, tendo como base as necessidades específicas da empresa. Como resultado, descreveu as van-tagens e desvanvan-tagens das ferramentas estudadas, identificando lacunas existentes, que lhe permitiram a proposição de funcionalidades de interesse da empresa. O pro-duto Autonomy, da Autonomy Corporation9, foi apresentado como uma ferramenta de mercado que automatiza o processo de síntese e tratamento de qualquer infor-mação não estruturada. Esta ferramenta apresenta uma abordagem inovadora por não se prender a uma estrutura de navegação. Outra ferramenta estudada foi a Cór-tex Competitiva, da Córtex Intelligence10, que utiliza robôs de monitoração para

bus-cas automátibus-cas, permitindo a automação de uma série de atividades do processo de IC por meio de técnicas de Text Mining. O autor enfatiza a IC como facilitadora da tomada de decisão e geradora de diferencial qualitativo em qualquer ramo do co-nhecimento.

6 http://www.sibi.ufrj.br/ 7 http://www.biblioteca.ucb.br/

8 O Ciclo de IC encontrado na literatura e utilizado neste trabalho será apresentado na seção 2.1.1. 9 http://www.autonomy.com/

(14)

Baseado nos resultados apresentados por Silva (2000), Lemos (2005) apre-senta um modelo de multiagentes para suporte ao processo de IC, com o qual busca liberar o usuário da tarefa de coleta de informações relevantes em sites Web. O au-tor propõe, mas não desenvolve, uma arquitetura multiagentes de uma ferramenta capaz de monitorar o conteúdo das páginas Web e informar, a partir de técnicas de análise textual, sobre alterações e relevância dessas alterações.

Moreira (2006) explora a utilização da tecnologia de agentes na recuperação de sinais antecipados na Web. A partir de um estudo de caso, identifica as seguintes dificuldades para a implantação de ferramentas de IC: (i) a escolha dos parâmetros a serem utilizados para a busca, (ii) a identificação de possíveis estruturas dos sites e (iii) a transformação das informações coletadas em sinais antecipados que possam representar um quadro onde fragmentos tornem-se um cenário que faça sentido. O autor desenvolveu uma ferramenta de recuperação de informação na Web por meio da tecnologia de agentes inteligentes apoiada nas ferramentas Web Crawler11 e

Web Spider12, que percorrem a Web em busca de informações indexadas. Apesar

de avaliar a abordagem adotada como promissora, os resultados alcançados não foram de todo satisfatórios, uma vez que parte do rastreamento teve de ser executa-do manualmente pelos pesquisaexecuta-dores, principalmente por não responder apropria-damente à segunda das três dificuldades elencadas.

Diversas outras referências relevantes encontradas a partir dessa pesquisa serão citadas no decorrer deste trabalho.

Pelas pesquisas realizadas, observou-se que a facilidade de acesso às infor-mações na Web e o crescente aumento de inforinfor-mações nela disponíveis aumentou a carga de trabalho para os profissionais de IC envolvidos na coleta e análise de in-formações relevantes, a ponto de essas atividades serem praticamente inviáveis sem a utilização de ferramentas computacionais. No entanto, apesar desses meca-nismos estarem se tornando bastante sofisticados, eles são ainda limitados, princi-palmente devido à rápida evolução das Tecnologias da Informação e Comunicação (TIC). Isso mostra a necessidade de ferramentas mais efetivas para coleta e trata-mento de informações sob a perspectiva da IC.

(15)

1.3. Relevância do estudo

Com o aumento da competitividade e com os avanços da tecnologia associa-dos à globalização, as organizações se vêem cada vez mais obrigadas a utilizar no-vas tecnologias como base de apoio para tomadas de decisão. O processo de deci-são das organizações baseado em informações do meio externo tornou-se mais difí-cil e complexo, pois ele passa necessariamente pela análise das informações corpo-rativas disponíveis na Web, cada vez maior em quantidade, riqueza e dinamismo (GANTZ et al., 2007; 2008).

Flexibilidade, agilidade, orientação para o mercado e estruturas leves de ope-ração são características imprescindíveis para o sucesso e sobrevivência das orga-nizações. Estas características têm maiores chances de se materializar quando a organização efetua uma gestão efetiva dos recursos da informação, do conhecimen-to e das TICs associadas (BRAGA, 1998).

Choo et al. (2000) apontam para a necessidade da utilização de ferramentas de MA para a análise das informações do mercado externo e a transformação dos dados coletados em informação para ganhos competitivos. Essas atividades de IC permitem a criação de muitos benefícios para as organizações, e a utilização de fer-ramentas de MA contribui para o processo de coleta e tratamento dos dados (KA-HANER, 2008).

Avalia-se que um terço (1/3) do tempo utilizado no processo de IC é gasto na fase de coleta das informações relevantes (PEREIRA, 2002). Para que as organiza-ções possam se adequar com rapidez à dinâmica do ambiente externo (mercado, concorrência, entre outras variáveis), é fundamental o desenvolvimento de novas técnicas e ferramentas para transformação dos dados em informação e estas em conhecimento. As ferramentas de apoio à IC, como as de obtenção de dados, pas-saram a ser primordiais para a consubstanciação de informações estratégicas e a tomada de decisão (BOVO e BALANCIERI, 2001).

1.4. Formulação do problema

(16)

cri-ou um problema para os analistas de inteligência envolvidos nessa atividade. Ao mesmo tempo o desenvolvimento das técnicas e ferramentas de recuperação e aná-lise de dados não acompanhou a evolução do cenário.

A Internet tornou-se um ambiente rico em informações e oportunidades para o qual se faz necessário o desenvolvimento de ferramentas de MA capazes de auxiliar a aquisição das informações relevantes para as organizações no processo de IC (TEO e CHOO, 2001). À medida que aumenta a relevância das informações dispo-níveis na Web para as organizações, faz-se necessário que essas organizações dis-ponham de ferramentas que as permitam se servir dessas informações, principal-mente na fase de coleta e tratamento das informações, conforme o ciclo de IC pro-posto por Herring (1996).

1.5. Objetivos

A finalidade deste trabalho é propor uma plataforma de monitoramento ambi-ental baseada em busca de informações na Web, capaz de subsidiar uma organiza-ção na fase de coleta e tratamento das informações, dentro do ciclo de IC (HER-RING, 1996). Para tanto, consideram-se os seguintes objetivos específicos:

• Identificar procedimentos envolvidos na coleta e análise das informações para

a IC;

• Identificar métodos e técnicas capazes de subsidiar a descoberta de

informa-ções relevantes para a tomada de decisão;

• Investigar a pertinência da abordagem baseada em agentes para a prospecção

de informações em um aspecto específico de uma organização;

• Como prova de conceito, desenvolver um protótipo com funções básicas de

monitoramento;

• Avaliar o protótipo por meio de um estudo de caso.

1.6. Organização da dissertação

(17)
(18)

2. REFERENCIAL TEÓRICO

Acompanhar a velocidade das mudanças em um mercado competitivo carac-terizado pela globalização é um fator crítico de sucesso cada vez mais importante para as organizações. Estas mudanças fazem com que as organizações sofram for-tes influências do ambiente externo, notadamente em seus processos de tomada de decisões. Com a disponibilização cada vez maior de informações na Web, o monito-ramento do ambiente externo via Web tem ganhado crescente relevância para a In-teligência Competitiva.

O MA já é realizado por meios convencionais, com a utilização de agentes humanos buscando na Web informações relevantes para as organizações. Para possibilitar a execução sistemática de ações mais efetivas de MA, é preciso que as ferramentas computacionais para esse fim tenham características como autonomia, pró-atividade, poder de interpretação e de análise contextual.

Este capítulo apresenta as bases teóricas e tecnológicas para se atingir este objetivo.

2.1. Inteligência competitiva

Na moderna economia, o processo de IC ganhou importância para a garantia da sustentabilidade das organizações, auxiliando na caracterização das influências de fatores relacionados ao seu ambiente externo (VALENTIM, 2003).

A necessidade das organizações de evitar surpresas e imprevistos confere à IC uma posição privilegiada na nova economia como instrumento de suporte à área estratégica da organização. Esta importância se deve ao valor que a IC agrega, pro-piciando à organização a identificação de oportunidades e ameaças do mercado.

Buscando um consenso sobre o que significa o processo de IC, diversos auto-res o definem de diferentes formas, conforme descrito a seguir. A visão de IC como um processo é comum a diversas definições.

Segundo Canongia (1998, p. 2-3), o objetivo da IC é:

[...] agregar valor à informação, fortalecendo seu caráter estratégico, catali-sando, assim, o processo de crescimento organizacional. Nesse sentido, a coleta, tratamento, análise e contextualização de informação permitem a ge-ração de produtos de inteligência, que facilitam e otimizam a tomada de de-cisão no âmbito tático e estratégico.

(19)

[...] um conjunto de capacidades próprias mobilizadas por uma entidade lu-crativa, destinadas a assegurar o acesso, capturar, interpretar e preparar conhecimento e informação com alto valor agregado para apoiar a tomada de decisão requerida pelo desenho e execução de sua estratégia competiti-va.

Valentin (2003, p. 2) considera que a IC é:

[...] o processo que investiga o ambiente onde a empresa está inserida, com o propósito de descobrir oportunidades e reduzir os riscos, bem como diag-nostica o ambiente interno organizacional, visando o estabelecimento de es-tratégias de ação a curto, médio e longo prazo.

Mais recentemente, a Associação Brasileira de Analistas de Inteligência Competitiva - ABRAIC (2007) definiu IC como:

[...] um processo sistemático e ético de coleta, análise e disseminação de in-formações que visa descobrir as forças que regem os negócios, reduzir o risco e conduzir o tomador de decisão a agir proativamente, bem como pro-teger o conhecimento sensível produzido.

Pode-se, então, dizer que há consenso sobre o entendimento de que IC é um processo fundamental à organização. Além disso, são perceptíveis as necessidades de informação em diferentes níveis de complexidade da organização, supridas pela IC (VALENTIM, 2003). Neste trabalho, a IC é entendida como um processo contínuo de coleta e tratamento de informações oriundas do ambiente externo da organiza-ção, por meio do MA.

Giesbrecht (2000) define o processo de IC como o sensor que proporciona à organização o conhecimento das oportunidades e das ameaças identificadas no ambiente, que poderá instruir suas tomadas de decisão. Segundo o autor, a IC é um instrumento de decisão que visa agregar valor à função de informação.

Kahaner (1996), na mesma linha, define o processo de IC como o programa institucional e sistemático para garimpar e analisar informações sobre as atividades da concorrência e as tendências do setor específico e do mercado em geral com o propósito de levar a organização a atingir seus objetivos e metas.

2.1.1. Um sistema de inteligência competitiva

(20)

Figura 1: Sistema de Inteligência Competitiva (HERRING, 1996)

O SIC é formado por cinco etapas:

Planejamento e coordenação: são identificadas as informações primordiais pa-ra atender o processo e satisfazer as necessidades e objetivos da organização; Coleta e tratamento das informações: refere-se à identificação e mapeamento das fontes de informação internas e externas relevantes e à definição do tipo de tratamento a ser dado à informação;

Processamento e gestão: agora, é necessário filtrar e armazenar os dados co-letados, preparando-os para avaliação de sua acuracidade e da confiabilidade da fonte. Nesta etapa, são utilizados aplicativos específicos para a normaliza-ção e organizanormaliza-ção dos dados (CANONGIA, 1998);

Análise das informações: aqui, as informações coletadas são avaliadas com o objetivo de gerar informações seguras sobre os produtos de inteligência; e Disseminação: nesta fase ocorre a disseminação das informações processadas nas fases anteriores; nela a informação analisada é entregue em um formato coerente e convincente aos tomadores de decisão.

Herring (1996) define o SIC como:

[...] um processo organizacional de coleta e análise das informações, que por sua vez é disseminado como inteligência aos usuários em apoio à to-mada de decisões, tendo em vista a geração ou sustentação de vantagens competitivas.

(21)

Desta forma, ética e legalmente, as informações encontradas podem ser tratadas e armazenadas para uso do analista de inteligência.

O SIC é detalhado em seus sete subprocessos, conforme mostrado na Figu-ra 2 (GOMES e BRAGA, 2008).

Figura 2: Processo de inteligência competitiva (GOMES & BRAGA, 2005)

No subprocesso 1 (Identificação das necessidades de inteligência), são defnidas as informações que deverão ser acompanhadas pelos colaboradores para i-dentificar as necessidades da IC. São formados grupos de analistas de inteligência que deverão monitorar o ambiente externo com base nos parâmetros definidos, com o objetivo de realizar o planejamento dos produtos de inteligência.

Um dos meios que podem ser utilizados para a identificação das necessida-des da área de MA é por meio de entrevistas. Segundo Inácio (2008), essas neces-sidades podem ser identificadas a partir dos seguintes pontos: (i) que decisões pre-cisam ser tomadas? (ii) o que é necessário saber? (iii) o que já se sabe? (iv) por que se precisa saber disso? (v) quando será necessário saber disso? (vi) o que será feito com o produto de inteligência? (vii) quanto custa obtê-lo? (viii) quanto custa não

ob-Uso dos produtos de IC Identificação das

necessidades e fontes de informação

Coleta e armazenamento de informação Análise de informação Disseminação de produtos de Inteligência Avaliação dos produtos de Inteligência Avaliação do

processo de IC Identificação das

necessidades de Inteligência

1

2 3

4

5

(22)

tê-lo? Nesse subprocesso, inicialmente, busca-se identificar as decisões de risco que ainda não foram tomadas e avaliar os pontos mais importantes dos agentes ex-ternos com objetivo de monitorar informações relevantes. Este monitoramento ante-cipado permite a identificação de possíveis opiniões sobre possíveis surpresas.

Posteriormente, é realizada uma análise para avaliar se as necessidades de informação de inteligência foram corretamente definidas. Em um segundo momento, as informações são validadas junto aos analistas de inteligência, buscando identifi-car o escopo do monitoramento e avaliar se este atende às necessidades da tomada de decisão. A partir do mapa das necessidades de inteligência hierarquizadas pro-duzidos pelarelação de tópicos e questões relevantes, é possível definir os pontos que deverão ser monitorados com o objetivo de relacionar os produtos de inteligên-cia.

O segundo subprocesso (Identificação das informações e suas fontes) busca identificar as informações mais relevantes e úteis para auxiliar na resposta às ques-tões identificadas no primeiro subprocesso. Partindo das informações identificadas e do monitoramento direcionado, são planejadas as ações de coleta das informações relevantes. A maioria das fontes de informações relevantes é encontrada na Internet, sendo assim de domínio público. Têm-se como fontes públicas de fácil acesso e custos aceitáveis, segundo Inácio (2008): (i) revistas especializadas, (ii) jornais, (iii) sites especializados, (iv) sites dos concorrentes, (iv) sites dos colaboradores, (v) di-agnósticos setoriais, (vi) entidades empresariais, (vii) organismos de fomento e de desenvolvimento, (viii) dados oficiais dos governos, (ix) diagnósticos setoriais, territo-riais e empresaterrito-riais elaborados por terceiros, (x) bancos de dados disponíveis no mercado, (xi) periódicos e publicações especializadas.

Ao final desse subprocesso, tem-se a relação dos dados a serem coletados e os principais eventos estratégicos para obter as informações necessárias. Uma clas-sificação das fontes de informação é realizada conforme a sua confiabilidade, perio-dicidade e necessidade, tendo em vista os grupos de tópicos e as questões relevan-tes para a geração dos produtos de inteligência.

(23)

A utilização de ferramentas para a busca de informações sobre o ambiente externo na Web pode beneficiar empresas e demais setores da sociedade. Para que isso aconteça, as informações precisam ser compreendidas no âmbito de um deter-minado contexto de negócio. O grau de interatividade e facilidade de uso das ferra-mentas de recuperação deve ser adequado às necessidades dos analistas e depen-de do envolvimento depen-de outros atores que depen-demandepen-dem informações depen-de interesse.

O quarto subprocesso (Análise de informações) abrange a análise e transfor-mação das informações coletadas em produtos de inteligência. Nessa fase, é produ-zido um relatório com os resultados e recomendações sobre o assunto em questão. Por se tratar da fase de resultados, é um processo crítico para a criação da inção que requer envolvimento destacado dos analistas. O grupo de analistas, forma-do por profissionais com conhecimento sobre o assunto, busca a geração e análise do produto de inteligência para uma tomada de decisão.

O quinto subprocesso (Disseminação dos produtos de inteligência) envolve a entrega e compartilhamento da informação analisada, que poderá ser feito de forma presencial, utilizando a tecnologia existente ou por meio de outro canal confiável de troca de informações. Quanto à forma de disseminação da informação dentro da or-ganização, esta deverá ser definida pelos autores envolvidos.

A Internet é o meio privilegiado para a disseminação da informação dentro da organização. Outra possibilidade é que as informações relevantes sejam entregues de acordo com normas pré-estabelecidas.

Os produtos de inteligência buscam responder necessidades específicas. Iná-cio (2008) apresenta alguns exemplos desses produtos:

Sumários executivos, gerados principalmente a partir das fontes secundárias,

devem fornecer análises e considerações sucintas sobre possíveis implicações das informações coletadas para o negócio, indicando alternativas de ação.

Alertas são análises rápidas e breves sobre uma questão atual e relevante para

o setor interessado. Por exemplo, uma mudança inesperada na taxa de dólar ou da legislação pode gerar impactos imediatos para os negócios da empresa. Esse produto deve ser enviado por e-mail ou notificada sua existência em área de fácil acesso aos setores interessados.

Relatórios analíticos contêm análises aprofundadas sobre um tópico de

(24)

Projeções estratégicas tratam analiticamente de tendências-chave. São

produ-tos mais complexos para consumo de longo prazo e geralmente se servem de técnicas baseadas em cenários (ex: mercado emergente).

Análises de situação abordam aspectos do ambiente externo com potencial ou

implicações no negócio. São produtos de tamanho e complexidade média para a tomada de decisões de curto prazo.

O sexto subprocesso (Avaliação dos produtos de inteligência) visa avaliar a eficiência do produto gerado e os resultados práticos da sua aplicação (GOMES e BRAGA, 2008). Essa avaliação pode ser feita da seguinte forma:

• Avaliar o grau de satisfação dos clientes de IC em relação ao conteúdo dos

produtos recebidos;

• Verificar os resultados alcançados com a utilização dos produtos de inteligên-cia, incluindo o aumento de produtividade, redução de custos, investimentos em inovação e qualidade. No caso de projetos alocados para a Gestão Estra-tégica Orientada para Resultados, esses indicadores devem prever também aqueles pactuados nesses projetos.

Finalmente, com o sétimo subprocesso (Avaliação do processo de inteligên-cia) verifica-se a eficiência do processo desenhado em relação à elaboração e exe-cução do produto de inteligência. Este processo requer que sejam analisados os de-sempenhos dos subprocessos precedentes. A avaliação do desempenho de cada subprocesso pode se dar pela utilização de alguns dos indicadores descritos por I-nácio (2008): (i) número de solicitações ad hoc, (ii) número de atendimentos realiza-dos, (III) número de produtos entregues, (iv) número de clientes atendidos, (v) prazo de entrega dos produtos de IC, (vi) tempo de elaboração dos produtos e (vii) acuida-de das análises e previsões.

Assim, os subprocessos de IC contribuem para a formação de uma cultura competitiva dentro da organização de forma a possibilitar que essa esteja a par das transformações que ocorrem no seu ambiente de negócio, propiciando vantagens competitivas sobre as demais.

2.1.2. Fatores importantes para a construção do SIC

(25)

recomendam alguns passos para a construção de um SIC, antecedidos pela defini-ção das funcionalidades e do fluxo do SIC:

1. Definição da missão: definição clara das informações que deverão ser coleta-das para a tomada de decisões e do usuário final do produto de inteligência; 2. Realização de auditoria informacional: mapeamento e identificação das fontes

de informações existentes na organização, de forma a permitir sua utilização pelo analista de inteligência;

3. Realização de marketing: conscientização do corpo organizacional sobre a im-portância do SIC e a natureza das informações geradas. A equipe deve incluir uma pessoa em contato direto com os demais setores da organização e que garanta o comprometimento desses setores;

4. Incentivo para os funcionários, mostrando que a gerência reconhece a contribu-ição do analista de inteligência.

Um SIC é, na verdade, um ambiente de aprendizado com vários diferentes estágios, com um grande fluxo de informações e com elevado número de variáveis de entrada que se alteram e são decodificadas de acordo com os cenários apresen-tados. Um dos aspectos importantes na criação de um SIC é a facilidade de acesso aos resultados da análise pelos tomadores de decisão. Segundo Gomes e Braga (2005), um SIC deve ser de conhecimento de todos da organização, haja vista a ne-cessidade de não haver duvidas quanto aos aspectos éticos e legais de sua utiliza-ção pela organizautiliza-ção.

Para Tarapanoff (2001), a inclusão de MA aprimora um SIC. Isso pode se dar pela inclusão de um subsistema de interpretação capaz de monitorar o ambiente ex-terno, interpretar as informações coletadas e incorporar essas informações ao sis-tema. No estágio de monitoramento é realizada a coleta de dados, onde se define o processo de observação do ambiente e a geração de informações aos analistas de inteligência. Já a interpretação ocorre em um segundo momento, onde os dados são tratados e passam a ter significado, pelo processo de tradução de eventos e o de-senvolvimento de entidades compartilhadas. O aprendizado se diferencia do estágio de interpretação pela introdução da ação levando a uma nova resposta, baseada na interpretação. O aprendizado se completa pela observação dos resultados obtidos.

(26)

2.1.3. Monitoramento ambiental na Web

Com a crescente competitividade entre as organizações, os gestores passa-ram a requerer instrumentos computacionais capazes de auxiliar na obtenção de in-formações do meio externo. Nesse contexto, os dados externos tornam-se um im-portante complemento aos dados gerados internamente.

O objetivo da IC é transformar a informação bruta em conhecimento por meio de um esforço sistemático de captação, análise e recuperação de informações. Com a implantação de sistemas de monitoramento ambiental nas organizações, elas po-dem ter maior poder de decisão nas suas áreas estratégicas.

Conceitualmente, Braga (1998) vê o processo de MA como a identificação, o acompanhamento e a análise dos sinais de alerta coletados. Para que a coleta des-ses sinais possa ter relevância para a organização, os mesmos precisam ser sele-cionados cuidadosamente dentro de uma diversidade de informações coletadas para posterior detalhamento quanto a tendências e eventos emergentes. Em seus estu-dos, Bright (apud BRAGA, 1998) estabelece quatro atividades para o desenvolvi-mento de um processo de MA em uma organização: (i) buscar nos sinais coletados algumas informações sobre inovações tecnológicas emergentes, (ii) avaliar se as tendências dos sinais coletados são verídicas e possuem uma continuidade futu-ra, (iii) avaliar os parâmetros e decisões que deverão ser adotados com o objetivo de definir a tecnologia a ser adotada e (iv) apresentar as informações coletadas em tempo hábil, propiciando um maior poder de decisão por parte da área de planeja-mento estratégico.

(27)

Figura 3: Processo de monitoramento ambiental (GUIMARÃES, 2006)

O grande potencial da Web vem sendo comprovado à medida que são cria-dos sistemas que se servem de sua infra-estrutura e de seu conteúdo para os mais variados fins. A importância da Internet como ambiente de sistemas compartilhado e ubíquo tem levado a esforços como o MIX – Mediation of Information Using XML (BARU et al., 1999), que usa a tecnologia de agentes para integrar informações ori-undas de diversas fontes.

(28)

2.2. Tecnologia de agentes

Embora não haja uma definição universal para o termo “agente” no âmbito da computação, pode-se considerar que agentes são entidades de software desenvol-vidas para auxiliar uma outra entidade (humana ou artificial) na realização de uma determinada tarefa.

A tecnologia de agentes permite que se repense a natureza da interação en-tre homem e computador, tornando-se o segundo um parceiro do primeiro, coope-rando para o alcance dos objetivos traçados. Uma visão extremista dessa perspecti-va é a afirmação de Negroponte (1995) de que o futuro da computação será caracte-rizado por uma completa delegação por parte dos usuários aos computadores, sem a necessidade de qualquer tipo de manipulação. A utilização de agentes possibilita a implantação de um estilo complementar de interação, chamado gerência indireta, no qual o computador se torna uma entidade ativa, dotada de certo grau de autonomia e capaz de realizar tarefas que auxiliem o usuário no desempenho de suas ativida-des, de acordo com seus interesses.

2.2.1. Definição de agentes

O uso de agentes tem sido bastante explorado pela comunidade de Inteligên-cia ArtifiInteligên-cial. Segundo Russell e Norvig (2004), um agente é “uma entidade que pos-sui a capacidade de perceber um ambiente por meio de sensores e agir nesse am-biente por meio de atuadores”. Para Wooldridge e Jennings (1995), agente é um sis-tema computacional situado em um determinado ambiente capaz de ações autôno-mas com objetivos pré-definidos. Eles enumeram as propriedades básicas de um agente da seguinte forma:

Autonomia: agentesoperam sem a necessidade de intervenção humana ou ou-tra qualquer, e tem certo controle sobre suas ações e estados internos.

Habilidade social: agentes interagem com outros agentes (incluindo humanos) por meio de uma linguagem de comunicação específica.

(29)

inici-ativa da ação.

Pode-se identificar uma gradação de sua complexidade desde os mais sim-ples até aqueles capazes de se adaptar, passando pelos reativos e baseados em objetivos. Em Nwana (1996) é apresentada uma tipologia para agentes na qual eles são analisados segundo várias dimensões, como: (i) mobilidade, (ii) presença de um modelo de raciocínio simbólico, (iii) exibição de um conjunto ideal e primário de atri-butos, tais como autonomia, cooperação e aprendizagem, (iv) papéis desempenha-dos, (v) filosofias híbridas, decorrentes da combinação das características anteriores e (vi) atributos secundários, tais como versatilidade, benevolência, confiabilidade, qualidades emocionais. Com base nessas características, Nwana (1996) classifica os agentes como colaborativos, móveis, de informação/Internet, reativos, híbridos, inteligentes e de interface.

Para Russell e Norvig (2004), as características dos agentes estão sujeitas às propriedades do ambiente onde serão executadas suas ações. Eles classificam as propriedades desses ambientes em:

Totalmente observáveis× Parcialmente observáveis: se os sensores do agente

disponibilizam informações sobre todos os aspectos do ambiente monitorados e em tempo integral, esse ambiente é tido como completamente observado. Nesse caso, o agente não necessita manter qualquer controle de seu estado interno. Caso contrário, ele é parcialmente observável.

Determinístico × Estocástico: no caso determinístico, o estado do ambiente é

completamente determinado pelo estado corrente e pelas ações selecionadas pelo agente. Caso contrário, o estado é estocástico.

Episódico× Sequencial: o primeiro caso ocorre quando a experiência do

agen-te pode ser dividida em episódios não dependenagen-tes de ações passadas e cada percepção pode ser associada diretamente a uma ação. No sequencial, as de-cisões a serem tomadas dependem da sequência de ações ou percepções passadas;

Dinâmico × Estático: diz-se que um ambiente é dinâmico quando ele pode se

alterar enquanto o agente está decidindo que ação tomar. Quando o ambiente não sofre nenhum tipo de alteração ele é dito estático e o agente não se preo-cupa com o tempo enquanto decide qual ação será tomada.

(30)

con-táveis e distintas, diz-se que o ambiente é discreto. Caso contrário, ele é contí-nuo.

Agente único × Múltiplos agentes: ambientes onde devem conviver múltiplos

agentes precisam prover uma forma de comunicação entre eles. Quando isto não ocorre, tem-se um ambiente de agente único.

Além de estar sujeito às características do ambiente, um agente deve, em certo grau, e dependendo de seus objetivos (RUSSELL e NORVIG, 2004):

Continuar funcionando mesmo depois que seu agenciador não está mais pre-sente (Independência);

Poder se adaptar a múltiplos ambientes, envolvendo múltiplas plataformas e sistemas (Adaptabilidade);

Apesar de independente, poder ser monitorado (Rastreabilidade);

Ser capaz de lidar com erros, recursos escassos e dados incompletos ( Robus-tez);

Ser capaz de realizar a gestão de seu próprio ciclo de vida, ou seja, iniciar e cessar seu comportamento de acordo com critérios próprios ( Autogerencia-bilidade);

Focar nos interesses do usuário (Representatividade);

Poder trocar mensagens com outros agentes ou entidades, o que inclui seres humanos (Comunicabilidade);

Ser capaz de se deslocar de um ambiente para outro e mover-se dentro de um mesmo ambiente, devido à necessidade de se adaptar às várias plataformas e sistemas (Flexibilidade e Mobilidade);

Ter individualidade, ou seja, capacidade de diferenciar-se de outros agentes iguais a ele (Personalidade);

Poder exibir “estados emocionais” que caracterizem seu estado diante das me-tas que visa cumprir e do estado atual do ambiente (Emocionabilidade);

Poder proporcionar a ilusão de ser um ser vivo, com o qual o usuário se comu-nica (Credibilidade);

Perceber as mudanças em seu ambiente e ser capaz de adequar-se a essas mudanças (Reatividade);

(31)

Ter propósitos, ou seja, ser orientado a metas (Proatividade);

Ser um processo que roda continuamente, ou seja, tem um ciclo de vida pró-prio (Continuidade);

Utilizar suas experiências prévias para aprender e adaptar-se a mudanças no ambiente (Aprendizagem).

Rezende (2003), em uma síntese das diversas definições encontradas na lite-ratura, define um agente como uma entidade, real ou virtual:

Capaz de agir num ambiente,

Capaz de se comunicar com outros agentes,

Movida por um conjunto de inclinações (sejam objetivos individuais a atingir ou uma função de satisfação a otimizar),

Que possui recursos próprios,

Capaz de perceber seu ambiente (de modo limitado),

Que dispõe (eventualmente) de uma representação parcial deste ambiente, Que possui competência e oferece serviços,

Que pode eventualmente se reproduzir e

Cujo comportamento tende a atingir seus objetivos utilizando as competências e os recursos que dispõe e levando em conta os resultados de suas funções de percepção e comunicação, bem como suas representações internas.

2.2.2. Arquitetura de um agente

A arquitetura mostrada na Figura 4 (REZENDE, 2003) descreve os compo-nentes de um agente a partir do seu fluxo de controle de dados e seus módulos. Es-sa arquitetura procura apresentar os diferentes módulos necessários para a constru-ção de um agente e suas respectivas inter-relações. O modelo proposto por Rezen-de (2003) tem os seguintes elementos:

Para agentes cognitivos, o controlador funciona como uma agenda para deter-minar a ordem de ativação de seus processos internos. Nos agentes reativos, este componente é dispensável, pois há um mapeamento direto entre o padrão reconhecido e uma ação.

(32)

32

(33)

A

interface com o usuário

permite a interação do agente de

software

com agentes

humanos. Pode caber ao usuário definir suas necessidades e que atividades

de-verão ser realizadas de forma pró-ativa. É o meio pelo qual os resultados

avalia-dos são apresentaavalia-dos.

A

interface

permite a comunicação com outros agentes por meio de uma

lingua-gem específica, como a

Agent Comunication Language

(ACL). Esta comunicação

possibilita aos agentes compartilharem informações através de ontologias ou de

áreas compartilhadas (

blackboards

, por exemplo).

A

interface com o ambiente

permite ao agente perceber e atuar sobre o meio no

qual ele está inserido.

O

componente de mobilidade

é primordial quando se está tratando de agentes

moveis, pois é graças a ele que o agente conseguirá se locomover e executar em

outros ambientes.

Além das propriedades identificadas acima, um agente pode ser desenvolvido

utilizando conceitos como conhecimento, crenças, intenções, desejos, compromissos e

obrigações. No entanto, a atribuição de características antropomórficas a agentes é

bastante controversa dentro da comunidade científica.

No âmbito da IC, a tecnologia de agentes promete automatizar e dar agilidade à

coleta de informações por meio da análise de dados que alimentarão

Data Marts

13

e

Data Warehouses

, que, por sua vez, constituem uma fonte de informações para auxílio

na tomada de decisão.

2.3. Sistemas multiagentes

A aplicação de Sistemas Multiagentes (SMA) em IC e a disponibilização de

in-formações na Web oferecem uma oportunidade sem precedentes para aprendizagem

sobre o ambiente externo das organizações. Entretanto, a extração de informação

rele-vante neste contexto é uma tarefa trabalhosa na ausência de mecanismos

(34)

nais de suporte. A aplicação da tecnologia de SMA apresenta-se como uma solução

atrativa para este problema por permitir tanto o monitoramento de sensores na Web

quanto o tratamento distribuído da informação.

Atualmente, dois frameworks se destacam na criação de sistemas inteligentes,

possibilitado a criação de SMA que implementam as necessidade básicas de um

agen-te como mobilidade e comunicação.

O

framework

RETSINA

O

Reusable Environment for Task-Structured Intelligent Networked Agents

(RETSINA) é um modelo desenvolvido pela Universidade Carnegie Mellon (RETSINA,

2008). A arquitetura proposta por esse modelo é composta por quatro tipos básicos de

agentes:

(i)

agentes de Interface

, que permitem a interação do usuário,

(ii)

agentes de

tarefas

, responsáveis por coordenarem as demandas feitas pelo usuário,

(iii)

agentes

de informação

, que fornecem acesso a uma fonte heterogênea de informações, e

(iv)

agentes de mediação

, que buscam outros agentes que possam prover as informações

necessárias ou o serviço para o seu processo. Cada agente de RETSINA possui outros

quatro módulos reutilizáveis para a comunicação, planejamento, programação e

acom-panhamento da execução das tarefas e dos pedidos dos demais agentes. Este modelo

representa um esforço importante para fornecer uma base que permita padronizar os

tipos de agentes e suas arquiteturas.

O

framework

JADE

O

Java Agents Development Framework

(JADE) é um

framework

para o

desen-volvimento de aplicações baseados em agentes desenvolvido em Java pelo laboratório

(35)

agentes autônomos do JADE, e

(iv)

gerenciamento de mensagens, que permite a troca

de informações em formatos tais como FIPA-ACL. Além dessas características, JADE

possui alguns módulos que buscam simplificar a administração da plataforma de

agen-tes.

2.4. Técnicas para o tratamento das informações

Diversos métodos de tratamento da informação têm permitido que a IC seja mais

eficaz, tornando-se um dos principais diferenciais competitivos entre as organizações.

Nesse contexto, o profissional envolvido no processo de transformação do

conhecimen-to ainda representa um importante faconhecimen-tor de sucesso para a adequação das

necessida-des da organização, buscando reduzir custos, recursos materiais e tempo.

A IC busca aumentar a competitividade da organização com base em

informa-ções coletadas através de SICs. Técnicas de armazenamento como

data warehouses

(DW) e de descoberta de conhecimento em bancos de dados (DCBD) podem prover um

suporte importante tanto para a persistência quanto para o tratamento das informações

coletadas.

Data Warehouse

Um DW é um repositório de informações consolidadas, relativas às atividades de

uma organização. Sua modelagem dimensional favorece a confecção de relatórios,

análises de grandes volumes de dados e a obtenção de informações estratégicas que

podem facilitar a tomada de decisão.

(36)

No contexto da IC, o uso de DW pode facilitar a criação de visões de interesse

do analista, por meio de modelos dimensionais, e a manutenção de versões das

mes-mas ao longo do tempo.

Descoberta de conhecimento em bancos de dados

DCBD é um processo que integra diversas etapas nas quais são conduzidas

ati-vidades voltadas para a extração padrões novos e úteis em bases de dados. Esse

pro-cesso pode ser direcionado, onde se tem por objetivo predizer, classificar ou

caracteri-zar o comportamento de alguns grupos de indivíduos pré-identificados. Por outro lado, o

processo pode também ser não direcionado, quando se busca descobrir estruturas da

massa de dados sem que se tenha informação prévia sobre a mesma. A etapa central

do processo é a Mineração de Dados, ou

Data Mining

(DM), na qual algoritmos são

e-xecutados sobre a base de dados para a identificação de relações entre variáveis que

possam levar aos padrões desejados. Conforme Possas et Al. (apud VALENTIN, 2003):

[DM] é um conjunto de técnicas que envolvem métodos matemáticos, algoritmos e heurísticas para descobrir padrões e regularidades em grandes conjuntos de dados.

A seguir são apresentadas algumas das técnicas utilizadas na mineração de

da-dos:

Análise de Agrupamentos:

aplicada quando se necessita obter conjuntos de

gru-pos de objetos similares, segundo algum critério definido pelo analista, dentre os

representados na base de dados. Uma de suas aplicações ocorre na área de

mar-keting

para a segmentação de mercado buscando-se identificar grupos de clientes

com hábitos de compra similares.

Árvores de Decisão:

usada quando se necessita obter um classificador a partir de

dados históricos que possa ser aplicado a novos casos. Por exemplo, pode-se

cri-ar um classificador de doenças a pcri-artir de prontuários com casos já

diagnostica-dos e aplicá-lo para se diagnosticar novos casos. Esta técnica permite a geração

de regras que podem ser facilmente compreendidas pelos especialistas.

Redes Neurais Artificiais

(RNA): são modelos computacionais que permitem

(37)

ca-pacidade de aprender através de exemplos, sem a necessidade de serem

explici-tamente programadas. Para que consigam atingir esse patamar, muitas RNA

utili-zam o paradigma do aprendizado supervisionado. A utilização dessa abordagem

implica, muitas vezes, em limitações impostas pela necessidade de se conhecer

as informações fornecidas a rede. Segundo Almeida & Dumontier (1996), as redes

neurais são capazes de tratar dados incompletos ou distorcidos, produzindo

resul-tados satisfatórios a partir de generalizações.

2.5. Discussão

É necessário ressaltar que o referencial teórico estudado visa subsidiar a

elabo-ração da proposta, não significando que os elementos estudados tenham sido

totalmen-te utilizados no desenvolvimento do protótipo.

Assim é que, nesta primeira versão, nenhum dos

frameworks

estudados para o

desenvolvimento de SMA foi utilizado. A opção pela construção direta deve-se ao fato

de que o aprendizado do

framework

acarretaria uma carga maior de trabalho,

reque-rendo mais tempo para a conclusão do protótipo. Como a tecnologia utilizada já era

dominada pelo autor, esta foi a alternativa adotada. Entretanto, as vantagens dos

fra-meworks

são atrativas, principalmente pela facilidade de desenvolvimento e

padroniza-ção, e serão futuramente exploradas para o desenvolvimento de um novo sistema mais

flexível.

(38)

3. ASPECTOS METODOLÓGICOS

3.1. Classificação da pesquisa

Quanto ao meio de investigação, esta pesquisa é de campo. Esta abordagem

compreende a observação de fatos e fenômenos do ambiente real, buscando coletar

informações relevantes do mesmo. Com base em métodos adequados, essas

informa-ções são analisadas e interpretadas, objetivando compreender o problema de pesquisa.

No que se refere às perspectivas da pesquisa, trata-se de uma pesquisa

experi-mental, onde o desenho da solução é feito pela aproximação de modelos aos requisitos

do ambiente proposto.

Quanto à sua natureza, esta é uma pesquisa aplicada, pois é movida pela

ne-cessidade de construir artefatos para fins práticos, buscando soluções para problemas

concretos.

Na presente pesquisa, utiliza-se de procedimentos qualitativos para a obtenção,

análise e interpretação de informações sobre a situação problema, qual seja a de

espe-cificar e prototipar um modelo de monitoramento ambiental na Web. A escolha por tais

procedimentos decorre, principalmente, do caráter subjetivo da formulação dos

requisi-tos do modelo objetivado.

3.2. Delimitação do estudo e plataforma de trabalho

Este trabalho utiliza como referência o aplicativo WebMonitor, desenvolvido pela

Intext Mining

14

, que monitora páginas que o analista de inteligência cadastrou e informa

quando algo mudou.

O protótipo foi desenvolvido sobre a plataforma Java, provendo desta forma um

ambiente completo de desenvolvimento com características de interoperabilidade, entre

outras. A versão inicial do protótipo foi desenvolvida para ambiente

desktop

utilizando

os recursos da plataforma J2SE. Apesar de não ser voltada, usualmente, para o

desen-volvimento de aplicações para o ambiente Web, sua utilização se justifica por ser uma

plataforma de domínio do autor. Por outro lado, a versão utilizada facilitou uma

(39)

ção informal do protótipo.

O modelo criado é inspirado na metáfora de um painel de controle no qual estão

dispostas as variáveis monitoradas com suas respectivas propriedades e ações

associ-adas. Por exemplo, a variável “cotação de dólar” poderia ter associada como

proprieda-de o tipo proprieda-de cotação (venda ou compra) e como ação o disparo proprieda-de um alerta no caso proprieda-de

uma variação acima de certo limiar. A ferramenta de apoio permite a coleta de

informa-ções automaticamente de fontes de informainforma-ções na Internet, marcadas pelo analista. O

modelo de processo de IC é composto de cinco fases: planejamento e controle, coleta,

processamento e exploração, análise e produção (BERNHARDT, 2003).

O foco deste trabalho é definido como o desenvolvimento de

(i)

um modelo de

monitoramento de informação na Web e

(ii)

um protótipo que efetue o monitoramento

ambiental em uma área específica baseado em conceitos de agentes inteligentes. A

especificação do modelo inclui a definição e detalhamento dos diversos papéis para os

agentes (agentes de prospecção, mineração, persistência entre outros).

Cabe ressaltar ainda que apenas um sistema de monitoramento ambiental não é

suficiente para garantir a compreensão do ambiente externo, pois isto depende da

competência de analistas de informação e gestores em analisar e interpretar os sinais e

informações obtidas e seus reflexos no

modus operandi

da organização.

3.3. Metodologia de desenvolvimento do protótipo

(40)

4. MODELO PROPOSTO E PROTÓTIPO

Este capítulo tem como objetivo apresentar a arquitetura do modelo proposto a

partir dos estudos levados a cabo sobre o processo de IC e descrever o protótipo

de-senvolvido. Como mencionado anteriormente, protótipo foi desenvolvido como uma

a-plicação

desktop

(

standalone

), uma vez que este ambiente é mais simples e estável. Ao

contrário, aplicações Web necessitam de um navegador sujeito a uma série de

valida-ções para sua utilização. A idéia é que, após a validação das funvalida-ções do protótipo, o

mesmo seja portado para o ambiente Web, por meio da tecnologia JWS.

A seguir, são apresentados

(i)

uma descrição do modelo proposto,

(ii)

os tipos

básicos de agentes contidos no modelo e

(iii)

o projeto da interface.

4.1. Contexto

O contexto para apresentação do modelo proposto é apresentado nesta seção

por meio de uma representação operacional, conforme mostrado na Figura 5. Essa

re-presentação inclui as seguintes fases:

Fontes de informação:

são definidas, escolhidas e selecionadas de acordo com o

propósito do trabalho. As informações podem estar em fontes diversas,

tradicio-nais ou não, o que vai requerer dos analistas de inteligência uma grande visão e

poder de associação. Muitas vezes a informação crítica não está explícita, mas as

informações publicadas e disponíveis podem levar à conclusão desejada. Para a

realização desta etapa, foi disponibilizada uma cópia do protótipo para os analistas

de inteligência da organização, com o propósito de se testar a ferramenta em

situ-ações reais. Com o

feedback

dos analistas, foi realizado o aprimoramento do

pro-tótipo. Em seguida, definiram-se algumas páginas de instituições que seriam

a-companhadas.

Dados:

são elementos de informações coletados que devem ser classificadas e

(41)

Figura 5: Modelo de contextualização do W3EnvScam

Geração das Informações:

é a fase onde são compilados os dados coletados e a

geração da informação focada no propósito do trabalho em questão. É a etapa da

estruturação das informações e dos cruzamentos entre si. Avalia-se a

interdepen-dência e estabelecem-se proposições que auxiliarão na obtenção dos resultados

esperados.

Na fase

Conhecimento

as informações passam por um processo de validação,

com foco naquilo que se deseja obter. As informações obtidas são confrontadas

com o que se busca e sua importância frente aos referenciais estratégicos é

aferi-da.

Na fase

Inteligência

os gestores aplicam ao conhecimento gerado suas

(42)

concorrên-cia.

Na fase

de Decisão

os analistas de inteligência, juntamente com os gestores,

ava-liam os resultados obtidos em relação às estratégias adotadas, buscando extrair

os insumos para a tomada de decisão.

Em

Resultado obtido

verifica-se o grau de acerto das decisões tomadas com base

nas direções escolhidas e

corrigem-se rumos. Essa etapa fornece indicadores

so-bre todas as etapas anteriores e, se bem utilizada, pode auxiliar no aprimoramento

do processo de tomada de decisões na organização.

A opção por situar o modelo proposto neste contexto deve-se à própria natureza

técnica da proposta, que envolve uma ferramenta de IC, para a qual um fundo mais

o-peracional mostra-se mais adequado.

4.2. Descrição do modelo

O modelo de monitoramento proposto tem como objetivo permitir que o analista

tenha uma maior independência na definição das variáveis que serão monitoradas. Esta

independência por parte do analista de inteligência em avaliar as reais necessidades na

escolha dos parâmetros a serem utilizados requer um maior conhecimento da

arquitetu-ra e do modo de funcionamento dos sites. Na versão inicial do protótipo, procurou-se

testar e analisar as possibilidades de tecnologias existentes para a localização de

in-formações através da Internet, municiando apenas a parte inicial do processo de IC,

qual seja, Coleta e Análise de Informação.

O protótipo foi desenvolvido com características de portabilidade, o que permite a

sua utilização em diferentes plataformas, tanto de hardware como de software,

garan-tindo um elevado grau de escalabilidade. O nome proposto para o protótipo é

W3EnvScan que significa

World Wide Web Environmental Scanning

ou Monitoramento

Ambiental na Web.

(43)

amenizar tais problemas, propõe-se, no modelo aqui apresentado, que as informações

sejam armazenadas em um banco de dados sobre o qual poderão ser realizadas

con-sultas e validações das informações recuperadas.

Figura 6: Estrutura de coleta e monitoramento do W3EnvScan

O sistema é capaz de acompanhar as páginas cadastradas, em tempo real

(co-mo se fosse um usuário) e em períodos parametrizados, para extrair os indicadores e

gerar aviso de falha, no caso de não se conseguir acessar o sítio. No momento do

a-cesso, são geradas informações sobre as páginas monitoradas com base em uma

sele-ção textual realizada pelo analista de inteligência. O monitoramento é realizado

exclusi-vamente via reconhecimento textual. Na versão atual do protótipo, informações contidas

nas imagens, gráficos e vídeos não são considerados para efeito de monitoramento.

O monitoramento se dá por meio de três agentes:

Agente Web

ou

de Monitoramento:

tem como finalidade efetuar acessos e a

verifi-cação periódica das páginas cadastradas pelo usuário em busca de atualizações.

O resultado gerado é uma lista de páginas e seus respectivos estados.

Agente de Busca:

tem a tarefa de recuperar, também em um ambiente Web, as

in-formações especificadas pelo analista de inteligência.

Agente de RSS:

tem como finalidade visitar canais previamente cadastrados pelos

usuários no intuito de buscar novas páginas que atendam às suas necessidades.

Utiliza a tecnologia

Really Simple Sindication

(RSS) que se baseia em um arquivo

XML que contém as definições de um canal de comunicação com a descrição de

suas respectivas páginas. O RSS serve como um contêiner de informações, onde

são apresentados diversos links de páginas com as suas descrições. Esta

tecno-logia é muito utilizada em páginas ou portais que possuem atualizações

frequen-Ethernet SBBD

Intranet

Internet

Web server

Imagem

Figura 1: Sistema de Inteligência Competitiva (HERRING, 1996)

Figura 1:

Sistema de Inteligência Competitiva (HERRING, 1996) p.20
Figura 2: Processo de inteligência competitiva (GOMES & BRAGA, 2005)

Figura 2:

Processo de inteligência competitiva (GOMES & BRAGA, 2005) p.21
Figura 3: Processo de monitoramento ambiental (GUIMARÃES, 2006)

Figura 3:

Processo de monitoramento ambiental (GUIMARÃES, 2006) p.27
Figura 4: Arquitetura básica de um agente (REZENDE, 2003)

Figura 4:

Arquitetura básica de um agente (REZENDE, 2003) p.32
Figura 5: Modelo de contextualização do W3EnvScam

Figura 5:

Modelo de contextualização do W3EnvScam p.41
Figura 6: Estrutura de coleta e monitoramento do W3EnvScan

Figura 6:

Estrutura de coleta e monitoramento do W3EnvScan p.43
Figura 8: Cadastro de serviços no W3EnvScan

Figura 8:

Cadastro de serviços no W3EnvScan p.45
Figura 9: Browser do W3EnvScan

Figura 9:

Browser do W3EnvScan p.46
Figura 10: Cadastro de serviço pelo browser do W3EnvScan

Figura 10:

Cadastro de serviço pelo browser do W3EnvScan p.50
Figura 11: Exemplo de cadastramento com o W3EnvScan

Figura 11:

Exemplo de cadastramento com o W3EnvScan p.50
Figura 12: Exemplo de monitoramento com o W3EnvScan

Figura 12:

Exemplo de monitoramento com o W3EnvScan p.51
Figura 13: Exemplo de Objetos de Monitoramento

Figura 13:

Exemplo de Objetos de Monitoramento p.55

Referências