4.2 Processos Internos do Modelo Quantify
4.2.3 Fus˜ao de Informac¸˜oes com Crit´erios de Qualidade
Visando cumprir os objetivos dispostos nesta tese, ´e proposto um processo de que organiza a fus˜ao de informac¸˜oes em detalhes quanto ao fluxo de entradas e sa´ıdas de informac¸˜ao com o objetivo de melhorar SAW para um sistema de tomada de decis˜ao em cen´arios complexos e de gest˜ao de emergˆencias.
Este processo pode ser abstra´ıdo em duas etapas principais, cada qual com seus mecanis- mos internos que desempenham pap´eis espec´ıficos, mas de grande contribuic¸˜ao para melhorar a representatividade da informac¸˜ao. As etapas (destacados em cinza claro) s˜ao: busca por informac¸˜oes sin´ergicas e a associac¸˜ao multicrit´erios, descritas em detalhes nas pr´oximas sec¸˜oes e ilustrada na Figura 4.7.
Figura 4.7: Processo de Fus˜ao de Informac¸˜oes com Crit´erios de Qualidade (cinza claro) e etapas adjacentes (cinza escuro)
4.2.3.1 Busca por Informac¸˜oes Sin´ergicas
Ap´os a aquisic¸˜ao e a avaliac¸˜ao de qualidade, um novo objeto JSON (JavaScript Object Notation) ´e produzido. Este objeto corresponde ao que conhecemos por resultados de N´ıvel L1 de fus˜ao de dados, com objetos e atributos (de acordo com a taxonomia JDL), juntamente com ´ındices de qualidade atribu´ıdos a cada objeto e ´ındices gerais de qualidade, de acordo com a metodologia apresentada para a avaliac¸˜ao da qualidade de objetos, atributos e situac¸˜oes identificados em tempo de aquisic¸˜ao.
Tal objeto JSON decodificado abastece a criac¸˜ao de uma ontologia preliminar (descrita mais adiante neste cap´ıtulo), que representa uma instˆancia semˆantica inicial de uma situac¸˜ao, com suas classes correntes, como por exemplo: pessoas, objetos e locais, cada qual com seus respectivos atributos, organizados semanticamente e com ind´ıcios de atividades em comum entre as mesmas (propriedades de relacionamento), definidas em tempo de aquisic¸˜ao.
trada para a fus˜ao de informac¸˜oes. Dentre os parˆametros de entrada est˜ao os pr´oprios objetos identificados nas fases anteriores, o tipo de fonte de dados, quais propriedades devem estar presentes e at´e mesmo um limiar de qualidade das informac¸˜oes, como mostra a Figura 4.8.
Figura 4.8: Entrada multicrit´erios para o processamento da fus˜ao
Uma vez que o processo de fus˜ao ´e iniciado, ´e realizada a busca de informac¸˜oes sin´ergicas entre as classes que j´a est˜ao presentes na ontologia atual, e que podem deter informac¸˜oes de objetos, atributos, propriedades e ´ındices de qualidade que possuem algum tipo de corres- pondˆencia.
Ap´os a busca de informac¸˜oes sin´ergicas entre as informac¸˜oes j´a representadas na ontolo- gia, ´e realizada uma busca por mais informac¸˜oes que ainda n˜ao foram consideradas no pro- cesso, provenientes da mesma fonte ou de outras fontes de dados, e que j´a foram submetidas ao processo de “Aquisic¸˜ao de Dados HUMINT”. Esta rotina ´e realizada a fim de obter novas informac¸˜oes sobre os objetos associados em cada momento, validando e dando maior con- sistˆencia as informac¸˜oes j´a definidas. A entrada deste processo ´e uma informac¸˜ao isolada (de N´ıvel 1 JDL) ou j´a associada entre objetos (de N´ıvel 2 JDL), e o resultado desta etapa poder´a ser tamb´em um novo objeto ou uma nova situac¸˜ao.
Este processo poder ser implementado por um algoritmo baseado nas t´ecnicas de minerac¸˜ao de dados, o algoritmo apriori, que infere a frequˆencia da presenc¸a de certas informac¸˜oes quando analisadas em relac¸˜ao ao resto de um ambiente (informac¸˜ao da situac¸˜ao e demais fontes). Esta inferˆencia ´e feita a partir de uma f´ormula de c´alculo do suporte de informac¸˜ao (covariˆancia), de acordo com a Figura 4.9.
Para o processo aqui proposto, s˜ao utilizados os princ´ıpios da minerac¸˜ao de dados, mas com algumas alterac¸˜oes realizadas com o objetivo de calcular a frequˆencia de tais informac¸˜oes, por um ´unico n´o ou parˆametro proposto, ou seja, ele procura a covariˆancia entre os dados e calcula este ´ındice de relacionamento. Trata-se do c´alculo do total de todos os itens relacionados, dividido pelo total de itens dispon´ıveis em todas as informac¸˜oes.
Figura 4.9: Parte do n ´ucleo do algoritmo de minerac¸˜ao de dados
Como resultado desse processo ´e obtido um conjunto de informac¸˜oes iniciais complemen- tadas `as novas informac¸˜oes com seus respectivos atributos, ´ındices de qualidade, propriedades e ´ındice de relacionamento entre tais informac¸˜oes.
4.2.3.2 Associac¸˜ao Multicrit´erios
A associac¸˜ao multicrit´erio usa as informac¸˜oes sin´ergicas encontradas sob os crit´erios men- cionados, por´em de forma combinada e hier´arquica. Esta associac¸˜ao atende tamb´em aos crit´erios pr´e-definidos de ´ındices de qualidade e propriedades semˆanticas. O processo a seguir insere uma nova informac¸˜ao na ontologia, satisfazendo a similaridade encontrada no contexto da informac¸˜ao original, e satisfazendo os multicrit´erios definidos no processo anterior. A Figura 4.10 mostra parte do n´ucleo do algoritmo de associac¸˜ao multicrit´erio.
Figura 4.10: Parte do n ´ucleo do algoritmo de associac¸˜ao multicrit´erio
Multicrit´erios podem ser definidos por duas fontes, uma sendo a entrada do operador em tempo de operac¸˜ao do sistema e a outra com base nas informac¸˜oes e conhecimento obtidos via an´alise de requisitos, antes da operac¸˜ao do sistema, e que incidem automaticamente sobre os algoritmos deste processo.
Como resultado da parte automatizada, todas as informac¸˜oes iniciais que s˜ao submetidas ao processo de fus˜ao s˜ao analisadas em busca de sinergia, com novos atributos, propriedades e
at´e mesmo novos objetos encontrados durante o processo, de forma combinada e hier´arquica, resultando em novas informac¸˜oes situacionais.
Este resultado pode ser submetido novamente ao processo anterior de busca de dados sin´ergicos, aumentando a capacidade do processo para encontrar novas informac¸˜oes e consoli- dar ainda mais as informac¸˜oes j´a encontradas.
Desta forma, a informac¸˜ao ´e especializada cada vez mais, enriquecendo a situac¸˜ao atual, ou parte da situac¸˜ao. Este processo ´e c´ıclico e ´e realizado toda vez que o resultado da associac¸˜ao
multicrit´erio n˜ao encontrar informac¸˜oes dentro dos limiares necess´arios, definidos ou pela determinac¸˜ao do humano ou delimitados pelo sistema.
Se um segundo ciclo n˜ao ´e realizado, as informac¸˜oes resultantes ser˜ao submetidas ao pro- cesso de avaliac¸˜ao de qualidade de informac¸˜oes, agora pontuando as novas informac¸˜oes encon- tradas, incidindo tamb´em nos ´ındices da situac¸˜ao corrente. Ap´os este processo, a informac¸˜ao reavaliada pela avaliac¸˜ao de qualidade da informac¸˜ao, ser´a re-instanciada na ontologia, descrita nas pr´oximas sec¸˜oes e representada para o uso do sistema.
No processo automatizado de fus˜ao realizado imediatamente ap´os a aquisic¸˜ao e avaliac¸˜ao de qualidade da informac¸˜ao, ´e feito o maior n´umero poss´ıvel de associac¸˜oes entre os objetos, seus atributos, propriedades e seus ´ındices de qualidade e limiares de qualidade pr´e-determinados, considerando a existˆencia de dois ou mais conjuntos de dados dispon´ıveis a partir da mesma fonte ou de fontes diferentes.
Este processo, chamado de fus˜ao prim´aria, atende aos requisitos de informac¸˜ao, ou seja, os crit´erios de propriedades definida na an´alise dos requisitos, tais como n´ıveis m´ınimos de quali- dade e principais propriedades entre as informac¸˜oes, que ´e ´util para definir o que deve ser pro- cessado primeiro e consequentemente mostrado para o operador. Estes requisitos de informac¸˜ao s˜ao baseados em um question´ario aplicado a diversos especialistas de diversas func¸˜oes e tempo de carreira, garantindo assim uma vis˜ao heterogˆenea do assunto e tamb´em o gerenciamento e validac¸˜ao dos crit´erios mais importantes para uma dada situac¸˜ao.
No caso da fus˜ao sobre demanda do operador humano, o algoritmo ´e ativado mais uma vez, mas os crit´erios de integrac¸˜ao s˜ao inteiramente selecionados pelo operador atrav´es da interface de usu´arios, em vez de todas as combinac¸˜oes poss´ıveis de objetos, atributos e propriedades identificados na fase de aquisic¸˜ao.
Este processo de associac¸˜ao, agora manual, al´em de ser baseado em objetos e atributos, ´e fortemente apoiado em ´ındices de qualidade e hip´oteses sobre informac¸˜oes relacionadas a objetos previamente classificados, que foram obtidos em ciclos passados ou diferentes fontes
de dados.
Uma vez que este processo de entrada ´e realizado pelo operador atrav´es de uma interface de usu´ario, os crit´erios para o processo de fus˜ao de dados podem ser escolhidos e alterados pelo mesmo operador humano, assim como a remoc¸˜ao de crit´erios pr´e-definidos pela an´alise de requisitos. Esta capacidade demonstra a flexibilidade da estrutura para receber e processar diferentes crit´erios para uma determinada situac¸˜ao, al´em de permitir que os agentes possam interagir com o sistema baseados nas suas experiˆencias e conhecimentos, contribuindo assim, para o processo de construc¸˜ao e desenvolvimento de SAW.