5.2 Propostas de Redução do Reticulado Conceitual
5.2.2 Representação Baseada em Agrupamentos RBA
A segunda proposta de redução da complexidade do reticulado conceitual é chamada representação baseada em agrupamento (RBA). Diferentemente do método JBS, que atua no contexto formal, o método RBA é aplicado durante o processo de construção do reticulado conceitual. A partir dos atributos de maior relevância, que são identificados pelo usuário para uma determinada aplicação, gera-se um lista de conceitos formais C. Essa lista é utilizada para construir o reticulado conceitual através de uma busca em largura, que inicia de cada conceito formal c ∈ C, até alcançar uma profundidade máxima, chamada de raio. Em síntese, o método RBA procura construir o reticulado conceitual considerando apenas os conceitos que orbitam os conceitos centrais, os quais são os primeiros conceitos formais que possuem os atributos considerados de maior relevância.
Antes de aplicar o método RBA é necessário determinar conjuntos de conjuntos de atributos K ⊆P(M) considerados mais relevantes. Se {mi} ∈ K, é porque se considera
que os conceitos que contêm miem suas intensões não podem ser descartados. Por outro
lado, se {mi, mj} ∈ K são importantes os conceitos em que ambos ocorrem. E assim por
diante. Observe que o conjunto K é o primeiro parâmetro de redução da complexidade utilizado pelo método RBA.
O segundo parâmetro necessário no método RBA é chamado raio r, que representa a partir de cada conceito formal c ∈ C a maior profundidade e altura alcançáveis a partir de c. Note que o valor de r é o segundo parâmetro de redução da complexidade utilizado pelo método RBA. Uma segunda opção de parada, conforme poderá ser observado, é um número máximo de conceitos formais.
A partir dessa apresentação inicial pode-se descrever o método, conforme os passos apresentados a seguir:
1. determine o conceito supremo (G, G0) e o conceito ínfimo (M0, M) do contexto formal (G, M, I).
2. selecione os conjuntos de conjuntos K ⊆ ℘(M) de atributos mais relevantes. 3. para cada conjunto H ∈ K determine um conceito formal c, formando assim um
4. faça uma expansão em largura partindo dos conceitos de C até alcançar o raio r, ou um número máximo de conceitos.
O método apresentado se concretiza no Algoritmo 13. Algoritmo 13 Algoritmo RBA
Entrada: Um conjunto de conjuntos de atributos K, um contexto formal (G, M, I), um valor de raio r e um número máximo de conceitos n.
Saída: Um reticulado L. 1: i=0
2: C = { (H0,H00) | H ∈ K}
3: inicialize L com os conceitos formais (G,G0) e (M0,M) 4: adicione em L cada conceito c ∈ C
5: sup = c 6: inf = c
7: enquanto i6 r e L possui menos de n conceitos faça
8: S =S
{ vizinhos superiores de c | c ∈ sup }
9: I =S
{ vizinhos inferiores de c | c ∈ inf } 10: sup = S
11: inf = I
12: adicione em L cada conceito c ∈ sup 13: adicione em L cada conceito c ∈ inf 14: i=i+1
15: fim enquanto 16: retorne L
A seguir um exemplo de aplicação do método RBA é apresentado. Seja o contexto formal para taxonomia dos animais apresentado na Tabela 1.1 e o reticulado conceitual equivalente apresentado na Figura 1.1. Suponha que no universo descrito pelo contexto formal, os atributos (h) raciocínio e (c) respiração branquial apresentem maior impor- tância para a aplicação que se tenha em mente, ou seja, k = {{h}, {c}}. Considere também um raio r = 2 e n = 2|M|(nesse caso o número de conceitos é irrelevante).
Nesse caso, a lista de conceitos C de maior representatividade será {({3}{b, d, e, g, h}), ({2, 6}{a, c})} que representam (3) humano possuindo as ca- racterísticas (b) terrestre, (d) respiração pulmonar, (e) pêlos, (g) glândulas mamárias e (h) raciocínio e (2) sapo e (6) tubarão possuindo as características (a) aquático e (c) respiração branquial.
5.2. PROPOSTAS DEREDUÇÃO DO RETICULADOCONCEITUAL 75 Na Figura 5.3 os conceitos formais iniciais gerados são apresentados; observe que nesse caso tem-se um raio igual a 1 (r = 1). Na Figura 5.4 a estrutura do reticulado para r= 2 é apresentada, e finalmente, na Figura 5.5 o reticulado obtido para r = 3 pode ser observado. Note que o reticulado final obtido não é idêntico ao reticulado original apresentado na Figura 1.1. O conceito formal ({5}, {b, d, f }), que representa o animal (5) coruja possuindo as características (b) terrestre, (d) respiração pulmonar e (d) penas não é gerado pelo método. Essa diferença é provocada pelo processo de construção do reticulado conceitual proposto pelo método RBA.
Figura 5.3: Reticulado conceitual criado pelo método RBA para r=1.
Figura 5.4: Reticulado conceitual criado pelo método RBA para r=2.
Note também que alguns valores de raio podem provocar inconsistências no reticulado. Por exemplo, na Figura 5.4 os conceitos formais ({2}, {a, b, c, d}) e ({4}, {b, d, e, g}) que representam o animal (2) sapo possuindo as características (a) aquático, (b) terrestre, (c) respiração branquial e (d) respiração pulmonar e o animal (4) macaco possuindo as características (b) terrestre, (d) respiração pulmonar, (e) pêlos e (g) glândulas mamárias respectivamente, compartilham as características (b) terres- tree (d) respiração pulmonar. Entretanto, para r = 2 não existe um conceito superior que possui somente as características (b) e (d). Observe que apenas para r = 3, Figura 5.5, esse conceito é adicionado. Novamente, essa diferença é provocada pelo processo de construção do reticulado conceitual proposto pelo método RBA, o qual realiza uma expansão em largura partindo dos conceitos chaves. Note que não são criado conceitos formais, e sim identificados aqueles pertencentes ao reticulado conceitual original, que estão dentro de um parâmetro estipulado.
Em relação às métricas propostas para análise da qualidade do conhecimento repre- sentado, na Tabela 5.6 a fidelidade e a perda descritiva para cada valor de raio r podem ser observadas. Note que, com o aumento do valor de raio, a fidelidade aumenta e a perda descritiva diminui. Ou seja, a perda torna-se menor e o conhecimento represen- tado mais consistente.
Tabela 5.6: Fidelidade e Perda descritiva para o contexto formal descrevendo a taxono- mia dos animais.
Raio r Fidelidade (%) Perda Descritiva (%)
1 76.19 58.33
2 74.07 33.33
3 85.18 13.88
Em relação aos grupos de técnicas para redução da complexidade do reticulado con- ceitual propostos na Seção 3.8, redução baseada no conhecimento do usuário e redução baseada na eliminação de informação redundantepropostos, note que o método RBA é classificado com uma redução baseada no conhecimento do usuário. Já em relação aos principais métodos de redução da complexidade do reticulado conceitual observados na literatura, o método RBA é similar aos métodos que atuam no reticulado conceitual (Subseção 3.8.2). Por exemplo, ao método apresentado por Arévalo et al. [2007], que propõe a geração de sub-hierarquias conceituais, e ao método apresentado por Stumme
5.2. PROPOSTAS DEREDUÇÃO DO RETICULADOCONCEITUAL 77 et al. [2002], que propõe apenas a geração de conceitos formais frequentes para cons- trução do reticulado conceitual.
O principal mérito do método RBA é selecionar do reticulado conceitual apenas o conjunto de conceitos formais mais relevantes, e em seguida, construir apenas a hierar- quia conceitual próxima desses conceitos. Criando dessa forma, um reticulado concei- tual reduzido.
Capítulo 6
Análise dos Resultados
Este capítulo tem como objetivo avaliar os principais paradigmas de construção dos reticulados conceituais através do benchmark proposto na Seção 4.2. Também serão avaliadas as técnicas de redução da complexidade propostas na Seção 5.2 utilizando o processo de avaliação discutido na Seção 5.1.
Todos os testes realizados foram feitos utilizando o arcabouço EF-Concept Analysis (Seção 4.1) em um computador com as seguintes características:
• fabricante: Dell;
• modelo: Latitude D630;
• processador: Intel(R) Core (TM) 2 Duo T7100 - 1.80 GHz, 1.80 GHz; • memória RAM: 2 GB;
• tipo de sistema: sistema operacional de 32 bits; • sistema operacional: Ubuntu 9.04;
• máquina virtual Java: versão 1.6.0-11.
Cabe ressaltar que não é possível ter controle sobre possíveis interferências da lin- guagem de programação utilizada e que todos os testes foram realizados utilizando ape- nas memória primária.
6.1
Avaliações do Benchmark Proposto
Nas subseções a seguir é feita uma avaliação dos paradigmas de construção do reticulado conceitual para o benchmark real e sintético propostos.