Método de Classificação Hierárquica Simbólica:

Tempo Hospital 1 [20,40] Hospital 2 [35,50] Hospital 3 [25,60] Hospital 4 [10,30]

Sexo Nacionalidade Grupo 1 {M} {Francesa, Portuguesa} Grupo 2 {M,F} {Espanhola, Portuguesa}

Profiss˜ao Grupo 1 Professores (70%) Gestores (30%) Grupo 2 Gestores (20%) Economistas (40%) Professores (40%)

k l=1 √ pl √ k

k l=1 √ 1−pl

Idade Sexo Nacionalidade Profiss˜ao

Grupo 1 [20,30] {M} {Francesa} Professor (70%)

Gestor (30%)

Grupo 2 [35,45] {M} {Espanhola, Francesa} Professor (40%)

Economista (40%) Gestor (20%) Grupo 3 [37,55] {F} {Espanhola, Portuguesa} Professor (50%)

Economista (20%) Gestor (30%)

Grupo 4 [40,62] {M,F} {Italiana, Alem˜a} Professor (30%)

Economista (40%) Gestor (30%)

0.7+√_√0.4+√0.3

Método de Classificação Hierárquica Simbólica:

Em [2] foi proposto um método de classificação hierárquica/piramidal conceptual as-

cendente para dados simbólicos. Neste trabalho será apenas analisada a classificação

hier´arquica.

O m´etodo permite considerar como entrada um conjunto de dados simb´olicos onde

cada elemento é descrito por variáveis simbólicas com a possibilidade de ter variáveis

de diferentes tipos. O critério que conduz à formação de classes é a dualidade intensão-

extens˜ao: cada classe da hierarquia deve corresponder a um conceito, isto ´e, cada classe

que é uma parte de E é representada por uma descrição cuja extensão é a classe propria-

mente dita.

O m´etodo pode ser resumido da seguinte forma: para cada candidato a classe, ´e cons-

tru´ıda uma descrição, generalizando as descrições correspondentes às classes a serem

agrupadas e uma classe candidata é eleg´ıvel apenas se esta nova descrição cobrir todos os

elementos da classe e nenhum outro. Cada classe formada fica associada a uma conjunc¸˜ao

de propriedades nas variáveis descritivas, que constituem uma condição necessária e su-

ficiente para adesão à classe. Para escolher entre as diferentes agregações que reúnem

a condição acima, um grau de generalidade avalia a proporção do espaço coberto pela

descrição considerada e a agregação que apresenta generalidade m´ınima é a classe a ser

formada.

Uma medida de generalidade permite quantificar a generalidade de uma descric¸˜ao,

permitindo assim escolher de entre as agregac¸˜oes poss´ıveis de uma dada etapa. O princ´ıpio

ser´a que as classes associadas a conceitos mais espec´ıficos devem ser formadas antes.

Escolhe-se então, de entre as classes que podem ser formadas, aquela cuja intenção do

conceito associado apresenta uma menor generalidade.

A formação de um novo conceito implica a determinação da sua intensão na forma de

uma descrição que deve generalizar os objetos associados aos conceitos que são agrupa-

dos. O processo de generalização das classes difere de acordo com o tipo de variável:

a. Vari´aveis intervalares

Sejam Y

, ..., Y

as p vari´aveis reais ou intervalares, Y

(ω

) = [l

, u

] (eventual-

mente l

= u

) e A = {ω

, ..., ω

} ⊆ E. A generalização pela união é definida por

f

: P (E) → I

, onde I ´e o conjunto de intervalos de IR, com a ordem de inclus˜ao,

tal que f

(A) = (I

, ..., I

), I

= [M in{l

}, M ax{u

}], ω

∈ A, j = 1, ..., p, isto

´e, I

´e o menor intervalo que cont´em todos os valores tomados pelos elementos de

A para Y

. A aplicac¸˜ao g

: I

→ P (E) que dá a extensão de uma descrição, é

g

((I

, ..., I

)) = {ω

∈ E : Y

(ω

) ⊆ I

, j = 1, ..., p}. O par (f

, g

) constitui

uma correspondˆencia de Galois [4].

Exemplo:

Considere quatro hospitais para os quais foram recolhidos dados relativos ao tempo

de espera dos doentes para serem atendidos no servic¸o de urgˆencias, medido em

minutos (vari´avel intervalar).

Tabela 4.2: Vari´avel intervalar

A descrição generalizada da classe A = {Hospital 1, Hospital 2} é f

(A) =

{[20, 50]}, que descreve os hospitais em que o tempo de espera para atendimento

nos servic¸os de urgˆencia varia entre os 20 e os 50 minutos.

b. Variáveis Categóricas de Valor Único e Multi Valor

Sejam Y

, ..., Y

_{: P (E) → I}

_{, onde I ´e o conjunto de intervalos de IR, com a ordem de inclus˜ao,}

_((I

_{(A) = (d}

_{: D → E que dá a extensão de uma descrição, é g}

_((d