2 TEORIA
2.6 Os objetos de estudo da Terminologia
2.6.3 O texto especializado
L’ensemble des formalismes présentés précédemment se divise essentiellement en deux catégories :
– ceux qui modélisent une TM en théorie des graphes : c’est à dire le format TMG (voir section 2.3.4) et le format à base d’hypergraphes (présenté en section 2.3.5) ; – et ceux qui conservent au mieux la structure du document XTM : c’est à dire le format TMDM (voir section 2.3.1) et le formalisme des Subject Maps (voir section 2.3.2) ;
le modèle Q (voir section 2.3.3) étant à part (et constituant une catégorie à lui seul). En effet, l’interprétation d’un document XTM (plus précisément XTM 2.0) en TMDM ou Subject Maps préserve presque toujours l’emboîtement des éléments XML dans la structure de l’objet résultant, alors que dans un document interprété graphiquement,
les éléments XML sont éclatés dans le réseau et les objets obtenus (des sommets) n’ont aucune profondeur.
Le formalisme XT MGM DK se range dans la première catégorie dite graphique. Il a
été conçu pour épouser les spécificités du format XT MM DK. Tout graphe expressible
dans le format XT MM DK est donc définissable en XT MGM DK. La réciproque aussi
est vérifiée : tout graphe définissable dans le format XT MGM DK est expressible en
XT MM DK. Le format XT MM DK étant une version du format XTM légèrement plus
contrainte, certaines TM expressibles en XTM 1.0 le sont plus difficilement en XT MM DK
et, par voie de conséquence, en XT MGM DK.
La différence essentielle que XT MGM DK entretient avec les autres formalismes -
à part celui à base d’hypergraphes - réside en ce qu’il attribue un statut particulier à certains éléments XML du format XTM 1.0 en les modélisant sous la forme de fonctions et en les distinguant des composants du réseau. En Subject Maps, en TMDM et en Q le moyen d’attribuer un nom, un type, un domaine de validité ou un sujet est de même nature que l’établissement des relations entre entités.
La démarche utilisée pour XT MGM DK peut être rapprochée de celle entreprise dans
[AdMRV02] (voir section 2.3.5) pour modéliser les TM par des hypergraphes. Dans cette approche, certains éléments XML du format XTM 1.0 sont représentés par la fonction θ ; cette fonction étant utilisée pour stratifier l’ensemble des TM. Il faut remarquer que cette fonction θ partage plusieurs significations selon son utilisation. Elle peut attribuer un do-
maine de validité à un élément de la TM, ou le typer. Dans le formalisme XT MGM DK,
les éléments XML du format XT MM DK permettant d’attribuer un nom, un type, un
domaine de validité ou un sujet sont représentés par quatre fonctions différentes, ce qui permet de conserver la distinction sémantique. Il faut souligner que puisque cette information est perdue lors de la modélisation d’une TM dans le format à base d’hyper- graphes, la réversibilité n’est plus possible car il existe plusieurs documents XTM 1.0
pour un hypergraphe TM. Par conséquent il peut exister plusieurs graphes XT MGM DK
correspondant à un hypergraphe TM.
Cette non réversibilité de la représentation existe aussi chez le format TMG. Ce dernier permet de modéliser toutes les TM représentables dans le format standard 1.0, cependant il est possible de créer un graphe TMG qui n’a pas d’équivalent en XTM 1.0
La famille
SG
Le modèle des graphes conceptuels (GC) a été introduit dans les années 80 par John F. Sowa [Sow84]. Il appartient à la famille des réseaux sémantiques et permet de représenter des connaissances de manière graphique. Différents usages sont associés aux GC selon les approches. Les GC proposés par John F. Sowa sont utiles pour donner une forme graphique à des expressions de la logique des prédicats sans pour autant que leur pouvoir d’expression ne se limite à un fragment particulier de cette logique. La famille SG des graphes conceptuels se conforme davantage aux exigences d’une utilisation pratique des GC. L’approche consiste à étudier en quelle mesure les GC peuvent offrir des services concrets tout en gardant un pouvoir d’expression maximum, dusse ce dernier être amoindri afin de garantir un usage convenable. Cette approche conduit à étudier et cibler des fragments décidables de la logique des prédicats pour donner une base formelle à la sémantique des connaissances expressibles et des raisonnements possibles dans la famille SG. Les GC et la famille SG présentent les caractéristiques suivantes :
– Comme énoncé précédemment, ils possèdent une sémantique formelle en logique des prédicats.
– La famille SG fournit différents types de connaissances : des faits représentés par des graphes conceptuels simples, des règles d’inférence, ainsi que des contraintes. – Les raisonnements sont basés sur des opérations de graphe ; ce qui fournit poten-
tiellement des possibilités d’explication des raisonnements à l’utilisateur puisque les raisonnements peuvent être visualisés dans le formalisme que celui-ci connaît et directement sur les connaissances qu’il a définies. Ces raisonnements sont corrects et complets par rapport à la sémantique formelle.
– Les algorithmes développés pour les graphes conceptuels, et en particulier pour la famille SG, utilisent des techniques de combinatoire (notamment de théorie des graphes et de satisfaction de contraintes) qui les rendent particulièrement efficaces. – La famille SG est implémentée dans CoGITaNT [Gen97], une API de développe-
ment d’applications à base de graphes conceptuels, utilisable librement [Gen97], et bénéficie d’outils graphiques associés TooCOM [Fur04] et CoGUI [Gut06].
Cette section présente la partie de la famille SG utilisée dans ce travail de thèse. Pour une présentation complète et une étude approfondie de sa complexité, voir [BM02] et [CM92].
3.1
Les graphes simples.
Un graphe conceptuel simple (SG) est un graphe biparti étiqueté dont l’une des classes de sommets, dite de sommets concepts, représente des entités, et l’autre, dite de sommets relations, représente des relations entre ces entités ou des propriétés de ces entités.
Le graphe G de la figure 3.1 peut être considéré comme représentant la connaissance suivante : “deux chercheurs, dont un travaille avec K dans le bureau 24, sont membres d’un projet auquel participe le chercheur J dont le bureau est situé près du bureau 24”.
G G’
membre membre membre
Chercheur Chercheur : K Chercheur : J Projet dans dans dans Bureau près Bureau : N°24 travaille−avec Fig. 3.1 – Un exemple de SG.
Les étiquettes des sommets sont définies dans un vocabulaire appelé support qui peut être plus ou moins riche. Le support peut être considéré comme une ontologie rudimentaire et les SG encodent des connaissances assertionnelles (que nous appellerons des faits) : ils assertent l’existence d’entités et de relations entre ces entités.