Calculer des DRS compositionnellement - Génération de modèles non minimaux

4.5 Génération de modèles non minimaux

5.1.4 Calculer des DRS compositionnellement

à ceux où les macros ont été remplacées par leur définition.

ne respectent donc pas davantage la convention de Barwise.

Insistons donc sur le fait que la proposition de (Muskens, 1996c) consiste à associer de façon compositionnelle des boîtes à des textes respectant la convention de Barwise, et uniquement à de tels textes. Cela signifie en particulier que la résolution des anaphores n’est pas envisagée ici comme faisant partie du processus de construction de boîtes mais comme une étape extérieure à ce processus¹.

Par ailleurs, nous avons beaucoup insisté sur la convention de Barwise car, comme on va le voir dans les sous-sections qui suivent, les nombres utilisés pour annoter les groupes nominaux jouent un rôle crucial dans les représentations associées aux entités introduites ou auxquels les groupes nominaux font référence.

Représentations des entrées lexicales

Nous donnons les représentations proposées par (Muskens, 1996c) pour les entrées lexicales, puis faisons quelques commentaires à leur sujet :

– déterminants indéfinis annotés (aⁿ) :

λP^′P.([u_n|];P^′(u_n);P(u_n)) – déterminants négatifs annotés (noⁿ) :

λP^′P.[|¬([un];P^′(un);P(un))]

– déterminants universels annotés (everyⁿ)]

λP^′P.[|(([un|];P^′(u_n))→P(u_n))]

– noms propres annotés (e.g.Maryⁿ) :

λP.P(Mary) – pronoms annotés (he_n) :

λP.P(δ)

oùδest le référent de discours contenant l’antécédent du pronom – pronoms relatifs (who, that) :

λP^′P.λv.(P(v);P^′(v)) – noms (e.g.man) :

λv.[|man(v)]

– verbes intransitifs (e.g.walk) :

λv.[|walk(v)]

1(Muskens, 1996c) propose néanmoins un algorithme permettant de vérifier qu’une DRS qui vient d’être construite vérifie les contraintes d’accessibilité. Nous dirons quelques mots de cet algorithme à la sous-section suivante.

– verbes intransitifs (e.g.love) :

λQ.λv.(Q(λv^′.[|love(v, v^′)])) – verbe auxiliaire négatif does not :

λP.λQ.[|¬Q(P)]

– construction conditionnelle if :

λpq.[|(p→q)]

Commençons par indiquer que, dans toutes ces règles, les variables P et P^′ sont de type π → s→ s → t, c’est-à-dire queP etP^′ sont des fonctions prenant en argument un référent de discours et construisant une DRS. La première règle associe un λ-terme à un déterminant indéfini annoté selon la convention de Barwise, comme nous l’avons expliqué précédemment.

Le terme associé aux déterminants indéfinis annotés est une fonction prenant deux fonctions des registres vers les boîtes en arguments et renvoyant une DRS complexe. Plus précisément, la boîte qui est construite consiste en la fusion de trois boîtes simples : l’une introduisant un référent de discoursunet ne comportant aucune condition, et deux autres obtenues en appliquant P^′ puisP au référent de discours qui vient d’être introduit. Le fait que l’indicenapparaissant dans le référent de discoursu_nsoit le même que celui annotant le déterminant indéfini dans la convention de Barwise n’est pas une coïncidence. En effet, dans (Muskens, 1996c), les nombres explicitant les relations anaphoriques selon la convention de Barwise sont utilisés pour choisir les noms des référents de discours à utiliser pour représenter les entités associées. Ces référents de discours sont desconstantesqu’il convient d’ajouter à l’environnement de typage au fur et à mesure qu’on les rencontre. Or, comme nous supposons que les textes considérés vérifient la convention de Barwise, nous en déduisons que si un texte annoté contient deux occurrences d’un déterminant indéfini, celles-ci seront annotées avec des nombres différents en exposant, comme dans l’exemple

A¹man owns a² donkey.

dont nous avions déjà fait état précédemment. D’après la règle que nous venons de donner pour associer un λ-terme à un déterminant indéfini, et grâce aux explications qui viennent d’être données, il est clair que la première occurrence du déterminant indéfini aura pour re- présentation λP^′P.[u1|];P^′(u1);P(u1), où u1 est une constante à ajouter à l’environnement de typage, tandis que la seconde occurrence du déterminant indéfini aura pour représentation λP^′P.[u2|];P^′(u2);P(u2), oùu2 est une autre constante, différente deu1et qui doit aussi être ajoutée à l’environnement de typage. On constate alors que les deux occurrences du déterminant indéfini ont des représentations qui ne sont pasα-équivalentes, et c’est précisément à cause de cette non-α-équivalence que nous avons dû modifier Nessiepour passer de la première à la seconde version de l’algorithme de construction sémantique, comme nous l’avons expliqué au chapitre 2. Sans cette modification, il n’aurait pas été possible de construire à l’aide deNessie des représentations sémantiques nonα-équivalentes pour des occurrences distinctes d’un même lexème comme le fait (Muskens, 1996c). Grâce à la modification décrite au chapitre 2 nous pourrons, comme nous le verrons au chapitre suivant, rendre effective la proposition de (Muskens, 1996c) et construire automatiquement les DRSs associées à des textes simples.

Pour en revenir aux termes associés aux entrées lexicales, nous aimerions faire une dernière re- marque au sujet des termes associés aux déterminants indéfinis. Nous avions vu en section 5.1.1 que, pour pouvoir construire les DRSs de façon compositionnelle, il est nécessaire de disposer d’un opérateur de fusion de DRSs noté;. La nécessité d’introduire cet opérateur avait alors été motivée par le fait qu’il permettait, lors de la construction du sens d’un texte constitué de plusieurs phrases, d’associer une DRS à chaque phrase puis de fusionner les DRSs pour en obtenir une représentant le sens du texte complet. Or, ce que montrent les termes associés aux indéfinis (et cela est confirmé par les termes associés aux autres déterminants, aux verbesetc.), c’est que l’opérateur de fusion de DRSs est amené à apparaître bien plus souvent dans une DRS complexe que ce que laissait supposer la section 5.1.1. En effet, cet opérateur ne sert pas seulement à fusionner les DRSs représentant les phrases. En réalité, dans un contexte où les représentations sémantiques sont envisagées comme des conjonctions de prédicats appliqués à des arguments, l’opérateur ;de fusion de DRSs joue un rôle capital, puisque, en quelque sorte, cet opérateur peut être vu comme l’équivalent dans le langage de la DRT de la conjonction dans le langage de la logique. De ce fait, comme nous le verrons au chapitre suivant, l’opérateur de fusion de DRSs apparaît à de multiples reprises dans les DRSs complexes que l’on souhaite construire. On comprend ainsi pourquoi la règle permettant d’éliminer cet opérateur en procédant à la fusion effective de DRSs et qui a été présentée en section 5.1.1 joue un rôle capital. Nous reviendrons à cette règle dans la section suivante, puis de nouveau au chapitre suivant.

Pour le moment, terminons la présentation des principales règles d’association entre entrées lexicales etλ-termes.

Compte tenu des explications qui viennent d’être données quant aux termes associés aux indéfinis, ceux associés à aux autres types de déterminants devraient être faciles à comprendre.

Les remarques qui ont été faites sur les indéfinis demeurent valables. Par ailleurs, bien que les DRSs soient un peu plus complexes que celles utilisées pour les indéfinis, les idées utilisées sont essentiellement les mêmes. La deuxième règle traite le cas des déterminants négatifs. La boîte qu’elle construit consiste en un univers vide (c’est-à-dire qu’elle n’introduit pas de nouveau référent de discours) et en une condition qui est la négation d’une boîte. La boîte à laquelle s’applique la négation est, quant à elle, similaire à celle utilisée dans la première règle. On pourrait se demander s’il est vraiment nécessaire de construire une boîte aussi compliquée pour les négations, et si l’on ne pourrait pas les représenter par des termes plus simples. Pourquoi ne pas utiliser, par exemple, quelque chose comme[u_n|¬(P^′(u_n);P(u_n))]? La raison pour laquelle se terme n’est pas utilisé est liée aux contraintes d’accessibilité. En effet, avec la représentation que nous venons de proposer, le référent de discours introduit par la négation est rendu accessible au niveau global, ce qui permet d’y faire référence plus tard dans le discours. Concrètement, cela signifie que le pronom « he » dans

No man walks. *He smokes

pourrait être relié anaphoriquement à l’entité introduite par l’homme apparaissant dans la pre- mière phrase et utilisé pour affirmer qu’aucun homme ne marche, ce qui n’est clairement pas conforme à nos intuitions. La DRS indiquée pour les déterminants négatifs n’a pas ce problème, car aucun référent de discours n’est ajouté au niveau global². En d’autres termes, la portée des

2Nous verrons cependant un peu plus loin que (Muskens, 1996c) n’interdit pas de construire des boîtes qui ne respectent pas les contraintes d’accessibilité.

référents de discours introduits par les négations est limitée. Ce résultat est atteint en construisant une DRS dont l’univers est vide et qui ne contient qu’une condition, qui est la négation d’une DRS complexe.

Des remarques d’un genre similaire peuvent être faites pour la troisième règle associant un λ-terme aux déterminants universels. Comme le montre la DRS associée, la sémantique du dé- terminant universel est construite à partir de l’implication, tout comme dans des représentations montagoviennes plus classiques. De plus, ici aussi la portée du référent de discours introduit par cette règle est contrôlée de façon précise, grâce à des techniques similaires à celles expliquées précédemment et bien connues en DRT. Grâce à ces mécanismes de contrôle de la portée des référents de discours, des discours tels que

Every man has a nose. *He has a really big nose.

ne devraient en principe pas être traités correctement, car le pronom n’a pas d’antécédent.

La quatrième règle associe unλ-terme aux noms propres. La représentation qui leur est asso- ciée est, au moins dans l’esprit, proche de celle utilisée dans les approches montagoviennes. Le λ-terme est une fonction prenant en argument une fonction des registres (référents de discours) vers les boîtes et renvoyant la boîte obtenue en appliquant cette fonction au référent de discours introduit par le nom propre. Signalons à ce propos que les noms propres donnent lieu non pas à une seule, mais à deux constantes dan (Muskens, 1996c). L’une est le nom propre vu comme entité, l’autre est un registre ou référent de discours spécifique qui contient, quelque soit l’état (c’est-à-dire pour tous les enchâssements), l’entité que nous venons d’introduire. Ceci se comprend aisément en revenant à la sémantique des DRSs et aux liens que nous avons fait avec la traduction de la satisfaction des formules du premier ordre dans leλ-calcul typé. Un nom propre est une constante qui doit être interprétée, et qui peut donc être vue, du point de vu logique, à la fois comme objet syntaxique et comme élément du domaine d’interprétation dénoté par l’objet syntaxique. Remarquons par ailleurs que, bien que la convention de Barwise requière que les noms propres soient annotés par un nombre en exposant, ce nombre n’est pas utilisé dans les termes qui les représentent. Cette annotation n’est cependant pas superflue, puisqu’elle permet à un pronom apparaissant ultérieurement dans le discours d’établir un lien anaphorique avec le nom propre considéré. Le nombre annotant le nom propre ne va donc pas être utilisé directement dans la représentation de celui-ci, mais dans la représentation d’éventuels pronoms y faisant ré- férence, comme le montre la cinquième règle. Pour cette règle, comme pour les autres, les idées qui l’inspirent sont claires. Elle est en effet relativement similaire à celle utilisée pour la règle précédente. Cependant, la règle est un peu différente de celle à laquelle on aurait pu s’attendre, puisqu’elle utilise un référent de discoursδau lieu d’utiliseru_n. Ceci est dû précisément au fait que le référent de discours à utiliser peut avoir été introduit par un nom propre, auquel cas son nom n’est pasun mais un nom dérivé de celui du nom propre. Mais il s’agit là de points de détail.

Les règles restantes associent desλ-termes aux pronoms relatifs, aux noms, verbes intransitifs et transitifs, au verbe auxiliaire « does not » et à des constructions de la forme « if ... then ... ».

La représentation des pronoms relatifs devrait être facile à comprendre, car elle est similaire aux représentations que nous venons de détailler. Les règles associant des représentations au nom

« man », au verbe intransitif « walk » et au verbe transitif « love » ont des généralisations évi- dentes à tous les noms, verbes intransitifs et transitifs. Suivant en cela les choix montagoviens,

(Muskens, 1996c) représente les noms et verbes transitifs par des prédicats ou relations unaires, tandis que les verbes transitifs sont représentés par des relations binaires. De ce fait, les repré- sentations qui leur sont associées sont des fonctions qui, à partir des paramètres qui conviennent à chacune de ces trois familles syntaxiques, construisent des boîtes contenant une seule condition, qui n’est autre que la relation considérée appliquée aux référents de discours passés en paramètres. Ces boîtes seront fusionnées aux autres pour former la représentation sémantique finale grâce à l’opérateur de fusion.

La représentation donnée au verbe auxiliaire « does not » demande elle aussi quelques explications. Son deuxième argument,Q, doit être de type(π → s→ s→ t) → s→ s→ t. Pour comprendre cela, il est utile de remarquer que ce type n’est autre que celui qu’il convient de donner aux groupes nominaux. Le type du premier argument,P, est celui des groupes verbaux.

Insistons sur le fait que, du point de vue des types, un groupe verbal constitué d’un verbe intransitif et un groupe verbal constitué d’un verbe transitif suivi d’un groupe nominal sont absolument identiques.

Enfin, la dernière règle associe une représentation aux constructions de la forme « if ... then ».

La lecture de cette représentation nous paraît relativement aisée, puisque la boîte associée à la construction est une boîte dont l’univers est vide et contenant une seule condition qui est une implication sur les boîtes. Remarquons que cette règle respecte elle aussi les contraintes d’accessibilité de la DRT. En particulier, les référents de discours introduits dans l’univers de l’antécédent de la conditionnelle sont accessibles aux conditions du conséquent de cette même conditionnelle, mais pas au-delà, puisque la construction conditionnelle tout entière est placée dans une boîte dont l’univers est vide.

En conclusion de cette sous-section sur les représentations des entées lexicales, notons que nous venons de donner presque toutes les règles apparaissant dans (Muskens, 1996c). La seule qui a été omise est celle qui permet le « quantifier rising » et que nous ignorerons ici. En effet, cette règle permet de gérer les ambiguïtés de portée des quantificateurs, problème qui ne sera pas abordé par cette thèse.

Règles de calcul des représentations de syntagmes complexes

Le calcul de la boîte associée à un texte d’entrée respectant la convention de Barwise se fait en deux étapes, conformément à la tradition montagovienne. Dans un premier temps, l’analyse syntaxique du texte d’entrée est mise en œuvre à l’aide d’un formalisme grammatical approprié.

Cette analyse produit un arbre syntaxique dont les feuilles sont étiquetées par des entrées lexicales et dont les nœuds sont, dans (Muskens, 1996c), unaires ou binaires. Dans un second temps, une boîte est associée à l’arbre syntaxique. Les règles données par Muskens et que nous allons reproduire ici concernent uniquement la seconde étape du traitement visant à produire une boîte à partir d’un arbre d’analyse. Ces règles de traduction, données par Muskens, sont au nombre de 5. Cependant, l’une d’entre elles s’occupe du « quantifier rising » et nous allons donc l’ignorer ici. Nous nous retrouvons donc avec les quatre règles de traduction suivantes :

1. La traduction d’une feuille est donnée par les règles vues à la sous-section précédente ; 2. La traduction d’un nœud unaire est la traduction de son unique sous-arbre ;

3. La traduction d’un arbre binaire est obtenue en appliquant celle de l’un des sous-arbres à

celle de l’autre, le sens de l’application étant donné de manière non ambiguë par les types.

La traduction d’un texte représenté par la boîteK1 suivi d’une phrase représentée par la boîteK2est donnée par la boîteK1;K2;

4. Deux règles de réduction : a) La règle deβ-réduction ;

b) La règle associée au lemme de fusion de boîtes, qui permet de remplacer le terme [u1, . . . , u_n|γ1, . . . , γ_m]; [u^′₁, . . . , u^′_k|δ1, . . . , δ_q]

par le terme

[u1, . . . , un, u^′₁, . . . , u^′_k|γ1, . . . , γm, δ1, . . . , δq] si les conditions du lemme de fusion de boîtes sont vérifiées.

Exemples

Nous allons montrer ici comment les règles qui ont été données dans les deux paragraphes précédents peuvent être utilisées pour associer des boîtes à des discours simples. Considérons pour commencer le discours suivant :

John¹walks.

Remarquons tout d’abord que ce texte respecte bien la convention de Barwise, bien que, en l’ab- sence de pronoms, cela ne soit pas très important ici. D’après les règles données précédemment, la boîte associée à ce texte est obtenue en appliquant la représentation de John notéehJohnià celle de walk notéehwalki. Nous obtenons alors leλ-terme suivant :

(λP.P(John))(λv.[|walk(v)]) Une première étape deβ-réduction conduit au terme

(λv.[|walk(v)])John qui se réduit à

[|walk(John)]

Remarquons que l’univers de cette DRS est vide. Nous faisons en effet l’hypothèse que les référents de discours utilisés pour décrire les noms propres sont toujours disponibles.

Par ailleurs, si nous nous souvenons que cette notation avec crochets n’est qu’une abréviation et qu’elle peut par conséquent être étendue pour obtenir un authentiqueλ-terme, nous obtenons d’après nos clauses de traduction le terme suivant :

λij.(i[]j∧walk(V(John, j)))

Rappelons que dans ce terme, l’expressioni[]jest elle-même une abréviation pour le terme

∀δ : π.V(δ, i) = V(δ, j). Nous procédons donc au remplacement de la forme abrégée par la forme étendue, ce qui nous conduit auλ-terme final suivant :

hJohn¹walksi=λi, j.((∀δ:π.V(δ, i) =V(δ, j))∧walk(V(John, j)))

Comme on peut le constater, même pour un texte aussi simple que celui considéré, sa re- présentation sémantique complètement étendue est un λ-terme quelque peu complexe et dans lequel la structure de la DRS qu’il représente n’est plus très visible. C’est pourquoi, lorsque nous présenterons des exemples plus complexes, nous nous en tiendrons le plus souvent aux formes abrégées, beaucoup plus évocatrices de véritables DRSs à notre avis. Nous reviendrons bientôt sur les liens entre forme abrégée et étendue des boîtes.

Considérons maintenant un exemple un tout petit peu plus compliqué, à savoir A¹man walks.

La nouveauté ici est le fait que le groupe nominal ne consiste plus seulement en un nom propre, mais en un nom commun accompagné d’un déterminant indéfini. Comme cela est requis par le nombre qui annote le déterminant, ce déterminant introduit le référent de discours constant u1. La représentation sémantique de la phrase est obtenue en appliquant celle du groupe nominal à celle du groupe verbal, la représentation du groupe nominal étant elle-même obtenue en appliquant celle du déterminant à celle du nom. Nous obtenons ainsi le terme suivant : (ha¹ihmani)hwalkice qui donne, compte tenu des règles de traduction données précédemment :

(λP^′, P.([u1|];P^′(u1);P(u1))λv.[|man(v)])λw.[|walk(w)]

En procédant à toutes lesβ-réductions possibles, on obtient : [u1|]; [|man(u1)]; [|walk(u1)]

À ce point, la seule règle de réduction que nous pouvons appliquer est celle qui permet de fusionner des boîtes. En l’appliquant deux fois nous obtenons la DRS finale :

[u1|man(u1),walk(u1)]

Il va de soi que la règle de fusion de boîtes est indispensable pour passer de l’avant-dernier terme au dernier. Un système de réduction ne comportant que laβ-réduction ne pourrait pas produire la forme la plus réduite. Cela signifie notamment que la règle de fusion de DRSs ne peut être exprimée en termes deβ-réduction.

Nous nous en tenons là pour les exemples pour le moment, mais nous en verrons de plus élabo- rés au chapitre suivant, lorsque nous pourrons utiliserNessiepour automatiser la construction de boîtes.

No documento Lambda Calcul Simplement Typé avec plusieurs Types de base (páginas 159-166)