Je tiens à le remercier pour son soutien, même si la thèse n'a pas été réalisée dans le cadre du projet Prothéo qu'il dirigeait à l'époque. Merci à Carlos pour son aide, même si l'article traitait d'un thème qui n'était pas le sien.
Les origines de la sémantique formelle
Tarski a défini Σ |= φ comme suit : Σ |= φ est vrai si un modèle satisfaisant toutes les formules de Σ satisfait également φ. Celui qui a vu l'intérêt et l'importance de ces outils pour l'étude de la sémantique linguistique est Richard Montague.
Quatre développements subséquents aux travaux de Montague
- Entités abstraites
- TYn en sémantique formelle
- Théorie de la Représentation des Discours (DRT)
- Grammaires Catégorielles Abstraites
Plus généralement, un système TYn arbitraire est une sorte de version de la théorie des types simples de Henkin. L’importance de cet article réside dans la précision de la modélisation qu’il propose de la sémantique formelle.
Sémantique computationnelle
Un autre travail de la même période est (Gunji, 1981), une thèse qui apporte une contribution pionnière non seulement à la sémantique computationnelle, mais aussi à la pragmatique computationnelle. Au début du chapitre 2 nous expliquerons en quoi la mise en œuvre de la construction sémantique qui vient d'être résumée nous semble limitée.
Plan de la thèse
- Inférence de type et langage fonctionnel
- Types de données
- Modules
- Foncteurs ou modules paramétrés
Cela illustre également le fait qu’un type de produit peut regrouper des objets de types différents. En pratique, c’est ce dernier type qui sera utilisé dans une situation comme celle que nous venons d’évoquer, plutôt qu’un type ad hoc.
Description de Nessie
Termes
Chaque alias contient l'expression de type utilisée pour le définir, ainsi qu'une version « étendue » où seuls les types atomiques apparaissent. En d’autres termes, une valeur de type ne garantit pas que l’expression qu’elle représente est correctement typée.
Lexiques
Cependant, il va sans dire que dans le foncteur que nous allons introduire pour implémenter les lexiques, nous utiliserons en réalité des expressions précédemment construites. Dans le cas des verbes qui viennent d'être donnés, les formes flexionnelles correspondent aux verbes conjugués, et les lemmes correspondent aux verbes à l'infinitif. Le lexique peut alors être pensé comme un dictionnaire dont les clés sont les noms de famille et dont les valeurs associées sont les familles telles qu'elles viennent d'être décrites.
Arbres
Il est à titre informatif uniquement et l'utilisateur est libre de l'utiliser comme il le souhaite. Cela pourrait être exprimé à l’aide d’un arbre à un enfant contenant un terme λ décrivant la fonction d’identité. Cela signifie que l’arbre utilisé pour calculer la représentation sémantique d’un texte ne reflète pas nécessairement fidèlement sa structure syntaxique.
Algorithme de construction sémantique
Il semble naturel que les arguments d’occurrence soient partagés de la même manière que les représentations sémantiques. Le calcul se poursuit en construisant une permutation qui relie les noms du formulaire. Dans la première feuille, nous obtenons une liste de constantes [(u1,pi)], et dans la deuxième feuille [(u2,pi)].
Fonctionnement
Cependant, lorsque nous avons présenté le premier algorithme de construction sémantique, nous avons indiqué que l'environnement de typage était une fois pour toutes calculé à partir du lexique. Avec ce deuxième algorithme de construction sémantique qui ajoute les constantes correspondant aux lemmes ouverts sur l'environnement tels que rencontrés lors du parcours d'un arbre syntaxique donné, il n'est plus nécessaire de les inclure dans l'environnement qui n'était pas initialement associé au lexique. Ainsi, lorsque Nessie est appelé et reçoit ces données, il commence par calculer la représentation sémantique et l'environnement de typage associés à l'arbre en utilisant l'algorithme décrit précédemment.
Conclusion
Puis la représentation sémantique ainsi obtenue est normalisée par β-réduction, et c'est cette valeur réduite qui est affichée. Il est également possible de l'afficher pour qu'il soit lisible par Prolog qui procède de la manière suivante. Par exemple, si le programme résout des équations, on peut vérifier que les solutions qu'il produit sont bien des solutions de l'équation initiale.
Phrases simples
- Conception d’un lexique pour Nessie
- Construction d’arbres syntaxiques
- Equivalence de représentations sémantiques
- Mise en place du test
- Résultats
L'appel {combine(t:T,[s:S])} précise comment, à partir de la représentation sémantique d'une phrase sans coordinations, on peut obtenir celle d'un texte. A titre d'exemple, voici la règle pour définir les phrases comme un groupe de noms suivi d'un groupe de verbes que nous avons vu précédemment, après modification. Par exemple, la règle DCG donnée précédemment pour construire l'arbre syntaxique d'une phrase à partir d'un groupe de noms et d'un groupe de verbes peut et doit être comparée à la clause suivante desemRulesLambda.pl : combine( s:app(A,B),[ np:A,vp:B]).
Coordinations
On note donc que pour les noms communs on utilise la coordination avec α = e, tandis que pour la coordination entre groupes nominaux ou groupes verbaux on utilise α = e → t. Les règles de coordination des groupes de noms et de verbes fonctionnent exactement de la même manière. Comme nous l'avons expliqué à la fin de la section précédente, parmi toutes les phrases données dans Curt, 16 phrases contiennent des coordinations.
Questions
Construction de représentations α-équivalentes à celles de Curt
Pour résoudre ce problème, nous proposons d'ajouter une nouvelle QUESTION constante au lexique de Nessie, qui sera utilisée dans la construction that(..) à la place des variables libres. Ici il faut modifier la liste passée à pairgap: [] pour qu'elle porte non seulement la représentation sémantique mais aussi l'arbre syntaxique qui lui correspond. Cette règle prend l'arbre syntaxique et la représentation sémantique qu'elle reçoit dans la liste liée aux espaces : et les renvoie comme la représentation sémantique et l'arbre syntaxique de la phrase nominale qui suit le verbe.
Vers des représentations plus pertinentes
Intuitivement, il est clair que l’individu que nous recherchons dans la première représentation sémantique est un individu qui est à la fois une personne et un danseur. Notons d'abord que, pour construire une question, il suffit de connaître les deux prédicats qui composent la question. C'est dans l'explication de cette constante que nous n'arrivons pas au bout de notre idée.
Conclusion
La notion d’aspect
Il nous semble que cet aspect est, en général, une notion relativement vague dont la définition a pu évoluer au fil du temps. Cette vision peut être soit ponctuelle, soit considérer l’action dans le temps. Dans le cas où l'action est considérée dans sa durée, on parle d'un point de vue imparfait.
Expression de l’aspect et du temps en polonais
Cependant, le temps sémantique d'un verbe conjugué dépend à la fois du temps morphologique et de l'aspect du verbe conjugué. Le présent morphologique d'un verbe imperfectif signifie que l'action décrite a lieu au moment de l'énonciation. En résumé, l'aspect « morphologique » d'un verbe ne se traduit pas seulement par l'aspect sémantique, il affecte également le temps sémantique du verbe.
Groupes nominaux
En effet, si un verbe parfait est conjugué au présent, il doit être interprété comme un futur, le temps de l'action étant situé après le temps de l'énoncé. En d’autres termes, le passé d’un verbe imperfectif traduit une action qui se déroule dans le passé et le passé d’un verbe perfectif traduit une action qui s’est terminée dans le passé. L'aspect morphologique véhicule ainsi deux informations : l'une liée à l'aspect sémantique, l'autre, en combinaison avec le temps morphologique du verbe, sert à déterminer son temps sémantique.
La proposition de Aalstein (Młynarczyk)
Les verbes d'État n'ont qu'une seule forme perfective dont la lecture, comme nous l'avons souligné, est inviolable. Tout d'abord, construisons la sémantique d'une phrase dans laquelle le verbe n'est pas conjugué. Comme déjà mentionné, un groupe nominal peut être constitué uniquement d'un nom, c'est-à-dire sans déterminant.
Sémantique des verbes polonais dans TYn
Typage et représentation sémantiques des verbes
Comme nous l'avons vu précédemment, la représentation proposée par Aalstein et Blackburn pour ce verbe est : Un terme possible pour transformer la représentation de l'infinitif « spacerowa´c » en une représentation du verbe conjugué au passé est. Pour le savoir, nous nous appuyons sur la représentation proposée par Aalstein et Blackburn pour le verbe « pisa´c » (écrire), qui est bien un verbe transitif.
On peut alors observer qu'avec des représentations sémantiques comme celles que nous venons de présenter, qui « cachent » les événements en limitant leur accès au seul verbe, d'autres composants ont du mal à le faire. Dans la section suivante, nous présenterons une méthode générique basée sur la continuation pour transférer des informations sémantiques d'une représentation à une autre. Bien que nous ne le fassions pas dans cette thèse, nous pourrions envisager d'utiliser cette méthode basée sur la continuation pour rendre les événements accessibles à partir de représentations sémantiques autres que celles qui les introduisent, résolvant ainsi le problème que nous venons de discuter.
Implantation
Comme celui vu dans le chapitre précédent, celui que nous utilisons pour le polonais contient, en plus des caractéristiques syntaxiques, un attribut est : qui sert à construire un arbre lors de l'analyse de la phrase. Du point de vue du DCG, la seule nouveauté par rapport au chapitre précédent concerne le traitement des verbes. Étant donné la capacité de Nessie à produire des représentations en logique du premier ordre avec des tris, la représentation sémantique que nous obtenons finalement concerne la phrase précédente.
Axiomatisation des événements
Présentation des axiomes
On peut distinguer deux groupes d'axiomes : l'un contient tous les axiomes liés aux types, l'autre contient les axiomes qui formalisent la structure du temps et les relations entre le temps et les événements. Le premier de ces axiomes exprime qu'un événement est instantané s'il existe un moment qui en est à la fois le début et la fin. S’il est vrai que le point culminant d’un événement est unique, il n’est pas vrai que tous les événements ont un point culminant.
Raffinement de la sélection des axiomes
On remplace R par la conjonction Ret de tous les axiomes de la liste calculée à l'étape précédente. Compte tenu de ces changements, les axiomes que nous avons vus précédemment sont écrits ici. C’est ainsi que sont présentés les axiomes présentés précédemment.
Génération de modèles non minimaux
Extensions du langage des DRSs
En effet, il semble alors naturel d'associer un DRS distinct à chaque phrase puis, pour calculer le DRS associé à un discours composé de plusieurs phrases, de concaténer les DRS précédemment associés à chacune des phrases. Or, selon le lemme de couplage énoncé précédemment, ce dernier DRS montre la même connexion que le DRS réduit suivant. Avec cette option, la phrase précédente peut être représentée par le DRS suivant, plus simple que le précédent.
Dénotation des formules du premier ordre
Le terme λ de TYnd dont nous avons besoin pour exprimer une telle propriété doit prendre une variable et deux valeurs comme paramètres et renvoyer une proposition, c'est-à-dire un objet de typet. Cette notation sera également étendue pour exprimer que deux valuations diffèrent sur au plus nvariables, c'est-à-dire que l'on ag[u1, let. Par exemple, la notation du quantificateur universel se lit comme suit : la formule ∀x.φ est vraie pour la valorisation fsi et seulement si pour toute valorisation g qui diffère de f au plus enx, grendφvrai.
Dénotation des DRSs
La désignation des autres formules du premier ordre est définie récursivement comme suit. Il ne reste plus qu'à adapter les explications que nous avons données au cas spécifique de la DRT. Dans le cadre du DRT tel qu'il se présente après enrichissements par l'ajout de l'opérateur ; et l’acceptation de référents de discours constants, ce que nous appelons « termes » correspondent aux référents de discours.
Calculer des DRS compositionnellement
Le fait que l'indice apparaissant dans la référence discursive un soit le même que celui de la notation du déterminant indéfini dans la convention de Barwise n'est pas une coïncidence. La boîte qu’il construit est constituée d’un univers vide (c’est-à-dire qu’elle n’introduit pas de nouvelle référence discursive) et d’une condition qui est la négation d’une boîte. Le DRS présenté pour les déterminants négatifs ne présente pas ce problème, car aucun référent de discours n'est ajouté au niveau global2.
Quelques remarques
Ce que nous pensons qu’il est important de noter à propos de cet algorithme, c’est la structure. Ici nous listerons uniquement les règles à suivre ainsi que le résultat sans confluence. Quoi qu’il en soit, ce deuxième système montre qu’il est possible de se passer de la règle de fusion des DRS et que la proposition (Muskens, 1996c) peut être mise en œuvre en utilisant uniquement la β-réduction et éventuellement la macro-expansion (vous pouvez choisir de les utiliser ou non). ).
Traitement Compositionnel de la Dynamicité
- Contextes
- Calcul effectif de représentations sémantiques
- Liens avec la DRT
- Liens avec Nessie
- Amélioration des arbres pour les coordinations
- Pronoms
Nous avons également vu que les continuations constituent un moyen naturel de transporter des contextes (c'est-à-dire des informations) d'une phrase à une autre. En effet, il ne suffit pas de déplacer le contexte d’une phrase à une autre. L'interprétation des verbes transitifs, quant à elle, n'est qu'une adaptation de la représentation utilisée par Montague aux contextes et aux continuations.
Implantation de la DRT compositionnelle de Muskens
En effet, en observant attentivement le terme que nous venons d'obtenir, on constate qu'il contient plusieurs occurrences de couplage constant représentant la fusion de deux DRS. Autrement dit, avec la représentation que nous venons d’obtenir, nous pouvons dire que nous ne sommes qu’à mi-chemin du chemin menant à un DRS, comme le prédisait Muskens. De la même manière, puisque l'amour est un lemme de la famille des verbes transitifs, la constante qu'il introduit est du type e→e→t.
Implantation du traitement compositionnel de la dynamicité
Lexique
Forts de ce premier succès, nous nous sommes empressés de calculer d'autres DRS : Pour la phrase « Tout homme aime une femme. Ou, pour un exemple un peu plus compliqué, nous pouvons calculer la représentation « Si tout le monde aime mio, alors Vincent aime mio ». En plus de Nessie, pour arriver à ce résultat nous avons dû recourir à un prétraitement d'arbres syntaxiques pour marquer les feuilles contenant des déterminants et à une réécriture pour effectuer des fusions DRS.
Calcul de représentations du sens
Résolution d’anaphores dans TYn
Ce que présuppose la proposition de de Groote
Une architecture logicielle pour la résolution d’anaphores
Approche algorithmique
Axiomatisation des relations anaphoriques
Conclusion
Définition et propriétés des grammaires catégorielles abstraites
Définitions
Quelques propriétés remarquables des ACGs
Problématique abordée
Épuration de Nessie
Non prise en compte des constantes d’occurrences
Élimination des alias et des macros
Élimination des arbres unaires et n-aires
Construction de l’ACG et preuve de la propriété de simulation
Notations
Construction de G
Preuve d’équivalence
Exemple
Conclusion
Pistes pour des recherches ultérieures