Lambda Calcul Simplement Typé avec plusieurs Types de base

Je tiens à le remercier pour son soutien, même si la thèse n'a pas été réalisée dans le cadre du projet Prothéo qu'il dirigeait à l'époque. Merci à Carlos pour son aide, même si l'article traitait d'un thème qui n'était pas le sien.

Les origines de la sémantique formelle

Tarski a défini Σ |= φ comme suit : Σ |= φ est vrai si un modèle satisfaisant toutes les formules de Σ satisfait également φ. Celui qui a vu l'intérêt et l'importance de ces outils pour l'étude de la sémantique linguistique est Richard Montague.

Quatre développements subséquents aux travaux de Montague

Entités abstraites
TYn en sémantique formelle
Théorie de la Représentation des Discours (DRT)
Grammaires Catégorielles Abstraites

Plus généralement, un système TYn arbitraire est une sorte de version de la théorie des types simples de Henkin. L’importance de cet article réside dans la précision de la modélisation qu’il propose de la sémantique formelle.

Sémantique computationnelle

Un autre travail de la même période est (Gunji, 1981), une thèse qui apporte une contribution pionnière non seulement à la sémantique computationnelle, mais aussi à la pragmatique computationnelle. Au début du chapitre 2 nous expliquerons en quoi la mise en œuvre de la construction sémantique qui vient d'être résumée nous semble limitée.

Plan de la thèse

Inférence de type et langage fonctionnel
Types de données
Modules
Foncteurs ou modules paramétrés

Cela illustre également le fait qu’un type de produit peut regrouper des objets de types différents. En pratique, c’est ce dernier type qui sera utilisé dans une situation comme celle que nous venons d’évoquer, plutôt qu’un type ad hoc.

Description de Nessie

Termes

Chaque alias contient l'expression de type utilisée pour le définir, ainsi qu'une version « étendue » où seuls les types atomiques apparaissent. En d’autres termes, une valeur de type ne garantit pas que l’expression qu’elle représente est correctement typée.

Lexiques

Cependant, il va sans dire que dans le foncteur que nous allons introduire pour implémenter les lexiques, nous utiliserons en réalité des expressions précédemment construites. Dans le cas des verbes qui viennent d'être donnés, les formes flexionnelles correspondent aux verbes conjugués, et les lemmes correspondent aux verbes à l'infinitif. Le lexique peut alors être pensé comme un dictionnaire dont les clés sont les noms de famille et dont les valeurs associées sont les familles telles qu'elles viennent d'être décrites.

Arbres

Il est à titre informatif uniquement et l'utilisateur est libre de l'utiliser comme il le souhaite. Cela pourrait être exprimé à l’aide d’un arbre à un enfant contenant un terme λ décrivant la fonction d’identité. Cela signifie que l’arbre utilisé pour calculer la représentation sémantique d’un texte ne reflète pas nécessairement fidèlement sa structure syntaxique.

Algorithme de construction sémantique

Il semble naturel que les arguments d’occurrence soient partagés de la même manière que les représentations sémantiques. Le calcul se poursuit en construisant une permutation qui relie les noms du formulaire. Dans la première feuille, nous obtenons une liste de constantes [(u1,pi)], et dans la deuxième feuille [(u2,pi)].

Fonctionnement

Cependant, lorsque nous avons présenté le premier algorithme de construction sémantique, nous avons indiqué que l'environnement de typage était une fois pour toutes calculé à partir du lexique. Avec ce deuxième algorithme de construction sémantique qui ajoute les constantes correspondant aux lemmes ouverts sur l'environnement tels que rencontrés lors du parcours d'un arbre syntaxique donné, il n'est plus nécessaire de les inclure dans l'environnement qui n'était pas initialement associé au lexique. Ainsi, lorsque Nessie est appelé et reçoit ces données, il commence par calculer la représentation sémantique et l'environnement de typage associés à l'arbre en utilisant l'algorithme décrit précédemment.

Conclusion

Puis la représentation sémantique ainsi obtenue est normalisée par β-réduction, et c'est cette valeur réduite qui est affichée. Il est également possible de l'afficher pour qu'il soit lisible par Prolog qui procède de la manière suivante. Par exemple, si le programme résout des équations, on peut vérifier que les solutions qu'il produit sont bien des solutions de l'équation initiale.

Phrases simples

Conception d’un lexique pour Nessie
Construction d’arbres syntaxiques
Equivalence de représentations sémantiques
Mise en place du test
Résultats

L'appel {combine(t:T,[s:S])} précise comment, à partir de la représentation sémantique d'une phrase sans coordinations, on peut obtenir celle d'un texte. A titre d'exemple, voici la règle pour définir les phrases comme un groupe de noms suivi d'un groupe de verbes que nous avons vu précédemment, après modification. Par exemple, la règle DCG donnée précédemment pour construire l'arbre syntaxique d'une phrase à partir d'un groupe de noms et d'un groupe de verbes peut et doit être comparée à la clause suivante desemRulesLambda.pl : combine( s:app(A,B),[ np:A,vp:B]).

Coordinations

On note donc que pour les noms communs on utilise la coordination avec α = e, tandis que pour la coordination entre groupes nominaux ou groupes verbaux on utilise α = e → t. Les règles de coordination des groupes de noms et de verbes fonctionnent exactement de la même manière. Comme nous l'avons expliqué à la fin de la section précédente, parmi toutes les phrases données dans Curt, 16 phrases contiennent des coordinations.

Questions

Construction de représentations α-équivalentes à celles de Curt

Pour résoudre ce problème, nous proposons d'ajouter une nouvelle QUESTION constante au lexique de Nessie, qui sera utilisée dans la construction that(..) à la place des variables libres. Ici il faut modifier la liste passée à pairgap: [] pour qu'elle porte non seulement la représentation sémantique mais aussi l'arbre syntaxique qui lui correspond. Cette règle prend l'arbre syntaxique et la représentation sémantique qu'elle reçoit dans la liste liée aux espaces : et les renvoie comme la représentation sémantique et l'arbre syntaxique de la phrase nominale qui suit le verbe.

Vers des représentations plus pertinentes

Intuitivement, il est clair que l’individu que nous recherchons dans la première représentation sémantique est un individu qui est à la fois une personne et un danseur. Notons d'abord que, pour construire une question, il suffit de connaître les deux prédicats qui composent la question. C'est dans l'explication de cette constante que nous n'arrivons pas au bout de notre idée.

Conclusion

La notion d’aspect

Il nous semble que cet aspect est, en général, une notion relativement vague dont la définition a pu évoluer au fil du temps. Cette vision peut être soit ponctuelle, soit considérer l’action dans le temps. Dans le cas où l'action est considérée dans sa durée, on parle d'un point de vue imparfait.

Expression de l’aspect et du temps en polonais

Cependant, le temps sémantique d'un verbe conjugué dépend à la fois du temps morphologique et de l'aspect du verbe conjugué. Le présent morphologique d'un verbe imperfectif signifie que l'action décrite a lieu au moment de l'énonciation. En résumé, l'aspect « morphologique » d'un verbe ne se traduit pas seulement par l'aspect sémantique, il affecte également le temps sémantique du verbe.

Groupes nominaux

En effet, si un verbe parfait est conjugué au présent, il doit être interprété comme un futur, le temps de l'action étant situé après le temps de l'énoncé. En d’autres termes, le passé d’un verbe imperfectif traduit une action qui se déroule dans le passé et le passé d’un verbe perfectif traduit une action qui s’est terminée dans le passé. L'aspect morphologique véhicule ainsi deux informations : l'une liée à l'aspect sémantique, l'autre, en combinaison avec le temps morphologique du verbe, sert à déterminer son temps sémantique.

La proposition de Aalstein (Młynarczyk)

Les verbes d'État n'ont qu'une seule forme perfective dont la lecture, comme nous l'avons souligné, est inviolable. Tout d'abord, construisons la sémantique d'une phrase dans laquelle le verbe n'est pas conjugué. Comme déjà mentionné, un groupe nominal peut être constitué uniquement d'un nom, c'est-à-dire sans déterminant.

Sémantique des verbes polonais dans TYn

Typage et représentation sémantiques des verbes

Comme nous l'avons vu précédemment, la représentation proposée par Aalstein et Blackburn pour ce verbe est : Un terme possible pour transformer la représentation de l'infinitif « spacerowa´c » en une représentation du verbe conjugué au passé est. Pour le savoir, nous nous appuyons sur la représentation proposée par Aalstein et Blackburn pour le verbe « pisa´c » (écrire), qui est bien un verbe transitif.

On peut alors observer qu'avec des représentations sémantiques comme celles que nous venons de présenter, qui « cachent » les événements en limitant leur accès au seul verbe, d'autres composants ont du mal à le faire. Dans la section suivante, nous présenterons une méthode générique basée sur la continuation pour transférer des informations sémantiques d'une représentation à une autre. Bien que nous ne le fassions pas dans cette thèse, nous pourrions envisager d'utiliser cette méthode basée sur la continuation pour rendre les événements accessibles à partir de représentations sémantiques autres que celles qui les introduisent, résolvant ainsi le problème que nous venons de discuter.

Implantation

Comme celui vu dans le chapitre précédent, celui que nous utilisons pour le polonais contient, en plus des caractéristiques syntaxiques, un attribut est : qui sert à construire un arbre lors de l'analyse de la phrase. Du point de vue du DCG, la seule nouveauté par rapport au chapitre précédent concerne le traitement des verbes. Étant donné la capacité de Nessie à produire des représentations en logique du premier ordre avec des tris, la représentation sémantique que nous obtenons finalement concerne la phrase précédente.

Axiomatisation des événements

Présentation des axiomes

On peut distinguer deux groupes d'axiomes : l'un contient tous les axiomes liés aux types, l'autre contient les axiomes qui formalisent la structure du temps et les relations entre le temps et les événements. Le premier de ces axiomes exprime qu'un événement est instantané s'il existe un moment qui en est à la fois le début et la fin. S’il est vrai que le point culminant d’un événement est unique, il n’est pas vrai que tous les événements ont un point culminant.

Raffinement de la sélection des axiomes

On remplace R par la conjonction Ret de tous les axiomes de la liste calculée à l'étape précédente. Compte tenu de ces changements, les axiomes que nous avons vus précédemment sont écrits ici. C’est ainsi que sont présentés les axiomes présentés précédemment.

Génération de modèles non minimaux

Extensions du langage des DRSs

En effet, il semble alors naturel d'associer un DRS distinct à chaque phrase puis, pour calculer le DRS associé à un discours composé de plusieurs phrases, de concaténer les DRS précédemment associés à chacune des phrases. Or, selon le lemme de couplage énoncé précédemment, ce dernier DRS montre la même connexion que le DRS réduit suivant. Avec cette option, la phrase précédente peut être représentée par le DRS suivant, plus simple que le précédent.

Dénotation des formules du premier ordre

Le terme λ de TYnd dont nous avons besoin pour exprimer une telle propriété doit prendre une variable et deux valeurs comme paramètres et renvoyer une proposition, c'est-à-dire un objet de typet. Cette notation sera également étendue pour exprimer que deux valuations diffèrent sur au plus nvariables, c'est-à-dire que l'on ag[u1, let. Par exemple, la notation du quantificateur universel se lit comme suit : la formule ∀x.φ est vraie pour la valorisation fsi et seulement si pour toute valorisation g qui diffère de f au plus enx, grendφvrai.

Dénotation des DRSs

La désignation des autres formules du premier ordre est définie récursivement comme suit. Il ne reste plus qu'à adapter les explications que nous avons données au cas spécifique de la DRT. Dans le cadre du DRT tel qu'il se présente après enrichissements par l'ajout de l'opérateur ; et l’acceptation de référents de discours constants, ce que nous appelons « termes » correspondent aux référents de discours.

Calculer des DRS compositionnellement

Le fait que l'indice apparaissant dans la référence discursive un soit le même que celui de la notation du déterminant indéfini dans la convention de Barwise n'est pas une coïncidence. La boîte qu’il construit est constituée d’un univers vide (c’est-à-dire qu’elle n’introduit pas de nouvelle référence discursive) et d’une condition qui est la négation d’une boîte. Le DRS présenté pour les déterminants négatifs ne présente pas ce problème, car aucun référent de discours n'est ajouté au niveau global2.

Quelques remarques

Ce que nous pensons qu’il est important de noter à propos de cet algorithme, c’est la structure. Ici nous listerons uniquement les règles à suivre ainsi que le résultat sans confluence. Quoi qu’il en soit, ce deuxième système montre qu’il est possible de se passer de la règle de fusion des DRS et que la proposition (Muskens, 1996c) peut être mise en œuvre en utilisant uniquement la β-réduction et éventuellement la macro-expansion (vous pouvez choisir de les utiliser ou non). ).

Traitement Compositionnel de la Dynamicité

Contextes
Calcul effectif de représentations sémantiques
Liens avec la DRT
Liens avec Nessie
Amélioration des arbres pour les coordinations
Pronoms

Nous avons également vu que les continuations constituent un moyen naturel de transporter des contextes (c'est-à-dire des informations) d'une phrase à une autre. En effet, il ne suffit pas de déplacer le contexte d’une phrase à une autre. L'interprétation des verbes transitifs, quant à elle, n'est qu'une adaptation de la représentation utilisée par Montague aux contextes et aux continuations.

Implantation de la DRT compositionnelle de Muskens

En effet, en observant attentivement le terme que nous venons d'obtenir, on constate qu'il contient plusieurs occurrences de couplage constant représentant la fusion de deux DRS. Autrement dit, avec la représentation que nous venons d’obtenir, nous pouvons dire que nous ne sommes qu’à mi-chemin du chemin menant à un DRS, comme le prédisait Muskens. De la même manière, puisque l'amour est un lemme de la famille des verbes transitifs, la constante qu'il introduit est du type e→e→t.

Implantation du traitement compositionnel de la dynamicité

Lexique

Forts de ce premier succès, nous nous sommes empressés de calculer d'autres DRS : Pour la phrase « Tout homme aime une femme. Ou, pour un exemple un peu plus compliqué, nous pouvons calculer la représentation « Si tout le monde aime mio, alors Vincent aime mio ». En plus de Nessie, pour arriver à ce résultat nous avons dû recourir à un prétraitement d'arbres syntaxiques pour marquer les feuilles contenant des déterminants et à une réécriture pour effectuer des fusions DRS.

Calcul de représentations du sens

Résolution d’anaphores dans TYn

Ce que présuppose la proposition de de Groote

Une architecture logicielle pour la résolution d’anaphores

Approche algorithmique

Axiomatisation des relations anaphoriques

Conclusion

Définition et propriétés des grammaires catégorielles abstraites

Définitions

Quelques propriétés remarquables des ACGs

Problématique abordée

Épuration de Nessie

Non prise en compte des constantes d’occurrences

Élimination des alias et des macros

Élimination des arbres unaires et n-aires

Construction de l’ACG et preuve de la propriété de simulation

Notations

Construction de G

Preuve d’équivalence

Exemple

Conclusion

Pistes pour des recherches ultérieures