Основная программа конференции Computational Linguistics and Intellectual Technologies Papers from the Annual International Conference “Dialogue” (2015) Issue 14 Volume 1 of 2


Academic year: 2023

Кобозева Ирина Михайловна Филологический факультет МГУ Козеренко Елена Борисовна Институт проблем информатики РАН Университет Корбетта Гревилля Суррея, Великобритания. Соколова Елена Григорьевна Российский научно-исследовательский институт искусственного интеллекта Толдова Светлана Юрьевна Филологический факультет МГУ Шаров Сергей Александрович Университет Лидса, Великобритания.


  • По крайней мере в разных значениях
  • Правда в разных значениях
  • Только в разных значениях
  • Кроме в разных значениях
  • Вообще в разных значениях

2 В вступлении предложения для введения валентности П используется конверсия в лексемах хоть 2, хоть 1, хоть 3 - уступительная конструкция, если не.. то - в сочетании с которой они часто употребляются. Истина 1, в отличие как минимум от 1, предполагает не потенциального, а фактического оппонента, в связи с чем степень противодействия ожиданиям и настойчивости говорящего в отстаивании своего мнения еще выше.


Прагматические свойства уступительных единиц

В этом смысле союз хотя 1 аналогичен уступительным единицам только 2, истинному 2 и вообще 1, которые также представляют собой указание на менее важную, более слабую ситуацию и не обладают способностью удерживать акцент и подвергаться рематизации. Для них предлагается следующая интерпретация [В. 19) Даже если P, Q = 'P может происходить с очень высокой скоростью; говорящий считает, что если возникает ситуация Р-типа, то обычно или естественно, что ситуация не-Q-типа не возникает; говорящий уверен, что Q' имеет место или будет иметь место.



  • Теоретические основания исследования и характер корпусного эксперимента
  • Справедливость versus несправедливость
  • Справедливость: метафорические модели и профилируемые смыслы
  • Несправедливость: метафорические модели и профилируемые смыслы
  • Справедливость versus несправедливость

142 из 148 контекстов употребления дают примеры употребления этого выражения, и в этих контекстах метафора С Т Р О И Т Е Л С Т ВА относится к стертым метафорам, то есть к устойчивым метафорам, используемым преимущественно на заднем плане [Баранов 2014]. Метафора ОБЪЕКТИВА (ОБЪЕКТ Т-ПРЕДЕМЕТ) существенно отличается по частоте от метафоры ПЕРСОНИФИКАЦИЯ и ЗДАНИЕ: 28 примеров против 148 контекстов метафорической модели СТРОИТЕЛЬСТВО/СТРОЕНИЕ 134 контекста для употребления метафоры ПЕРСОНИФИКАЦИЯ.


Literature and language series [Izvestiya Akademii Nauk, seriya literatury i yazyka], Vol. 2005), The phenomenon of corruption in metaphors of two discourses [Fenomen corruptsii v metaforah dvukh discursov], Computational linguistics and intellectual technologies: Proceedings of the International Conference "Di-alog 2005" [Komp'yuternaya Metaforah dvukhdiskursovi: Konferentsii "Dialog 2005"], Bekasovo, pg. 2014), Descriptive Theory of Metaphor [Deskriptornaya teoriya metafory]. To recover the missing information and introduce secondary dependencies into the converted SynTagRus, we create a simple guessing algorithm based on four probabilistic features: how likely a given argument type is to be shared; how likely is it that an argument in a given position splits;.



The conjunction is the head of the coordinated nodes, and its outgoing relations are the same as its incoming. Mareček and Kljueva convert SynTagRus to the Prague style, note that they apply "a few rules" but "far from all cases can be solved."

fig. 1. PROIEL-style coordination. The conjunction is the head of the  coordinated nodes, and its outgoing relations are the same as the ingoing one
fig. 1. PROIEL-style coordination. The conjunction is the head of the coordinated nodes, and its outgoing relations are the same as the ingoing one

Coordination: theoretical and practical importance

The main issues encountered in the conversion process had to do with coordination and null verb insertion, as the necessary information was not always recoverable in the SynTagRus data. We are not aware of any highly successful previous attempts at this task of converting multiple treebanks to the Prague style, note that they "apply some heuristics" but cannot reliably recover shared dependencies.

Materials and methods

  • Objective, key notions and limitations
  • Data
  • Probabilistic features
  • Algorithm
  • Deterministic Rules

Adoption rate (non-subjects only) FL (on the first conjunction . and to the left of it). All rules pertain only to subjects and can only predict negative outcomes (i.e., the absence of adoption) that override statistical guesswork.

Table 1. Number of potential adoption cases and adoption rate (#real  adoptions/#potential adoptions) for SynTagRus (estimated on a sample of  346 sentences, see main text) and the Codex Marianus (6350 sentences)
Table 1. Number of potential adoption cases and adoption rate (#real adoptions/#potential adoptions) for SynTagRus (estimated on a sample of 346 sentences, see main text) and the Codex Marianus (6350 sentences)

Results and discussion

Им важнее выдавить нас из страны, дискредитировать [нас], доказать, что мы воруем деньги наблюдателей». первый союз в примере (3) с опущенным глаголом «уменьшился»:. 3) «Не сердись», — сказала она торопливо, опустив глаза.


Interestingly, more than half of the cases that the guesser identified as false positives at the intermediate stage turned out to be human annotation errors (i.e., cases where we should have inserted secondary dependencies when annotating the extracted pattern, but we did not ). For example, one can test whether our finding that current arguments are more likely to be shared is true. 2005), Syntax and Semantic Annotated Russian Corpus: Status and Perspectives [Sintaksicheski i semanticheski annotirovannyj korpus russkogo yazyka: sovremennoe sostoyanie i perspektivy], Russian National Corpus [Nacional’nyj korpus russkogo jazyka:.


  • Корпуса устной, или звучащей, речи строятся и анализируются с пози- ции когнитивных процессов, происходящих в режиме реального времени при
  • Следует отметить, что причины затруднений при порождении слова не сводятся только к неправильному срабатыванию механизма извлечения. Здесь

The aim of our study was to investigate the characteristics of formal markers of word repetition problems in narratives of neurologically healthy people and people with aphasia.

Метод и материалы

  • Испытуемые
  • Процедура
  • Анализ

Результаты и обсуждение

  • Дискурсивно‑прагматический и лексико‑семантический уровни
    • Норма
    • Афазия
  • Фонологический уровень
    • Афазия

Маркеры трудностей словопроизводства в нормальном и клиническом дискурсе. репрезентации) могут внешне не отличаться друг от друга и требовать специальной проверки (Howard, Gatehouse, 2006), эти два этапа словообразования условно объединяют в единый лексико-семантический уровень.


2008), Illocation of Informing in Oral Narratives: Corpus Study [Illokutsiya soobshcheniya v ustnykh rasskazakh: Opyt Korpusnogo IsleDo-Vaniya], Proceedings of the International Conference Corpus Linguistics-2008, [Trudy MEZHDUNARODNOY KONFERENTSII “Korpusnaya Lingvistika-2008], [spbgu] , стр. 2006), Аномия: теоретические и клинические аспекты. 2010), Приобретенные нарушения речи и языка, John Wiley &. 1997), Производство устной речи и ее нарушение при афазии, Psychology Press, Хоув, Великобритания. 1968), Принципы социологического изучения русского языка, В русском языке и советском обществе, Москва. Однако случай плавающего квантора в инфинитивной фразе варьируется в зависимости от типа примененной PRO-проверки и некоторых других структурных особенностей инфинитивной фразы.


Floating quantifiers and the case of Russian subject PRO

Nominative is restricted to PRO subject control constructions and the dative is an incorrect case for the subject of the infinitive clause. First, it can be easily demonstrated that the overt dative subject of the infinitive sentence is not associated with tense constructions.

fig. 1. Я пришел сам
fig. 1. Я пришел сам

PRO control in Compreno

Third, despite the claims of most of the cited authors, there are other accessible cases for floating quantifiers in an infinitive clause, cf (15). 2 The location of the object in the Compreno system roughly corresponds to the role of the patient, referring to a general subject of the situation.

fig. 2. Я пришел починить трубу
fig. 2. Я пришел починить трубу

Floating quantifiers and the case choice in Compreno

In (22), figure 7, the PRO of infinitive clause is governed by the subject of the matrix predicate. In (23), figure 8, the PRO of infinitive clause is controlled by the dative object of the matrix predicate, so the infinitive node displays DativePRO flag.

fig. 7. Я хочу починить трубу сам
fig. 7. Я хочу починить трубу сам

Further applications of the TypeOfPRO flag

Its PRO is assigned dative case and transmits dative to the floating quantifier by agreement. By the same principle, object control PRO as in (24) can be assigned accusative and allow the floating quantifier to be accusative via agreement.


The central part of the system is a semantic analyzer of texts in natural language. Thanks to this resource, we can find the answer to the question using data not only in different sentences of the text, but also in the repository of individuals.

Introductory remarks

Igor Boguslavsky et al. ontologies/football-ont.daml) (Dukle, 2003), the football ontology of the i3media project (Bouayad-Agha et al. 2011) and the Kiktionary ontology (kiktionary.de). An important component of an ontology is the set of class instances, which can be many times larger than the set of classes and properties.

OntoEtap Ontology

More specifically, our semantic analyzer aims to make progress in the following directions: i) The use of extralinguistic knowledge in addition to linguistic data presented in the dictionary and grammar. The other source is our own little football news domain ontology, written in OWL using SWRL rules.

Representation of Word Meanings

Первое значение слова эквивалентно термину GeneralRank, принадлежащему классу MilitaryRank, а второе значение соответствует структуре hasRole(Human,GeneralRank). Следующие предложения даже не содержат слова «гол», но явно относятся к такого рода событиям: (1) Уже на второй минуте вратарь выбил мяч из ворот»; (2) Месси отправил мяч в левый верхний угол ворот.

fig. 1. Basic Semantic Structure (BSemS) for sentence (1)
fig. 1. Basic Semantic Structure (BSemS) for sentence (1)

From Sentence to Text

Case studies

  • Building a semantic structure of the message with semantic structures of individual sentences
  • Addressing the information on individuals stored in the Repository of Individuals

ScoreValue2 in the same MatchScore_1 was 1 (line 6), and this MatchScore_1 was scored in FootballMatch_1 (line 7). Treatment of data about individuals stored in the Repository of individuals stored in the Repository of individuals.

fig. 6. Semantic structure
fig. 6. Semantic structure

Question Answering Based on Semantic Analysis

  • Generating an OWL‑document for semantic structures
  • Generation of answers to natural language questions

The answer generation mechanism used in our question answering system is based on the comparison of the semantic structure of the user question with structures found in the individual's store. Semantic structure elements that are not question words are treated in the same way in ASK and SELECT queries.

fig. 9. An OWL-document representing a semantic structure
fig. 9. An OWL-document representing a semantic structure

Future work and conclusion

2012), The ETAP Parser: State of the Art, Computational Linguistics and Intellectual Technologies. 2011), Dependency-Based Learning of Compositional Semantics. Proceedings of the Conference on Empirical Methods in Natural Language Processing 2009, Volume 1 EMNLP 09 (pp. Fuzzy Ontology for Natural Language.

Введение: теоретические подходы к анализу

В (Циммерлинг 2010) центральной идеей классификации предикатов на -о является соотношение дативной предикативной конструкции, которая в работе названа предикатом ситуационного признака LexP, с прилагательной формой - предикатом, соотносимым с конкретным референтом. В 4 классе допускается дательный подлежащее в любой из форм (ОК — мне приятный человек, ОК мне приятен, ОК мне приятен).

Методы сбора и анализа данных

Сам материал исследования был представлен двумя примерными предложениями, первое из которых было взято из текстов XVIII века, а другое – из текстов XXI века2. В XXI веке ситуация меняется в противоположную сторону: конструкции с выраженным дативным подлежащим (тот, который мне нужен) уже составляют 19% от общего числа встречаемости этого типа, а конструкции с предлогом for становятся очень редкими. и составляют всего 2.

Представим данные табл. 2 в виде отдельной таблицы, отражающей изменения в каждой из форм: употребление в XVIII веке будет показано курсивом, употребление в XXI веке подчеркнуто. У нас слишком мало данных о предикативном безличном употреблении соответствующей лексемы в XVIII веке, поэтому в окончательную выборку, конечно, не вошли явления XVIII века.


In the end, I will briefly argue that, in a sense, the evolution of the alternation is akin to degrammaticalization, showing a movement from a morphophonologically conditioned external sandhi to a morphosyntactic category akin to government. I will first briefly introduce the origin of this alternation, then discuss the approach to the phenomenon adopted in (Zalizniak 1967), and move on to the cases of 'remote control' of the alternation and their relevance to the interpretation of the phenomenon.

Origins and the present status of the form

The participle form of the prepositional case (as in в нём) is then a variant of a form that does not exist at all - a strange status for a variant. While all paradigmatic questions are addressed in detail, consideration of the conditions of use of the 'n' form is beyond the scope of Zalizniak's research.

Contact position

Bulygina suggests that the choice of form is determined by phonological rules and not by prepositions. As Chapter 4 shows, the case of the Russian 'n'-forms is different because they are primarily syntactically and not phonologically conditioned; sensitive to what they depend on (prepositions of comparatives) rather than to what immediately precedes them.

Distant position

Construction with ves for the first time occurs at the end of the 20th century; all other occurrences fall between 2000 and today. All these constructions occur in the corpus; in the case of the preposition к, each occurs only once.

Использование современных технологий, в частности электронных кор- пусов, с одной стороны, существенно облегчают работу лингвиста, предостав-

Дмитрий Добровольский, Ирина Левонтина. когда говорящий забыл определенное имя, а также когда оно никогда ему не было известно.5 Так, если говорящий стоит на берегу и видит незнакомца на борту своей яхты, он кричит: «Эй, девочка, что... твое?» имя . в меньшей степени это относится и к форме того, как его зовут). Она также отметила, что «по мнению носителей английского языка, это выражение произносится с ударением на чем-то, что в целом не соответствует законам интонации предложения с одинаковой структурой. Как вас зовут?».

Теперь остановимся кратко на другой частице, которая в одном из своих многочисленных значений сближается с рассмотренной частицей бишь. Речь

Verstehst du, uns war eben der Shuchrai, павший в де Hand, der – weißt du noch. Eisenbahner делает еще один шаг вперед. Дело в том, что если бы подразумевалось, что адресат выкурил еще одну сигарету, ни одна из них не стала бы сразу означать eine: Und du hast mit ihm noch eine geraucht.

Сама природа идеи актуализации забытого такова, что очень естествен- ным оказывается использовать соответствующие слова как заполнители пауз

How do corpus data match intuition?, Frequency Effects in Linguistic Representation, Mouton de Gruyter, Berlin, New York, Vol. 2007), Emphasis and frequency of meanings: A comparison of corpus and experimental data on polysemy, available at:. http://ucrel.lancs.ac.uk/publications/CL2007/paper/205_Paper.pdf. 2009), Adjective-noun collocations in elicited and corpus data: Similarities, differences and the whys and wherefores, Corpus Linguistics and Linguistic Theory 5 (1), p. 2009), Corpus collocates versus word associations, Corpus Linguistics and Linguistic Theory 5 (2), p. 2004), A Comparison of Retrieved Data and Corpora, Language, Culture, and Mind, CSLI Publications, Stanford, CA, p. 2002), Formulaic Language and Lexicon, Cambridge University Press, Cambridge. How do corpus data match intuition?, Frequency Effects in Linguistic Representation, Mouton de Gruyter, Berlin, New York, Vol. 2007), Emphasis and frequency of meanings: A comparison of corpus and experimental data on polysemy, available at:. http://ucrel.lancs.ac.uk/publications/CL2007/paper/205_Paper.pdf. 2009), Adjective-noun collocations in elicited and corpus data: Similarities, differences and the whys and wherefores, Corpus Linguistics and Linguistic Theory 5 (1), p. 2009), Combining corpus linguistic and psychological data on word co-occurrences: Corpus collocates versus word associations, Corpus Linguistics and Linguistic Theory 5 (2), pp. 2004), Comparing elicited data and corpora, Language, culture and mind, CSLI Publications, Stanford, CA, pp.

Критерии выделения сослагательного наклонения

  • Дистрибуция форм
  • Возможность повторения частицы бы

Союзы с частицей бы: два слова или одно

  • Опущение частицы
  • Дистантное положение частицы

Quand le signe du conditionnel est une particule mobile : le cas du russe », dans Ultériorité au passé : le conditionnel, Direction J. L'objectif général de la présente étude était d'évaluer comment le modèle d'introduction de « l'histoire » s'applique à l'oral. histoires;.

Интродукция персонажей по Чейфу

Интродуктивная модель в русских «Рассказах о грушах»

  • Тип привязки
  • Речевые сбои
  • Статус персонажа и распространенность вводящего его предложения
  • Ограничение на легкое подлежащее
  • Ограничение одного нового понятия

Более того, некоторые обнаруженные закономерности (в частности, нарушения обоих ограничений Чейфа) ждут дальнейшего исследования на материале других, невводных предложений русского языка. ред.) (1980), «Грушевые истории: когнитивные, культурные и лингвистические аспекты повествовательного производства» , Norwood: Ablex. Мы оцениваем наш подход в области документов плана действий, а также в области литературы, признавая некоторые части текста романа Кафки «Процесс» метаязыковыми закономерностями и отличая их от описания романа в исследованиях Кафки другими. .

The domain of documents and meta‑documents

In the design document domain we will distinguish between texts that are mostly expressed via meta-language and those mostly in language object. Using "The Trial" text as a training data set will help to understand the linguistic properties of metalanguage and language object.

Learning discourse structure via tree kernels

But to distinguish metalanguage from language object in text, one has to consider different discourse structures that we automatically learn from text. In the field of literature, we will try to draw a line between pure metalanguage (literary works with a special level of abstraction) and a mixed text (a typical literary work).

Anaphora and rhetoric relations for classification tasks

It includes the entire first sentence, a verb phrase from the second sentence, and a verb phrase from the third sentence according to the rhetorical relation of elaboration. From the point of view of tree kernel learning, spanning trees are learned in the same way as ordinary parse trees.

Building extended trees and learning them

Check that each of the extended trees does not have a supertree in E. If verified, add it to E;. Note that the resulting trees are not correct parse trees for a sentence, but nevertheless provide an adequate feature space for tree core learning.

fig. 1: An arc which connects two parse trees for two sentences in a text  (on the top) and the derived set of extended trees (on the bottom) The algorithm for building an extended tree for a set of parse trees T is presented  below:
fig. 1: An arc which connects two parse trees for two sentences in a text (on the top) and the derived set of extended trees (on the bottom) The algorithm for building an extended tree for a set of parse trees T is presented below:
  • Evaluation
  • Related work and conclusions
  • Overview
    • Approaches to new language integration to LSRs
    • Approaches to WSA
  • Background
    • Compreno Description
    • Stages of text analysis
  • Methodology
    • Parallel corpus processing and statistical data retrieval
    • Statistical data filtration

Using the model as a reference point, we perform a semantic-syntactic analysis of a portion of available bilingual resources (bilingual dictionaries and parallel corpora) in a source language that has already been described (in our case, English). . In the framework of our system, idioms are positioned according to the meaning of the whole expression.

Table 1 shows evaluation results for the both above domains. Each row shows the  results of the baseline classification methods, such as Keyword statistics (TF*IDF, [21, 22],  Nearest-Neighbor classification and Naïve Bayes [23, 24].
Table 1 shows evaluation results for the both above domains. Each row shows the results of the baseline classification methods, such as Keyword statistics (TF*IDF, [21, 22], Nearest-Neighbor classification and Naïve Bayes [23, 24].

In order to reduce the number of irrelevant links, we introduce addi- tional scores which reflect the degree of affinity with the units added by other elements

Fine-grained sense elimination is applied when we obtain both parent and direct child SCs as candidate SCs for a given meaning. As we have already pointed

  • Additional Semantic‑Syntactic Analysis of a Dictionary Entry Additional semantic syntactic analysis of a dictionary entry is applied to mul-
  • Evaluation and discussion
  • Conclusion
  • Основные типы жестов, сопровождающих кванторы
    • Квантованные жесты
    • Обозначение точки
    • Жесты, изображающие форму объектов

Transactions of the Association for Computational Linguistics (TACL), p. 2014), High-Performance Word Meaning Approximation by Joint Modeling of Meaning Distance and Brightness Similarity. Proceedings of the 7th Global WordNetConference, Tartu, pp. 1997), A perspective on semantic analysis methods and their evaluation.

Table 3. Treatment of Multiword Expressions
Table 3. Treatment of Multiword Expressions


fig. 1. PROIEL-style coordination. The conjunction is the head of the  coordinated nodes, and its outgoing relations are the same as the ingoing one
fig. 2. SynTagRus-style coordination. The first conjunct is the head  of the conjunction, which again is the head of the second conjunct,  they are connected through a set of special “coordinative” relations We managed to convert SynTagRus to the PROIEL fo
Table 1. Number of potential adoption cases and adoption rate (#real  adoptions/#potential adoptions) for SynTagRus (estimated on a sample of  346 sentences, see main text) and the Codex Marianus (6350 sentences)
Table 2. Adoption rate for different positions of a potential adoptee,  calculated for all arguments together; subjects only; non-subjects only Position of a poten‑


