Клаузы с формами глагола быть в русской устной речи: корпусное исследование
В работе представлено исследование, посвященное анализу клауз с глаголом быть в русской устной речи. Семантические и синтаксические аспекты функционирования глагола быть анализируются посредством создания «инвентаря» семантических ролей, которыми могут обладать его актанты и сирконстанты, а также списка способов кодирования этих ролей в русской устной речи. Актуальность данной работы обусловлена ее принадлежностью к более крупному исследовательскому проекту, цель которого – разработать алгоритм взаимодействия различных уровней языка в процессе восприятия речи. Результаты данного исследования дополнят информацией о семантическом и синтаксическом уровнях языка базу данных, на которых основывается функционирование алгоритма.
Введение ………………………………………………………………………………………………… 4
Глава 1. Теоретические предпосылки исследования ………………………………….. 6
1.1. О понятии «валентность» ……………………………………………………………….. 6
1.2. Семантическая валентность, предикат, семантический актант …………… 8
1.3. Синтаксическая валентность, актант, сирконстант, распространитель 12
1.4. Некоторые отклонения от прототипической ситуации …………………….. 16
1.5. Семантическая роль, классификации семантических ролей …………….. 18
1.5.1. Понятие и общие принципы выделения семантических ролей ……. 18
1.5.2. Различные инвентари семантических ролей ………………………………. 23
1.5.3. Определение семантической роли актантов: типичные проблемы и
подходы к их решению …………………………………………………………………….. 27
1.6. Специфика глагола быть ………………………………………………………………. 30
Глава 2. Анализ употребления клауз с глаголом быть в русской
устной речи …………………………………………………………………………………………… 32
2.1. Контекст и прикладные задачи исследования …………………………………. 32
2.2. Опорный перечень способов кодирования семантических ролей в
русской устной речи …………………………………………………………………………… 33
2.3. Общая информация о материале исследования……………………………….. 34
2.3.1. Корпус русской устной речи и работа с ним ……………………………… 34
2.3.2. Пользовательский подкорпус НКРЯ …………………………………………. 37
2.3.3. Итоговый рабочий корпус ……………………………………………………….. 37
2.4. Модификации инвентаря семантических ролей ………………………………. 40
2.4.1. Субъект экзистенциального предложения …………………………………. 40
2.4.2. Объект обладания ……………………………………………………………………. 42
2.4.3. Определение, Определение: как, Состояние, Роль и Функция …….. 44
2.4.4. Тождественность …………………………………………………………………….. 47
2.5. Частотность активации семантических ролей …………………………………. 47
2.5.1. Общая информация …………………………………………………………………. 47
2.5.2. Сочетаемость семантических ролей ………………………………………….. 49
2.6. Распределение семантических ролей по формам глагола быть ……….. 63
2.6.1. Типичные случаи активации семантических ролей в клаузах с
«быть» …………………………………………………………………………………………….. 64
2.6.2. Типичные случаи активации семантических ролей в клаузах с
«есть» ……………………………………………………………………………………………… 65
2.6.3. Типичные случаи активации семантических ролей в клаузах с
формами будущего времени «быть» ………………………………………………….. 66
2.6.4. Типичные случаи активации семантических ролей в клаузах с
формами прошедшего времени «быть» ……………………………………………… 67
2.7. Способы кодирования наиболее абсолютно частотных семантических
ролей в клаузах с глаголом быть …………………………………………………………. 68
Заключение …………………………………………………………………………………………… 72
Список использованной литературы ……………………………………………………….. 74
Приложение 1. Опорный инвентарь семантических ролей и способов их
выражения ……………………………………………………………………………………………. 79
Приложение 2. Опорный инвентарь семантических ролей и способов их
выражения: влияние конструкций…………………………………………………………… 84
Приложение 3. Распределение по формам глагола быть: Экзистенциальный
субъект …………………………………………………………………………………………………. 86
Приложение 4. Распределение по формам глагола быть: Место ………………. 87
Приложение 5. Распределение по формам глагола быть: Посессор ………….. 88
Приложение 6. Распределение по формам глагола быть:
Объект Обладания …………………………………………………………………………………. 89
Приложение 7. Распределение по формам глагола быть: Определение …….. 90
Приложение 8. Распределение: когда по формам глагола быть:
Время: когда …………………………………………………………………………………………. 91
Приложение 9. Распределение по формам глагола быть: Тождественность. 92
Приложение 10. Распределение по формам глагола быть: Агенс ……………… 93
В работе представлено исследование, посвященное анализу клауз с
глаголом быть в русской устной речи. Целью работы было описание
семантических и синтаксических аспектов функционирования глагола быть
посредством создания «инвентаря» семантических ролей, которыми могут
обладать его актанты и сирконстанты, а также списка наиболее частотных
способов кодирования этих ролей в русской устной речи.
Актуальность данной работы обусловлена, во-первых, сравнительной
непредставленностью глагола быть в научной литературе при его
чрезвычайно высокой частотности в письменной и устной речи и
разнообразии грамматических функций, выполняемых им в русском языке.
Во-вторых, настоящая работа является частью выполняемого
исследователями из СПбГУ проекта «Алгоритмы восстановления
редуцированных форм: роль системы языка», цель которого – разработать
алгоритм взаимодействия различных уровней языка в процессе восприятия
речи, который был бы близок к тому, как распознает речь носитель языка
(проект поддержан грантом РФФИ №19-012-00629, рук. – Е. И. Риехакайнен).
Результаты исследования, представленного в выпускной квалификационной
работе, дополнят информацией о семантическом и синтаксическом уровнях
языка базу данных, на которой основывается функционирование алгоритма.
Для достижения обозначенной цели были поставлены следующие
задачи:
– обобщить имеющиеся в научной литературе сведения о
семантических и синтаксических валентностях, а также о семантических
ролях и об их основных классификациях;
– сформировать на основе этих сведений метод описания
семантических ролей, адекватный практическим целям работы, т.е.
пригодный для последующего использования в алгоритме и апробации на
естественном языковом материале;
– проанализировать материал русской устной речи с опорой на
составленное описание, в случаях необходимости – дополнить или
модифицировать описание;
– выявить на основе проанализированного материала наиболее
часто активирующиеся семантические роли в клаузах с глаголом быть, а
также типичные способы их выражения в русской устной речи.
Решение перечисленных задач было осуществлено с помощью
следующих методов:
− критический анализ научной и методической литературы;
− отбор корпусного материала;
− семантический и синтаксический анализ материала;
− количественный анализ результатов.
Объектом исследования являются контексты употребления глагола
быть в русской устной речи; предмет исследования – реализация
семантических ролей глагола быть в русской устной речи.
Основным источником материала исследования послужили данные
Корпуса русской устной речи (http://russpeech.spbu.ru/); вспомогательным
источником материала исследования был пользовательский устный
подкорпус, входящий в состав Национального корпуса русского языка (далее
– НКРЯ; http://ruscorpora.ru/).
Теоретическая значимость исследования обусловлена вкладом,
который она вносит в изучение проблематики семантических ролей и их
кодирования. Практическая значимость работы обусловлена тем, что ее
результаты будут учтены в алгоритме, имитирующем механизм восприятия
речи человеком; кроме того, составленная классификация семантических
валентностей может быть использована при обучении русскому языку как
иностранному.
В данной работе было представлено исследование, посвященное анализу
клауз с формами глагола быть в русской устной речи и описанию его
результатов в формате, который будет способствовать работе алгоритма
автоматического распознавания русской устной речи.
В первой главе работы были проанализированы и обобщены
существующие классификации семантических ролей с тем, чтобы на их основе
создать опорный инвентарь семантических ролей, на который можно было бы
ориентироваться при создании более специфических инвентарей,
адаптированных под нужды конкретного исследования. Затем этот инвентарь
был расширен и дополнен способами выражения семантических ролей, так
чтобы более точно описывать именно русскую устную речь (результат
представлен в Приложениях 1, 2).
В следующей части работы был проведен анализ клауз с глаголом быть,
в результате чего был сформирован модифицированный инвентарь
семантических ролей, с помощью которого можно описать специфику
значений и функционирования в русской устной речи именно форм глагола
быть. Так, в «репертуар» семантических ролей были введены следующие
частотные в материале корпуса семантические роли:
Экзистенциальный субъект
Объект обладания
Посессор
Тождественность
Роль
Функция
Также был обсужден ряд неоднозначных случаев и предложены критерии для
их разрешения.
Далее корпусный материал был описан в терминах перечисленных выше
(а также и более традиционно выделяемых) ролей, в результате чего были
сделаны выводы о частотности активации семантических ролей глагола быть
в русской устной речи, их распределении по формам глагола быть,
тенденциях их сочетаемости в рамках одной клаузы и основных способах
кодирования наиболее частотных из них.
Так, можно сделать следующие общие наблюдения о клаузах с глаголом
быть в проанализированном материале русской устной речи:
− значения глагола быть обуславливают специфику инвентаря
семантических ролей, выполняемых присоединяемыми им
распространителями;
− так, полное описание клауз с формами глагола быть требует введения
особых семантических ролей, малочастотных для распространителей
среднего глагола русского языка и высокочастотных для
распространителей глагола быть;
− самыми частотными семантическими ролями оказываются
Экзистенциальный субъект, Место, Посессор и Объект Обладания;
− клаузы с глаголом быть демонстрируют большую вариативность в
возможностях сочетания в их пределах семантических ролей, однако
прослеживается также и ряд общих закономерностей:
наиболее типичной оказывается ситуация сочетаемости в
пределах одной клаузы двух семантических ролей;
в материале корпуса встречаются пары семантических ролей,
чрезвычайно склонные к сочетаемости друг с другом;
– в разной степени частотные семантические роли Экзистенциальный
субъект, Объект обладания, Агенс и Тождество реализуются формально
схожим образом (именные группы в именительном или родительном
падеже) и, следовательно, представляют наибольшую сложность для
алгоритма распознавания устной речи;
– в некоторых (но не во всех) случаях можно выявить закономерности
сочетаемости этих ролей с другими, которые могут помочь при попытке
интерпретировать семантическую роль распространителя.
Последние выполненные заказы
Хочешь уникальную работу?
Больше 3 000 экспертов уже готовы начать работу над твоим проектом!