XML-формат синтаксической разметки в СКАТе

Горлов Никита Геннадьевич
Бесплатно
В избранное
Работа доступна по лицензии Creative Commons:«Attribution» 4.0

Целью данной диссертации является разработка синтаксической разметки Санкт-Петербургского корпуса агиографических текстов и её XML-представления в соответствии с рекомендациями TEI, а также автоматизация формирования её XML-представления. В задачи исследования входит: исследование опытов разработки различных синтаксически размеченных корпусов, как исторических, так и охватывающих современные языки; исследование предыдущего опыта разработки формата синтаксической разметки для СКАТа и разработка перечня новых синтаксических отношений для церковнославянского языка; изучение рекомендаций TEI по синтаксической разметке текстов и разработка XML-формата синтаксической разметки для последующей полуавтоматической или ручной обработки текстов СКАТа; разработка программы для полуавтоматического внедрения синтаксической разметки в существующие XML-файлы СКАТа. Работа состоит из введения, четырёх глав, заключения и трёх приложений. В качестве материала данной диссертации используется текст жития Димитрия Прилуцкого.

Санкт-Петербургский агиографический корпус (СКАТ) – это проект кафедры математической лингвистики Филологического факультета СПбГУ, разрабатываемый с 2006 года. Цель проекта – перевод церковнославянских рукописей в электронный формат и последующее их издание. В настоящее время введено несколько десятков рукописей, охватывающих промежуток XVI-XVII вв., которые представляют собой жития русских святых и похвальные слова к ним. Для текстов корпуса разработан формат морфологической разметки, которая осуществляется силами студентов кафедры математической лингвистики. Несколько лет назад была поставлена задача создания формата синтаксической разметки для корпуса. С самого начала создания корпуса разработчики опирались на рекомендации консорциума Text Encoding Initiative.
Text Encoding Initiative (далее – TEI) является консорциумом по разработке и развитию единого стандарта представления текстов в электронном виде. Главным результатом деятельности этого консорциума является список рекомендаций (Guidelines), определяющий язык разметки для представления структурных, интерпретационных и концептуальных особенностей текстов, главным образом из области гуманитарных наук, общественных наук и лингвистики. Формализм TEI построен на базе SGML/XML [7, С. 55] (до четвёртой версии включительно; начиная с версии P5 – исключительно XML).
Целью данной диссертации является разработка синтаксической разметки Санкт-Петербургского корпуса агиографических текстов и её XML-представления в соответствии с рекомендациями TEI, а также автоматизация формирования её XML-представления.
В задачи исследования входит:
исследование опытов разработки различных синтаксически размеченных корпусов, как исторических, так и охватывающих современные языки;
исследование предыдущего опыта разработки формата синтаксической разметки для СКАТа и разработка перечня новых синтаксических отношений для церковнославянского языка;
изучение рекомендаций TEI по синтаксической разметке текстов и разработка XML-формата синтаксической разметки для последующей полуавтоматической или ручной обработки житий;
разработка программы для автоматического внедрения синтаксической разметки в существующие XML-файлы рукописей.
Работа состоит из четырёх глав, заключения и приложений. В первой главе «Исследование опыта разработки синтаксически размеченных корпусов» рассматриваются десять синтаксически размеченных корпусов, их особенности, модели синтаксической разметки и соответствие её рекомендациям TEI. Во второй главе «Разработка синтаксической разметки для СКАТа» рассматривается предыдущий опыт создания модели синтаксической разметки для Санкт-Петербургского агиографического корпуса и разрабатывается новая система синтаксических отношений и соотвествующих им тэгов для ручной разметки корпуса. В третьей главе «Разработка XML-формата синтаксической разметки для СКАТа» рассматриваются возможности представления синтаксических структур в XML-формате в соответствии с рекомендациями TEI и разрабатывается подходящий способ XML-представления разработанной во второй главе системы синтаксических отношений. В четвёртой главе «Программа для автоматической генерации XML-формата синтаксической разметки в СКАТе» описывается разработанная в рамках данной диссертации программа для внедрения разработанной во второй главе синтаксической разметки в существующие XML-представления текстов житий СКАТа в соотвествии с разработанными в третьей главе правилами XML-формата этой разметки. В Заключении подводятся итоги работы. В Приложении 1 «Пример синтаксической разметки корпуса» приводится синтаксически размеченный фрагмент Жития Димитрия Прилуцкого размером в 151 строку. В Приложении 2 «Пример XML-формата синтаксической разметки корпуса» приводится XML-представление синтаксической разметки фрагмента из Приложения 1. В Приложении 3 «Ссылка на скачивание программы для автоматической генерации XML-формата синтаксической разметки» приводится ссылка, перейдя по которой, можно скачать программу, описанную в четвёртой главе, а также ряд сопетствующих материалов.
Актуальность выбранной темы дипломной работы тем, что на данный момент для Санкт-Петербургского агиографического корпуса до сих пор не была принята к эксплуатации система синтаксической разметки, применимая на практике (при ручной разметке), а также не был разработан исчерпывающий XML-формат такой разметки.
Новизна работы характеризуется тем что в её рамках была разработана новая система отношений для разрабатываемой разметки, новый способ XML-представления синтаксической разметки для СКАТа, а также программа, чьих основных функций ранее не встречалось в инструментарии для работы с данным корпусом.
В качестве материала данной диссертации используется текст жития Димитрия Прилуцкого.

Заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 5 000 ₽

Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям

    Нажимая на кнопку, я соглашаюсь на обработку персональных данных и с правилами пользования Платформой

    Последние выполненные заказы

    Хочешь уникальную работу?

    Больше 3 000 экспертов уже готовы начать работу над твоим проектом!

    Кирилл Ч. ИНЖЭКОН 2010, экономика и управление на предприятии транс...
    4.9 (343 отзыва)
    Работы пишу, начиная с 2000 года. Огромный опыт и знания в области экономики. Закончил школу с золотой медалью. Два высших образования (техническое и экономическое). С... Читать все
    Работы пишу, начиная с 2000 года. Огромный опыт и знания в области экономики. Закончил школу с золотой медалью. Два высших образования (техническое и экономическое). Сейчас пишу диссертацию на соискание степени кандидата экономических наук.
    #Кандидатские #Магистерские
    692 Выполненных работы
    Лидия К.
    4.5 (330 отзывов)
    Образование высшее (2009 год) педагог-психолог (УрГПУ). В 2013 году получено образование магистр психологии. Опыт преподавательской деятельности в области психологии ... Читать все
    Образование высшее (2009 год) педагог-психолог (УрГПУ). В 2013 году получено образование магистр психологии. Опыт преподавательской деятельности в области психологии и педагогики. Написание диссертаций, ВКР, курсовых и иных видов работ.
    #Кандидатские #Магистерские
    592 Выполненных работы
    Виктор В. Смоленская государственная медицинская академия 1997, Леч...
    4.7 (46 отзывов)
    Имеют опыт грамотного написания диссертационных работ по медицине, а также отдельных ее частей (литературный обзор, цели и задачи исследования, материалы и методы, выв... Читать все
    Имеют опыт грамотного написания диссертационных работ по медицине, а также отдельных ее частей (литературный обзор, цели и задачи исследования, материалы и методы, выводы).Пишу статьи в РИНЦ, ВАК.Оформление патентов от идеи до регистрации.
    #Кандидатские #Магистерские
    100 Выполненных работ
    Дарья Б. МГУ 2017, Журналистики, выпускник
    4.9 (35 отзывов)
    Привет! Меня зовут Даша, я окончила журфак МГУ с красным дипломом, защитила магистерскую диссертацию на филфаке. Работала журналистом, PR-менеджером в международных ко... Читать все
    Привет! Меня зовут Даша, я окончила журфак МГУ с красным дипломом, защитила магистерскую диссертацию на филфаке. Работала журналистом, PR-менеджером в международных компаниях, сейчас работаю редактором. Готова помогать вам с учёбой!
    #Кандидатские #Магистерские
    50 Выполненных работ
    Дмитрий Л. КНЭУ 2015, Экономики и управления, выпускник
    4.8 (2878 отзывов)
    Занимаю 1 место в рейтинге исполнителей по категориям работ "Научные статьи" и "Эссе". Пишу дипломные работы и магистерские диссертации.
    Занимаю 1 место в рейтинге исполнителей по категориям работ "Научные статьи" и "Эссе". Пишу дипломные работы и магистерские диссертации.
    #Кандидатские #Магистерские
    5125 Выполненных работ
    Татьяна М. кандидат наук
    5 (285 отзывов)
    Специализируюсь на правовых дипломных работах, магистерских и кандидатских диссертациях
    Специализируюсь на правовых дипломных работах, магистерских и кандидатских диссертациях
    #Кандидатские #Магистерские
    495 Выполненных работ
    Анна В. Инжэкон, студент, кандидат наук
    5 (21 отзыв)
    Выполняю работы по экономическим дисциплинам. Маркетинг, менеджмент, управление персоналом. управление проектами. Есть опыт написания магистерских и кандидатских диссе... Читать все
    Выполняю работы по экономическим дисциплинам. Маркетинг, менеджмент, управление персоналом. управление проектами. Есть опыт написания магистерских и кандидатских диссертаций. Работала в маркетинге. Практикующий бизнес-консультант.
    #Кандидатские #Магистерские
    31 Выполненная работа
    Дарья С. Томский государственный университет 2010, Юридический, в...
    4.8 (13 отзывов)
    Практикую гражданское, семейное право. Преподаю указанные дисциплины в ВУЗе. Выполняла работы на заказ в течение двух лет. Обучалась в аспирантуре, подготовила диссерт... Читать все
    Практикую гражданское, семейное право. Преподаю указанные дисциплины в ВУЗе. Выполняла работы на заказ в течение двух лет. Обучалась в аспирантуре, подготовила диссертационное исследование, которое сейчас находится на рассмотрении в совете.
    #Кандидатские #Магистерские
    18 Выполненных работ
    Юлия К. ЮУрГУ (НИУ), г. Челябинск 2017, Институт естественных и т...
    5 (49 отзывов)
    Образование: ЮУрГУ (НИУ), Лингвистический центр, 2016 г. - диплом переводчика с английского языка (дополнительное образование); ЮУрГУ (НИУ), г. Челябинск, 2017 г. - ин... Читать все
    Образование: ЮУрГУ (НИУ), Лингвистический центр, 2016 г. - диплом переводчика с английского языка (дополнительное образование); ЮУрГУ (НИУ), г. Челябинск, 2017 г. - институт естественных и точных наук, защита диплома бакалавра по направлению элементоорганической химии; СПХФУ (СПХФА), 2020 г. - кафедра химической технологии, регулирование обращения лекарственных средств на фармацевтическом рынке, защита магистерской диссертации. При выполнении заказов на связи, отвечаю на все вопросы. Индивидуальный подход к каждому. Напишите - и мы договоримся!
    #Кандидатские #Магистерские
    55 Выполненных работ

    Другие учебные работы по предмету

    Видовые различия в русской речи польских и чешских студентов
    📅 2021год
    🏢 Санкт-Петербургский государственный университет
    Фразеологические единицы в политическом дискурсе
    📅 2021год
    🏢 Санкт-Петербургский государственный университет