Сравнительный анализ результатов машинного перевода (на материале французских и русских текстов)

Худякова Юлия Михайловна
Бесплатно
В избранное
Работа доступна по лицензии Creative Commons:«Attribution» 4.0

Стирая языковые барьеры и расширяя горизонты коммуникации, технологии машинного перевода становятся неотъемлемой частью нашей повседневной жизни. Результаты автоматического перевода представляют собой всё более связные и осмысленные тексты. Для поддержания тенденции популяризации компьютерного перевода проводятся исследования, направленные на оценку его качества и выявление ошибок перевода с целью их последующего исправления. В данной работе особое внимание уделяется сравнению результатов работы нескольких систем машинного перевода.
С помощью детального разбора и классификации расхождений выявляются особенности функционирования каждой из систем. В качестве материала исследования используются русские и французские тексты и их ручные переводы, обеспечивающие возможность проведения анализа в обоих направлениях перевода.

Развитие машинного перевода неразрывно связано с увеличением количества переводимой информации. Постоянная необходимость совершенствования качества работы систем машинного перевода свидетельствует об их высокой востребованности. В современном мире становится важно не только обеспечение возможности межъязыковой коммуникации и обмена информацией вне языковых барьеров, но и скорость и эффективность этих процессов. Вследствие технического прогресса машинный перевод находит свое место и в области трудовой деятельности человека: все большую популярность обретает профессия постредактора – специалиста, занимающегося доработкой автоматически переведенного текста [Koponen 2016].
Интерес к системам машинного перевода в профессиональном контексте подтверждает необходимость исследования качества их работы. Одним из методов анализа систем является сопоставление результатов их работы с целью последующего разбора найденных ошибок и определения наиболее совершенного на момент проведения исследования инструмента для постредактирования. В сравнении становится возможно увидеть то, как по-разному функционируют системы, и как это влияет на генерируемый текст.
Цель этого исследования заключается в сопоставительном анализе работы систем машинного перевода для оценки их качества и составления классификации выявленных ошибок. Для достижения данной цели были сформулированы следующие теоретические и практические задачи:
Изучение и обобщение источников информации по теме машинного перевода, системах перевода и их особенностях.
Определение понятия «качество перевода», анализ существующих подходов к оценке качества перевода.
Отбор материала для сравнения результатов перевода.

Данное исследование содержит результаты сопоставительного анализа результатов машинного перевода, выполненного онлайн-сервисами «Google Translate», «Яндекс – Переводчик» и «PROMT. One» для языковой пары «русский – французский». В ходе работы были рассмотрены понятия, связанные с автоматическим переводом, история развития научного направления и особенности существующих систем машинного перевода. Отдельное внимание уделялось направлениям перевода «с русского языка на французский» и «с французского языка на русский» в контексте переводоведения. Методы оценки результатов машинного перевода были проанализированы с точки зрения возможности их применения в практике переводоведения. В рамках работы был произведен сравнительный анализ результатов перевода русских и французских текстов, разработана форма классификации ошибок МП, разобраны примеры ошибок каждой из рассматриваемых систем, вычислены автоматические оценки качества и читабельности переводов. В результате всех этапов исследования можно сделать следующие выводы:
Использованный в работе метод автоматической предобработки текстов для выделения несоответствий в переводах может быть применен в составлении классификаций ошибок других направлений перевода и в поиске примеров неточностей МП для обучающих пособий и курсов по автоматизированному переводу.
Использование тегов для выделенных несоответствий в переводах значительно облегчает процесс ручной разметки.
Найденные примеры ошибок МП могут быть использованы в качестве тестов для проверки знаний постредактора.
Анализ обнаруженных ошибок в результатах работы систем машинного перевода продемонстрировал преимущество сервисов «Google Translate» и «Яндекс – Переводчик». Однако в некоторых приведенных примерах прослеживается высокое качество работы сервиса «PROMT. One» с точки зрения адаптации перевода, лексического разнообразия и смыслового соответствия оригиналу.
Автоматическая оценка качества перевода, несмотря на сложность интерпретации полученных результатов, демонстрирует результаты, аналогичные выводам, сделанным в процессе составления классификации. Самую высокую оценку получила система компании Google. Вычисления, полученные при помощи разных метрик, обладали схожими значениями, что позволило сопоставить их и сделать общие выводы.
Подсчет читабельности результатов МП с использованием метрик ARI, FK, SMOG, CL может найти практическое применение в оценке трудозатрат постредактора.
В качестве возможных перспектив исследования представляется релевантным расширение корпуса текстов, дополнение составленной классификации, анализ причин возникновения ошибок машинного перевода и поиск вариантов их устранения.

Литература:
Александрова Е. М. Влияние лексического сходства языков на переводимость каламбура // Филологические науки. Вопросы теории и практики. 2019. №4. С. 108-113.
Андреева, А. Д. Обзор систем машинного перевода // Молодой ученый. 2013. № 12. С. 64-66.
Апресян Ю. Д., Богуславский И. М., Иомдин Л. Л., Лазурский А. В., Митюшин Л. Г., Санников В. З., Цинман Л. Л. Лингвистический процессор для сложных информационных систем. М.: Наука, 1992.
Бархударов Л. С. Язык и перевод (Вопросы общей и частной теории перевода). М.: «Междунар. отношения», 1975.
Белобородова Е.А., Бодулева А.Р. Преимущества и недостатки машинного перевода // Инновационная наука. 2016. №9 (21). С. 224-226.
Бунтман Н. В., Гончаров А. А., Нуриев В. А. Ошибки в машинном переводе: проблемы классификации // Системы и средства информатики. 2019. Т. 29. № 3. С. 92-103.
Владова И. М. Перевод как межкультурная коммуникация // Русский язык за рубежом. 2011. № 4(227). С. 27-32.
Гак В. Г. Сопоставительная лексикология: на материале французского и русского языков. М.: «Междунар. отношения», 1977.
Гриф М. Г., Тимофеева М. К. Интерлингва в системах машинного перевода для жестовых языков // Труды СПИИРАН. 2012. № 20 (1). C. 116-137.
Добровольский Б. Д. Лексические трудности перевода в лингвокультурном аспекте. М., 2009.
Дроздова К.А. Машинный перевод: история, классификация, методы // Вестник Омского государственного педагогического университета. Гуманитарные исследования. 2015. №3 (7). С. 156-158.
Замуруева H. A. Жанровые особенности официально-делового стиля речи // Ученые записки ОГУ. Серия: Гуманитарные и социальные науки. 2010. №3-2. С. 120-123.
Ивтушок Е. Машинный перевод не справился с пониманием больших текстов. 2018. URL: (дата последнего обращения: 01.06.2021).
Карцева Е. Ю., Маргарян Т. Д., Гурова Г. Г. Развитие машинного перевода и его место в профессиональной межкультурной коммуникации // Вестник РУДН. Серия: Теория языка. Семиотика. Семантика. 2016. №3. С. 155-164.
Кенжаев А. Д. Машинный перевод: история и современность // Иностранные языки и регионоведение. М.: 2014.
Кольцова, Д. А., Кольцов С. В. История и развитие машинного перевода // Русский язык и культура в зеркале перевода. 2019. № 1. С. 130-135.
Комиссаров В. Н. Теория перевода. М., 1990. Т. 8.
Кочеткова Н. С., Ревина Е. В. Особенности машинного перевода // Филологические науки. Вопросы теории и практики. Тамбов: Грамота, 2017. № 6. Ч. 2. С. 106-109.
Кулагина О. С. О современном состоянии машинного перевода // Математические вопросы кибернетики. Вып. 3. М.: Наука, 1991. С. 5–50.
Кушеева М.Н., Гомбожапова Т.Н., Аюшеева Н.Н. Метод оценки качества семантической сети текста // Современные наукоемкие технологии. 2019. № 11-1. С. 77-81.
Легостина М. С. Метрики оценки качества машинного перевода // Инноватика-2019: сборник материалов XV Международной школы-конференции студентов, аспирантов и молодых ученых. Томск: Общество с ограниченной ответственностью “СТТ”. 2019. С. 490-493.
Люльчева Е. М. Имплицитные способы выражения отрицания // Вестник ИГЛУ. 2013. №2 (23). С. 100-108.
Минаева И. В. Картирование как метод репрезентации в работах Ойвинда Фальстрема // Артикульт. 2014. 16(4). С. 104-113.
Митренина О. В. Машинный перевод // Прикладная и компьютерная лингвистика. 2-е изд. ред. М.: Издательская группа URSS. 2017. С. 156-189.
Мифтахова Р. Г. Технологии машинного перевода. Нейроперевод // Доклады Башкирского университета. 2018. Т. 3. № 6. С. 711-715.
Мохов Н. А. Новейшие информационные технологии в переводе: опыт и перспективы // Язык и культура: Сборник статей XXIX Международной научной конференции. Томск: Национальный исследовательский Томский государственный университет. 2019. С. 230-235.
Рогушина Ю. В. Использование критериев оценки удобочитаемости текста для поиска информации, соответствующей реальным потребностям пользователя // Проблеми програмування. 2007. № 3. C. 76–87.
Рычихин А. К. О методах оценки качества машинного перевода // Системы и средства информ. 2019. Т. 29. № 4. С. 106–118.
Солнышкина М. И., Гафиятова Э. В., Казачкова М. Б. Инструменты оценки сложности текста: современная парадигма // Научное наследие Е.И. Пассова в контексте развития иноязычного образования: Материалы Международной научной конференции, посвященной 90-летию со дня рождения Е.И. Пассова, Липецк, 01–02 декабря 2020 года / Под общей редакцией В.Б. Царьковой, А.А. Люлюшина. Липецк: Липецкий государственный педагогический университет имени П.П. Семенова-Тян-Шанского, 2020. С. 251-263.
Томилова А. И. Явление межъязыковой псевдоэквивалентности в русском и французском языках: теоретические и прикладные аспекты. Екатеринбург: Уральский государственный педагогический университет (УрГПУ), 2018.
Томин В. В. О проблемах машинного перевода научно-технического текста в информационном поле кросс-культурного взаимодействия // Вестник ОГУ. 2015. №1 (176). С. 33-39.
Федюк П. С. Специфика определения критериев широкозначности лексических единиц // Известия РГПУ им. А. И. Герцена. 2009. №101. 200-205.
Худяков Н. А. Современные технологии машинного перевода текстов: преимущества и недостатки // Иностранные языки: лингвистические и методические аспекты. 2019. № 41. С. 208-214.
Якобсон Р. О. О лингвистических аспектах перевода // Вопросы теории перевода в зарубежной лингвистике. М., 1978. С. 16-24.
Banerjee S., Lavie A. METEOR: An Automatic Metric for MT Evaluation with Improved Correlation with Human Judgments // Proceedings of Workshop on Intrinsic and Extrinsic Evaluation Measures for MT and/or Summarization at the 43rd Annual Meeting of the Association of Computational Linguistics (ACL-2005). Michigan, 2005.
Bromley A. Charles Babbage’s Analytical Engine, 1838 // IEEE Annals of the History of Computing. T. 4. № 3. 1982. P. 196-217.
Carl M. Post-Editing Machine Translation: Efficiency, Strategies, and Revision Processes in Professional Translation Settings // Psycholinguistic and Cognitive Inquiries into Translation and Interpreting. 2015. P. 145-174.
Cheragui M. Theoretical overview of machine translation // CEUR Workshop Proceedings. № 867. 2012. P. 160-169.
Hutchins J. Machine Translation: A Brief History. Oxford: Pergamon Press, 1995.
Koponen M. Machine Translation Post-editing and Effort. Empirical Studies on the Post-editing Process. Helsinki, 2016.
Lin Ch. ROUGE: A Package for Automatic Evaluation of summaries. Proceedings of the ACL Workshop: Text Summarization Braches Out. 2004.
Papineni K., Roukos S., Ward T., Zhu W. BLEU: A Method for Automatic Evaluation of Machine Translation. 2002.
Peng H. The Impact of Machine Translation and Computer-aided Translation on Translators // IOP Conference Series: Materials Science and Engineering. 2018.
Zhou S., Jeong H., Green P. How consistent are the best-known readability equations in estimating the readability of design standards? // IEEE Transactions on Professional Communication. 2017.
Zong Zh. Research on the Relations Between Machine Translation and Human Translation. Journal of Physics: Conference Series. 2018.
Интернет-ресурсы:
Яндекс – Переводчик. URL: . (Дата последнего обращения: 01.06.2021).
Яндекс Подбор Слов. URL: . (Дата последнего обращения: 01.06.2021).
DiffLib. URL: . (Дата последнего обращения: 01.06.2021).
Google Translate. URL: . (Дата последнего обращения: 01.06.2021).
Natural Language Toolkit. URL: . (Дата последнего обращения: 01.06.2021).
PROMT One. URL: . (Дата последнего обращения: 01.06.2021).
RapidAPI. Top 8 Best Translation Websites & Services (in 2021). URL: . (Дата последнего обращения: 01.06.2021).
RENOUVO (Réseau pour la nouvelle orthographe du français). URL: . (Дата последнего обращения: 01.06.2021).

Заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 5 000 ₽

Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям

    Нажимая на кнопку, я соглашаюсь на обработку персональных данных и с правилами пользования Платформой

    Последние выполненные заказы

    Хочешь уникальную работу?

    Больше 3 000 экспертов уже готовы начать работу над твоим проектом!

    Елена Л. РЭУ им. Г. В. Плеханова 2009, Управления и коммерции, пре...
    4.8 (211 отзывов)
    Работа пишется на основе учебников и научных статей, диссертаций, данных официальной статистики. Все источники актуальные за последние 3-5 лет.Активно и уместно исполь... Читать все
    Работа пишется на основе учебников и научных статей, диссертаций, данных официальной статистики. Все источники актуальные за последние 3-5 лет.Активно и уместно использую в работе графический материал (графики рисунки, диаграммы) и таблицы.
    #Кандидатские #Магистерские
    362 Выполненных работы
    Вики Р.
    5 (44 отзыва)
    Наличие красного диплома УрГЮУ по специальности юрист. Опыт работы в профессии - сфера банкротства. Уровень выполняемых работ - до магистерских диссертаций. Написан... Читать все
    Наличие красного диплома УрГЮУ по специальности юрист. Опыт работы в профессии - сфера банкротства. Уровень выполняемых работ - до магистерских диссертаций. Написание письменных работ для меня в удовольствие.Всегда качественно.
    #Кандидатские #Магистерские
    60 Выполненных работ
    Евгений А. доктор, профессор
    5 (154 отзыва)
    Более 40 лет занимаюсь преподавательской деятельностью. Специалист в области философии, логики и социальной работы. Кандидатская диссертация - по логике, докторская - ... Читать все
    Более 40 лет занимаюсь преподавательской деятельностью. Специалист в области философии, логики и социальной работы. Кандидатская диссертация - по логике, докторская - по социальной работе.
    #Кандидатские #Магистерские
    260 Выполненных работ
    Кормчий В.
    4.3 (248 отзывов)
    Специализация: диссертации; дипломные и курсовые работы; научные статьи.
    Специализация: диссертации; дипломные и курсовые работы; научные статьи.
    #Кандидатские #Магистерские
    335 Выполненных работ
    Ксения М. Курганский Государственный Университет 2009, Юридический...
    4.8 (105 отзывов)
    Работаю только по книгам, учебникам, статьям и диссертациям. Никогда не использую технические способы поднятия оригинальности. Только авторские работы. Стараюсь учитыв... Читать все
    Работаю только по книгам, учебникам, статьям и диссертациям. Никогда не использую технические способы поднятия оригинальности. Только авторские работы. Стараюсь учитывать все требования и пожелания.
    #Кандидатские #Магистерские
    213 Выполненных работ
    Татьяна С. кандидат наук
    4.9 (298 отзывов)
    Большой опыт работы. Кандидаты химических, биологических, технических, экономических, юридических, философских наук. Участие в НИОКР, Только актуальная литература (пос... Читать все
    Большой опыт работы. Кандидаты химических, биологических, технических, экономических, юридических, философских наук. Участие в НИОКР, Только актуальная литература (поставки напрямую с издательств), доступ к библиотеке диссертаций РГБ
    #Кандидатские #Магистерские
    551 Выполненная работа
    Лидия К.
    4.5 (330 отзывов)
    Образование высшее (2009 год) педагог-психолог (УрГПУ). В 2013 году получено образование магистр психологии. Опыт преподавательской деятельности в области психологии ... Читать все
    Образование высшее (2009 год) педагог-психолог (УрГПУ). В 2013 году получено образование магистр психологии. Опыт преподавательской деятельности в области психологии и педагогики. Написание диссертаций, ВКР, курсовых и иных видов работ.
    #Кандидатские #Магистерские
    592 Выполненных работы
    Виктор В. Смоленская государственная медицинская академия 1997, Леч...
    4.7 (46 отзывов)
    Имеют опыт грамотного написания диссертационных работ по медицине, а также отдельных ее частей (литературный обзор, цели и задачи исследования, материалы и методы, выв... Читать все
    Имеют опыт грамотного написания диссертационных работ по медицине, а также отдельных ее частей (литературный обзор, цели и задачи исследования, материалы и методы, выводы).Пишу статьи в РИНЦ, ВАК.Оформление патентов от идеи до регистрации.
    #Кандидатские #Магистерские
    100 Выполненных работ
    Алёна В. ВГПУ 2013, исторический, преподаватель
    4.2 (5 отзывов)
    Пишу дипломы, курсовые, диссертации по праву, а также истории и педагогике. Закончила исторический факультет ВГПУ. Имею высшее историческое и дополнительное юридическо... Читать все
    Пишу дипломы, курсовые, диссертации по праву, а также истории и педагогике. Закончила исторический факультет ВГПУ. Имею высшее историческое и дополнительное юридическое образование. В данный момент работаю преподавателем.
    #Кандидатские #Магистерские
    25 Выполненных работ

    Другие учебные работы по предмету

    Видовые различия в русской речи польских и чешских студентов
    📅 2021год
    🏢 Санкт-Петербургский государственный университет
    Фразеологические единицы в политическом дискурсе
    📅 2021год
    🏢 Санкт-Петербургский государственный университет