ПРИМЕНЕНИЕ ГЕНЕТИЧЕСКИХ АЛГОРИТМОВ ДЛЯ ПОЛУЧЕНИЯ ЛОГИЧЕСКИ СВЯЗНОГО МАШИННОГО ПЕРЕВОДА ТЕКСТА Захожая Елена Вячеславовна, Протасов Владислав Иванович Московский физико-технический институт,
Московский государственный горный университет
факультет общей и прикладной физики
Долгопрудный, Москва, Россия
elena.zakhozhaya@gmail.com, protonus@yandex.ru В докладе исследуется принципиальная возможность построения гибридной системы машинного перевода на основе генетических алгоритмов. Метод генетического консилиума позволяет как объединить различные подходы к машинному переводу, так и вовлечь в процесс перевода пользователя, и тем самым использовать неформализованные знания человека для значительного улучшения точности и связности перевода. Существенным достоинством предложенного метода является то, что пользователю достаточно знать лишь один язык из двух, участвующих в переводе. К минусам метода можно отнести его трудоемкость. В результате была показана принципиальная работоспособность метода, разработан детальный алгоритм, а также на основе экспериментов были выявлены общие закономерности метода.
В ходе работы текст переводится несколькими различными электронными переводчиками в необходимом направлении, затем, после некоторой обработки и фильтровки, каждый из полученных результатов переводится в обратном направлении. Процесс повторяется, количество итераций, через которое достигается результат, зависит от сложности текста и направления перевода, а также желаемой точности. Контроль и фильтровка производятся двумя способами. Первый доступен для обоих направлений перевода: на итерации, когда мы имеем в наличии текст на знакомом пользователю языке, у пользователя есть возможность проследить, как выглядят тексты, полученные разными электронными переводчиками. Пользователь выбирает тот вариант перевода, который, по его мнению, наиболее удачен на данной итерации, либо составляет их комбинацию. (Наиболее удачным считается наиболее близкий по смыслу к исходному текст при переводе с известного на незнакомый, либо наиболее логически связный при переводе с незнакомого.) Второй способ отсеивания наиболее слабых вариантов проводится на этапе, на котором мы имеем варианты на незнакомом пользователю языке. Отсеивание производится машиной на основании сравнения варианта с исходным текстом, поэтому такое отсеивание используется только для перевода с незнакомого языка. Сравнение является пословным, особый вес в оценку варианта дает правильное использование временных форм глагола. Как показали эксперименты, такая оценка действительно позволяет отбросить наименее точные и оставить в рассмотрении наиболее точные варианты перевода.
Конец процесса определяется пользователем: когда варианты, предоставляемые ему для оценки, становятся принципиально неразличимыми, результат работы консилиума считается достигнутым. Таким образом, пользователь контролирует точность перевода.
Гибридная система объединяет работу различных электронных агентов, независимо от алгоритмов их работы, что позволяет учитывать все возможные результаты, и в итоге получать их наилучшую возможную комбинацию. Вовлечение человека дает возможность оценивать комбинации с той точки зрения, с которой их видит конечный потребитель перевода, а использование метода генетического консилиума в основе системы обеспечивает тот факт, что полученная комбинация является наилучшей.
ЛИТЕРАТУРА
[1] Протасов В.И. Конструирование метасистемных переходов в интеллектуальных системах.-М.,изд. Института физико-технической информатики, 2009 г., 186 с.
[2] Сокирко А. Будущее машинного перевода.-Компьютерра №21, 5.06.2002.
[3] Федоров А. В. Основы общей теории перевода (лингвистические проблемы).- СПб.: Филологический факультет СПбГУ; М.: ООО «Издательский Дом «ФИЛОЛОГИЯ ТРИ», 2002. - 416 с. |