Технология и программно-инструментальные средства формирования электронного словаря паронимов украинского языка



Дата12.10.2012
Размер36 Kb.
ТипДокументы
ТЕХНОЛОГИЯ И ПРОГРАММНО-ИНСТРУМЕНТАЛЬНЫЕ СРЕДСТВА ФОРМИРОВАНИЯ ЭЛЕКТРОННОГО СЛОВАРЯ ПАРОНИМОВ УКРАИНСКОГО ЯЗЫКА

Грязнухина Татьяна Александровна, Любченко Татьяна Петровна, Широков Владимир Анатольевич, Якименко Константин Николаевич

Украинский языково-информационный фонд НАНУ

Киев, Украина

ukritalbd@faust.net.ua, t.lyubch@gmail.com, vshirokov48@mail.ru, kandobell@mail.ru

Паронимия, вследствие её соотнесённости с взаимодействием между формой и содержанием языковых знаков, требует особого внимания в системах автоматической обработки текстовой информации. В частности, в системах информационного поиска некорректное включение паронимов в состав ключевых слов запроса может вообще привести к стопроцентонму шуму системы.

Паронимия, вообще, является довольно распространенным явлением языка, что и обусловило постановку задачи создания электронного словаря паронимов (ЭСП), интегрирование его в Лексикографическую систему Украинского языково-информационного фонда НАНУ с целью использования в качестве инструмента паронимического индексирования текстов.

Поскольку речь идет о письменной форме языка, а во всех известных нам определениях паронимов в качестве основного дифференцирующего признака принято сходство звучания компонентов паронимической пары, первоочередной задачей данного исследования явилась интерпретация фонетических свойств паронимов в терминах графемной структуры слова. В нашей работе при эксплицитном представлении признака звукового сходства учитывались конкретные допустимые фонологические признаки букв, которыми могут отличаться слова-паронимы, их количество, а также совпадение места ударения. Различие устанавливается между словами одинаковой длины, принадлежащими к одному лексико-грамматическому классу, и с учетом позиции данных графем.


Признак семантического различия паронимов интерпретируется в работе как несовпадение их значений, зафиксированных в лексикографической базе данных толкового Словаря украинского языка в 20 томах (СУМ1), созданной в Украинском языково-информационном фонде НАН Украины. Кроме описанной группы собственно паронимов в лексикографическую базу данных (ЛБД) паронимов вводятся так называемые квазипаронимы (~неполные, семантические паронимы) типа: естетський – естетичний, ефектно – ефективно, коректний – коректурний. Как правило, в такие паронимические пары могут входить слова разной длины (l ≥ 6). Звуковое сходство квазипаронимов обеспечивается совпадением начальных частей слов, захватывающих корневые морфемы, а звуковое различие касается суффиксальной части слова и на графемном уровне оно представлено цепочками из 2-4 букв. Фонологические характеристики последних не подчиняются условиям, выведенным для собственно паронимов. Для большинства квазипаронимов признак семантического различия не выполняется полностью, но имеющиеся отличия их значений существенны и влияют на степень адекватности передаваемого смысла. Такие слова фиксируют все словари паронимов. В речи они широко распространены, и поэтому распознавание их в процессе автоматической обработки текста необходимо.

Исходным материалом, на котором осуществляется автоматическое формирование ЛБД претендентов украинских паронимов, является украинский грамматический словарь. Этапы формирования ЭСП:

  • Создание ЛБД претендентов на роль паронимов. Разработаны алгоритмы автоматического формирования списков собственно паронимов и квазипаронимов. Редактирование полученных списков осуществляется в среде, интегрированной с СУМ.

  • Формирование базы ЭСП в соответствии с разработанной структурой словарной статьи, в которой левая часть представлена номером паронимической пары и ее компонентами. Для квазипаронимов предусмотрена особая метка. Правая часть словарной статьи содержит информацию о значениях компонентов паронимической пары, которая выбирается из СУМ. Интерфейс программы редактирования позволяет вносить коррективы в обе части словарной статьи.

1 СУМ – аббревиатура, обозначающая Словарь украинского языка (Словник української мови)




Похожие:

Технология и программно-инструментальные средства формирования электронного словаря паронимов украинского языка iconОльга Викторовна вишнякова словарь паронимов русского языка
В словарь включено около 1000 пар паронимов современного русского языка, показаны возможная их сочетаемость с другими словами, в...
Технология и программно-инструментальные средства формирования электронного словаря паронимов украинского языка iconК вопросу о пользе электронного словаря на уроке иностранного языка

Технология и программно-инструментальные средства формирования электронного словаря паронимов украинского языка iconИсследование семантики союзов на основе толкового словаря украинского языка
Нан украины разрабатывается новый 20-томный словарь. Массив союзных статей
Технология и программно-инструментальные средства формирования электронного словаря паронимов украинского языка iconЧто такое Microsoft. Net?
Разработчикам программного обеспечения технология. Net предоставляет новую программную платформу и великолепные инструментальные...
Технология и программно-инструментальные средства формирования электронного словаря паронимов украинского языка iconРазвитие словаря
Словарь любого языка развивается в нескольких направлениях. Главными из них являются утраты слов, пополнения словаря, семантические...
Технология и программно-инструментальные средства формирования электронного словаря паронимов украинского языка iconАнна Юрьевна
Информационная технология формирования лексического ядра языка печатных источников XVIII – нач. XIX вв. На основе
Технология и программно-инструментальные средства формирования электронного словаря паронимов украинского языка icon«Связи с общественностью» Лю Энь ю «Технология формирования имиджа политика
Магистерская диссертация Лю Энь ю «Технология формирования имиджа политика (опыт Тайваня)» посвящена актуальной и практически важной...
Технология и программно-инструментальные средства формирования электронного словаря паронимов украинского языка iconИнструментальные средства проектирования интеллектуальных систем
Программные средства инженерии знаний и реализации интеллектуальных информационных систем (иис) можно разделить на следующие группы:...
Технология и программно-инструментальные средства формирования электронного словаря паронимов украинского языка iconИнструментальные средства трансформации схем алгоритмов и программ

Технология и программно-инструментальные средства формирования электронного словаря паронимов украинского языка iconЛекции 2 Инструментальные средства проектирования, разработки и отладки экспертных систем

Разместите кнопку на своём сайте:
ru.convdocs.org


База данных защищена авторским правом ©ru.convdocs.org 2016
обратиться к администрации
ru.convdocs.org