Прикладная лингвистика и языковая инженерия в. Ш. Рубашкин vrub



Скачать 131.17 Kb.
Дата27.10.2012
Размер131.17 Kb.
ТипДокументы
ПРИКЛАДНАЯ ЛИНГВИСТИКА И ЯЗЫКОВАЯ ИНЖЕНЕРИЯ*

В. Ш. Рубашкин


vrub@mail.nw.ru

Аннотация


В статье обсуждаются базовые понятия, используемые для обозначения тех направлений в лингвистике, которые связаны с информационными технологиями: Обосновывается точка зрения, согласно которой термин компьютерная лингвистика следует считать устаревшим. Предлагается использовать более адекватный термин инженерная лингвистика. Сопоставляются также термины лингвистическая и концептуальная семантика.

Ключевые слова: компьютерная лингвистика, инженерная лингвистика, семантика.

Abstract


The paper discusses the notions which is using in linguistics to denote its domains concerning information technologies: applied linguistics, computational linguistics, mathematical linguistics, corpora linguistics, theoretical linguistics et al. We explain why notion computational linguistics is archaic now and must be replaced by the term engineer linguistics. The notions linguistic semantics and conceptual semantics are compared also.

УДК: 81'33

Представления о междисциплинарных границах и разграничении научных направлений внутри научной дисциплины – едва ли не самый консервативный элемент в развитии научного знания. Пересмотр и даже уточнение этих представлений – процесс всегда болезненный и чреватый конфликтами. Определение и терминологическое оформление и тех и других границ весьма чувствительно к конъюнктуре - это почти всегда задевает интересы научных школ и групп, сложившиеся стереотипы и т.п. Но в такой динамичной, претерпевающей фактически взрывное развитие сфере, какую являет собой весь комплекс наук и направлений "информационно-когнитивного" цикла такой пересмотр с очевидностью неизбежен. Более того, он вполне назрел. Многое здесь уже понятно, но терминологическое и институциональное оформление этого понимания явно запаздывает. В докладе предлагается более пристально взглянуть на эту проблему.

Внутри самой лингвистики явно ощущается избыток названий, именующих разные разделы и направления, с одной стороны, и отсутствие единого их понимания, с другой. Действительно: прикладная лингвистика, структурная лингвистика, математическая лингвистика, компьютерная лингвистика, инженерная лингвистика, корпусная лингвистика, наконец, теоретическая лингвистика и общая лингвистикаЧто это – перечень разных разделов языкознания, каждый из которых может быть охарактеризован через свой специфический предмет, или просто исторически сложившийся набор названий, достаточно прихотливо и субъективно накладываемых на живой и многообразный процесс исследований и разработок? Вряд ли вызовет возражения мысль, что имен здесь больше, чем предметов для именования.


Дисциплинарное окружение "прикладной" лингвистики являет собой такую же картину: искусственный интеллект, инженерия знаний, концептуальное моделирование, формальная онтология, философская логика, логическая семантика и собственно информационные технологии – это действительно о разном? Помимо прочего, стоит держать в уме, что предстоит (и давно назрела) тяжелая работа по приведению в разумный порядок информационных ресурсов, накопленных в сети. Амбициозный проект Semantic Web предполагает, в частности, использование хорошо организованных и концептуально прозрачных средств классификации знаний – без чего он останется пустой и безжизненной оболочкой. Это еще один серьезный аргумент в пользу тезиса: "пора разобраться!"

Подчеркнем, что речь идет не просто об упорядочении терминологии ("не все ли равно, как говорить – лишь бы понимали"). Речь идет об организации науки и научных исследований, о дисциплинарных границах, о приоритетных направлениях исследований, о содержании учебного процесса и образовательных стандартах и других подобных вещах, к которым весьма небезразличны все участники процесса.

Ключевыми для понимания ситуации мы полагаем следующие противопоставления:

  • общая vs прикладная и инженерная лингвистика;

  • компьютерная vs "бескомпьютерная" лингвистика;

  • структурная vs прецедентная (статистическая) лингвистика;

  • лингвистическая vs "экстралингвистическая" ("концептуальная"?, "онтологическая"1?) семантика.

Рассмотрим их подробнее.

Прикладная, компьютерная и инженерная лингвистика. В известной книге А.Н. Баранова прикладная лингвистика определяется как "деятельность по приложению научных знаний об устройстве и функционировании языка в нелингвистических научных дисциплинах и в различных сферах практической деятельности человека, а также теоретическое осмысление такой деятельности" [2, с.7]. С таким определением – за исключением выделенного фрагмента - трудно не согласиться. При этом нужно, на наш взгляд, отдать себе полный отчет в том, что выделение прикладной лингвистики не есть что-то специфическое, но полностью соответствует вполне сложившейся в науке парадигме разделения, условно говоря, "естествознания" и "техники", или, говоря точнее, противопоставления объектного знания-что и процедурного знания-как. С этой точки зрения "техническими" являются не только такие традиционно относимые к сфере техники дисциплины как, скажем, машиноведение, электротехника, вычислительная техника и т. п., но и медицина, педагогика, политтехнология и вся сфера социальной инженерии. Применительно к лингвистике первый тип знаний (знания-что) должен быть ассоциирован с общей лингвистикой, второй (знания-как) – с прикладной. Подчеркнем, что правильным представляется в этой связи не противопоставление теоретическая – прикладная, а общая – прикладная лингвистика. Противопоставление теоретическая – экспериментальная проводит границу внутри общей лингвистики с точки зрения разграничения эмпирического и теоретического уровней исследования и описания объекта – в данном случае языка. Что касается "применения в нелингвистических научных дисциплинах", то общенаучная традиция не склонна квалифицировать такое применение как прикладную науку. Скажем, применение теоретических моделей и экспериментальных методов физики в химии породило физическую химию, которая справедливо считается фундаментальной, а никак не прикладной научной дисциплиной. Представляется, что таким же образом следует поступать и применительно к таким междисциплинарным штудиям, как, скажем, психолингвистика или социолингвистика. Представляется все же, что более последовательным будет и здесь деление знаний на как и что.

Если следовать Баранову, как, впрочем и многим другим авторам2, прикладная лингвистика в широком понимании это и переводоведение, и терминоведение, и языковая дидактика, и лексикография, и многое другое. И с этой точки зрения употребление термина прикладная лингвистика в более узком значении лингвистика, ориентированная на компьютерные информационные технологии, - как это исторически сложилось в отечественном обиходе и как это представлено в названиях ряда соответствующих институций - кажется непоследовательным и выходящим за рамки общенаучной традиции.

Это более узкое значение часто связывается с также не вполне адекватным термином компьютерная лингвистика. Следует, видимо, признать, что термин компьютерная лингвистика - если понимать его в прямом значении – в сегодняшней ситуации скорее дезориентирует, чем что-либо проясняет, он полностью себя изжил. Глубокие изменения, которые происходят сейчас в лингвистике и смежных областях знания, означают конец деления лингвистики на «компьютерную» и «традиционную». Определения прикладная, структурная, математическая, компьютерная призваны были в 50-х – 60-х г.г. прошлого века обозначить переход на новый уровень лингвистических исследований. Они – эти определения – были нужны, пока новые методы и подходы должны были отстаивать свое право на существование и как-то обозначать свою новизну и специфичность. Теперь же совсем иная эпоха – то, что было новым, спорным, поражавшим воображение полвека назад, превратилось в трюизмы. Поэтому и все эти определения становятся избыточными. Лингвистика в большой степени (хотя и с существенными оговорками) становится в ряд эмпирических дисциплин, основанных на систематизированных наблюдениях над своими объектами (и там, где это возможно, на эксперименте) и использующих стандартный гипотетико-дедуктивный метод теоретического конструирования.3 Наличие и технологическая доступность обширных собраний самых разнообразных текстов, в том числе и в особенности размеченных текстов, делает «бескомпьютерную» методологию исследования в лингвистике и смежных областях архаичной и просто невозможной.4 Содержание, которое этим термином сейчас чаще всего обозначается, есть не просто лингвистическое исследование с использованием компьютера, а инженерное моделирование разных аспектов языковой компетенции. А для этого содержания более адекватным будет, конечно, термин инженерная лингвистика, имеющий пока весьма ограниченное хождение.5 Сюда должны быть включены: технологии распознавания звуковой речи и письменного текста; автокорректоры; разумеется, автоматический перевод; лингвистически нетривиальные функции документальных ИПС; системы, поддержки естественно-языкового диалога с различными техническими системами (роботами, реляционными базами данных, экспертными системами); технологии типа Information Extraction, технологии свертывания текста (автоматизация реферирования); наконец, в дальнейшем – системы глубокого понимания делового текста.

Противопоставление общей и инженерной лингвистики не есть противопоставление по используемому инструментарию. Основная интенция общей лингвистики – максимально полное описание исследуемых языковых явлений. Задачи же инженерной лингвистики более утилитарные, она, как и всякая инженерия, есть «искусство возможного» – здесь важно понять, с одной стороны, какие аспекты лингвистических описаний (и – более широко – моделей языка) релевантны для решения рассматриваемой практической задачи, с другой стороны, что из этих описаний может быть доведено до уровня алгоритмов и работающих программных систем. Инженерная лингвистика, по-видимому, не теряя связи с общей лингвистикой, все более будет смыкаться с инженерией знаний, особенно на семантическом уровне. Так что, строго говоря, инженерная лингвистика – это не совсем лингвистика, или, точнее, не только лингвистика. При такой интерпретации термины прикладная и инженерная лингвистика должны быть соотнесены даже не как общее и частное, а, скорее, как два понятия с пересекающимися объемами.

Инженерная – утилитарная по определению - задача, вообще говоря, не имеет дисциплинарной принадлежности и дисциплинарных предрассудков. Выбираются средства, обеспечивающие наилучший результат. И не случайно именно в таком контексте нередко зарождаются новые методы и новые подходы. Весьма убедительным примером этого является внедрение прецедентных (example-based, case-based) методов решения задач языковой инженерии. Общая лингвистика отнюдь не торопилась признать, так сказать, "законность" такого подхода6. Но сейчас, очевидно, что ей предстоит теоретически осмыслить эти методы и включить их в свой арсенал, уравняв их в правах со ставшими уже традиционными методами структурного моделирования.

Лингвистическая семантика – и что еще?… Здесь, видимо, пока далеко до полной ясности; отнюдь не случайно, что все семантические проблемы, не покрываемые термином лингвистическая семантика, получили у языковедов чисто отрицательное определение – как экстралингвистическая семантика. В среде лингвистов возобладала точка зрения, согласно которой основная задача лингвистической семантики состоит в "реконструкции «наивной модели» мира на основе полного описания лексических и грамматических значений" [1, с. 6]. Убедительной демонстрацией того, в каких границах лингвиста интересует значение языковых выражений, может, на наш взгляд, служить превосходная в своем роде книга Е. В. Рахилиной [6]. "Стараясь не покидать пределов «чистой» лингвистики, языковеды, стоящие на этой позиции, принципиально отказываются от анализа содержательной стороны речевых произведений в полном ее объеме и интересуются лишь той частью содержания, которая закодирована единицами языка, составляющими данный речевой отрезок" [3, с. 14]. За стремлением соблюсти «чистоту» лингвистического подхода, отделить "лингвистически интересное" от "лингвистически неинтересного" стоит допущение, что можно действительно полностью отделить "наивную модель мира" от профессиональных знаний, всегда отнесенных к определенной предметной области. Однако и с точки зрения теории познания, и с точки зрения практики концептуального моделирования профессиональные знания основаны на той же скрытой в языке "априорной" (в кантовском смысле) модели мира, что и "наивные знания". Поэтому ограничить здесь можно лишь состав описываемых языковых объектов, но не состав средств их классификации и описания. Можно, конечно, вполне плодотворно обсуждать различия профессионального и обыденного взгляда на мир. Но ни там, ни тут нельзя обойтись без "логики здравого смысла" (commonsense metaphysics), оформленной в виде ядра концептуальной системы. Важно не то, что профессиональные и обыденные определения одних и тех же понятий могут отличаться; важнее другое – то, что и профессиональный и обыденный взгляд согласны в том, что скажем, собака - конкретизирует понятия домашнее животное и хищник, а также то, что это понятие объемно несовместимо, например, с понятиями дом или береза. Это, конечно, "лингвистически неинтересные" факты, но без их учета и фиксации семантическое описание лексики будет заведомо неполным и несистемным. Способность языковых выражений соотноситься с миром вещей реализуется не непосредственно, но через систему понятий. Этот принципиальный тезис на словах, конечно, признается всеми, но чаще всего игнорируется в реальной работе лингвистов. А собственно концептуальное моделирование, считавшееся со времен Аристотеля прерогативой логики, постепенно отступило в сферу искусственного интеллекта и инженерии знаний. Но и то и другое, к сожалению, пока представляет собой научное движение энтузиастов, не имеющее четкого институционального оформления.

Системообразующими элементами семантического описания лексики являются общая семантическая категоризация и – для предметных имен и предметных признаков - таксономия, точнее, расширенная таксономия (дерево признаков) [8, с. 76 - 94], определяющая полную систему объемных отношений между понятиями. На этой системе отношений только и может быть базирован механизм наследования свойств, без применения которого описание столь большой системы, как язык становится совершенно безнадежным делом. Что касается действительного решения семантических проблем, то путь к нему, как нам представляется, надо искать в объединении усилий многих специалистов, представляющих разные дисциплинарные традиции, и, соответственно, в организации проекта, направленного на создание мощного – мощного как с точки зрения функциональности, так и с точки зрения охвата лексического материала – концептуального словаря ("универсальной онтологии"), оформляемого как стандартный информационно-вычислительный ресурс, доступный и полезный для самых разных информационных технологий.

Литература


  1. Апресян Ю. Д. Дейксис в лексике и грамматике и наивная модель мира // Семиотика и информатика. – 1986. – Вып. 28.

  2. Баранов А. Н. Введение в прикладную лингвистику. – М., 2001.

  3. Кобозева И. М. Лингвистическая семантика. – М., 2000

  4. Коваль С.А. О составляющих прикладной лингвистики // Структурная и
    прикладная лингвистика. Межвузовский сборник. Вып. 6. СПб: Издательство С.-Петербургского университета, 2004. С. 305-309

  5. Коваль С.А. Лингвистические проблемы компьютерной морфологии. (рукопись).7

  6. Рахилина Е. В. Когнитивный анализ предметных имен: семантика и сочетаемость. - М.: Русские словари. 2000.

  7. Рубашкин В. Ш. Корпусная поддержка в процедурах обработки текста и семантического описания лексики // Доклады научной конференции "Корпусная лингвистика и лингвистические базы данных". – Спб.: Изд-во СпбГУ, 2002

  8. Рубашкин В. Ш. Представление и анализ смысла в интеллектуальных информационных системах. - М.: Наука, 1989.

  9. Raskin V. The How's and Why's Ontological Semantics // Компьютерная лингвистика и интеллектуальные технологии: Труды международной конференции "Диалог'2005". – М.: Наука, 2005.



* Доклад подготовлен при поддержке гранта РФФИ (проект № 03-06-80109)

1 Ср. [9].

2 Ср., напр., [4]. Автор этой работы, правда, считает правильным включить в прикладную лингвистику и междисциплинарные штудии, такие как психолингвистика и социолингвистика. Представляется все же, что более последовательным будет и здесь деление знаний на как и что.

3 Феноменология лингвистического исследования, его эмпирический материал – это сочетаемость языковых единиц (синтагматика). Задача теоретичесчкого конструирования – построение семиотических (структурных) моделей, объясняющих и теоретически воспроизводящих эту феноменологию.

4 И с этой точки зрения корпусная лингвистика может быть определена как раздел лингвистики, ориентированный на подготовку, так сказать, экспериментальной базы лингвистических исследований. Использование корпусов для проверки выдвигаемых теоретических гипотез скоро станет обыденной и необходимой составляющей любого корректно поставленного исследования.

5 См. подробное обсуждение этого тезиса в работе [5].

6 См., например, [7, с.139].

7 Автор благодарит С. А. Коваля за предоставленную возможность ознакомиться с рукописью подготавливаемой им монографии.

Похожие:

Прикладная лингвистика и языковая инженерия в. Ш. Рубашкин vrub iconПрикладное языкознание преподавание языков, особенности описания языка. Прикладная лингвистика
Прикладная лингвистика лингводидактика, комп лингвистика- направление в языкознании, кот занимается разработкой матем решения практич...
Прикладная лингвистика и языковая инженерия в. Ш. Рубашкин vrub iconМетодические рекомендации по государственной аттестации выпускников по направлению подготовки 031301. 65 «Теоретическая и прикладная лингвистика»
«Теоретическая и прикладная лингвистика» (Специалист; Лингвист), а также Положения о выпускной квалификационной работе, разработанном...
Прикладная лингвистика и языковая инженерия в. Ш. Рубашкин vrub iconПрограммы учебной дисциплины «Лингвистика текста» Направление подготовки 035700 «Лингвистика» Профиль 4 – «Теоретическая и прикладная лингвистика»
Цель курса – изучение основных положений теории текста, особенностей структурной и содержательной организации текста
Прикладная лингвистика и языковая инженерия в. Ш. Рубашкин vrub iconПрограммы учебной дисциплины «Контрастивная лингвистика» Направление подготовки 035700 «Лингвистика» Профиль 4 – «Теоретическая и прикладная лингвистика»
Цель курса – сопоставительное изучение английского, китайского, немецкого языков; анализ схождений и расхождений между языками, независимо...
Прикладная лингвистика и языковая инженерия в. Ш. Рубашкин vrub iconОсновной образовательной программы (ооп)
Направление подготовки 035700 Лингвистика, профиль Теоретическая и прикладная лингвистика
Прикладная лингвистика и языковая инженерия в. Ш. Рубашкин vrub icon1 Цели и результаты изучения дисциплины Цель
...
Прикладная лингвистика и языковая инженерия в. Ш. Рубашкин vrub iconФункциональный дуализм языка и языковая конвергенция (опыт моделирования языковой картины земной цивилизации)
Когнитивная лингвистика: ментальные основы и языковая реализация. Ч. 2 Текст и перевод в когнитивном аспекте. Сб статей к юбилею...
Прикладная лингвистика и языковая инженерия в. Ш. Рубашкин vrub iconСборнику «Машинный перевод и прикладная лингвистика»
К сборнику «Машинный перевод и прикладная лингвистика» (1964. Вып. 8)
Прикладная лингвистика и языковая инженерия в. Ш. Рубашкин vrub iconПрикладная лингвистика как научное направление

Прикладная лингвистика и языковая инженерия в. Ш. Рубашкин vrub iconМежкультурная коммуникация в аспекте лингвокультурологических и этнопсихолингвистических знаний
Языковая личность, языковая способность, языковая компетенция, речевое поведение начинают оцениваться как понятия, лингвокультурологическое...
Разместите кнопку на своём сайте:
ru.convdocs.org


База данных защищена авторским правом ©ru.convdocs.org 2016
обратиться к администрации
ru.convdocs.org