Концепция магистерской программы «Компьютерная лингвистика» (направление подготовки 035800. 68)



Дата26.07.2013
Размер74.5 Kb.
ТипДокументы
Концепция магистерской программы

«Компьютерная лингвистика»

(направление подготовки 035800.68)
Обоснование и обзор рынка труда:

Информационный взрыв последних лет значительно изменил не только общественную, но и научную жизнь: он породил совершенно новые задачи, которые во многом поменяли структуру научного знания, в частности, прочно соединив его гуманитарную составляющую с областью естественных и точных наук. Так возникло новое междисциплинарное направление, которое сейчас принято называть компьютерной лингвистикой; оно успешно и динамично развивается как самостоятельная область, которая нуждается в профессиональных кадрах, компетентных в этом пространстве. В настоящей момент специалисты по компьютерной лингвистике очень востребованы и в самых крупных компаниях, занимающихся собственно разработками в области лингвистики ( Яндекс, АBBYY, Авикомп, Медиалогия, Epam, Mail.ru), и в других крупных, средних и мелких компаниях, занимающихся менеджментом текстового контента (Интегрум, Паблик.ру, РИАН) или анализом неструктурированных данных (брокерские компании, хедхантеры, юридических консалтинг и др.). Спрос в данном случае намного превышает предложения. Для отечественного образования задача подготовки таких кадров – новая, она стала очевидной только в самое последнее время в связи с бурным развитием данной области. Отметим, что на сегодняшний день в Москве нет ни одной магистратуры по компьютерной лингвистике. В прошлом году такая магистратура был открыта в СПБГУ и в нижегородском филиале НИУ ВШЭ. Важно понимать, что сам термин «компьютерный лингвист» - далеко не нов; он использовался и 30 лет назад, еще в прошлом, «безинтернетном» столетии, когда компьютеры только появились. Сейчас в этот термин, конечно, вкладывается совсем другой смысл. Организация любого, в том числе и неязыкового контента так или иначе связана с организацией естественного языка, поскольку запрос к любой системе строится на естественном языке или его модификации. Таким образом, язык, вернее, технологии обработки языковых данных, оказываются здесь своего рода метаинструментами. Таким образом, иначе должен формироваться список компетенций, необходимых для подготовки специалиста по компьютерной лингвистике. Задача настоящей программы их определить, сформулировать и реализовать.
Компетенции:

С одной стороны, специалист такого профиля бесспорно должен владеть всеми достижениями в области языковых технологий и языкового анализа, причем на всех уровнях: от инструментальной фонетики до семантики дискурса, совершенное владение которыми абсолютно необходимо, причем для магистрантов – на новом уровне, более высоком, чем того требует общелингвистическая подготовка бакалавриата.
Это значит, что студенты магистратуры по компьютерной лингвистике должны не просто владеть основами лингвистических знаний и теорий, а еще и быть в курсе современных лингвистических теории, хорошо ориентироваться в актуальной проблематике и новом инструментарии.

С другой стороны, компьютерный лингвист должен быть иметь достаточную подготовку в области информационных технологий. Следует отдельно подчеркнуть, что в концепцию магистратуры не входит подготовка собственно программистов, в этом филологический факультет не может конкурировать с техническими ВУЗами и факультетами. Фокус программы состоит именно в расширении понимания возможностей лингвиста и того, как именно могут быть использованы его знания о языке, его гуманитарный бэкграунд и его способности к формализации и структурированию языковых объектов в современных технологических процессах. Именно такие специалисты сейчас востребованы для работы в программистских коллективах. Речь в данном случае идет о самой динамичной на сегодняшний день среде – это среда небольших команд, решающих задачу создания или информационного обеспечения системы или продукта. Опыт показывает, что такого рода задачи не решаются в одиночку – наиболее успешными на этом рынке оказываются как раз такие команды, в которых у каждого исполнителя есть своя роль, но которые умеют говорить на одном языке. В области лингвистических технологий оптимальным такое взаимодействие становится тогда, когда лингвист оказывается ведущим: он может не только сформулировать общую понятную всем участникам задачу, и создать общую конструкцию ожидаемого результата, но и предложить конкретный алгоритм достижения этого результата.

Тем самым, магистратура по компьютерной лингвистике на филологическом факультете НИУ ВШЭ ставит своей целью подготовку специалистов, способных участвовать в самых современных проектах, связанных с языковыми технологиями, а также самим их создавать, формулировать новые задачи и предлагать алгоритмы их решения. При этом междисциплинарность, изменчивость и высокая реактивность сферы электронных коммуникаций дает нам уникальную возможность «придумать профессию», связав между собой и объединив в одно целое разные группы компетенций.

В нашем понимании выпускник магистратуры по компьютерной лингвистике филологического факультета НИУ ВШЭ должен

  • иметь хороший теоретический бэкграунд в теоретической лингвистике, математических методах обработки данных

  • знать, как устроена современная электронная языковая среда

  • уметь увидеть в ней новые проектные задачи

  • уметь их формулировать и формализовать

  • уметь работать с данными: понимать, какие именно данные нужны для решения поставленной задачи, как взаимодействуют лингвистические и иные данные, откуда их можно получить

  • понимать, какие языковые структуры лежат за той или иной локальной задачей, каковы лингвистические и экстралингвистические свойства текстов, используемых для решения задач.

  • знать, какие лингвистические технологии следует применять в зависимости от условий задачи, понимать на какие лингвистические данные и ресурсы может опираться технология

  • уметь программировать прототипы и модели решений

  • уметь подготавливать необходимые лингвистические ресурсы

  • уметь проектировать цепочку процесса обработки языковых данных

  • уметь интерпретировать результаты автоматической обработки лингвистических данных,

  • оценивать трудоемкость разных решений и пороги допустимых ошибок

  • уметь выбирать оптимальную методологию тестирования

Таким образом, мы позиционируем роль компьютерного лингвиста как точку пересечения других профессиональных компетенций: собственно программистских, менеджерских, экспертных и др. Такое понимание соответствует междисциплинарному характеру большинства задач и командному подходу к их решениям.

Программа:

Перечисленные компетенции будут сформированы в рамках предлагаемой программы. Программа включает в себя два общепрофессиональных курса по формальным, функциональным и когнитивным моделям в лингвистике. Ключевая задача курсов – включить студента в пространство современной лингвистической мысли, осветить сегодняшний спектр существующих теорий и направлений в лингвистике. В программе по компьютерной лингвистике, будет уделяться специальное внимание возможности прикладного использования рассматриваемых теоретических аппаратов.

Кроме этого, в программе заложен ряд курсов по выбору связанных с современной информационной средой, обществом и используемыми технологиями, каждый из которых направлен на расширение базовых, выходящих за пределы узкопрофессиональных, знаний. Это курс по социальным сетям, курс «Digital humanities» (на английском языке), курс по машинному обучению и курс по моделированию когнитивных процессов.

Собственно профессиональные компетенции будут формироваться в курсе «Компьютерная лингвистика», который задуман как максимально полный двухгодичный курс. Отсутствие формального деления на мелкие курсы по отдельным направлениям позволит выстраивать курс гибко в соответствии с актуальными потребностями студентов и рынка. Современная компьютерная лингвистика является точкой пересечения лингвистических теорий и математических методов и программирования, поэтому основной курс по компьютерной лингвистике будет поддержан курсом «Математические модели компьютерной лингвистики» и собственно курсом по лингвистическому программированию. Кроме того, обязательным курсом является «Мастер-класс по компьютерной лингвистике». Планируется, что в основе этого курса будут лежать гостевые лекции практиков из самых разных областей, так или иначе сопряженных с языковыми технологиями.

Программа предусматривает также ряд специальных курсов по выбору, позволяющих студентам углубленно изучить одну из тем общего курса по компьютерной лингвистике. Это курсы по машинному переводу, по речевым технологиям, по семантическим технологиям, корпусным технологиям, компьютерной лексикографии , а также курс по оценке лингвистических систем и компонентов.

Центральным курсом магистратуры станет научно-исследовательский семинар «Проектирование лингвистических ресурсов и систем». Предполагается, что на этом семинаре будут сформированы небольшие проектные команды, задачей которых будет сделать некоторый продукт, пройдя весь путь от начала (задумки, анализ уже реализованных близких проектов, формализации требований) и до конца (реализации, тестирования, запуска). Семинар будет являться площадкой сотрудничества с компаниями и институтами, заинтересованными в решении задач в области компьютерной лингвистики.
Преподавательский состав.

Основные курсы по компьютерной лингвистике будут читаться преподавателями филологического факультета, имеющими большой научно-практический и преподавательский опыт в области компьютерной лингвистики: д.ф.н. Е.В. Рахилиной, к.ф.н О.Н.Ляшевской, к.ф.н. А.А. Бонч-Осмоловской, к.ф.н. Б.Л.Иомдиным, к.ф.н. И.В.Ефименко. Е.В. Рахилина является одним из основателей направления корпусной лингвистики в России, идеологом и организатором создания Национального корпуса русского языка. О.Н.Ляшевская имеет большой опыт в области разработки лингвистических компьютерных ресурсов, Ляшевская читала курсы по соответствующим дисциплинам в университете Тромсе (Норвегия). А.А Бонч-Осмоловская участвовала и руководила проектами в области компьютерной лингвистики в разных коммерческих компаниях. В течение последних пяти лет Бонч-Осмоловская читает курсы по компьютерной лингвистике на филологическом факультете МГУ им. М.В. Ломоносова. Б.Л. Иомдин читает курс по компьютерной лингвистике в Школе Анализа Данных Яндекса. И.В.Ефименко имеет большой опыт руководства проектами по компьютерной лингвистике в ай-ти отрасли, читает курс по онтологичекому инжинирингу на отделении прикладной математики факультета бизнес-информатики НИУ ВШЭ.

Подготовка программ теоретического блока по лингвистике будет осуществляться научным руководителем направления лингвистики д.ф.н. Е.В. Рахилиной при участии к.ф.н А.Б. Летучего и к.ф.н. М.А. Даниэля. Именно эти преподаватели читают основные курсы по теории языка на филологическом факультете НИУ ВШЭ.

Подготовка магистров по компьютерной лингвистике будет осуществляться с помощью преподавателей отделения прикладной математики факультета бизнес-информатики ( в том числе, базовой кафедры Яндекса в НИУ ВШЭ), факультета социологии, общеуниверситетской кафедры высшей математики, сотрудников «Центра семантических технологи» Института информационных технологий НИУ ВШЭ. Элективный курс на английском языке «Digital humanities» будет прочтен профессором Дартмутского колледжа Михаилом Гронасом.



Похожие:

Концепция магистерской программы «Компьютерная лингвистика» (направление подготовки 035800. 68) iconПрограмма дисциплины «Компьютерная лингвистика»
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления подготовки/ специальности,...
Концепция магистерской программы «Компьютерная лингвистика» (направление подготовки 035800. 68) iconОсновной образовательной программы (ооп)
Направление подготовки 035700 Лингвистика, профиль Теоретическая и прикладная лингвистика
Концепция магистерской программы «Компьютерная лингвистика» (направление подготовки 035800. 68) iconПрограммы учебной дисциплины «Лингвистика текста» Направление подготовки 035700 «Лингвистика» Профиль 4 – «Теоретическая и прикладная лингвистика»
Цель курса – изучение основных положений теории текста, особенностей структурной и содержательной организации текста
Концепция магистерской программы «Компьютерная лингвистика» (направление подготовки 035800. 68) iconПрограммы учебной дисциплины «Контрастивная лингвистика» Направление подготовки 035700 «Лингвистика» Профиль 4 – «Теоретическая и прикладная лингвистика»
Цель курса – сопоставительное изучение английского, китайского, немецкого языков; анализ схождений и расхождений между языками, независимо...
Концепция магистерской программы «Компьютерная лингвистика» (направление подготовки 035800. 68) iconПрограмма дисциплины «Проектирование лингвистических ресурсов и систем»
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления подготовки/ специальности...
Концепция магистерской программы «Компьютерная лингвистика» (направление подготовки 035800. 68) iconНаименование магистерской программы: «Интенсивное плодоводство и виноградарство», направление – «Садоводство»
Руководитель магистерской программы: Раджабов Агамагомед Курбанович, доктор с х н наук, профессор
Концепция магистерской программы «Компьютерная лингвистика» (направление подготовки 035800. 68) iconНаименование магистерской программы: «Овощеводство, селекция и семеноводство овощных культур». Направление – «Садоводство»
Руководитель магистерской программы: Мамонов Евгений Васильевич, доктор с х н., профессор
Концепция магистерской программы «Компьютерная лингвистика» (направление подготовки 035800. 68) iconАннотация рабочей программы дисциплины
Направление(я) подготовки (специальность) 035700 Лингвистика
Концепция магистерской программы «Компьютерная лингвистика» (направление подготовки 035800. 68) iconКомпьютерная лингвистика
Компьютерная лингвистика – раздел computer science, исследующий проблемы обработки естественных языков ( processing)
Концепция магистерской программы «Компьютерная лингвистика» (направление подготовки 035800. 68) iconКомпьютерная лингвистика
Компьютерная лингвистика – раздел computer science, исследующий проблемы обработки естественных языков ( processing)
Разместите кнопку на своём сайте:
ru.convdocs.org


База данных защищена авторским правом ©ru.convdocs.org 2016
обратиться к администрации
ru.convdocs.org