Онтологический подход к разработке баз знаний учебно-методических комплексов



Скачать 104.51 Kb.
Дата05.09.2014
Размер104.51 Kb.
ТипРеферат
УДК 002.53:004.89

ОНТОЛОГИЧЕСКИЙ ПОДХОД К РАЗРАБОТКЕ БАЗ ЗНАНИЙ УЧЕБНО-МЕТОДИЧЕСКИХ КОМПЛЕКСОВ

Захарова Наталья Иркиновна

Пермский государственный университет, zaharova_n_i@list.ru


В статье рассмотрены методы онтологического инжиниринга для автоматизированного определения степени соответствия содержания текстов учебно-методического характера заявленной тематике. С помощью основных принципов построения онтологий созданы онтологии общих знаний по дисциплине «Основы защиты информации», онтологии УМК «Информатика» по разделу «Основы защиты информации», онтологии структуры УМК. Рассмотрена архитектура демо-версии подсистемы OntoCtrl 2.0.
Введение

Одной из важных составляющих образовательного процесса являются созданные высококвалифицированными специалистами учебно-методические комплексы (УМК). Однако даже наличие всякого рода документов, содержащих рекомендации по структуре и содержанию УМК, не гарантирует ни соответствие УМК требованиям ГОС по соответствующей учебной дисциплине, ни оценку качества УМК.

Оценка качества УМК – это очень сложный процесс, для которого отсутствуют общепризнанные критерии, что может привести к некоторому несоответствию между предметным содержанием УМК и прописанным в ГОС требованиям к знаниям и умениям по учебной дисциплине.

В то же время правильно и хорошо составленное УМК, без сомнения, очень важно не только при заочной форме обучения, когда студент осваивает материал самостоятельно, а преподаватель лишь контролирует этот процесс, но и для поддержки дистанционной формы традиционного обучения.

Поэтому разработка программ, даже в незначительной степени автоматизирующих процесс оценивания качества УМК, является актуальной и востребованной на практике.

Для автоматической проверки соответствия предметного содержания учебно-методических текстов заявленной тематике была разработана демонстрационная версия подсистемы OntoCtrl 2.0.

При рассмотрении проблемы с точки зрения автоматизации обработки текстовой информации, оценка качества УМК - частный случай более общей задачи автоматизированного определения степени соответствия текстов на естественном языке заявленной тематике.[1]

В данной ситуации требуется привлечение экспертных знаний, использование современных методов искусственного интеллекта и интеллектуальных интернет-технологий, поэтому наиболее подходящим к процессу составления УМК является подход, основанный на инженерии знаний.[5] Учитывая преимущества, которые дают онтологии при обработке неструктурированной информации, в качестве предлагаемого подхода был выбран онтологический инжиниринг.



Описание предлагаемого подхода

С помощью онтологического подхода мы можем наиболее цельно представить сведения о рассматриваемой проблемной области.

Кроме того, материал, представленный в единой форме, вместе с цепочкой взаимосвязей между понятиями, определениями одних терминов посредством других дает не только более полное понимание предметной области, но и лучше воспринимается, тиражируется и воспроизводится.[3] Так, построив онтологию УМК одной дисциплины, мы совершенно логичным образом, без переписывания кода, сможем расширить ее и использовать программное средство для оценки УМК другой дисциплины.

Построение онтологии – это затяжной и итерационный процесс, требующий многократного повторения описанных выше шагов. Это обуславливается, например, наличием скрытых знаний, неявных связей, которые не были очевидными на первом этапе построения онтологии, выявлением новых, возможно, более абстрактных понятий промежуточного уровня.[4]

Прежде всего, мы определили, что построение онтологии в нашем случае осуществляется по принципу снизу вверх. Этот процесс начинается с определения самых общих понятий предметной области с последующей конкретизацией понятий.

Обобщенный алгоритм построения онтологии для любой проблемной области можно представить следующим образом:


  1. Выделение основные понятия и термины проблемной области

  2. Построение таксономии понятий

  3. Определение взаимосвязей между понятиями

  4. Определение экземпляров понятий

Фрагмент онтологии структуры УМК выполненной в графическом редакторе StarUML представлен на рис.1



Рис.1 Фрагмент онтологии проблемной области в StarUML

В перспективах развития данной работы для взаимодействия, дальнейшей интеграции с программными системами и подключения больших онтологических ресурсов, а также наложения дополнительной семантики на проблемную область необходимо представить созданную онтологию проблемной области в нотации OWL2. Для этого воспользуемся свободно распространяемым, открытым графическим редактором для создания и представления онтологий, являющимся также средой для построения баз знаний – Protégé. Этот редактор позволит создать онтологию в нотации OWL2 и посмотреть ее в различных синтаксисах, таких как RDF/XML,OWL/XML.

Для решения многих задач, связанных с автоматической обработкой текстов на естественном языке, в частности, задачи автоматической проверки соответствия предметного содержания учебно-методических текстов заявленной тематике, возникают серьезные проблемы, связанные с корпусом языка.

Проблема однозначной интерпретации смысла текста на ЕЯ является весьма серьезной проблемой, даже частичное решение которой имеет очень большое значение. Роль ее для текстового поиска заключается в том, что пользователь ищет не тексты, а информацию. И для поиска он задает не кусочки текста (так как этот текст ему в общем случае неизвестен), а понятия русского языка, характеризующие информацию, которую он хочет найти. К семантическим проблемам относятся проблема семантической близости слов, семантической многозначности и лексико-семантической неоднозначности, которые решаются с помощью семантических метрик. Выбор метрики для нахождения семантической близости слов происходит эмпирически, в зависимости от топологии проблемной области.



Выбор семантической метрики

При решении разного рода задач, связанных с автоматической обработкой текстов на естественном языке возникают серьезные проблемы, связанные с корпусом языка. К таким проблемам относятся проблема семантической близости слов, семантической многозначности и лексико-семантической неоднозначности, которые решаются при помощи использования метрик для измерения семантического расстояния.[8] Но для каждой конкретной проблемной области, в зависимости от решаемой задачи, эвристически выбирается своя метрика для подсчета семантического расстояния, так как использование метрики зависит от топологии проблемной области.

В общем случае на выбор метрики влияют:


  • Наличие перегибов;

  • Длина пути между понятиями;

  • Различные типы перегибов;

  • Различные типы связей, присутствующие в онтологии;

  • Максимальная длина пути между понятиями;

  • Учет локального и глобального контекста;

Очень важно при определении семантической близости понятий учитывать особенность пути между понятиями:

  • чем длиннее путь между понятиями, тем слабее семантическая близость;

  • наличие перегиба на пути ослабляет семантическую близость;

  • разные типы перегибов на пути могут по-разному влиять на семантическую близость;

  • перегиб пути на высоком уровне иерархии хуже, чем на более низком уровне.

Также необходимо при выборе соответствующей метрики учитывать топологию связей между понятиями. Так при обычной классификации, то есть при наличии в основном связи «is a» гораздо выгоднее брать более простую метрику, такую как, например, метрика Leacock и Chodorov, которые в своих исследованиях тоже учитывали только таксономию понятий.[7,9] Если же в онтологии присутствует много типов связей, то также необходимо определиться с весом каждого вида связи. Оценки подбираются эвристическим путем в зависимости от топологии сети.[5]

Для получения наиболее семантически верных результатов необходимо также разграничивать такие вещи как локальный и глобальный контекст понятия. В этом случае возникает вопрос в выборе размеров локального контекста. Обычно в виде локального контекста берут линейную окрестность N*N, где N зависит от глубины онтологии.[6]

Так как в построенной онтологии по дисциплине «Основы защиты информации» при анализе ее топологии было установлено, что в онтологии есть семантические перегибы одного вида «перегиб-сверху», то в дальнейшей работе при выборе метрики придется учитывать веса различных типов связей. А также необходимо принять во внимание, что перегиб пути на высоком уровне иерархии хуже, чем на более низком уровне.[8]

Таким образом, при разработке любого алгоритма и выборе метрики для подсчета семантического расстояния необходимо первым делом провести анализ онтологии по описанным выше критериям.

Применительно к данной топологии проблемной области на данном этапе работы использовалась метрика, которая применялась для концептов Тезауруса Роже, в которой расстояние соответствует числу ребер кратчайшего пути между концептами. Причем связь «is a» бралась за единицу расстояния, а мера связи «a part of» высчитывалась в зависимости от количества составляющих целое понятий.

Архитектура OntoCtrl

К настоящему времени база знаний (БЗ) OntoCtrl 2.0 представляет собой онтологию структуры УМК, онтологию УМК «Информатика» по разделу «Основы Защиты Информации», онтологию общих знаний по разделу «Основы защиты информации» и документ, созданный в Microsoft Word c расширением «xml» содержащий описание онтологии «Искусственных Нейронных Сетей».

Для описания онтологий существуют различные языки и системы, однако, наиболее наглядным, удобным, познавательным, но трудозатратным, является графический подход, позволяющий специалистам непосредственно «рисовать» онтологии, что играет важную роль для понимания информации и значительно увеличивает степень ее осмысления. Для графического представления онтологий в системе OntoCtrl был выбран программный продукт StarUML- один из ведущих программных инструментов моделирования. Но представление онтологий в только лишь графическом редакторе предоставляет удобный и наглядный графический интерфейс, не отражая при этом никакой семантики связи между концептами онтологии.

Подсистема OntoCtrl 2.0 рассчитана на различные категории пользователей, как на пользователей-новичков, так и на пользователей-профессионалов, поэтому необходимо предоставить высококвалифицированному специалисту удобное и доступное средство для создания и редактирования онтологий.(рис. 2)

OntoCtrl 2.0 содержит компонент для экспорта и импорта онтологий, позволяя создавать онтологии как в графическом виде, так и в текстовом формате, представляя онтологию в виде взаимосвязанной тройки: «понятие», «связь», «понятие», используя лишь средства Microsoft Word, что позволит редактировать онтологии в простой и наглядной форме для неподготовленного пользователя.

Компонент экспорта и импорта онтологий был отлажен на онтологии общих знаний по дисциплине «Искусственных нейронных сетей», созданной в Microsoft Word.





Рис. 2. Экспорт и импорт в системе OntoCtrl

Онтологии, составляющие БЗ подсистемы, были «нарисованы» в графическом редакторе StarUML, но сам по себе графический редактор лишь предоставляет удобный и наглядный графический интерфейс, ни не отражая при этом никакой семантики связи между понятиями в онтологиях, ни не предоставляя возможности оценить степень соответствия УМК заявленной тематике. Импортировав графическое представление онтологии с помощью компонента экспорта и импорта в OntoCtrl 2.0, у пользователя появляется гораздо больше возможностей, представляемых подсистемой.

Подсистема OntoCtrl 2.0 включает в себя компоненту визуального представления онтологии, позволяющую просматривать, пополнять и редактировать иерархию понятий, компоненту регистрации пользователя, а также компоненту нестандартного запроса для организации диалога с системой на некотором, соответствующем БЗ, подмножестве естественного языка (ЕЯ) для автоматизации проверки степени полноты соответствия онтологии УМК «Информатика» по разделу «Основы защиты информации» по отношению к онтологии общих знаний по дисциплине «Основы защиты информации».

В рамках системы OntoCtrl 2.0 компонента для нестандартного запроса по данному полю знаний дает пользователю возможность осуществлять своеобразный диалог с системой, создавая SQL-запросы на некотором подмножестве естественного языка, а также определять взаимосвязи между понятиями и определять, какое из понятий более общее и из каких частей состоит. Пользователь, работая с компонентом нестандартного запроса, составляет запрос на некотором подмножестве ЕЯ, далее этот запрос переводится системой в SQL-запрос и выполняется приложением, обращаясь к БД. В ответ пользователь получает нужную ему информацию.

С помощью компоненты проверки смыслового содержания, проводится анализ соответствия между двумя онтологиями: онтологией УМК «Информатика» по разделу «Основы Защиты Информации» и онтологией общих знаний по разделу «Основы защиты информации». Компонент проверки смыслового содержания работая с заполненной БД, используя семантические метрики сопоставляет содержание, развернутость и соответствие между терминами предметной области. Что дает нам представление об полноте представления знаний в УМК.

В системе OntoCtrl 2.0 компонент регистрации пользователя осуществляет процедуры идентификации, аутентификации и регистрации.

При попытке зайти в систему, если компонент регистрации обнаружит, что пользователь не зарегистрирован в системе OntoCtrl 2.0, то система предложит пройти процесс регистрации.



Рис 3. Архитектура OntoCtrl 2.0

Заключение

В данной статье представлен онтологический подход для решения задач автоматической проверки соответствия предметного содержания учебно-методических текстов заявленной тематике, посредством автоматической проверки степени полноты соответствия смыслового содержания онтологии УМК «Информатика» по разделу «Основы Защиты Информации» онтологии общих знаний по разделу «Основы защиты информации»

OntoCtrl 2.0 имеет веб-интерфейс, который позволит в дальнейшем подключать информационные ресурсы Интернета для каждой его компоненты.

В дальнейшем по мере наращивания БЗ предметного содержания учебных дисциплин, поставлена цель расширить онтологию и разработать общий подход к онтологическому анализу УМК учебных дисциплин с целью автоматизации процессов анализа соответствия текстов УМК заявленным целям и ГОС.



Библиографический список

  1. Гаврилов Э.П. Комментарий к закону об авторском и смежных правах. З-е изд., перераб. и доп. М.: Экзамен, 2003.

  2. Гаврилова Т.А., Хорошевский В.Ф. Базы знаний интеллектуальных систем. СПб.:Питер, 2000. 383 с.

  3. Нариньяни А.С. Кентавр по имени ТЕОН: Тезаурус+Онтология // Труды Международной конференции ДИАЛОГ-2001. М., 2001. С.184-188.

  4. Загорулько Ю.А., Попов И.Г. Описание сложных предметных областей на основе интеграции средств представления знаний. М: Москва, 2001, 115 с.

  5. С.А. Козлов. Генерация образовательных траекторий на основе динамических профилей обучаемых//Вестник пермского университета «Математика, механика, информатика» 2009 выпуск 3(29). С.139-142

  6. Крижановский А.А. Математическое и программное обеспечение построения списков семантически близких слов на основе рейтинга вики-текстов. [Электронный ресурс] [Режим доступа: http://www.dialog-21.ru/dialog2006/materials/html/Krizhanovsky.htm] [Проверено: 20.12.2009]

  7. Лукашевич Н.В., Чуйко Д.C. Автоматическое разрешение лексической многозначности на базе тезаурусных знаний [Электронный ресурс] [Режим доступа: http://www.cir.ru/docs/ips/publications/2007_yandex_ambig.pdf] [Проверено: 19.12.2009]

  8. Крижановский А.А. Семантически близкие слова. [Электронный ресурс][Режим доступа: http://www.dialog-21.ru/dialog2004/materials009/html/Krizhanovsky.htm] [Проверено: 20.06.2010]

  9. Борисов К.Е. Применение семантической близости для повышения надежности в поиске текстовой информации [Электронный ресурс] [Режим доступа: http://katpop.narod.ru/txt/popdip/index.htm] [Проверено: 20.06.2010]


Ontological approach to development of knowledge bases methodical complexes

Zakharova Natalya Irkinovna

PSU, zaharova_n_i@list.ru


In the article the principles of construction of ontologies, which are built with the ontology of general knowledge on the subject "Fundamentals of Information Security, Ontology methodical complex "Information"section on"Principles of information security", the ontology structure methodical complex. The architecture demo subsystem OntoCtrl 2.0 and debugged on the ontology of general knowledge on the subject "Fundamentals of Information Security," Ontology CMD "Information" section on "Principles of Information Security"

Похожие:

Онтологический подход к разработке баз знаний учебно-методических комплексов iconЛитература по всему курсу 31 Тематический план семинарских занятий и методические рекомендации к ним
История государства и права зарубежных стран: Учебно-методический комплекс / А. Ю. Саломатин. М.: Норма, 2011. 496 с.: 60x90 1/16....
Онтологический подход к разработке баз знаний учебно-методических комплексов iconСтруктура умк под учебно-методическим комплексом
Современные умк являются логичным развитием традиционных учебно-методических комплексов, обогащенных использованием современных информационных...
Онтологический подход к разработке баз знаний учебно-методических комплексов iconМетодические рекомендации по изучению и преподаванию курса Программа курса «Сравнительное правоведение»
Сравнительное правоведение: Учебно-методический комплекс / А. В. Малько, А. Ю. Саломатин. М.: Норма: инфра-м, 2011. 352 с.: 60x90...
Онтологический подход к разработке баз знаний учебно-методических комплексов iconВ. А. Беленко, кандидат физико-математических наук
Разработка мультимедиа для учебно-методических комплексов системы дистанционного обучения по дисциплинам, связанных с преподаванием...
Онтологический подход к разработке баз знаний учебно-методических комплексов iconСеминар для учителей нсо и преподавателей педвузов сфо «Формирование предметных компетенций учителя математики в аспекте подготовки учащихся общеобразовательных учреждений к гиа и егэ»
Всероссийский заочный конкурс учебно-методических комплексов по музыкальным
Онтологический подход к разработке баз знаний учебно-методических комплексов iconУчебно-методических комплексов для проведения факультативных занятий на 2011/2012 учебный год по состоянию на 21. 09. 2012 г
Математика. 3-4 классы. Путешествие в страну Занимательной математики (пособие для учителей + программа)
Онтологический подход к разработке баз знаний учебно-методических комплексов iconВопросы к экзамену по курсу «Гидрогеология», где представлен необходимый минимум знаний, который должны усвоить студенты после обучения по данной дисциплине
Учебно-методический комплекс по курсу «Гидрогеология» является систематическим, взаимосвязанным и последовательным набором учебно-методических...
Онтологический подход к разработке баз знаний учебно-методических комплексов iconПоложения о рецензировании учебно-методических материалов в умк ф-та пм-пу
При рассмотрении учебно-методических указаний достаточно одного рецензента, а в случае учебных пособий назначаются два рецензента,...
Онтологический подход к разработке баз знаний учебно-методических комплексов iconГоризонтальное масштабирование sql azure (федерация)
Для освобождения емкости необходимо объединить несколько баз данных sql azure в одну. Этот подход называется сегментированием баз...
Онтологический подход к разработке баз знаний учебно-методических комплексов iconПрограмма «Развитие научного потенциала высшей школы»
Координационный Совет учебно-методических объединений и научно-методических советов Минобрнауки РФ
Разместите кнопку на своём сайте:
ru.convdocs.org


База данных защищена авторским правом ©ru.convdocs.org 2016
обратиться к администрации
ru.convdocs.org