Применение модельно-ориентированных семантических сетей в задачах проектирования гетерогенных информационных систем



Скачать 86.09 Kb.
Дата17.04.2013
Размер86.09 Kb.
ТипДокументы
ПРИМЕНЕНИЕ МОДЕЛЬНО-ОРИЕНТИРОВАННЫХ СЕМАНТИЧЕСКИХ СЕТЕЙ В ЗАДАЧАХ ПРОЕКТИРОВАНИЯ ГЕТЕРОГЕННЫХ ИНФОРМАЦИОННЫХ СИСТЕМ

Верлань А.Ф., Олецкий А.В.
Рассматриваются вопросы, связанные с построением графа информационного посредничества, который может лечь в основу проектирования распределенных веб-ориентированных информационных систем. Обсуждаются вопросы, связанные с применением XML и с возможным применением описываемой методики в системах управления контентом.
Характерной особенностью современных веб-ориентированных информационных систем является отход от традиционной трёхуровневой клиент-серверной архитектуры и переход к архитектуре распределённых объектов. Во многом это связано с принципиальной гетерогенностью источников данных, которые могут представлять собой как традиционные реляционные базы данных, так и текстовые данные; документы, написанные на естественных языках; XML-документы, построенные на основе различных словарей и схем [1]; внешние веб-сервисы [2] и т.п. Разнородными часто оказываются и средства промежуточного уровня, предназначенные для обработки данных. Для написания отдельных модулей часто применяются разные языки программирования; могут использоваться различные архитектуры распредёленных приложений [3,4] и т.п. Всё это порождает очевидные проблемы, связанные с совместимостью, повторным использованием и интегрируемостью отдельных модулей, а также с надёжностью и наращиваемостью таких систем в целом.

Важным является и то, что веб-программирование становится всё более контентно-ориентированным, то есть декларативным и управляемым данными. Основной акцент должен делаться не на процедурах обработки, а на описании самих данных и на средствах решения основной задачи веб-ориентированных информационных систем: извлечь информацию, необходимую конкретному клиенту, и представить её в виде, подходящем для этого клиента. В связи с этим следует отметить необходимость интеллектуализации процедур обработки данных, и, соответственно, их тяготение к декларативному программированию.

Актуальной проблемой является развитие интеллектуализированных систем управления контентом, предназначенных для автоматизированного создания сложных веб-ориентированных систем и их дальнейшей поддержки.

В построении распределённых информационных систем доминируют эвристические подходы. Появление новых инструментальных средств существенно опережает развитие строгой систематизированной теории, которая могла бы лечь в основу эффективного использования этих средств. Не вызывает сомнений, что в основе такой теории должен лежать объектно-ориентированный онтологический анализ, с одной стороны – предметной области, а с другой – обработчиков информации. Такой анализ должен учитывать как свойства отдельных информационных единиц, так и связи между ними.


При этом, кроме традиционных иерархий, непосредственно описывающих онтологию предметной области и связанных с наследованием и агрегацией, необходимо рассматривать связи между потребителями и источниками информации, в частности – между информацией, доступной системе, и данными, передаваемыми клиенту. Структуру этих связей естественно представить как ориентированный граф, связывающий поставщиков и потребителей информации. Такой граф можно назвать графом информационного посредничества. в рассмотрение вовлекаются связи типа «издатель-подписчик» и «модель-вид-контроллер»; при этом могут быть применены соответствующие шаблоны проектирования [4, 5]. Граф информационного посредничества может быть перестраиваемым; это позволяет разделить возможность передачи информации и её фактическую передачу. Важным при этом представляется и применение подходов, основанных на методах децентрализованного управления в системах распределённого искусственного интеллекта, в частности, подходов, характерных для агентно-ориентированного программирования [6-8].

Граф информационного посредничества естественно рассматривать как некоторую разновидность фреймово-семантических сетей [6]. При этом узлы выступают как формы представления тех или иных информационных единиц, а дуги соответствуют двум основным типам процедур:

  • процедурам, позволяющим искать необходимую информацию в соответствии с запросом клиента;

  • процедурам, позволяющим переходить от одной формы представления информации к другой.

Такая сеть во многом подобна функциональной сети, рассмотренной в [9], где описывалось её применение для выбора методов и алгоритмов решения определённого класса математических задач (интегральных уравнений Фредгольма первого рода). Важно отметить, что многие формализмы, характерные для информационных потоков, возникающих в этих задачах, могут быть по аналогии применены и для анализа аналогичных потоков в гетерогенных веб-ориентированных системах.

Рассматриваются два основных типа моделей: информационные модели, описывающие базовую информацию, и структурные (порождающие) модели, описывающие различные формы представления этой информации. Подобно подходу, рассмотренному в [9], процесс формирования конкретной информационной единицы I можно представить в виде I=R(M,S), где M – базовая информация; Sдекларативно описанная структурная модель, определяющая ее представление. При этом сами описания представлений также рассматриваются как равноправные информационные единицы, и к ним может быть применён аналогичный подход.

В качестве основных классов, позволяющих работать с подобным модельно-ориентированным графом информационного посредничества, рассматриваются следующие:

  • информационные узлы («модели»), информация в которых содержится в наиболее абстрактном и независимом от представления виде;

  • классы, позволяющие в соответствии с запросом пользователя извлечь необходимую информацию;

  • классы, порождающие на основе заданной информации и соответствующей структурной модели конкретную форму её представления («вид»); в сочетании с классами предыдущего типа такие классы выступают в роли «клиентов» или «подписчиков» информации; таким образом, с одной фиксированной «моделью» может ассоциироваться целое семейство «видов».

  • классы-преобразователи, позволяющие переходить от одной формы представления к другой;

  • классы-контроллеры, позволяющие корректировать информацию, содержащуюся в информационной системе; при этом изменение «модели» автоматически передаётся всем «видам», что обеспечивает необходимый уровень автоматической актуализации данных в информационной системе (например, изменение одной страницы веб-сайта приводит к автоматическому изменению всех связанных с ней страниц);

  • дополнительные сервисные классы, позволяющие сравнивать между собой формы представления данных и выбирать из них наиболее подходящие (поскольку выбрать наиболее подходящую форму заранее часто не представляется возможным); минимизировать цепочки информационной подписки; обеспечивать необходимый уровень защиты информации, идентификации и аутентификации пользователей и т.п.

Иерархия связей между поставщиками и потребителями информации может оказаться многоуровневой, поскольку «вид», полученный на некотором промежуточном уровне, сам становится «моделью» для потребителей информации, находящихся на следующем уровне. Например, в типичной системе управления контентом контент как выборка из информационной базы, с одной стороны, выступает как «вид» для данных о предметной области, хранящихся в системе, а с другой – как «модель» для визуального представления, отображаемого браузером; в рассмотрение вовлекаются шаблоны, задающие структуру страниц, навигацию по сайту и т.п.

Могут быть рассмотрены различные типы взаимодействия между потребителями и поставщиками информации, в частности, следующие:

  • простая подписка;

  • коммутируемая подписка;

  • «классная доска»;

  • информационный брокераж и т.п.

Таким образом, обработка клиентского запроса естественным образом распадается на два основных этапа:

  • извлечение базовой информации, релевантной запросу;

  • последовательность трансформаций, необходимых для представления информации в нужном виде; этой последовательности можно поставить в соответствие некоторый путь на графе информационного посредничества.

Представляется наиболее целесообразным хранить базовую информацию на основе сочетания XML-файлов и реляционных баз данных. XML-файлы отображают общую структуру информационной системы и описывают подключаемые источники данных; при этом используется модель на основе графа полуструктурированных данных [10]. Этот каркас информационной системы представляет собой её стабильную и редко изменяемую основу. Он должен быть непосредственно связан с онтологией предметной области; более чётко – в системе должны быть предусмотрены формализмы, позволяющие отображать онтологию предметной области на структуру базового XML-представления. В частности, на этом уровне рассматриваются классы предметной области и связи между ними, а также базовые знания о классах-обработчиках и о структурных моделях. Может быть поставлена задача автоматизированной генерации подобных описаний. С другой стороны, кортежи реляционных баз данных должны содержать конкретные информационные единицы (экземпляры классов), которые часто удаляются, пополняются, модифицируются и т.п., и для работы с ними можно использовать стандартные технологии запросов к базам данных. При этом систему можно спроектировать так, чтобы обеспечить лёгкий переход от одной формы представления к другой (в случае высокого уровня структурированности данных можно установить соответствие между элементами XML-файла и кортежами реляционной базы данных).

Такой подход позволяет устранить, с одной стороны, недостатки, присущие чисто реляционному хранению данных, а с другой - значительное дублирование, присущее хранению информации в XML-файлах из-за многократного повторения имён элементов. Более того, в такой системе легко предусмотреть возможность использования собственных форматов данных, которые могут оказаться ещё более экономичными. В частности, могут быть использованы различные алгоритмы сжатия данных: фракталы и вейвлет-анализ, метод главных компонент и интегральное преобразование Карунена-Лоэва [11, 12]. Внешнее же приложение, запрашивающее информацию, получит требуемые данные в стандартном виде.

Естественно, могут быть легко подключены источники данных и промежуточные представления любых других типов (текстовые файлы, мультимедиа, внешние веб-ресурсы и т.п.). Здесь XML-разметка также может выступать как важное средство для описания семантически значимых данных; в частности, на её основе может решаться задача актуализации информационных ресурсов.

Дальнейшая разработка формализмов для описания веб-ориентированных информационных систем позволит решить ряд вопросов, связанных с автоматизацией их проектирования, разработки и поддержки. Это может оказаться полезным, в частности, при создании систем управления контентом в сложных гетерогенных средах.

ЛИТЕРАТУРА


  1. Холзнер С. XML. Энциклопедия. – СПб: Питер, 2004. – 1101 с.

  2. Ньюкомер Э. Веб-сервисы. Для профессионалов. - СПб: Питер, 2003. – 256 с.

  3. Цимбал А., Аншина М. Технологии создания распределённых систем. Для профессионалов. - СПб: Питер, 2003. – 576 с.

  4. Фаулер М. Архитектура корпоративных программных приложений. – М.:Изд. дом «Вильямс», 2004. – 544 с.

  5. Гамма Э., Хелм Р., Джонсон Р., Влиссидес Дж. Приемы объектно-ориентированного проектирования. Паттерны проектирования. –СПб:Питер, 2003. – 368 с.

  6. Люгер Дж.Ф. Искусственный интеллект: стратегии и методы решения сложных проблем. - М.:Изд. дом «Вильямс», 2003. – 864 с.

  7. Гаврилова Т.А., Хорошевский В.Ф. Базы знаний интеллектуальных систем. – СПб:Питер, 2000. – 384 с.

  8. Тарасов В.Б. От многоагентных систем к интеллектуальным организациям. – М.:Эдиториал УРСС, 2002. – 352 с.

  9. Верлань А.Ф., Горошко И.О., Олецкий А.В. Объектно-ориентированная архитектура интеллектуального решателя задач обработки и интерпретации экспериментальных зависимостей. //Моделювання та інформаційні технології. Збірник наукових праць. Вип.1. - Львів, Світ, 1999. - С.11-18.

  10. Гарсиа-Молина Г., Ульман Дж., Уидом Дж. Системы баз данных. Полный курс. - М.:Изд. дом «Вильямс», 2003. – 1088 с.

  11. Уэлстид С. Фракталы и вейвлеты для сжатия изображений в действии. – М.:Триумф, 2003. – 302 с.

  12. Олецкий А.В. О применении интегрального разложения Карунена - Лоэва при моделировании динамических систем. // УСиМ, 1999, №2. - С.12-15.

Похожие:

Применение модельно-ориентированных семантических сетей в задачах проектирования гетерогенных информационных систем iconАннотация программы учебной дисциплины
Субд, технологиями проектирования и разработки информационных систем. В задачи изучения дисциплины входит изучение методов проектирования...
Применение модельно-ориентированных семантических сетей в задачах проектирования гетерогенных информационных систем iconТема №6 Математические и методологические аспекты автоматизированного проектирования информационных систем. Лекция: Методологии моделирования предметной области
Математические и методологические аспекты автоматизированного проектирования информационных систем
Применение модельно-ориентированных семантических сетей в задачах проектирования гетерогенных информационных систем iconВолков Денис Владимирович “РосБизнесКонсалтинг”, Москва
Опыт применения xml в интеграции гетерогенных информационных систем и ресурсов рбк
Применение модельно-ориентированных семантических сетей в задачах проектирования гетерогенных информационных систем iconПрограмма дисциплины "проектирование информационных систем" Рекомендуется Министерством образования РФ для направления подготовки
Основной задачей преподавания данной дисциплины является системное представление основных этапов проектирования информационных систем,...
Применение модельно-ориентированных семантических сетей в задачах проектирования гетерогенных информационных систем iconО некоторых семантических дефектах в логике интеллектуальных систем
А. А. Зенкин, о некоторых семантических дефектах в логике интеллектуальных систем. – Девятая национальная конференция по искусственному...
Применение модельно-ориентированных семантических сетей в задачах проектирования гетерогенных информационных систем iconОтчет по учебно-производственной практике по теме: Применение информационных систем и технологий на предприятии ООО «Системы промышленной автоматизации (спа)»
Применение информационных систем и технологий на предприятии ООО «Системы промышленной автоматизации (спа)»
Применение модельно-ориентированных семантических сетей в задачах проектирования гетерогенных информационных систем iconМагистранты: Боярский Станислав Андреевич (рук. Марчук А. Г.) Особенности построения фактографических семантических сетей Кожевников Александр Константинович (рук. Марчук А. Г.) Извлечение фактов из плоского текста Специалисты
Боярский Станислав Андреевич (рук. Марчук А. Г.) Особенности построения фактографических семантических сетей
Применение модельно-ориентированных семантических сетей в задачах проектирования гетерогенных информационных систем iconМодельно – сервисный центр проектирования и
Рс – модель ррв, тррв, рвгп (как вариант – три рс, работающих в lan как кластер)
Применение модельно-ориентированных семантических сетей в задачах проектирования гетерогенных информационных систем iconПрограмма дисциплины "представление знаний в информационных системах" Рекомендуется Министерством образования РФ для направления подготовки
Целью дисциплины “Представление знаний в информационных системах” является изучение теоретических основ представления и обработки...
Применение модельно-ориентированных семантических сетей в задачах проектирования гетерогенных информационных систем iconИнструментальные средства проектирования интеллектуальных систем
Программные средства инженерии знаний и реализации интеллектуальных информационных систем (иис) можно разделить на следующие группы:...
Разместите кнопку на своём сайте:
ru.convdocs.org


База данных защищена авторским правом ©ru.convdocs.org 2016
обратиться к администрации
ru.convdocs.org