Программа дисциплины Теория решеток и ее использование при анализе текстов



Скачать 67.13 Kb.
Дата08.11.2012
Размер67.13 Kb.
ТипПрограмма дисциплины
Правительство Российской Федерации

 

Государственное образовательное бюджетное учреждение
высшего профессионального образования


   Государственный университет –

Высшая школа экономики

 

Факультет БИЗНЕС-ИНФОРМАТИКИ

 

 

Программа дисциплины

 

Теория решеток и ее использование при анализе текстов

 

для направления 040200.62 «Социология» подготовки бакалавров

 

 

Объедков Сергей Александрович (sergei.obj@gmail.com)

 

 

Рекомендована секцией УМС

«Прикладная математика

и информатика»

 

Председатель

__________________ Кузнецов С.О.

«_____» __________________ 200___ г.

Одобрена на заседании кафедры

Анализа данных

и искусственного интеллекта

 

Зав. кафедрой

__________________ Кузнецов С.О.

«_____» __________________ 200___ г.


 

Утверждена УС факультета

бизнес-информатики

 

Ученый секретарь

__________________ Фомичев В.А.

« ____» ___________________200___ г.

 

 

 

 

Москва

 

 

 

 

 

 

Пользуётесь готовыми стилями:
Normal – для основного текста
Heading – для заголовков
Tables – для таблиц (без отступа)

  1. Пояснительная записка

Автор программы


к.т.н. Сергей Александрович Объедков

Требования к студентам


Изучение курса «Теория решеток и ее использование при анализе текстов» требует предварительных знаний по элементарной теории множеств, пропозициональной логике, теории вероятности.

Аннотация


Анализ формальных понятий (АФП) — область математической теории решеток с приложениями в естественных и гуманитарных науках. В АФП реализована попытка математического определения иерархии понятий и предложены методы построения такой иерархии по различным данным, а также методы выявления зависимостей в данных. Приложения решеток понятий (решеток Галуа) в области социологии появились еще в начале 90-х годов. Исследования в этом направлении проводились, в частности, во Франции (В. Дюкенн, CNRS и Maison des Sciences de l’Homme) и в США (Л. Фриман и Д. Уайт, UCI).



Решетки формальных понятий позволяют получить иерархическую абстракцию данных, облегчая тем самым извлечение информации, классификацию, визуализацию и анализ данных. Решетка понятий строится обычно на основе множества объектов некоторой предметной области, описанных при помощи определенного набора признаков. Элемент решетки понятий — понятие — характеризуется объемом, т.е. множеством объектов, подпадающих под данное понятие, и содержанием, т.е. набором признаков, необходимых для того, чтобы иметь возможность отнести объект к понятию. Понятия могут могут быть более или менее общими (охватывающими большее или меньшее количество объектов), и решетка отражает этот порядок на понятиях.


В курсе дается введение в АФП и обсуждаются возможности его применения в социологических исследованиях.

Учебные задачи курса


В результате изучения дисциплины студенты должны получить представление о математическом аппарате и программных средствах прикладной теории решеток и анализа формальных понятий, а также возможностях их использования в социологических исследованиях, в том числе, в задачах, связанных с анализом текстовой информации.

 

  1. Тематический план курса «Теория решеток и ее использование при анализе текстов»








Название темы

Всего часов по дисциплине

Аудиторные часы

Аудиторные часы Самосто-ятельная работа

Лекции

Сем. и практика занятия

1

Контексты, понятия и решетки понятий

30

4

4

22

2

Решетки понятий в анализе социальных сетей

18

2

2

14

3

Импликации и зависимости

30

4

4

22

4

Решетки понятий в анализе текстовых данных

30

4

4

22

 

Итого

108

14

14

80

 

  1. Источники информации

Базовый учебник


Ganter, B. and Wille, R., Formal Concept Analysis: Mathematical Foundations, Springer, 1999.


Список литературы

Основная литература


  1. Freeman, L., Cliques, Galois lattices, and the structure of human social groups, Social Networks 18, 173-187 (1996).

  2. Roth, C., Obiedkov, S., and Kourie, D., Towards Concise Representation for Taxonomies of Epistemic Communities, CLA, Lecture Notes in Computer Science, vol. 4923, Springer, 2006, pp. 240-255.

Дополнительная литература


  1. Doyen, A.L., Duquenne, V., Nuques, S., Carlier, M., What can be learned from a Lattice Analysis of a Laterality Questionaire, Behavior Genetics,Vol. 30, No 2, March 2001.

  2. Duquenne, V. and Mohr, J.W., The Duality of Culture and Practice: Poverty Relief in New York City, 1888-1917, Theory and Society, Vol. 26, No 2/3, Special Double Issue on New Directions in Formalization and Historical Analysis, Apr.-Jun., 1997, pp. 305-356.

  3. Duquenne, V., Mohr, J., and Le Pape, A., Comparison of dual orderings in time, Social Science Information 37 (1997), pp. 227-253.

  4. Jurafsky, D. and Martin, J.H., Speech and Language Processing, Prentice Hall, 2008.

  5. Schweizer, T., The Dual Order of Actors and Possessions/ Current Antropology, Vol. 34, No. 4 (Aug.-Oct., 1993), pp.469-483.

 

  1. Формы  контроля и структура итоговой оценки

Итоговый контроль – зачет (120 мин.)

 

Итоговая оценка складывается из следующих элементов:

-              работа на семинарах – 10%;

-              письменный зачет – 90%.

Таблица соответствия оценок по десятибалльной и системе зачет/незачет


Оценка по 10-балльной шкале

Оценка по 5-балльной шкале

1

незачет

2

3

4

зачет

5

6

7

8

9

10

 

Таблица соответствия оценок по десятибалльной и пятибалльной системе


По десятибалльной шкале

По пятибалльной системе

1 – неудовлетворительно

2 – очень плохо

3 – плохо

неудовлетворительно – 2

4 – удовлетворительно

5 – весьма удовлетворительно

удовлетворительно – 3

6 – хорошо

7 – очень хорошо

хорошо – 4

8 – почти отлично

9 – отлично

10 - блестяще

отлично - 5

 

  1. Программа курса «Теория решеток и ее использование при анализе текстов»

Тема 1. Контексты, понятия и решетки понятий.


Введение в анализ формальных понятий. Обзор основных приложений. Формальный контекст. Оператор Галуа. Формальное понятие. Алгоритм построения решетки понятий контекста. Многозначный контекст, шкалирование. Вложенные диаграммы. Программное средство Concept Explorer.

Основная литература


  1. Ganter, B. and Wille, R., Formal Concept Analysis: Mathematical Foundations, Springer, 1999 (Глава 1).

Дополнительная литература


  1. Doyen, A.L., Duquenne, V., Nuques, S., Carlier, M., What can be learned from a Lattice Analysis of a Laterality Questionaire, Behavior Genetics,Vol. 30, No 2, March 2001.

  2. Schweizer, T., The Dual Order of Actors and Possessions/ Current Antropology, Vol. 34, No. 4 (Aug.-Oct., 1993), pp.469-483.


Тема 2. Решетки понятий в анализе социальных сетей.

Обзор задач анализа социальных сетей: обнаружение сообществ, выявление лидеров и переферийных членов сообществ; подходы к решению этих задач, основанные на решетках формальных понятий.

Основная литература


  1. Freeman, L., Cliques, Galois lattices, and the structure of human social groups, Social Networks 18, 173-187 (1996).

Дополнительная литература


  1. Duquenne, V. and Mohr, J.W., The Duality of Culture and Practice: Poverty Relief in New York City, 1888-1917, Theory and Society, Vol. 26, No 2/3, Special Double Issue on New Directions in Formalization and Historical Analysis, Apr.-Jun., 1997, pp. 305-356.

 

Тема 3. Импликации и зависимости.


Импликации между признаками в формальном контексте. Базис импликаций Дюкенна-Гига, алгоритм его построения. Функциональные зависимости, их связь с импликациями. Частичные импликации и ассоциативные правила. Полуавтоматическое приобретение знаний при помощи метода "исследования признаков": построение репрезентативных формальных контекстов для предметных областей. 

Основная литература


  1. Ganter, B. and Wille, R., Formal Concept Analysis: Mathematical Foundations, Springer, 1999 (Глава 2).

Дополнительная литература


  1. Duquenne, V., Mohr, J., and Le Pape, A., Comparison of dual orderings in time, Social Science Information 37 (1997), pp. 227-253.


Тема 4. Решетки понятий в анализе текстовых данных.

Предварительная лингвистическая обработка данных: выделение ключевых слов, формирование признаков, построение контекста. Способы отсева нерелевантных понятий в больших решетках: индексы устойчивости и отделимости понятия, вероятность понятия. Примеры решеточного анализа текстовых данных.

Основная литература


  1. Roth, C., Obiedkov, S., and Kourie, D., Towards Concise Representation for Taxonomies of Epistemic Communities, CLA, Lecture Notes in Computer Science, vol. 4923, Springer, 2006, pp. 240-255.

Дополнительная литература


  1. Jurafsky, D. and Martin, J.H., Speech and Language Processing, Prentice Hall, 2008 (Глава 22). 

 

Автор программы: _____________________________/ Объедков С.А. /

6

 

Похожие:

Программа дисциплины Теория решеток и ее использование при анализе текстов iconРабочая Программа учебной дисциплины (модуля) сдм. 04. Теория и практика перевода текстов разных стилей и жанров

Программа дисциплины Теория решеток и ее использование при анализе текстов iconУчебная программа Дисциплины р4 «Теория электрических цепей»
Знания, полученные при изучении дисциплины «Теория электрических цепей», необходимы для изучения дисциплин: «Теория электрической...
Программа дисциплины Теория решеток и ее использование при анализе текстов iconРабочая программа дисциплины Математическая логика и теория алгоритмов Направление подготовки 230700 Прикладная информатика
Целями освоения дисциплины «Математическая логика и теория алгоритмов» являются получение теоретических знаний по основам математическая...
Программа дисциплины Теория решеток и ее использование при анализе текстов iconПрограмма дисциплины История мировой культуры для направления 030200. 62 «Политология» подготовки бакалавра
В ходе семинарских занятиях акцент делается на анализе избранных, репрезентативных культурных феноменов сквозь призму различных философско-культурологических...
Программа дисциплины Теория решеток и ее использование при анализе текстов iconЦели и задачи дисциплины
В основе методов лежит теория языков и формальных грамматик, а также теория автоматов. Программные системы, предназначенные для анализа...
Программа дисциплины Теория решеток и ее использование при анализе текстов iconУчебной дисциплины «Теория графов» для направления 010100. 62 «Математика»
Пк-19); владение методами математического и алгоритмического моделирования при анализе теоретических проблем и задач (пк-21); владение...
Программа дисциплины Теория решеток и ее использование при анализе текстов iconПрограмма дисциплины «Теория узлов»
Рабочая программа дисциплины «Теория узлов» [Текст]/Сост. Ландо С. К.; Гу-вшэ.–Москва.–2008.–5 с
Программа дисциплины Теория решеток и ее использование при анализе текстов iconУчебная программа Дисциплины р10 «Основы теории колебаний»
Такое единство позволяет существенно глубже разобраться в сути явлений в каждой конкретной ситуации и, кроме того, воспользоваться...
Программа дисциплины Теория решеток и ее использование при анализе текстов iconПрограмма дисциплины дпп. 04 Математическая логика и теория алгоритмов
Цель дисциплины: ознакомление студентов с основными приемами символической логики, используемыми при исследовании структуры математических...
Программа дисциплины Теория решеток и ее использование при анализе текстов iconПрограмма дисциплины «Теория и история менеджмента»
Программа дисциплины «Теория и история менеджмента» для направления 080200. 62 «Менеджмент» подготовки бакалавра
Разместите кнопку на своём сайте:
ru.convdocs.org


База данных защищена авторским правом ©ru.convdocs.org 2016
обратиться к администрации
ru.convdocs.org