Кластерный анализ Метод ближней связи



Скачать 22.95 Kb.
Дата04.07.2013
Размер22.95 Kb.
ТипДокументы

Кластерный анализ 1. Метод ближней связи


1. Подготовка тестовых данных.

Подготовьте несколько примеров данных для последующих упражнений. А именно:

1) Набор точек, формирующих два кластера (рис. 1а). Например, это могут быть выборки из двух нормальных распределений с разными средними значениями.



(а) (б)

Рис. 1.

2) Точки, разбросанные вдоль окружности (см. рис. 1б).

3) Придумайте сами.

Результатом должна стать матрица X размером , ставящая в соответствие каждому из N объектов (точек на плоскости в данных примерах) его параметры (координаты в данном случае).

2. Функции, вычисляющие меры расстояния.

Создайте функции, вычисляющие различные меры расстояния (евклидово, манхэттенское, супремум-норму она же расстояние Чебышева). Параметрами должны быть номера объектов и матрица X.

3. Вычисление матрицы расстояний.

Создайте процедуру, вычисляющую матрицу расстояний.

4. Сортировка элементов матрицы расстояний, построение зависимости расстояния от номера в отсортированном массиве. Возможность задания порогового расстояния.

5. Переход от матрицы расстояний к матрице смежности.

6. Выделение кластеров (односвязных элементов на графе) по матрице смежности.

Вариант алгоритма:

Для хранения информации о принадлежности точек к кластеру используется одномерный целочисленный массив с числом элементов равным числу точек. Значение i-го элемента массива это номер кластера, к которому принадлежит i-я точка. Для нахождения этого массива делаем следующее:

1) Предполагаем, что каждая точка принадлежит своему собственному кластеру, то есть заполняем массив числами 1, 2, 3, …, N ().

2) Перебираем элементы верхней половины матрицы смежности. Если встречается 1 (пусть это будет элемент с индексами i и j), то это значит, что i-ю и j-ю точки надо отнести к одному кластеру. То есть, если , то кластеры и надо объединить. Для этого смотрим, какой из номеров кластеров больше (например, gif" name="object7" align=absmiddle width=51 height=21>), и меняем номер в массиве C всем точкам, относящимся к этому кластеру. То есть для всех k, таких что , выполняем .

После выполнения описанной операции в нумерации кластеров образуется пропуск (не будет кластера с номером ). Для удобства дальнейшей работы с кластерами этот пропуск лучше устранить. Для этого номера всех кластеров больших следует уменьшить на 1.

Конец алгоритма.

Для удобства дальнейшей работы удобно хранить общее количество кластеров в одной переменной. Для его вычисления на первом шаге делаем это количество равным числу точек. Каждый раз, объединяя кластеры, уменьшайте это количество на 1.

7. Вывод результатов.

Для тестовых примеров следует вывести точки в Chart, покрасив их в соответствии с принадлежностью к кластеру. Можно предусмотреть 5-6 цветов для наиболее крупных кластеров, а остальные покрасить серым цветом.

После выполнения алгоритма каждый кластер имеет уникальный номер. Для правильной раскраски следует подсчитать, сколько элементов попадает в каждый кластер, а затем перенумеровать кластеры так, чтобы нумерация соответствовала убыванию числа точек.




Похожие:

Кластерный анализ Метод ближней связи iconЛекция №23 кластерный анализ
Синонимами термина "кластерный анализ" являются "автоматическая классификация объектов без учителя" и "таксономия"
Кластерный анализ Метод ближней связи iconКластерный анализ в задачах социально-экономического прогнозирования 1 Введение в кластерный анализ
Охватывает функции расстояний 1, 2, 3
Кластерный анализ Метод ближней связи iconКонспект лекции 4 (часть 2) концевая н. В. 2007 Тема Многомерный статистический анализ Вопросы Многомерный статистический анализ
Многомерный статистический анализ. Задачи классификации объектов: кластерный анализ. Дискриминантный анализ
Кластерный анализ Метод ближней связи iconКластерный анализ диспропорций инновационно
Выявление этих групп позволит провести более тщательный анализ аспектов привлечения, освоения и учета инвестиций и инноваций
Кластерный анализ Метод ближней связи iconКластерный анализ диспропорций инновационно
Выявление этих групп позволит провести более тщательный анализ аспектов привлечения, освоения и учета инвестиций и инноваций
Кластерный анализ Метод ближней связи iconАнализ понятие о кластерном анализе. Кластерный анализ один из новейших математико-статистических методов, получивших распространение благод
...
Кластерный анализ Метод ближней связи iconПрограмма spss реализует три метода кластерного анализа: 2 -этапный (Two-Step)
Задание Выполните кластерный анализ для переменных и сравните результаты с факторным анализом 7
Кластерный анализ Метод ближней связи iconЮ., Волкова Г. В. Всероссийский нии биологической защиты растений
По двум последним признакам проведен кластерный анализ, который выявил, что изоляты гриба из восточной степной и северной зон обособлены...
Кластерный анализ Метод ближней связи iconКластерный анализ в экономических исследованиях: направления и опыт использования
В статье рассмотрены подходы к определению термина «кластер», выделены наиболее часто используемые методы и направления кластерного...
Кластерный анализ Метод ближней связи iconХроматографический анализ
Метод важнее открытия, ибо правильный метод исследования приведет к новым, еще более ценным открытиям
Разместите кнопку на своём сайте:
ru.convdocs.org


База данных защищена авторским правом ©ru.convdocs.org 2016
обратиться к администрации
ru.convdocs.org