Учебное пособие для студентов всех специальностей Москва 2003 ббк 22. 17я7 удк 519. 22 (075. 8) 6Н1 к 60



страница6/10
Дата08.10.2012
Размер0.71 Mb.
ТипУчебное пособие
1   2   3   4   5   6   7   8   9   10

ГЛАВА 3.Методы классификации
многомерных наблюдений


Рассматриваются кластерный и дискриминантный анализ. Кластерный анализ решает задачу классификации объектов при практически отсутствующей априорной информации о наблюдениях внутри классов; в дискриминантном анализе предполагается наличие такой информации.
Практика показывает, что классификация объектов исследования, проведенная по факторам или главным компонентам, полученным в результате снижения размерности исходного пространства признаков, оказывается более объективной, чем классификация тех же объектов по исходным признакам.

§ 3.1.Кластерный анализ


Методы кластерного анализа позволяют разбить изучаемую совокупность объектов на группы однородных в некотором смысле объектов, называемых кластерами или классами. Наибольшее распространение получили два подхода к задаче классификации: эвристический, реализующий некоторую схему разделения объектов на классы, исходя из интуитивных соображений, и экстремальный, реализующий схему разделения на основе заданного критерия оптимальности. Наиболее трудным в задаче классификации является определение меры однородности объектов.

3.1.1Меры однородности объектов


Пусть каждый из исходных объектов с номерами задается как точка , , в мерном пространстве признаков . Совокупность этих точек можно трактовать как выборку объема из многомерной генеральной совокупности .

Замечание. Результаты классификации зависят от выбора масштаба и единиц изменения признаков. Чтобы исправить такое положение, прибегают к стандартной нормировке признаков Однако эта операция, уравнивая разделительные возможности всех признаков, может привести и к нежелательным последствиям.

В случае зависимых признаков и их различной значимости при классификации объектов за меру однородности объектов принимают расстояние Махалонобиса

gif" name="object222" align=absmiddle width=71 height=21> (20)

где симметричная (чаще всего диагональная) неотрицательно-определенная матрица «весовых» коэффициентов признаков, ковариационная матрица генеральной совокупности, из которой извлекаются объекты. Частными случаями (20) являются:

евклидово расстояние, использование которого оправдано, если генеральная совокупность имеет нормальный закон с , а признаки однородны по своему физическому смыслу и одинаково «весомы» с точки зрения решения вопроса об отиесении объекта к тому или иному кластеру;

взвешенное евклидово расстояние;

хеммингово расстояние , используемое при дихотомических признаках; число несовпадений значений соответствующих признаков на м и м объектах.

Для оценки однородности объектов в пространстве разнотипных признаков (число дихотомических признаков, к которым могут быть сведены и ранговые и номинальные признаки, а число количественных признаков), обычно используют не расстояние между объектами, а меру их сходства. Сходство го и го объектов, например, можно рассчитать так: , где (число дихотомических признаков, значение которых совпадают объектов и ), (расстояние Махалонобиса в пространстве количественных признаков, среднее значение расстояния по всем парам объектов).

К мерам однородности (расстоянию и сходству ) предъявляются следующие требования: симметрии ; максимального сходства объекта с самим собой ; монотонного убывания по (из следует, что ).
Замечание 1. В некоторых задачах классификации объектов мера однородности объектов содержательно интерпретируема. Например, при классификации отраслей экономии используется матрица межотраслевого баланса, где годовые поставки в денежном выражении й отрасли в ю; здесь можно принять

Замечание 2. Методы кластер-анализа могут использоваться и для классификации признаков. В качестве мер однородности признаков обычно используются характеристики степени их коррелированности (коэффициенты корреляции; коэффициенты, основанные на критерии и т. д.). Задача классификации признаков может иметь как самостоятельный интерес (помимо кластер-анализа эта задача может решаться методами факторного и компонентного анализа), так предшествовать задаче классификации объектов в пространстве большого числа признаков: располагая кластерами — группами однородных признаков, можно в каждой группе выделить по одному представителю-признаку и классификацию объектов провести в пространстве представителей. При большом числе исходных признаков классификацию объектов можно провести и в пространстве главных компонент и в пространстве общих факторов.

Программа «Cluster Analysis» ППП «STATISTICA» в качестве исходной информации использует либо матрицу расстояний, либо необработанные данные (Raw data) — матрицу и в этом случае предусмотрены следующие варианты метрики расстояний: евклидово расстояние; квадратичное евклидово; манхетеннское («расстояние городских кварталов») ; расстояние Чебышева ; обобщенное расстояние Колмогорова (Power distance) , которое в качестве частных случаев включает в себя все рассмотренные выше виды расстояний.
1   2   3   4   5   6   7   8   9   10

Похожие:

Учебное пособие для студентов всех специальностей Москва 2003 ббк 22. 17я7 удк 519. 22 (075. 8) 6Н1 к 60 iconКонспект лекций москва 2004 удк 519. 713(075)+519. 76(075) ббк 22. 18я7 С32
Учебное пособие предназначено для студентов факультета Кибернетики, изучающих на пятом семестре математическую лингвистику и основы...
Учебное пособие для студентов всех специальностей Москва 2003 ббк 22. 17я7 удк 519. 22 (075. 8) 6Н1 к 60 iconУчебное пособие для студентов всех специальностей Саратов 2009 удк 519. 17 Ббк 22. 174 С 32 Рецензенты
С32 Ведение в теорию графов: учеб пособие. Саратов: Сарат гос техн ун-т, 2009. 36с
Учебное пособие для студентов всех специальностей Москва 2003 ббк 22. 17я7 удк 519. 22 (075. 8) 6Н1 к 60 iconУчебное пособие Москва 2002 ббк 63. 3 /2/ я 73 Рецензент: Иванова А. А
Учебное пособие предназначено для студентов I курса всех направлений и всех специальностей дневной формы обучения
Учебное пособие для студентов всех специальностей Москва 2003 ббк 22. 17я7 удк 519. 22 (075. 8) 6Н1 к 60 iconУчебное пособие Москва, 2009 удк 811. 111 Ббк 81. 2Англ к 893 к 893
Учебное пособие предназначено для студентов продвинутого этапа обучения гуманитарных специальностей. Пособие базируется на оригинальном...
Учебное пособие для студентов всех специальностей Москва 2003 ббк 22. 17я7 удк 519. 22 (075. 8) 6Н1 к 60 iconУчебное пособие для студентов гумманитарных специальностей Павлодар удк 811. 124 (075. 8) Ббк 81. 2 Латиня 75 И87
Г. Х демисинова кандидат филологических наук, доцент, зав кафедрой теории и практики перевода пгу
Учебное пособие для студентов всех специальностей Москва 2003 ббк 22. 17я7 удк 519. 22 (075. 8) 6Н1 к 60 iconУчебное пособие Москва 2006 удк 341. 645: 347. 922(075) ббк 67. 412. 2 О 23

Учебное пособие для студентов всех специальностей Москва 2003 ббк 22. 17я7 удк 519. 22 (075. 8) 6Н1 к 60 iconУчебное пособие для студентов всех специальностей Саратов 2011 удк 510. 6 Ббк 22. 12 С 32 Рецензенты
С 32 Элементарный курс математической логики. Логические функции: учеб пособие. Саратов: Сарат гос техн ун-т, 2011. 32 с
Учебное пособие для студентов всех специальностей Москва 2003 ббк 22. 17я7 удк 519. 22 (075. 8) 6Н1 к 60 iconУчебное пособие Оренбург, 2007 удк 811. 131. 1(075) ббк 81. 2Фр-923 а 23 Рецензенты
Данное учебное пособие предназначено для студентов, занимающихся изучением древних языков и античной культуры и имеет целью помочь...
Учебное пособие для студентов всех специальностей Москва 2003 ббк 22. 17я7 удк 519. 22 (075. 8) 6Н1 к 60 iconУчебное пособие для самостоятельной работы обучающихся Сызрань 2007 Составители: П. П. Гавриш, Ю. А. Мелешкин удк 621. 375 Ббк 32. 85
Учебное пособие предназначено для обучающихся всех специальностей, изучающих теорию электрических цепей
Учебное пособие для студентов всех специальностей Москва 2003 ббк 22. 17я7 удк 519. 22 (075. 8) 6Н1 к 60 iconУчебное пособие для студентов всех специальностей ч луганск 2003 удк 01 Рябова С. В. Основы информационного поиска: Учеб пособие для студ всех специальностей. Ч /С. В. Рябова. Луганск: Изд-во вну им. В. Даля, 2003. 44с
Рябова С. В. Основы информационного поиска: Учеб пособие для студ всех специальностей. Ч /С. В. Рябова.– Луганск: Изд-во вну им....
Разместите кнопку на своём сайте:
ru.convdocs.org


База данных защищена авторским правом ©ru.convdocs.org 2016
обратиться к администрации
ru.convdocs.org