Учебное пособие для студентов всех специальностей Москва 2003 ббк 22. 17я7 удк 519. 22 (075. 8) 6Н1 к 60



страница4/10
Дата08.10.2012
Размер0.71 Mb.
ТипУчебное пособие
1   2   3   4   5   6   7   8   9   10

§ 2.3.Факторный анализ

2.3.1Модель факторного анализа


Как и прежде будем полагать, что Х = (X1X2, …, Xk)T — исходный k-мерный случайный вектор. Каноническая модель факторного анализа для центрированного вектора имеет следующий вид:

(2.3.16)

где F = (F1F2, …, Fm) — центрированный и нормированный случайный вектор некоррелированных m общих факторов для всех исходных случайных величин Xi (m < k), — (неслучайная) матрица нагрузок случайных величин Xi на факторы Fj, — нормально распределенный центрированный вектор специфических факторов 1, 2, …, k, некоррелированных как между собой, так и с общими факторами.

Пусть — ковариационная матрица вектора Х, а Σε =  — ковариационная матрица (диагональная) вектора с диагональными элементами, равными .

Построим систему уравнений для нахождения матриц A и Σε. С учетом (16) и условий на векторах F и получим:



Итак,



или

(2.3.17)

Таким образом, здесь, в отличие от модели главных компонент, ковариации исходных случайных величин полностью воспроизводятся матрицей нагрузок, а для воспроизведения их дисперсий помимо нагрузок нужны дисперсии i специфических факторов. И далее, так как

,

то здесь, как и в компонентном анализе, ковариации .


Замечание. Если исходный k-мерный вектор Х не только центрирован, но и нормирован, то ΣХ — это корреляционная матрица RХ и система (17) примет вид

RХ = AAT+Σε

или

(2.3.18)

и в этом случае , а .

Величину называют общностью случайной величины Хi, а матрицу R' = A'A'T, где редуцированной матрицей (R' отличается от R только тем, что ее диагональными элементами являются не единицы, а общности hi).

В системе (17) k2 уравнений, а число неизвестных (aij и υi) равно mk + k < < k(+ 1). Если допустить, что k, m и матрица ΣХ таковы, что решение этой системы существует (иначе построение модели (16) допустимо?), то это решение не единственно.

Действительно, пусть V — ортогональная матрица размером . Проведем тождественные преобразования модели (16):

. (2.3.19)

В преобразованной модели вектор общих факторов — это вектор , а матрица нагрузок .

Итак, если решение системы (17) существует, то оно не единственно: допустим целый класс матриц нагрузок, которые связаны между собой ортогональными преобразованиями.

Замечание. В методе главных компонент также допустимо ортогональное преобразование матрицы нагрузок. Однако вращение пространства главных компонент меняет вклады компонент в общую дисперсию исходных случайных величин: они не равны собственным значениям.

При каких дополнительных условиях на k, m и матрицу нагрузок А решение системы (17) единственно с точностью до ортогонального преобразования? Матрица А должна быть такой, чтобы при вычеркивании из нее любой строки оставшуюся матрицу можно было бы разделить на две подматрицы ранга m (откуда получаем, что 2m  k — 1). Сформулированное требование к матрице А является не только достаточным, но и при m = 1 и m = 2 необходимым условием единственности решения системы (17).

Будем предполагать, что решение единственно с точностью до ортогонального преобразования. Тогда, вращая систему координат в m-мерном пространстве общих факторов, можно найти такую матрицу нагрузок, которая позволила бы дать содержательную интерпретацию общих факторов в терминах исходных случайных величин. Существует несколько вариантов дополнительных условий на класс матриц А, обеспечивающих уже окончательную однозначность решения. От этих условий зависит и метод нахождения матриц А, Σε, вектора F, и, соответственно, способ их статистического оценивания.

Наиболее формализованы следующие варианты дополнительных идентифицирующих требований к виду матрицы А:

  1. матрица должна иметь диагональный вид с различными расположенными в порядке убывания диагональными элементами;

  2. матрица ATB (где матрица задана заранее) имеет ранг m и должна быть треугольной (наддиагональной); в частности, при

    матрица ,

т. е. исходный признак Х1 выражается только через общий фактор F1; X2 — через F1 и F2 и т. д.

Общая итерационная схема нахождения (при заданном m) параметров (АΣε) факторной модели такова:

  • задаются нулевым приближением диагональной матрицы Σε (нулевым приближением дисперсий vi специфических факторов);

  • получают нулевое приближение матрицы ψ = AAT;

  • последовательно определяют нулевые приближения столбцов a1a2, …, am матрицы А;

Замечание. Нетрудно убедиться в том, что . Исходя из этого равенства и учитывая специфику выбранного варианта идентифицирующих требований к матрице А, сначала находят столбец а1. Затем переходят к матрице и определяют столбец а2 и т. д.

  • определяют первые приближения дисперсий vi (первое приближение матрицы Σε) и переходят к следующей итерации;

  • итерационный процесс заканчивают, когда очередное приближение матрицы Σε мало отличается от предыдущего.

В реальных задачах располагают лишь оценкой ковариационной матрицы ΣX. Заменив в рассмотренной общей схеме ΣX на , можно получить оценки и соответственно матрицы нагрузок А и ковариационной матрицы Σε специфических факторов.

2.3.2Метод максимального правдоподобия


Реализация описанной общей итерационной схемы для первого варианта идентифицирующего требования к виду матрицы А приводит к оценкам максимального правдоподобия параметров aij и vi — оценкам, получаемым методом максимального правдоподобия для модели (16) при постулировании нормальности распределения наблюдений вектора Х с учетом указанного требования. При достаточно общих ограничениях оценки максимального правдоподобия и асимптотически нормальны, несмещены и эффективны.

Можно доказать, что при максимизации логарифмической функции правдоподобия с учетом требования 1) диагональными элементами матрицы будут первые m наибольших собственных значений матрицы , а соответствующие собственные векторы будут столбцами матрицы . Поэтому итерационная схема нахождения оценок и при заданном m примет следующий вид:

  • задаются нулевыми приближениями дисперсий специфических факторов, или иначе задаются нулевым приближением матрицы ;

  • получают нулевое приближение матрицы φ;

  • находят — наибольшее собственное значение матрицы φ(0) и соответствующий ему собственный вектор — это столбец матрицы ; в φ(0) матрицу заменяют на и для новой матрицы φ(0) находят наибольшее собственное значение и соответствующий ему собственный вектор — это будет столбец матрицы , и далее до получения m столбцов матрицы ;

  • получают первое приближение дисперсии , иначе? первое приближение матрицы и переходят к следующей итерации.

2.3.3Факторный анализ показателей…


Используя процедуру метода максимального правдоподобия, проведем факторный анализ шести экономических показателей (см. стр. ), при этом примем m = 2, , где и — нагрузки показателя Хi на первые две компоненты. Результаты одной итерации приведены в табл. 2.3.1.

Таблица 2.3.1



0,4112

0,3728

0,3903

0,5296

0,5875

0,4328



4,1433



0,6952

0,6267

0,3835

0,1928

0,4604

0,5379



2,4759



0,0170

–0,4266

0,5779

0,5065

0,1759

–0,3220



0,5164

0,4252

0,5189

0,7063

0,7571

0,6070

Окончательные оценки нагрузок и дисперсий специфических факторов указаны в табл. 2.3.2:

Таблица 2.3.2

Показатель

Оценки нагрузок на факторы





F1

F2

X1

0,6627

–0,0519

0,4419

0,5581

X2

0,5895

–0,3634

0,4796

0,5204

X3

0,3967

0,5950

0,5114

0,4886

X4

0,1749

0,2642

0,1004

0,8996

X5

0,4463

0,1808

0,2319

0,7681

X6

0,4618

–0,2575

0,2796

0,7204

Оценка доли вклада Fj

в общую дисперсию, %



23,12

10,96







Допустимо ли представление исходного вектора Х с помощью модели (16) факторного анализа с числом общих факторов, равным m (в примере = 2). Гипотеза о том, что число общих факторов равно m отвергается (с вероятностью ошибки, равной ), если

, (2.3.20)

где число степеней свободы q = .

В примере вместо ковариационной матрицы использовалась корреляционная матрица . Учитывая это, в неравенстве (19): n = 153, , , , 2 = 4,95, k = 6, = 2, .

Так как 4,95 < 9,49, то гипотезу о наличии двух общих факторов не отвергаем при  = 0,05.

2.3.4Центроидный метод


Одним из способов реализации общей итерационной схемы при идентифицирующем условии 2) является центроидный метод. Оценки, получаемые этим методом, близки к оценкам максимального правдоподобия, и являются более «устойчивыми» по отношению к отклонениям от нормальности распределения наблюдений вектора Х; однако исследование их статистических свойств затруднено из-за использования в процедуре метода эвристических неформализуемых соображений. Метод менее трудоемок по сравнению с методом максимального правдоподобия и геометрически интерпретируем:

  • исходные случайные величины X1X2, …, Xk отождествляют с радиус-векторами X1X2, …, Xk k-мерного пространства, построенными так, чтобы , а ;

  • изменяя знаки отдельных векторов, добиваются, чтобы как можно больше корреляций были положительными (как можно больше векторов образовывали однонаправленный пучок);

  • определяют вектор F1 (общий фактор F1первый центроид) как нормированную сумму векторов пучка и нагрузки ;

  • затем подсчитывают корреляционную матрицу остаточных переменных , где a1 = (a11a21, …, ak1)T, и относительно и проделывают аналогичную процедуру, выделяя F2 второй центроид и т. д.

Для центроидного метода описанная выше общая итерационная схема факторного анализа конкретизируется (в терминах выборки) следующим образом:

  • задаются нулевым приближением дисперсий (обычно ), или иначе задаются нулевым приближением ковариационной матрицы специфических факторов;

  • подсчитывают ;

  • определяют нулевое приближение первого столбца матрицы : , где — нулевое приближение первого столбца b1 вспомогательной матрицы В; затем вычисляют и определяют нулевое приближение второго столбца матрицы : , где вектор состоит из чисел «+1» и « 1», а знаки подбираются так, чтобы знаменатель в последней дроби был максимальным. Так продолжают до получения m столбцов матрицы ;

  • получают диагональную матрицу , элементы которой вычисляются как и переходят к следующей итерации.

Замечание. Из изложенного алгоритма видно, что столбец b1 матрицы B задает веса, с которыми суммируются вектора одного пучка для получения общего вектора F1. поскольку все веса по модулю равны единице, то определение очередного центроида состоит в простом суммировании векторов пучка; знаки же единиц определяют нужное направление каждого из векторов пучка. Вообще говоря, знаки устанавливаются на основе анализа знаков элементов остаточных матриц ; в данном алгоритме предлагается при подборе знаков ориентироваться на максимизацию произведения , что позволяет быстрее выделить m общих факторов, объясняющих возможно большую часть общей дисперсии исходных величин.

Недостатком центроидного метода является зависимость получаемых им значений нагрузок от шкалы измерения исходных величин, поэтому их обычно нормируют.

2.3.5Метод Бартлетта оценки общих факторов


В заключение приведем метод Бартлетта оценки общих факторов в предположении, что известны оценки и . Согласно этому методу модель (16) для каждого фиксированного наблюдения i (i = 1, 2, …, n) рассматривается как регрессия

,

и величины f1i, f2i, …, fmi интерпретируются как неизвестные коэффициенты регрессии. Тогда в соответствии с процедурой наименьших квадратов вектор определяется по формуле

,

где — вектор значений исходных признаков X1X2, …, Xk в i-м наблюдении.

2.3.6Реализация методов факторного анализа
в пакете SPSS


В ППП «SPSS» наряду с методом главных компонент и методами факторного анализа: максимального правдоподобия и центроидным реализованны методы, основанные на итерационных процедурах вычисления общностей. Суть методов при использовании корреляционной матрицы состоит в нахождении заданного числа главных компонент редуцированной матрицы , в которой стоящие на диагонали неизвестные общности заменяют некоторыми нулевыми приближениями (например, оценками квадратов множественных коэффициенов корреляции); после нахождения нулевых приближений оценок нагрузок пересчитывают оценки общностей и переходят к следующей итерации; итерации продолжают до тех пор, пока не превышено максимальное число итераций или изменение в общностях меньше заданного.

В ППП реализованны следующие наиболее типичные стратегии вращения факторного пространства (current rotation), обеспечивающие максимально возможную концентрацию дисперсии исходных данных на координатных осях выделенных факторов и облегчающие предметную интерпретацию факторов: «варимакс» (максимизирует различие столбцов матрицы нагрузок и тем самым обеспечивает разделение факторов за счет уменьшения числа исходных переменных, связанных с каждым фактором); «квартимакс» (максимизирует различие строк матрицы нагрузок и тем самым уменьшает число факторов, связанных с каждой переменной); «биквартимакс» (максимизирует различие и столбцов и строк матрицы нагрузок)

В ППП также предусмотрен расчет матрицы значений общих факторов для каждого наблюдения (factor scores button), которая может использоваться в двух направлениях: при построении регрессии признаков на факторы и при проведении классификации наблюдений в факторном пространстве.

2.3.7Решение практических задач с помощью факторного анализа

2.3.7.1Простая задача с ручными вычислениями из предметной области




2.3.7.2Факторный анализ производственной деятельности предприятий




2.3.7.3Факторный анализ показателей размера одежды




2.3.7.4Факторный анализ социологического опроса




2.3.7.5Факторный анализ финансовых показателей




1   2   3   4   5   6   7   8   9   10

Похожие:

Учебное пособие для студентов всех специальностей Москва 2003 ббк 22. 17я7 удк 519. 22 (075. 8) 6Н1 к 60 iconКонспект лекций москва 2004 удк 519. 713(075)+519. 76(075) ббк 22. 18я7 С32
Учебное пособие предназначено для студентов факультета Кибернетики, изучающих на пятом семестре математическую лингвистику и основы...
Учебное пособие для студентов всех специальностей Москва 2003 ббк 22. 17я7 удк 519. 22 (075. 8) 6Н1 к 60 iconУчебное пособие для студентов всех специальностей Саратов 2009 удк 519. 17 Ббк 22. 174 С 32 Рецензенты
С32 Ведение в теорию графов: учеб пособие. Саратов: Сарат гос техн ун-т, 2009. 36с
Учебное пособие для студентов всех специальностей Москва 2003 ббк 22. 17я7 удк 519. 22 (075. 8) 6Н1 к 60 iconУчебное пособие Москва 2002 ббк 63. 3 /2/ я 73 Рецензент: Иванова А. А
Учебное пособие предназначено для студентов I курса всех направлений и всех специальностей дневной формы обучения
Учебное пособие для студентов всех специальностей Москва 2003 ббк 22. 17я7 удк 519. 22 (075. 8) 6Н1 к 60 iconУчебное пособие Москва, 2009 удк 811. 111 Ббк 81. 2Англ к 893 к 893
Учебное пособие предназначено для студентов продвинутого этапа обучения гуманитарных специальностей. Пособие базируется на оригинальном...
Учебное пособие для студентов всех специальностей Москва 2003 ббк 22. 17я7 удк 519. 22 (075. 8) 6Н1 к 60 iconУчебное пособие для студентов гумманитарных специальностей Павлодар удк 811. 124 (075. 8) Ббк 81. 2 Латиня 75 И87
Г. Х демисинова кандидат филологических наук, доцент, зав кафедрой теории и практики перевода пгу
Учебное пособие для студентов всех специальностей Москва 2003 ббк 22. 17я7 удк 519. 22 (075. 8) 6Н1 к 60 iconУчебное пособие Москва 2006 удк 341. 645: 347. 922(075) ббк 67. 412. 2 О 23

Учебное пособие для студентов всех специальностей Москва 2003 ббк 22. 17я7 удк 519. 22 (075. 8) 6Н1 к 60 iconУчебное пособие для студентов всех специальностей Саратов 2011 удк 510. 6 Ббк 22. 12 С 32 Рецензенты
С 32 Элементарный курс математической логики. Логические функции: учеб пособие. Саратов: Сарат гос техн ун-т, 2011. 32 с
Учебное пособие для студентов всех специальностей Москва 2003 ббк 22. 17я7 удк 519. 22 (075. 8) 6Н1 к 60 iconУчебное пособие Оренбург, 2007 удк 811. 131. 1(075) ббк 81. 2Фр-923 а 23 Рецензенты
Данное учебное пособие предназначено для студентов, занимающихся изучением древних языков и античной культуры и имеет целью помочь...
Учебное пособие для студентов всех специальностей Москва 2003 ббк 22. 17я7 удк 519. 22 (075. 8) 6Н1 к 60 iconУчебное пособие для самостоятельной работы обучающихся Сызрань 2007 Составители: П. П. Гавриш, Ю. А. Мелешкин удк 621. 375 Ббк 32. 85
Учебное пособие предназначено для обучающихся всех специальностей, изучающих теорию электрических цепей
Учебное пособие для студентов всех специальностей Москва 2003 ббк 22. 17я7 удк 519. 22 (075. 8) 6Н1 к 60 iconУчебное пособие для студентов всех специальностей ч луганск 2003 удк 01 Рябова С. В. Основы информационного поиска: Учеб пособие для студ всех специальностей. Ч /С. В. Рябова. Луганск: Изд-во вну им. В. Даля, 2003. 44с
Рябова С. В. Основы информационного поиска: Учеб пособие для студ всех специальностей. Ч /С. В. Рябова.– Луганск: Изд-во вну им....
Разместите кнопку на своём сайте:
ru.convdocs.org


База данных защищена авторским правом ©ru.convdocs.org 2016
обратиться к администрации
ru.convdocs.org