Конспект лекции 3 (часть 2) В. М. Малашенко



Скачать 356.88 Kb.
страница3/4
Дата08.10.2012
Размер356.88 Kb.
ТипКонспект
1   2   3   4

2.2.Оценивание параметров моделей с гетероскедастичностью возмущений


Рассмотрим использование обобщенного метода наименьших квадратов для корректировки гетероскедастичности возмущений. Пусть строится линейная регрессионная модель (0). Будем считать, что модель гетероскедастична, т. е. дисперсии возмущений (i=1, 2, …, n) не равны между собой, а сами возмущения не коррелированны и их математические ожидания равны нулю. Это означает, что ковариационная матрица вектора возмущений будет диагональной:




.

(0)

Для оценки параметров такой модели используется взвешенный метод наименьших квадратов (Weighted Least Squares), являющийся частным случаем обобщенного МНК.

Сущность взвешенного метода наименьших квадратов состоит в том, что каждый квадрат остатка (i=1, 2, …, n) «взвешивается» с помощью коэффициента , где (i) — среднее квадратическое отклонение i-го возмущения. Тем самым добиваются равномерного вклада остатков в остаточную сумму квадратов, что приводит, в конечном счете к получению несмещенных и наиболее эффективных оценок параметров модели.

Условие взвешенного метода наименьших квадратов имеет вид:




.

(0)

Вектор b* оценок параметров модели определяется по формуле (0).

На практике, однако, средние квадратические отклонения возмущений (i) почти никогда не бывают известны. Поэтому для применения взвешенного метода наименьших квадратов, необходимо сделать предположение о значениях (i). Весьма часто считают, что среднее квадратическое отклонение возмущений пропорционально значениям одного из факторов, предположительно делающих выборочную совокупность неоднородной.

Пусть имеются исходные данные для построения модели множественной регрессии (табл. 1).




Таблица

1

Исходные данные для построения модели множественной регрессии




Номер наблюдения (объекта)

Значение результата Y

Набор факторов и их значения

X0

X1

X2



Xj



Xp

1

y1

1

x11

x12



x1j



x1p

2

y2

1

x21

x22



x2j



x2p



















i

yi

1

xi1

xi2



xij



xip




















n

yn

1

xn1

xn2



xnj



xnp


Представим модель (0) в развернутом виде:




(i=1, 2, …, n).

(0)

Если предположить, что среднее квадратическое отклонение возмущений (i) (i=1, 2, …, n) пропорционально значениям xij фактора Xj (или, что одно и тоже — дисперсия возмущений пропорциональна квадрату значений фактора Xj), то исходные данные преобразуются их делением на соответствующие значения xij (i=1, 2, …, n). Такое преобразование называется масштабированием исходных данных по фактору Xj. (табл. 2).

Таблица

2

Масштабирование исходных данных по фактору Xj




Номер наблюдения (объекта)

Значение результата Y

Набор факторов и их значения

X0

X1

X2



Xj



Xp

1

y1/x1j

1/x1j

x11/x1j

x12/x1j



1



x1p/x1j

2

y2/x2j

1/x2j

x21/x2j

x22/x2j



1



x2p/x2j



















i

yi/xij

1/xij

xi1/xij

xi2/xij



1



xip/xij



















n

yn/xnj

1/xnj

xn1/xnj

xn2/xnj



1



xnp/xnj


Таким же образом преобразуется и модель (0):




(i=1, 2, …, n),

(0)

или, что одно и тоже —




(i=1, 2, …, n),

(0)

Введем обозначения.

Пусть , , , , …, , , тогда преобразованная модель окончательно будет иметь вид:




(i=1, 2, …, n).

(0)

Параметры преобразованной модели (0) оцениваются обычным методом наименьших квадратов. Если предположение о пропорциональности среднего квадратического отклонения возмущений значениям фактора Xj имеет основание, то «новое» возмущение i будет иметь постоянную и притом — наименьшую дисперсию, а коэффициенты уравнения регрессии окажутся несмещенными и эффективными оценками параметров модели (0). Вместе с тем следует иметь в виду, что новые преобразованные переменные получают другое экономическое содержание и их регрессия имеет иной смысл, чем регрессия по исходным данным. Поэтому численно оценки параметров моделей (0) и (0) в общем случае не совпадают.

Если строится линейная модель парной регрессии Y по X




(i=1, 2, …, n),

(0)

то она трансформируется в модель




(i=1, 2, …, n),

(0)

в которой свободный член и угловой коэффициент как бы поменялись местами.

На практике иногда имеет смысл попробовать использовать одновременно несколько факторов для масштабирования исходных данных. Если каждый раз получаются сходные результаты и тесты Голдфельда–Квандта по всем факторам не выявляют гетероскедастичность возмущений, то эту проблему можно считать решенной.

В ряде случаев дисперсия возмущений зависит не от включенных в модель факторов, а от тех, которые не включены в модель, но играют существенную роль в исследуемой зависимости. Иногда для устранения гетероскедастичности необходимо изменить спецификацию модели, например, линейную на логарифмическую и т.д.

Пример 1


По 12 транспортным компаниям исследуется зависимость годового дохода (переменная Y, млн. руб.) от среднегодового количества грузовых автомобилей (переменная X). Имеются данные, для удобства упорядоченные по фактору X:


п/п

1

2

3

4

5

6

7

8

9

10

11

12

X

15

18

22

27

25

31

34

37

40

45

48

48

Y

235

250

247

287

260

262

307

280

357

410

389

311


Требуется:

  1. Построить линейную модель парной регрессии Y по X.

  2. Проверить наличие гетероскедастичности возмущений методом Голдфельда–Квандта.

  3. При обнаружении гетероскедастичности возмущений построить взвешенную модель регрессии.


Решение

1. По исходным данным строим линейную модель парной регрессии

(i=1, 2, …, n; n=12).

Параметры модели оцениваем обычным методом наименьших квадратов. С помощь табличного процессора MS Excel были определены коэффициенты уравнения регрессии : b0=160,6; b1=4,277. Таким образом, уравнение примет вид:

.

Уравнение регрессии статистически значимо на уровне =0,05: F статистика имеет значение F=25,15; табличное значение F-критерия Фишера — F0,05; 1;10=4,96; коэффициент детерминации — R2=0,716.

Значение углового коэффициента уравнения регрессии b1=4,277 показывает, что увеличение количества автомобилей на одну единицу приводит к росту годового дохода в среднем на 4,277 млн. руб.

Визуальный анализ графика зависимости годового дохода от количества автомобилей дает основание предполагать наличие гетероскедастичности возмущений. Видно, что отклонение от линии регрессии наблюдений, соответствующих крупным предприятиям, больше, чем для малых предприятий:



2. Построим график остатков и проведем его визуальный анализ. Предсказываемые уравнением регрессии значения результата и остатков (i=1, 2, …, n; n=12) приведены в таблице:


i

1

2

3

4

5

6

7

8

9

10

11

12

xi

15

18

22

27

25

31

34

37

40

45

48

48

yi

235

250

247

287

260

262

307

280

357

410

389

311



225

238

255

276

268

293

306

319

332

353

366

366

ei

10

12

-8

11

-8

-31

1

-39

25

57

23

-55


График остатков по фактору X показан на рисунке:



Визуальный анализ графика остатков показывает, что их разброс растет по мере увеличения фактора Х, что может свидетельствовать о гетероскедастичности возмущений. Проверим это предположение методом Голдфельда–Квандта. Будет считать, что возмущения распределены по нормальному закону и их среднее квадратическое отклонение пропорционально значению фактора Х. Все остатки уже упорядочены по Х. Выбираем первых и последних остатков. По каждой из групп определяем сумму квадратов остатков:

;

.

Так как SS2>SS1 , то F-статистику рассчитываем по формуле

.

Табличное значение F-критерия Фишера для уровня значимости =0,05 и чисел степеней свободы числителя и знаменателя (где p=1 — число факторов в модели) составляет F0,05; 3;3=9,28.

Так как , статистическая гипотеза об одинаковой дисперсии возмущений отклоняется на уровне значимости =0,05. Факт наличия гетероскедастичности возмущений считается установленным.

3. Применим взвешенный МНК к исходной модели в предположении, что среднее квадратическое отклонение возмущений пропорционально значению фактора Х, для чего масштабируем исходные данные по Х:


i

1

2

3

4

5

6

7

8

9

10

11

12

1/xi

0,0667

0,0556

0,0455

0,0370

0,0400

0,0323

0,0294

0,0270

0,0250

0,0222

0,0208

0,0208

yi/xi

15,67

13,89

11,23

10,63

10,40

8,45

9,03

7,57

8,93

9,11

8,10

6,48


Исходную модель преобразуем в модель (i=1, 2, …, n; n=12). Оцениваем параметры преобразованной модели 1 и 0 обычным методом наименьших квадратов. С помощь MS Excel были определены коэффициенты уравнения регрессии преобразованной модели: b1=3,863; b0=173,2, и уравнение регрессии примет вид:

(F=106; R2= 0,914).

Угловой коэффициент данного уравнения сравнивают со свободным членом исходного уравнения регрессии и наоборот. Видно, что значения соответствующих параметров уравнений отличаются друг от друга.

Тест Голдфельда–Квандта, примененный к преобразованной модели, не выявляет гетероскедастичности ее возмущений: F-статистика не превышает табличное значение F-критерия Фишера .

Используя преобразованное уравнение регрессии делаем вывод, что увеличение количества автомобилей на одну штуку приводит к росту годового дохода в среднем на 3,863 млн. руб.
1   2   3   4

Похожие:

Конспект лекции 3 (часть 2) В. М. Малашенко iconКонспект лекции. Удовлетворенный наконец создавшейся атмосферой, он спросил: Что есть Человек?
Однажды на Земле наш старый профессор философии, войдя в аудиторию, с полминуты молча изучал шестнадцать своих жертв (вероятно, засунул...
Конспект лекции 3 (часть 2) В. М. Малашенко iconРассмотрение исторических эпох. Карма неправдивости
Предлагаемая работа первоначально предназначалась исключительно для личного пользования. Часть II (лекции с 14 по 25) была в работе...
Конспект лекции 3 (часть 2) В. М. Малашенко iconЛекции лекции лекции, зачет лекции лекции Зимняя сессия
Памятка для студентов 1 курса экономического факультета заочной формы обучения по направлению подготовки
Конспект лекции 3 (часть 2) В. М. Малашенко iconЛекции состоит в следующем
Таким образом, первая часть моей лекции будет посвящена герме­невтике текста, а вторая—тому, что я назвал бы, в целях исследования,...
Конспект лекции 3 (часть 2) В. М. Малашенко iconКонспект лекции 4 (часть 2) концевая н. В. 2007 Тема Многомерный статистический анализ Вопросы Многомерный статистический анализ
Многомерный статистический анализ. Задачи классификации объектов: кластерный анализ. Дискриминантный анализ
Конспект лекции 3 (часть 2) В. М. Малашенко iconКонспект лекций Часть II таганрог 2001
Конспект предназначен для студентов специальностей: 072000 "Стандартизация и сертификация в промышленности", 190304 "Приборы и комплексы...
Конспект лекции 3 (часть 2) В. М. Малашенко iconКонспект лекции 3 (часть 1) Орлова И. В., Гусарова О. М. 2007 Тема Множественная регрессия. Вопросы Нелинейная регрессия. Нелинейные модели и их линеаризация
Линейные зависимости рассматриваются лишь как частный случай для удобства и наглядности рассмотрения протекаемого экономического...
Конспект лекции 3 (часть 2) В. М. Малашенко iconЛекции: Каждый из периодов развития культуры по-своему ценен, но одной из интереснейших страниц в истории мы называем Античную культуру (от лат. Antigus), что обозначает "древний"
Незабудь фамилию и класс. З оформление отдельная оценка. Доклады тоже сопровождайте иллюстрациями. Тексты лекции смотри ниже. Сделай...
Конспект лекции 3 (часть 2) В. М. Малашенко iconЛекции по педагогической психологии Педагогическая психология возникла: а в начале XIX в, в во второй половинеxix в
В работе с тестом см лит-ру: Зимняя И. А. Педагогическая психология: Учеб. М.: Логос, 2001. Часть Гл. 1, 2; Лекции по педагогической...
Конспект лекции 3 (часть 2) В. М. Малашенко iconЗакон республики татарстан о внесении изменения в бюджетный кодекс республики татарстан принят
Татарстана, 2004, n 4-5; 2005, n 6 (II часть), n 10 (I часть), n 12 (IV часть); 2006, n 6 (I часть), n 12 (I часть); 2007, n 8, n...
Разместите кнопку на своём сайте:
ru.convdocs.org


База данных защищена авторским правом ©ru.convdocs.org 2016
обратиться к администрации
ru.convdocs.org