Курс лекций для студентов специальности Психология Часть математическая статистика Лекция 2



Скачать 106.89 Kb.
Дата30.01.2013
Размер106.89 Kb.
ТипКурс лекций

Математика. Курс лекций для студентов специальности Психология



Часть 3. математическая статистика

Лекция 2

статистическое оценивание параметров распределения


  1. Числовые характеристики выборки

    1. Среднее значение признака

    2. Характеристики изменчивости признака

  2. Точечные оценки параметров генеральной совокупности

  3. Интервальные оценки параметров генеральной совокупности



  1. Числовые характеристики выборки


Группировка и построение частотного распределения – первый шаг статистического анализа полученных данных. Следующий шаг – получение числовых характеристик выборки, позволяющих глубже понять особенности объекта наблюдения: среднее значение признака, вокруг которого варьируют остальные значения; степень изменчивости признака.




Числовые характеристики

выборки

Среднее значение Характеристика изменчивости

признака признака

* среднее арифметическое * размах выборки

* медиана * выборочная дисперсия

* мода * среднее квадратическое отклонение
Рисунок 5.6
1.1. Среднее значение признака
Основной характеристикой вариационного ряда является его среднее арифметическое. Это абстрактная типическая характеристика всей совокупности. Она уничтожает, погашает, сглаживает влияние индивидуальных особенностей и позволяет представить в одной величине некоторую общую характеристику реальной совокупности.

Для дискретного выборочного ряда среднее арифметическое значений (или выборочное среднее значение) равно

. (5.1)

Если числа в выборке повторяются, например, - раз, - раз, …, - раз, причем gif" name="object10" align=absmiddle width=121 height=21>, то для сгруппированных выборочных данных выборочное среднее равно

(5.2)

и называется взвешенным средним (здесь - середина -го интервала). Для интервального вариационного ряда за принимают середину -го интервала.

Среднее арифметическое имеет двойной смысл: 1) оно может быть средним значением признака в данной совокупности (средняя зарплата отдела); 2) приближенное значение постоянной величины, подвергающейся изменениям (рост человека).

Модой называется числовое значение признака, которое встречается в выборке с наибольшей частотой (обозначается ). Некоторые распределения могут не иметь моды или иметь две моды (бимодальное распределение).

Медианой называется значение признака, которое делит упорядоченное множество данных пополам (обозначается ).

Если число членов ряда нечетное (), то серединой ряда будет значение . Если число членов ряда четное (), то за медиану обычно принимают .
1.2. Характеристики изменчивости признака

Для измерения изменчивости значений признака внутри группы требуются меры, которые оценивают изменчивость, неоднородность, разброс значений в группе данных, что в известном смысле есть неопределенность.

Размахом выборки называют разность между наибольшим и наименьшим значениями признака в выборке: .

Размах измеряет на числовой шкале расстояние, в пределах которого изменяется варианта. Он не учитывает каждое отдельное значение, не стабилен и меняется от выборки к выборке.

Выборочной дисперсией называется среднее арифметическое квадратов отклонений значений от выборочной средней :

. (5.3)

Здесь - значение признака для дискретного вариационного ряда или середина -го интервала для интервального ряда.

Для сгруппированных данных выборочная дисперсия вычисляется по формуле

, (5.4)

где - число групп признака (или число частичных интервалов), - середина частичного интервала.

Выборочная дисперсия является мерой разброса значений признака относительного среднего значения. Для практических вычислений более удобна следующая формула:

, (5.5)

которая для сгруппированных данных имеет вид

. (5.6)

Выборочным средним квадратическим отклонением признака называется положительное значение квадратного корня из дисперсии выборки:

. (5.7)

Выборочное среднее квадратическое отклонение – мера абсолютной изменчивости признака и выражается в тех же единицах измерения, в которых выражен изучаемый признак.

2. Точечные оценки параметров генеральной совокупности
Исходным материалом для статистического исследования служит совокупность результатов наблюдений , представляющих собой значения случайной величины (исследуемого признака) с распределением , зависящим от неизвестного параметра (параметров).

Например, на основании экспериментальных данных при исследовании ошибок наблюдений (измерений) предполагают, что случайные ошибки распределены нормально. При этом неизвестны лишь параметры распределения и (математическое ожидание и среднее квадратическое отклонение). Если же предполагать, что удовлетворяет распределению Пуассона, то определению подлежит только один параметр . Естественно возникает задача оценки параметра (параметров), которым определяется распределение .

Поскольку случайная выборка возникает из генеральной совокупности в результате случайного отбора, значения случайной величины можно рассматривать и как значения разных независимых случайных величин , …, с тем же распределением , что и у величины .

При таком толковании рассчитанная по наблюдениям данной выборки числовая характеристика (например, среднее арифметическое) является случайной величиной и принимает от выборки к выборке различные значения, то есть является функцией выборки.

Таким образом, генеральную совокупность описывает параметр , а выборку – его статистическая оценка , которая вычислена по выборке и рассматривается как оценка параметра совокупности. Например, выборочное среднее оценивает генеральную среднюю ; выборочная дисперсия оценивает генеральную дисперсию . Статистики принято обозначать латинскими буквами, а параметры – греческими.

Статистическая оценка

параметров распределения
Доверительный

Несмещенная Точечная Интервальная интервал

Эффективная оценка оценка

Состоятельная Доверительная

вероятность

* среднее арифметическое * размах варьирования

* медиана * выборочная дисперсия

* мода * выборочное среднее

квадратическое отклонение
Рисунок 5.7 – Статистическое оценивание параметров распределения
Если статистическая оценка параметра характеризуется одним числом, она называется точечной. К таким оценкам относятся выборочное среднее и выборочная дисперсия.

Статистическая оценка является случайной величиной и меняется в зависимости от выборки.

Возникает вопрос: каким требованиям должна удовлетворять оценка, чтобы получить «хорошее» приближение к истинному значению оцениваемого параметра и чтобы ее можно было предпочесть всем прочим возможным оценкам?

Пусть - вычисленная по выборке оценка неизвестного параметра функции распределения генеральной совокупности. Выбор оценки из множества возможных оценок должен определяться следующими критериями (их предложил Р.А. Фишер).

1. Оценка должна быть несмещенной, т.е. ее математическое ожидание должно быть равно оцениваемому параметру. Если имеются несколько несмещенных оценок для , тогда выбирают ту из них, которая обладает наименьшей дисперсией (при заданном объеме выборки).такая оценка называется эффективной.

2. Оценка должна быть достаточной (исчерпывающей), обеспечивающей такую полноту использования всей содержащейся в выборке информации о неизвестном параметре, чтобы никакая другая оценка не могла дать о нем дополнительных сведений.

3. Оценка должна быть состоятельной, т.е. с увеличением объема выборки значение должно сходиться к оцениваемому параметру . Состоятельность – это не свойство оценки при фиксированном объеме выборки, а свойство последовательности оценок и возрастающем объеме выборки.

Среднее арифметическое представляет собой несмещенную оценку математического ожидания генеральной совокупности. Более того, для нормально распределенной генеральной совокупности является также эффективной, состоятельной и достаточной.

Этим объясняется предпочтение, отдаваемое как оценке математического ожидания нормально распределенной генеральной совокупности перед другими возможными оценками, такими, как среднее геометрическое, мода, медиана и др.

Выборочная дисперсия является смещенной оценкой генеральной дисперсии . В качестве несмещенной оценки принимают исправленную выборочную дисперсию

, (5.8)

где - коэффициент, позволяющий «исправить» смещенную оценку (выборочную дисперсию).

При больших значения и будут мало отличаться.. поэтому «исправление» выборочной дисперсии производят при малых ().

В целях повышения надежности полученной оценки следует увеличивать объем выборки.
3. Интервальные оценки параметров генеральной совокупности
Если статистическая оценка параметра закона распределения случайной величины характеризуется двумя числами – концами интервала, то такая оценка называется интервальной.

Интервал , в который попадает оцениваемый параметр с заданной надежностью (вероятностью), называется доверительным интервалом.

Доверительный интервал применяется в случае сравнительно небольшого объема выборки, когда предполагается, что надежность точечной оценки может быть невысокой.

Интервальной оценкой параметра называется интервал , который с заданной вероятностью накрывает неизвестное значение параметра. Интервал называется доверительным, а вероятность - доверительной вероятностью или уровнем надежности.

Обозначим - приближенное значение истинной величины параметра , полученное по выборке. Доверительный интервал симметричен относительно оценки и имеет вид

, (5.9)

где - предельная ошибка выборки (наибольшее отклонение выборочного значения параметра от его истинного значения). Это означает, что неравенства выполняются с вероятностью .
Рассмотрим построение доверительного интервала для оценки математического ожидания. Пусть - выборка объема из генеральной совокупности объема ; - выборочное среднее; - выборочное среднее квадратическое отклонение.

Доверительный интервал уровня надежности для математического ожидания (генеральной средней) имеет вид

, (5.10)

где - предельная ошибка выборки, которая зависит от объема выборки , доверительной вероятности и равна половине доверительного интервала.

В случае малой выборки () доверительный интервал для математического ожидания строится только для нормальной генеральной совокупности. При этом предельная ошибка выборки равна:

(5.11)

Здесь находится по таблице распределения Стьюдента для степеней свободы и заданной доверительной вероятности .

В случае большой выборки () предельная ошибка выборки равна

(5.12)

Здесь находится по таблице значений функции Лапласа из условия .
Пример 1. При обследовании 50 членов семей получен дискретный вариационный ряд.




1

2

3

4

5

6

7

8

9



2

4

6

8

10

9

6

4

1



  1. Определите средний размер (среднее число членов) семьи.

  2. Охарактеризуйте изменчивость размера семьи.

Объясните полученные результаты, сделайте выводы.

Решение

1. В данной задаче изучаемый признак является дискретным, так как размер семей не может отличаться друг от друга менее чем на одного человека. Рассчитаем средний размер (среднее число членов) семьи по формуле . Получим:

.

Средний размер семьи около 5 человек.

2. Для расчета дисперсии используем формулу . Получим:



Дисперсия размера семьи – 3,7 .

Найдем среднее квадратическое отклонение размера семьи: . Среднее квадратическое отклонение размера семьи - 2 человека.

Найдем коэффициент вариации размера семьи по формуле . Коэффициент вариации составляет 38%. Так как коэффициент вариации больше 35%, можно сделать вывод о том, что изучаемая совокупность семей является неоднородной, чем объясняется высокая изменчивость размера семьи в данной совокупности.

Пример 2. Найти доверительный интервал с надежностью 0,95 для оценки математического ожидания нормально распределенной случайной величины, если известны ее среднее квадратическое отклонение , выборочная средняя и объем выборки .

Решение

Воспользуемся формулой . Значение найдем по таблице значений нормированной функции Лапласа , с учетом того, что , т.е. . Находим по таблице значение аргумента . Получим доверительный интервал:

;

или .





Похожие:

Курс лекций для студентов специальности Психология Часть математическая статистика Лекция 2 iconКурс лекций для студентов специальности Психология Часть математическая статистика Лекция 4 Проверка гипотез о законе распределения
Распределением признака называется закономерность встречаемости разных его значений. В данной теме будем рассматривать сравнение...
Курс лекций для студентов специальности Психология Часть математическая статистика Лекция 2 iconКурс лекций для студентов специальности Психология Часть линейная и векторная алгебра Лекция 2
Каждой квадратной матрице поставим в соответствие некоторое число, которое будем называть определителем матрицы, и укажем правило...
Курс лекций для студентов специальности Психология Часть математическая статистика Лекция 2 iconКурс лекций для студентов специальности Психология Часть Элементы теории множеств и математической логики Лекция 1
Понятия «множество», «элемент множества», «элемент принадлежит множеству» относятся к первичным, неопределяемым понятиям современной...
Курс лекций для студентов специальности Психология Часть математическая статистика Лекция 2 iconКурс лекций для студентов специальности Психология Часть основы математического анализа Лекция 2
К основным операциям (+, –,, ), которые применяются в элементарной математике, в высшей математике добавляется еще одна – операция...
Курс лекций для студентов специальности Психология Часть математическая статистика Лекция 2 iconКурс лекций для студентов специальности Психология Часть Элементы теории множеств и математической логики Лекция 2
Комбинаторика – раздел математики, в котором изучаются вопросы о том, сколько комбинаций, подчиненных тем или иным условиям, можно...
Курс лекций для студентов специальности Психология Часть математическая статистика Лекция 2 iconИ. И. Боголепов теория вероятностей и математическая статистика в технике краткий курс лекций для инженеров
Анонс книги: И. И. Боголепов. Теория вероятностей и математическая статистика к технике
Курс лекций для студентов специальности Психология Часть математическая статистика Лекция 2 iconКурс лекций по высшей геодезии раздел «теоретическая геодезия»
Курс лекций ведется на кафедре прикладной геодезии и фотограмметрии Полоцкого государственного университета для студентов специальности...
Курс лекций для студентов специальности Психология Часть математическая статистика Лекция 2 iconКурс лекций для студентов фен нгу (28. 03. 2004)
Название курса: Гидробиология. Курс лекций объемом 32 часа реализуется в рамках программы обучения по специальности «химик-эколог»...
Курс лекций для студентов специальности Психология Часть математическая статистика Лекция 2 iconКонтрольная работа по дисциплине «Теория вероятностей и математическая статистика»
«Теория вероятностей и математическая статистика» для студентов пиэф всех форм обучения экономических специальностей
Курс лекций для студентов специальности Психология Часть математическая статистика Лекция 2 iconКурс «Основы кибернетики» для студентов специализаций 01. 02. 08. 01 (математическая кибернетика) и 01. 02. 13. 01(программное и аппаратное обеспечение информационной безопасности)
Курс является обязательным для всех студентов, обучающихся по специальности 01. 02 – прикладная математика и информатика. При этом...
Разместите кнопку на своём сайте:
ru.convdocs.org


База данных защищена авторским правом ©ru.convdocs.org 2016
обратиться к администрации
ru.convdocs.org