Тема Согласование описательных, доказательных и предсказательных статистик при сравнении двух независимых выборок



Скачать 107.54 Kb.
Дата22.05.2013
Размер107.54 Kb.
ТипАнализ
Практика 2. Тема 2. Согласование описательных, доказательных и предсказательных статистик при сравнении двух независимых выборок.

1.Проверка согласованности данных с нормальным распределением 1

2. Графический анализ. Диаграмма «Короб с усами». 4

3. Доказательная статистика. 8

4. Отношение правдоподобий. 10

5. Планирование эксперимента 11


  1. Анализ качества статистических данных.

Статистический анализ начинается с выбора методов обработки данных. Существуют параметрические и непараметрические методы. Выбор методов зависит от характера распределения исследуемых выборок. В статистическом анализе параметрические методы используются в том случае, если данные подчиняются закону нормального распределения, в противном случае применяются непараметрические методы. По - этому перед началом работы с нашими данными необходимо провести тест на нормальное распределение.

1.Проверка согласованности данных с нормальным распределением



Программ РAST (путь)

  1. Ввод данных:

Выделите необходимые столбцы, скопируйте, перейдите в рабочее меню программы PAST, на вкладке Edit выберите команду Paste. Также можно использовать стандартные команды обмена данными (Ctrl + C ; Ctrl + V). Для того, чтобы присвоить столбцам имена, отметьте флажок Edit labels. Поля в первой строке станут доступными для изменения. Введите имена столбцов. Снимите флажок.

Ваша форма должна выглядеть так, как показано на рис.1.



Рисунок 1 Ввод данных в программу PAST.


  1. Гистограмма.

На главном меню найдите вкладку Plot(график). Эта вкладка содержит все возможные графики, которые строятся в программе PAST. Выделите нужный столбец, выберите Histogram. Откроется форма, представленная на рисунке 2. Отметьте флажок Fit normal, для того чтобы отобразилась кривая распределения.


Рисунок 2 Гистограмма для первой выборки
X Start и X End – соответственно наименьшее и наибольшее значение в исследуемой выборке.

Bins – количество столбцов. Здесь столбцы обозначают количество наблюдений в определенном интервале.
Проанализируйте получившийся график. Насколько кривая приближается к нормальному распределению?
Закройте окно с диаграммой.


  1. Сравнение значений с нормальным распределением.

Откройте вкладку Plot. Команда Normal probability plot.


Проанализируйте график: красная линия изображает нормальное (гауссово) распределение. Чем ближе точки к данной линии, тем больше распределение выборки приближается к нормальному. См Рисунок 3.


Рисунок 3 График сравнения значений с нормальным распределением.
Анализ по критериям. Для проверки согласованности закона распределения используются следующие критерии:

Шапиро – Уилкоксона – наиболее мощный критерий;

Жарка – Бера – критерий проверки симметрии распределения:

Монте – Карло

Хи – квадрат – для выборок большого объема.

Выделите столбец с данными. Выберите: Past – Statistics - Normality test.

Таблица 1. Критерии согласованности с нормальным распределением.

N, объем выборки.

19

Shapiro-Wilk W

0,933

p(normal)

0,1971

Jarque-Bera JB

0,8963

p(normal)

0,6388

p(Monte Carlo)

0,4794

Chi^2

0,57895

p(normal)

0,44673

Chi^2 OK (N>20)

NO


Проанализируйте получившиеся p – значения. Если величина p <0,05, то распределение выборки отлично от нормального. Наиболее показательно p- значение для критерия Шапиро – Уилкоксона, но и p- значения для других критериев стоит учитывать. Для нашего примера критерии представлены в таблице 1 . Мы видим, что p – значения достаточно велики, что бы утверждать о нормальном распределении выборки.
Далее определим, насколько отличаются наши выборки, иными словами, можно ли утверждать о принадлежности данных по матерям и детям к разным генеральным совокупностям. Для этого проведем графический анализ с помощью диаграммы «boxplot».

2. Графический анализ. Диаграмма «Короб с усами».


Программа InStat

  1. По умолчанию количество строк в каждом столбце 100. Однако количество данных скорее всего гораздо больше 100. Чтобы увеличить количество строк необходимо: ManageResize Worksheet. В появившемся окне (Рисунок 4) изменить 100 в графе Length на необходимое значение (максимальное количество в большей выборке)

  2. Вставьте свои данные в соответствующие столбцы.



Рисунок 4 Окно для изменения длины столбца (количества строк)


  1. На вкладке Graphics, выберете Boxplot

  2. Отметьте флажки, как показано на рисунке 4:

  • Данные (Plot data points)

  • Размах значений (with jitter)

  • Усы (show outliers)

  • Доверительный интервал для медиан (Show confidence limits for medians)

  • Соединить медианы (Connect medians)

  • Средние значения(Show means)

  • Доверительный интервал для средних (Show 1 devs from mean)




Рисунок 5 Окно для построения «Короба с усами»
На полученном графике (рисунок 6), точкам соответствуют данные выборок. Голубые прямоугольником («коробом») обозначен интервал от первой до третьей квартили.

Медиана изображена синей пунктирной линией.

Короткая жирная линия указывает на среднее значение по выборке, а зеленые короткие черточки – доверительные интервалы для средних.

Так как объем выборок большой, то данные могут полностью закрыть «короб с усами». Для редактирования размера точек: ChartSeries. В появившемся окне Editing (Рисунок 6) надо выбрать X1, проконтролируйте обозначение — серая точка.



Рисунок 6 Окно для редактирования графика «короб с усами»
Далее на вкладке Points изменим графы Width и Height:



Рисунок 7 Редактирование точек на «коробе с усами»

Аналогично изменить размер точек для второй выборке X2.

На рисунке 8 изображена диаграмма «boxplot» для наших данных.



Рисунок 8 Диаграмма «boxplot»
Чем дальше друг от друга расположены медианы и средние, тем сильнее различия между исследуемыми выборками значений. Основной критерий для предположения о различии выборок: среднее значение одной выборки не входит в доверительный интервал для среднего значения другой.
Мы можем наблюдать, что доверительные интервалы для средних не включают в себя средние значения сравниваемых выборок. Следовательно, можно предположить, что различия между выборками статистически значимы. Для доказательства проведем дальнейший анализ.

3. Доказательная статистика.


Плагин ESCI JSMS.

  1. Ввод данных

Откройте программу ESCI JSMS.xls. В правом окне (в желтой области) очистите содержимое ячеек от данных, вставьте ваши данные в два столбца соответственно.

  1. Работа с графиком

Посмотрите на полученный график (Рисунок 9).

Синие прозрачные точки – наши данные.

Черная точка – среднее значение, черная линия – 99% доверительный интервал для среднего значение.

Красный треугольник – разница между средними значениями, а красная линия – 99% интервал для разности.

Важно: если доверительный интервал для разности накрывает ноль – различия между выборками статистически не значимы. На рисунке 9 показано: ДИ для разности не накрывает ноль, что говорит о найденном статистически значимом различии между выборками.


Рисунок 9 Различия между двумя выборками.



  1. Работа с таблицей:

Обратите внимание на таблицу «Описательная статистика» (Descriptive statistics).


Рисунок 10 Описательная статистика
n1, n2 – объем выборки.

M1, M2 – средние значения (Mean)

Сl- to - доверительный интервал для средних

SD – стандартное отклонение

Effect Size – размер эффекта – показывает разницу между средними значениями выборок.( измеряется в единицах выборки).

t- критерий Стъюдента

p – двухстороннее p- значение

Pooled s – совокупное стандартное отклонение

Сohen’s d - Размер эффекта по Коэну

Cl on the difference – 99%ый ДИ для размера эффекта
Все данные показатели нужны для доказательства или опровержения различия между двумя исследуемыми выборками. Заполните поля в Вашей таблице (Шаблон).

Интерпретация некоторых показателей:
Традиционная интерпретация P-значений (шкала Michelin)



Интерпретация размера эффекта по Коэну

Размер эффекта, ES (d)

Градация эффекта

0,2 – 0,5

Малый (слабый)

0,5 – 0,8

Умеренный

> 0,8

Большой (сильный)


4. Отношение правдоподобий.


Бейзов фактор, BF.- отношение правдоподобий. Характеризует меру правдоподобия нулевой гипотезы .

- гипотеза об отсутствии различий.

  1. Откройте Интернет браузер. Пройдите по ссылке: http://pcl.missouri.edu/bayesfactor.

  2. Выберите: Grouped or two-sample t-tests.

  3. Введите: Sample Size for Group 1- размер первой выборки n1.

Sample Size for Group 2 – размер второй выборки n2.

t-value – значенин t –критерия Стьюдента.

Scale r on effect size – 1.0.

  1. Нажмите: «Отправить».

  2. Выпишите значение: Scaled JZS Bayes Factor.


В нашем случае: Scaled JZS Bayes Factor = 0.000537149. Это означает, что нулевая гипотеза об отсутствии различий менее правдоподобна, чем альтернативная гипотеза о наличии различий. То есть альтернативная гипотеза Н1 правдоподобней нулевой гипотезы H0 в 1852 раза.


5. Планирование эксперимента


Поиск предсказательных интервалов при повторных экспериментах для размера эффекта вероятности воспроизведения.

  1. Откройте программу LePrep.Отметьте Replication (Повторение).

  2. Введите число степеней свободы (degrees of freedom).

Df = (n1+n2)-2;

  1. Поставьте галочку на interval estimates (Интервальная оценка)

  2. Отметьте Standartized. Введите в соответствующее поле значение размера эффекта по Коэну (Cohen)

  3. Отметьте t. Введите значение t – критерия Стьюдента. Проверьте, совпало ли p – значение - окно «twotailed p».




Рисунок 11 Совпадение р-значения в LePrep и ESCI JSMS


  1. Отметьте Prediction intervals (интервал предсказания). Выберите значение 99%.

  2. Обратите внимание на значение в окне «effect size in a replication» (размер эффекта при повторе) (см. Рисунок 12) – в данном интервале будет находиться размер эффекта при повторном эксперименте. Выпишите данное значение в графу: «99%-й ПИ для dc» (В примере на Рисунке 12 99%-й ПИ для dc: [-1.115,-0.326])




Рисунок 12 Значение параметров при повторном эксперименте

Полученные значения на Рисунке 12:

[-0.992,-0.436] – оценочный интервал для размера эффекта по Коэну при бесконечном числе повторов опыта

[-10.663,-3.110] – предсказательный интервал для критерия Стьюдента при повторном эксперименте

[0, 9.8121∙10-04] – предсказательный интервал для р-значения при повторном эксперименте

[-1.115, -0.326] - предсказательный интервал для размера эффекта по Коэну при повторном эксперименте

Интервалы важны для оценки, так как они отражают возможные значения, а не частные, как точечные оценки


  1. Нестандартизированный размер эффекта

Отметьте Unstandardized. Введите значение размера эффекта в единицах измерения выборки (ES). Выпишите данное значение в графу: «99%-й ПИ для ES»

Проследите как изменились интервалы и совпали ли они с интервалами из ESCI JSMS (Рисунок 13). Какие выводы можно сделать?



Рисунок 13 Значение интервалов для нестандартизированного размера эффекта


  1. Отметьте psrep - вероятность воспроизведения. Вероятность получения такого же результата в последующих экспериментах.

Посмотрите на рисунок 14. Окно psrep.

Psrep- вероятность воспроизведения.

Окно p – предсказательный интервал для вероятности воспроизведения. Выпишите данные значения в графу: «Вероятность воспроизведения, Psrep с 99%-ым ПИ».



Рисунок 14 вероятность воспроизведения (psrep)
Мощность критерия и необходимый минимальный объем выборки:

  1. Откройте программу G*Power.

  2. Расчет мощности критерия

  1. На вкладке test family выберите t tests

  2. На вкладке Statistical tests (Статистические тесты) выберите Means: difference between two independent means(two groups). (Среднее: различие между двумя независимыми средними (две группы))

  3. На вкладке type of power analysis (тип анализа мощности) выберите Post hoc: Compute achieved power…( После получения данных: расчет достигнутой мощности )

  4. В окне Input Parameters (Входные параметры):

    1. отметьте tail(s) – two.

    2. в поле Effect size введите значения размера эффекта по Коену (стандартизированного) (см. графу «Размер эффекта по Коэну, d в таблице).

    3. в поля Sample size group 1 (2) введите объемы выборок (см. n1, n2 в таблице).

  5. Нажмите Calculate (Расчет). В графу «Достигнутая мощность, 1 – β» выпишите значение Power( 1 – β err prob).

  6. Окно Output Parameters (Выходные параметры): выпишите значение Power (1-β) в графу «Достигнутая мощность, 1 – β».




Рисунок 15 расчет мощности критерия


  1. Необходимый минимальный объем выборки:




  1. На вкладке type of power analysis выберите A priori:Compute required sample size…(До получения данных: Расчет требуемого объема выборки)

  2. В окне Power (1-β) введите значение 0,95 (в идеале он должен быть 1)

  3. В окне allocation ratio введите отношение объемов выборки n1 и n2.

  4. Нажмите Calculate. (Расчет)

  5. В графу: «Необходимые минимальные объемы выборок при α = 0,01 и 1 – β = 0,95» выпишите значения sample size group 1(2) для выборок n1(n2).




Рисунок 16 расчет необходимого минимального объема выборки
Что можно сказать по графикам? Достаточен ли был объем выборок? Достаточно ли одного изолированного исследования, чтобы сделать определенные выводы?





Похожие:

Тема Согласование описательных, доказательных и предсказательных статистик при сравнении двух независимых выборок iconПроверка равенства дисперсий двух и более нормальных выборок
Имеются две или несколько независимых выборок из нормальных распределений. Критерии, используемые для проверки равенства дисперсий:...
Тема Согласование описательных, доказательных и предсказательных статистик при сравнении двух независимых выборок iconН. Э. Баумана. Проверка однородности двух независимых выборок
В настоящем приложении приведены примеры типовых задач, которые решаются на занятиях по эконометрике на факультете "Инженерный бизнес...
Тема Согласование описательных, доказательных и предсказательных статистик при сравнении двух независимых выборок iconПервичные описательные статистики глава 4 первичные описательные статистики
Компактное описание группы при помощи первичных статистик позволяет интерпрети­ровать результаты измерений, в частности, путем сравнения...
Тема Согласование описательных, доказательных и предсказательных статистик при сравнении двух независимых выборок iconИнтервальные оценки
Если для выборок большого объема точность обычно бывает достаточной (при условии несмещенности, эффективности и состоятельности оценок),...
Тема Согласование описательных, доказательных и предсказательных статистик при сравнении двух независимых выборок iconИнтервальные оценки
Если для выборок большого объема точность обычно бывает достаточной (при условии несмещенности, эффективности и состоятельности оценок),...
Тема Согласование описательных, доказательных и предсказательных статистик при сравнении двух независимых выборок iconУрок Тема: Encontros de trabalho Грамматика § Согласование времен Indicativo. Косвенная речь
Охватывает практически в полном объеме все основные грамматические категории продвинутого этапа обучения, а именно: условное наклонение,...
Тема Согласование описательных, доказательных и предсказательных статистик при сравнении двух независимых выборок icon1. основные этапы статистического анализа данных 5
Сравнение средних значений количественных признаков двух зависимых (связанных) выборок 36
Тема Согласование описательных, доказательных и предсказательных статистик при сравнении двух независимых выборок icon* в формуле 40) дадут перечисление неупорядоченных к -выборок без повторений, т е. сочетаний без повторений из
Если заменить числа на объекты, то коэффициенты при в формуле 40 дадут перечисление неупорядоченных к -выборок без повторений, т...
Тема Согласование описательных, доказательных и предсказательных статистик при сравнении двух независимых выборок iconРасчёт экономической эффективности нагрева 1 м3 воды с 10 оС до 65 оС при использовании электроэнергии по льготному ночному тарифу в сравнении с газовой котельной
С при использовании электроэнергии по льготному ночному тарифу в сравнении с газовой котельной
Тема Согласование описательных, доказательных и предсказательных статистик при сравнении двух независимых выборок iconЛекция 12. Сравнение средних значений признака
Важнейшей задачей анализа двух выборок является вопрос о наличии различий между выборками. Напомним, что выборки однородны, если...
Разместите кнопку на своём сайте:
ru.convdocs.org


База данных защищена авторским правом ©ru.convdocs.org 2016
обратиться к администрации
ru.convdocs.org