Статистическая проверка гипотез

Автор работы: Пользователь скрыл имя, 08 Декабря 2011 в 01:08, лабораторная работа

Краткое описание

Цель работы данной работы ознакомиться с процессом проверки статистических гипотез.
Поставленная цель определила задачи работы:
1. Определить сущность, понятие проверки статистических гипотез.
2. Рассмотреть этапы проверки статистических гипотез.
3. Рассмотреть критерии проверки статистических гипотез.

Содержание работы

ВВЕДЕНИЕ 3
ТЕОРИТИЧЕСКАЯ ЧАСТЬ 4
1. Сравнение двух дисперсий нормальных генеральных совокупностей 7
2. Сравнение двух средних генеральных совокупностей 8
3. Сравнение двух вероятностей биномиальных распределений 10
4. Проверка гипотезы о значимости выборочного коэффициента корреляции 11
5. Критерий согласия Пирсона 12
ПРАКТИЧЕСКАЯ ЧАСТЬ 14
ЗАКЛЮЧЕНИЕ 18
СПИСОК ЛИТЕРАТУРЫ 19
ПРИЛОЖЕНИЕ 1 20
ПРИЛОЖЕНИЕ 2 21
ПРИЛОЖЕНИЕ 3 22
ПРИЛОЖЕНИЕ 4 23

Содержимое работы - 1 файл

Федеральное государственное образовательное бюджетное учреждение высшего профессионального образования ФИНА

— 238.47 Кб (Скачать файл)

     а) Н1: М (Х) ≠ М (Y)  – критическая область двусторонняя, zкр определяется как аргумент функции Лапласа, при котором и критическая область задается неравенством |Z| > zкр.

     б) Н1: М (Х) > М (Y) – критическая область правосторонняя, zкр определяется как аргумент функции Лапласа, при котором и критическая область определяется неравенством Z > zкр.

     в) Н1: М (Х) < М (Y) – критическая область левосторонняя, заданная неравенством Z < -zкр, где zкр вычисляется так же, как в предыдущем случае.

     2) Имеются две независимые выборки  большого объема, извлеченные из  генеральных совокупностей, законы  распределения и дисперсии которых  неизвестны. При этом для объема  выборки, не меньшего 30, можно  считать, что выборочные средние  распределены приближенно нормально,  а выборочные дисперсии являются  достаточно хорошими оценками  генеральных дисперсий (следовательно,  считаем известными приближенные  значения генеральных дисперсий). Тогда задача сводится к предыдущей, и статистический критерий имеет вид:

                                      

     Наблюдаемое значение критерия вычисляется по формуле

                           

     При этом выбор вида критической области  и определение критических точек  проводятся так же, как в пункте 1.

     3) Генеральные совокупности распределены  нормально, причем их дисперсии  неизвестны, а объем выборок  т и п мал (следовательно, нельзя получить хорошие оценки генеральных дисперсий). Если предположить, что генеральные  дисперсии равны, то в качестве критерия для проверки нулевой гипотезы Но: М (Х) = М (Y) служит случайная величина

                        ,

     имеющая при справедливости нулевой гипотезы распределение Стьюдента с k = n + m – 2 степенями свободы.  Наблюдаемое значение критерия вычисляется по формуле

                      .

     Критическая область строится в зависимости  от вида конкурирующей гипотезы.

     а) Н1: М (Х) ≠ М (Y)  – критическая область двусторонняя, задаваемая неравенством |T| > tдвуст.кр., где tдвуст.кр.(α, k) находится из таблицы критических точек распределения Стьюдента.

     б) Н1: М (Х) > М (Y) – критическая область правосторонняя, определяемая условием T > tправ.кр.. Критическая точка вновь находится по таблице критических точек распределения Стьюдента.

     в) Н1: М (Х) < М (Y) – критическая область левосторонняя, T < – tправ.кр.. 

  1. Сравнение двух вероятностей биномиальных распределений

     Пусть известны результаты двух серий независимых  испытаний: в первой серии проведено  п1 опытов, и событие А появилось т1 раз; во второй серии из п2 опытов событие А появилось т2 раз. Обозначим неизвестную вероятность появления события А в одном опыте первой серии через р1, а во второй серии – через р2. Требуется проверить при уровне значимости α нулевую гипотезу о равенстве этих вероятностей: Но: р1 = р2.

     В качестве критерия выбирается нормированная  нормально распределенная случайная  величина

                                   .

     Наблюдаемое значение критерия вычисляется по формуле:

                              .

     Построение  критической области:

     а) при конкурирующей гипотезе Н1: р1 ≠ р2 uкр определяется из равенства , и двусторонняя критическая область задается неравенством |U| > uкр.

     б) при конкурирующей гипотезе Н1: р1 > р2 uкр для правосторонней критической области находится из условия , и вид критической области: U > uкр.

     в) при конкурирующей гипотезе Но: р1 < р левосторонняя критическая область имеет вид U < – uкр, где uкр находится по формуле из пункта б). 

  1. Проверка  гипотезы о значимости выборочного коэффициента корреляции

     Пусть имеется выборка объема п из нормально распределенной двумерной генеральной совокупности (Х, Y), и по ней найден выборочный коэффициент корреляции rB ≠ 0. Требуется при заданном уровне значимости α проверить нулевую гипотезу о равенстве нулю генерального коэффициента корреляции:

     Ho: rГ = 0 при конкурирующей гипотезе Н1: rГ ≠ 0. Критерием является случайная величина

                                              ,

     имеющая при справедливости нулевой гипотезы распределение Стьюдента с k = n – 2 степенями свободы. Критическая область при заданном виде конкурирующей гипотезы является двусторонней и задается неравенством |T|> tкр, где tкр(α, k) находится по таблице критических точек распределения Стьюдента. 

 

  1. Критерий  согласия Пирсона

     Критерием согласия называется критерий проверки гипотезы о предполагаемом законе неизвестного распределения.

     Пусть по выборке объема п получено эмпирическое распределение:

Варианты  xi      x1         x2       ...        xs
Частоты ni      n1         n2       ...        ns
 

     С помощью критерия Пирсона можно  проверить гипотезу о различных  законах распределения генеральной  совокупности (равномерном, нормальном, показательном и др.). Для этого в предположении о конкретном виде распределения вычисляются теоретические частоты , и в качестве критерия выбирается случайная величина

                                           ,

     имеющая закон распределения χ2 с числом степеней свободы

k = s – 1 – r, где s – число частичных интервалов выборки, r – число параметров предполагаемого распределения. Критическая область выбирается правосторонней, и граница ее при заданном уровне значимости α находится по таблице критических точек распределения χ2.

     Теоретические частоты  вычисляются для заданного закона распределения как количества элементов выборки, которые должны были попасть в каждый интервал, если бы случайная величина имела выбранный закон распределения, параметры которого совпадают с их точечными оценками по выборке, а именно:

     а) для проверки гипотезы о нормальном законе распределения 

= п ∙ Рi, где п – объем выборки, xi и xi + 1 – левая и правая границы i-го интервала, - выборочное среднее, s – исправленное среднее квадратическое отклонение. Поскольку нормальное распределение характеризуется двумя параметрами, число степеней свободы k = n – 3;

     б) для проверки гипотезы о показательном  распределении генеральной совокупности в качестве оценки параметра λ  принимается  . Тогда теоретические частоты = п ∙ Рi, . Показательное распределение определяется одним параметром, поэтому число степеней свободы k = n – 2;

     в) для проверки гипотезы о равномерном  распределении генеральной совокупности  концы интервала, в котором наблюдались  возможные 

     значения  Х, оцениваются по формулам:

                           

     Тогда плотность вероятности 

     

     Число степеней свободы k = n – 3, так как равномерное распределение оценивается двумя параметрами. 

 

     

     ПРАКТИЧЕСКАЯ ЧАСТЬ

     Пример 1.

     Даны  две независимые выборки объемов  п1 = 10 и п2 = 15, извлеченные из генеральных совокупностей Х и Y, распределенных по нормальному закону. Найдены исправленные выборочные дисперсии и Проверим при уровне значимости α = 0,05 нулевую гипотезу о равенстве генеральных дисперсий при конкурирующей гипотезе H1:  D (X) > D (Y).

     Решение.

     Найдем  значение Критическая область – правосторонняя. Вычислим наблюдаемое значение критерия:

     Следовательно, нет оснований отвергнуть нулевую  гипотезу. 

     Пример 2.

     Имеются независимые выборки значений нормально  распределенных случайных величин

       Х: 2, 2, 3, 3, 4, 4, 4, 5, 5, 6     и     Y: 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 5, 7, 8, 9.

     Требуется проверить для уровня значимости α = 0,1 при условии равенства генеральных  дисперсий нулевую гипотезу Но: М (Х) = М (Y) при конкурирующей гипотезе Н1: М (Х) ≠ М (Y).

     Решение.

     Объемы  выборок т = 10, п = 15. Вычислим выборочные средние и исправленные выборочные дисперсии:   Вычислим наблюдаемое значение критерия: Критическая область – двусторонняя, tдвуст.кр.(0,1; 23) = 1,71. Итак, |Tнабл | < tдвуст.кр., следовательно, нет оснований отвергнуть нулевую гипотезу – можно считать, что математические ожидания генеральных совокупностей равны.

     Пример 3.

       В серии из 20 независимых испытаний  событие А появилось 8 раз, в серии из 15 испытаний – 7 раз. При уровне значимости α = 0,05 проверяется

     нулевая гипотеза Но: р1 = р2 при конкурирующей гипотезе Но: р1 < р2.

     Решение.

     Критическая область – левосторонняя, следовательно, икр = 1,645, и критическая область имеет вид U < - 1,645. Вычислим инабл =   Uнабл > – uкр, следовательно, гипотеза принимается, и можно считать, что вероятность события А в обеих сериях испытаний одинакова. 

     Пример 4.

     По  выборке объема п = 150, извлеченной из нормально распределенной двумерной генеральной совокупности, вычислен выборочный коэффициент корреляции rB = - 0,37. Проверим при уровне значимости α = 0,01 нулевую гипотезу Ho: rГ = 0 о равенстве нулю генерального коэффициента корреляции при конкурирующей гипотезе

     Н1 : rГ ≠ 0.

     Решение.

     Критическая точка tкр(0,01; 150) = 2,58. Вычислим наблюдаемое значение критерия: Поскольку |Tнабл | > tкр, нулевая гипотеза отвергается, то есть Х и Y коррелированы.  

     Пример 5.

     Для выборки, интервальный статистический ряд которой имеет вид 

Номер интервала Границы интервала Эмпирические  частоты
                1          2 – 5                  6
                2          5 – 8                   8
                3          8 – 11                 15 
                4         11 – 14                 22
                5         14 – 17                  14
                6         17 – 20                  5

Информация о работе Статистическая проверка гипотез