Статистический анализ данных выборочного наблюдения

Автор работы: Пользователь скрыл имя, 10 Апреля 2012 в 16:54, курсовая работа

Краткое описание

Целью данного курсового проекта является освоение инструментов статистики для дальнейшего применения в решении управленческих задач. В качестве задач курсового проекта следует выделить следующее:
1. Овладение методами выполнения оценок параметров больших множеств по данным выборочного наблюдения;
2. Приобретение навыков работы с большими массивами данных и навыки представления данных статистического наблюдения в виде, удобном для восприятия, анализа и принятия решений;
3. Развитие аналитических навыков в ходе применения вариационного метода интерпретации полученных результатов.

Содержание работы

Введение……………………………………………………………………………………………….3

1. Сводка и группировка данных статистического наблюдения……………………………………...4
2. Вариационный анализ……………………………………………………………………………….. 8
3. Проверка гипотезы о нормальном характере распределения……………………………………...10
4. Корреляционно-регрессионный анализ……………………………………………………………. 11
5. Множественный корреляционно-регрессионный анализ………………………………………….15
6. Анализ качественных признаков……………………………………………………………...……..16
7. Интервальные оценки………………………………………………………………………………...18

Заключение………………………………………………………..………………………… ………....19
Литература………………………………………………………………………………………………20

Содержимое работы - 1 файл

Трифонова Ольга, 8202 на 5.doc

— 4.09 Мб (Скачать файл)

Нам необходимо дать краткую характеристику нормального распределения и проверить гипотезу о нормальном законе распределения по указанному в задании признаку. Можно воспользоваться критерием согласия Пирсона (χ 2 -квадрат). Идея критерия Пирсона заключается в расчете и последующей оценке значений, которые бы имели место в случае нормального характера распределения. Чем больше размер этих отклонений, тем меньше оснований считать распределение близким к нормальному.

 

Баллы по тренингу Продажа (t)

Число участников (Эмпирические частоты)

Теоретические частоты

χ2

46

17

6,3

18,31

52

11

11,2

0,00

58

20

19,5

0,01

65

15

21,5

1,97

71

22

22,2

0,00

77

13

19,2

2,01

83

16

14,0

0,28

80

21

19,6

0,11

 

 

 

22,69

Если значение статистики «Хи-квадрат» больше критического значения, то это является свидетельством того, что наблюдаемые частоты значимо отличаются от тех, которые ожидаются. В этом случае следует отклонить нулевую гипотезу и принять альтернативную гипотезу, сделав вывод о том, что наблюдаемые выборочные проценты значимо отличаются от заданных опорных значений.

Если значение статистики «Хи-квадрат» меньше критического значения, то наблюдаемые значения не очень отличаются от значений, которые можно ожидать.  В этом случае следует принять нулевую гипотезу (как приемлемую возможность) и сделать вывод, что наблюдаемые выборочные проценты не имеет значимых отличий от заданных опорных значений.

 

 

 

Используя функцию ХИ2ОБР для уровня значимости 0,05 и степени свободы

10, получаем 14,07

22,69

>

14,07

  

    Вывод: В этом пункте мы проверяли гипотезы о нормальном распределении признака БТП. Был использован критерий Пирсона. Через функцию ХИ2ОБР мы получили оценку значения, равную 14,07. В нашем случае получается 14,07 меньше 22,69. Отсюда делаем вывод, что нет оснований отклонить гипотезу о нормальном распределении выборки по признаку Баллы по тренингу "Продажа"

2. Графический метод

Наиболее простой, но весьма приближенный метод оценки согласия результатов с тем или иным распределением – графический. По этому методу результаты  располагают в вариационном ряду. Затем для каждого результата xi рассчитывают накопленную частость по формуле , где i – номер результата в вариационном ряду, n – объём выборки. Используя накопленные частости как значения функции распределения, для каждого W(i) находят соответствующие значения квантиля предполагаемого распределения. В частности, для нормального распределения находят квантили стандартного нормального распределения zi. Результаты наносят на график в координатах x – z. Поскольку предполагается, что значения xi являются квантилями того же вида распределения, что и zi, между значениями x и z должна быть линейная зависимость. Если нанесенные на график точки укладываются вдоль прямой линии лишь с небольшими отклонениями, считается, что результаты удовлетворительно описываются выбранным теоретическим распределением. При больших отклонениях от прямой экспериментальное распределение не соответствует выбранному теоретическому. Возможна также оценка допустимых величин отклонений от прямой.

 

                                                                                                                               Здесь использовали графический 

                                                                                                                                 метод для проверки гипотезы о

                                                                                                                                 нормальном распределении призна-

                                                                                                                                 ка БТП. Так как нанесенные на гра-

                                                                                                                                 фик точки укладываются вдоль 

                                                                                                                                 прямой линии лишь с незначитель-

                                                                                                                                 ными отклонениями, то результаты

                                                                                                                                 удовлетворительно описываются

                                                                                                                                 выбранным теоретическим распре

                                                                                                                                 делением. Т.е. в данном случае нор-

                                                                                                                                 мальном. Соответственно нет осно

                                                                                                                                 ваний отклонить гипотезу.

4. Корреляционный анализ между показателем «БТП» по всем представленным в наблюдении признакам.

 

1. Использую функцию КОРРЕЛ() рассчитать коэффициент корреляции между признаками.

 

 

 

 

 

 

 

 

 

 

Баллы по тренингу "Продажа"

Баллы по тренингу "Новая техника"

Баллы по тренингу "Сервисное обслуживане"

Возраст

Опыт работы

IQ

EQ

Средняя зарплата/месяц

Баллы по тренингу "Продажа"

1,00

0,02

-0,03

-0,05

-0,03

0,02

1,00

0,01

Баллы по тренингу "Новая техника"

0,02

1,00

-0,83

-0,85

-0,83

-0,13

0,02

-0,80

Баллы по тренингу "Сервисное обслуживане"

-0,03

-0,83

1,00

0,97

1,00

0,07

-0,04

0,91

Возраст

-0,05

-0,85

0,97

1,00

0,97

0,06

-0,05

0,93

Опыт работы

-0,03

-0,83

1,00

0,97

1,00

0,07

-0,04

0,91

IQ

0,02

-0,13

0,07

0,06

0,07

1,00

0,02

0,02

EQ

1,00

0,02

-0,04

-0,05

-0,04

0,02

1,00

0,01

Средняя зарплата/месяц

0,01

-0,80

0,91

0,93

0,91

0,02

0,01

1,00

                        Корреляция - это статистическая зависимость между случайными величинами, при которой изменение одной из случайных величин приводит к изменению другой.

  Корреляционная решетка – это аналитическая группировка единиц совокупности по двум признакам, между которыми оценивается связь. По расположению и концентрации единиц на поле корреляционной решетки можно сделать предположение о наличии и направлении связи, а также предварительную оценку тесноты связи.

                         Поле корреляции – это графическое отображение связи между переменными,  это множество точек, координатами которых являются пары значений признаков  по всем единицам совокупности. Анализируя график, следует оценить, насколько  характер распределения точек на координатном поле подтверждает или не подтверждает. При отсутствии тесных связей имеет место беспорядочное расположение точек на графике. Чем сильнее связь между признаками, тем теснее будут группироваться точки вокруг определенной линии, выражающей форму связи.

Если коэффициент корреляции равен до ±0,3, то связь между признаками почти отсутствует, от ±0,3 до ±0,5- связь слабая, от±0,5 до ±0,7 связь умеренная, от ±0,7 до ±1,0 связь сильная. По таблице можно сказать, что самая сильная связь существует между БТП и EQ.

 

Вывод: В данном пункте была проведен корреляционный анализ между показателями БТП по всем представленным признакам.  Для этого создали  корреляционную решетку. Нашли, что самая сильная связь существует между БТП и EQ.

 

2. Построить график корреляционного поля между признаком БТП и остальными признаками (кроме качественных)

 

                                                                                     

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

                                                                                               

 

 

   

 

 

                                                                                             

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

                                   

Вывод:   Здесь с помощью поле корреляции также был проведен корреляционный анализ. На графике видно, что сильная связь присутствует между признаками БТП и EQ, т.к точки располагаются и группируются на графике очень тесно вокруг линии, выражающей форму связи.

 

5. Построить уравнение линейной регрессионной связи результативного признака с факторным признаком, наиболее тесно связанным с результативным.

Информация о работе Статистический анализ данных выборочного наблюдения