Анализ динамических рядов и построение уравнения многофакторной корреляционной связи

Автор работы: Пользователь скрыл имя, 26 Марта 2012 в 08:34, курсовая работа

Краткое описание

Курсовая работа имеет комплексный характер, ее выполнение включает следующие стадии:
Проведение качественного анализа таблицы исходных динамических рядов.
Выпрямление исходных динамических рядов, при необходимости.
Расчёт показателей вариации динамических рядов. Ранжирование признаков-факторов.
Количественное измерение тесноты связи между динамикой признака-функции и определённого числа признаков-факторов методом парной корреляции.
Построение уравнения многофакторной корреляционной связи признака-функции с наиболее значимыми признаками-факторами.

Содержание работы

Введение
1. Качественный анализ таблицы исходных динамических рядов
1.2. Понятие о динамических рядах.
1.2 Анализ исходных динамических рядов
1.2.1. Исследование исходных динамических рядов на непрерывность
1.2.2. Характеристика динамики исходных динамических рядов
1.2.3. Анализ характера связи между изучаемым обобщающим признаком и признаками-факторами
2. Расчет показателей вариации динамических рядов
2.1. Понятие вариации динамических рядов
2.2. Расчет показателей вариации
3. Количественное измерение тесноты связи признака-функции и признаков-факторов методом парной корреляции
3.1. Понятие корреляции
3.2. Анализ коэффициентов парной корреляции
4. Построение уравнений многофакторной корреляционной связи
4.1. Понятие множественной регрессии
4.2. Построение уравнения множественной регрессии
Заключение
Список использованной литературы

Содержимое работы - 1 файл

Статистика моя курсовая!.doc

— 609.50 Кб (Скачать файл)

Для измерения вариации признаков (их вариабельность) в пределах совокупности или ее частей используются следующие показатели:

Самым элементарным показателем вариации признака явля­ется размах вариации (R), определяемый как разность между наибольшим (xmax) и наименьшим (xmin) значениями признака у единиц совокупности:

                                                    (2.1.)     

Однако размах вариации показывает лишь крайние от­клонения признака и не отражает отклонения всех вариан­тов в ряду. При изучении вариации нельзя ограничиваться только определением ее размаха. Для анализа вариации не­обходимы показатели, которые отражают все колебания варьи­рующего признака и дают обобщённую характеристику.

В практических расчетах экономической статистики применяют следующие показатели вариации:

1. Среднее линейное отклонение – средняя арифметическая из абсолютных отклонений индивидуальных значений признака от его расчетной базы (модуля или устойчивой средней).

1) - для дискретного ряда                                                         (2.2.)

2)   - для вариационного ряда с неравными частотами  (2.3.)

Где: – значение признака i-ой группы; – среднее значение признака в исследуемой совокупности; – число единиц совокупности;   – число единиц i-ой группы (частоты).

Среднее линейное отклонение как меру вариации признака применяют в статистической практике ред­ко (только в тех случаях, когда суммирование показателей без учета знаков имеет экономический смысл). С его помощью, например, анализируется состав работающих, ритмичность производства, оборот внешней торговли.

2. Дисперсия – показатель, нивелирующий незначительные колебания в значениях признака, тем самым, исключая анализ сторонних влияний на признак, поэтому часто используется для оценки вариации.

1)        - для дискретного ряда                                             (2.4.)

2)   - для вариационного ряда                                         (2.5.)

3. Среднее квадратическое отклонение регистрирует интервал колебания признака.

1)       - для дискретного ряда                                            (2.6.)

2)      - для вариационного ряда                                  (2.7.)

Среднее квадратическое отклонение - это обобщаю­щая характеристика размеров вариации признака в совокупности. Оно показывает, на сколько в среднем отклоняются конкретные варианты от их среднего значения; является абсолютной мерой колеблемости признака и выражается в тех же единицах, что и варианты, поэтому экономически хорошо интерпретируется.

Чем меньше значение дисперсии и среднего квадратического отклонения, тем лучше средняя арифметическая отражает собой всю представляемую совокупность.

Среднее квадратическое отклонение имеет два знака. Это позволяет регламентировать (уточнять) допустимые границы (пределы) вариации признака:

границы колебания признака

Нормативные значения показателей вариации устанавливаются с учетом содержания признака. Например:

-          устойчивые количественные признаки характеризуются нормативным значением: = 8-10%;

-          то же для качественных признаков: =3-5%.


4. Коэффициент вариации - относительная величина, используемая для оценки вариаций различных признаков.

1) Для количественных признаков (от среднего линейного отклонения):

                                                    (2.8.)

2) Для качественных и количественных признаков с высокой долей качества (от среднего квадратического отклонения):

;                                                    (2.9.)                        

Где: - среднее линейное отклонение; хi - значение признака i-ой группы; - среднее значение признака в исследуемой совокупности; п - число единиц совокупности; fi - число единиц i-й группы (частота или частость).

           Для количественных признаков применяется линейный коэффициент вариации, для качественных и количественных с высокой долей качества – коэффициент вариации. Наиболее устойчивыми признаются признаки с наименьшим линейным отклонением или коэффициентами вариации.

 

2.2.           Расчет показателей вариации

Для построения уравнения множественной регрессии сначала необходимо оценить признаки-факторы на вариабельность (устойчивость). Для этого необходимо произвести расчет показателей вариации для каждого из признаков.

Программа «Elvis» производит расчет показателей вариации признаков. Полученные результаты расчетов для каждого из признаков следующие:

 

Таблица 6

Показатели вариации для соответствующих признаков

Признак

Линейный коэффициент вариации

1-ый

Y

.226253E+02

2-ой

.225757E+02

3-ий

.154326E+02

4-ый

.135370E+02

5-ый

.224211Е+02


 

Для составления уравнения многофакторной корреляционной связи следует выбрать два наиболее результативных признака-фактора. В нашем случае анализ линейных коэффициентов вариации позволяет заключить, что Х1 и Х2 признаки-факторы являются устойчивыми.

 

 

 

 

 

 


3. Количественное измерение тесноты связи признака-функции и признаков-факторов методом парной корреляции

 

3.1. Понятие  корреляции

Основной задачей корреляционного анализа является  выявление связей между случайными переменными и оценка её тесноты. Исходя из индивидуального задания, необходимо выявление зависимости между общими объемами глубокого разведочного бурения (Y) и объемами глубокого поискового разведочного бурения, разведочного бурения на нефть и газ и на природный газ. (X).

Корреляцией называют важнейший частный случай статистической связи, состоящий в том, что разным значениями одной переменной соответствуют различные средние значения другой. С изменением значения признака х закономерным образом изменяется среднее значение признака у; в то время как в каждом отдельном случае значение признака у (с различными вероятностями) может принимать множество различных значений.

В статистике различают следующие варианты зависимостей:

1. Парная корреляция – связь между двумя признаками (результирующим и факторным или двумя факторными).

2. Частная корреляция – зависимость между результирующим и одним факторным признаками при фиксированном значении других факторных признаков.

3. Множественная корреляция – зависимость результативного и двух или более факторных признаков, включаемых в исследование.

Парный линейный коэффициент корреляции. При прямолинейной форме связи между признаком-функцией и признаком-фактором показатель тесноты связи двух признаков определяется по формуле линейного коэффициента корреляции r, рассчитанного по формуле (3.1.):

                                       (3.1.)

где - значения признаков х и у соответственно для i-ro объекта;  - средние арифметические значения этих признаков.

 

Или по формуле:

,                                                (3.2.)

где - средние значения  признаков х и у; - среднеквадратичное отклонения этих признаков.

 

Отметим, что .Чем ближе к единице, тем сильнее связь. Если , то между признаком-функцией и признаком-фактором существует прямая зависимость (увеличение или уменьшение одного признака сопровождается аналогичным изменением другого признака); а если , то между признаками существует обратная связь (увеличение или уменьшение одного признака сопровождается противоположным по направлению изменением другого признака). Равенство коэффициента нулю () свидетельствует об отсутствии линейной связи. Равенство коэффициента  -1 или +1 показывает наличие функциональной связи.

Оценкой тесноты связи при криволинейной зависимости служит индекс корреляции (форма корреляционного отношения). Он определяется по формуле:

                                                             (3.3.)

где - общая дисперсия результативного признака, отображающая совокупное влияние всех признаков;   - остаточная дисперсия, отображающая вариацию результативного признака от всех прочих, кроме факторов – признаков.

 

Справедливо и следующее соотношение:

                     (3.4.)

где - индивидуальные значения результативного признака; - его общее среднее значение; индивидуальные значения у по уравнению связи.

 

Поскольку исходное поле качественное, ряды непрерывны и сонаправлены, и имеет место балансовая связь, допустимо в качестве показателя тесноты связи между признаком-функцией и признаком-фактором принять линейный (парный) коэффициент корреляции.

 

3.2. Анализ коэффициентов парной корреляции

Этот анализ выполняется для всех видов связи (кроме полной балансовой) между признаками-функциями и признаками-факторами. Цель данного анализа - получение коэффициента парной корреляции. На основе исходного информационного поля были получены следующие коэффициенты парной корреляции:

Таблица 7

Полученные коэффициенты парной корреляции

Пара признаков

Коэффициент парной корреляции

1-я

.994440E+00

2-я

.794928E+00

3-я

.668167E+00

4-я

-.548484Е-01


 

Таким образом мы видим, что наиболее надежной является связь признака-функции с признаком-фактором Х1. Знак перед коэффициентом корреляции говорит о прямой или обратной связи между признаком-функцией и признаком-фактором. Соответственно, если знак «+» связь прямая, если «-» - обратная, что находит свое отражение при последующем отборе признаков для построения уравнения множественной регрессии (т.к. нельзя брать признаки, имеющие коэффициенты с разными знаками).

Выполним ранжирование признаков по коэффициенту парной корреляции по мере его убывания:

1)      Объем глубокого разведочного бурения на нефть и газ (Х1) = 0,994;

2)      Объем глубокого разведочного бурения на природный газ (Х2) = 0,795;

3)      Объем глубокого разведочного поискового бурения (Х3) = 0,668;

4)      Объем глубокого опорного и параметрического бурения (Х4) = -0,055.

Значения 1,2,3 коэффициентов имеют одинаковый знак и корректны, что подтверждает линейный характер связи, причём данные значения положительны, что говорит о прямой связи между признаком-функцией и признаком-фактором. Значение 4-ого признака отрицательно по знаку, что значит что связь имеет обратный характер.  Анализ коэффициентов парной корреляции позволяет заключить, что связь между общим объемом глубокого разведочного бурения (Y) и объемами бурения на нефть и газ (Х1) и глубокого бурения на природный газ (Х2) достаточно надежна. Важно отметить, что Х3, Х4 некачественные сводки таблицы, не влияющая на выбор признака-фактора для построения уравнения множественной регрессии .


4. Построение уравнений многофакторной корреляционной связи

 

4.1. Понятие  множественной регрессии

Основными задачами регрессионного анализа являются установление формы зависимости между переменными, оценка функции регрессии, оценка неизвестных значений (прогноз значений) зависимой переменной.

Регрессия – это  зависимость среднего значения одной величины y от другой величины (или нескольких величин) х.

        Существует несколько видов регрессии:

1.       числа явлений (переменных), учитываемых в регрессии, различают:

       простую регрессию. Она представляет собой регрессию между двумя переменными;

       множественную или частную регрессию. Это регрессия между зависимой переменной у и несколькими причинно обусловленными независимыми переменными х1, х2, …, хm. В случае множественной регрессии предполагается существование множества одновременно развивающихся не зависимых друг от друга цепей причинно-следственных связей, среди которых часть может соответствовать прямой зависимости, а часть – обратной.

Информация о работе Анализ динамических рядов и построение уравнения многофакторной корреляционной связи