Автоматизированный априорный анализ статистической совокупности в среде MS Excel
Лабораторная работа, 01 Мая 2012, автор: пользователь скрыл имя
Краткое описание
В процессе исследования совокупности необходимо решить ряд задач.
I. Статистический анализ выборочной совокупности
1. Выявить наличие среди исходных данных резко выделяющихся значений признаков (аномалий в данных) и исключить их из выборки.
2. Рассчитать обобщающие статистические показатели совокупности по изучаемым признакам: среднюю арифметическую ( ), моду (Мо), медиану (Ме), размах вариации (R), дисперсию( ), среднее квадратическое отклонение ( ), коэффициент вариации (Vσ).
3. На основе рассчитанных показателей в предположении, что распределения единиц по обоим признакам близки к нормальному, оценить:
а) степень колеблемости значений признаков в совокупности;
б) степень однородности совокупности по изучаемым признакам;
в) количество попаданий индивидуальных значений признаков в диапазоны ( ), ( ), ( )..
Содержимое работы - 1 файл
ОТЧЕТ 1,2,3 (шаблон).doc
— 599.00 Кб (Скачать файл)Вывод:
В генеральной совокупности предприятий значение коэффициента а0 следует ожидать с надежностью Р=0,95 в пределах ……………. а0 ….……….., значение коэффициента а1 в пределах …………… а1 ….………… Уменьшение уровня надежности ведет к расширению (сужению) доверительных интервалов коэффициентов уравнения.
- Определение практической пригодности построенной регрессионной модели.
- близость к единице свидетельствует о хорошей аппроксимации исходных (фактических) данных с помощью построенной линейной функции связи ;
- близость к нулю означает, что связь между фактическими данными Х и Y нельзя аппроксимировать как построенной, так и любой другой линейной моделью, и, следовательно, для моделирования связи следует использовать какую-либо подходящую нелинейную модель.
- Пригодность построенной регрессионной модели для практического использования можно оценить и по величине индекса детерминации R2, показывающего, какая часть общей вариации признака Y объясняется в построенной модели вариацией фактора X.
- В основе такой оценки лежит равенство R = r (имеющее место для линейных моделей связи), а также шкала Чэддока, устанавливающая качественную характеристику тесноты связи в зависимости от величины r.
- Согласно шкале Чэддока высокая степень тесноты связи признаков достигается лишь при >0,7, т.е. при >0,7. Для индекса детерминации R2 это означает выполнение неравенства R2 >0,5.
- При недостаточно тесной связи признаков X, Y (слабой, умеренной, заметной) имеет место неравенство 0,7, а следовательно, и неравенство .
- С учетом вышесказанного, практическая пригодность построенной модели связи оценивается по величине R2 следующим образом:
- неравенство R2 >0,5 позволяет считать, что построенная модель пригодна для практического применения, т.к. в ней достигается высокая степень тесноты связи признаков X и Y, при которой более 50% вариации признака Y объясняется влиянием фактора Х;
- неравенство означает, что построенная модель связи практического значения не имеет ввиду недостаточной тесноты связи между признаками X и Y, при которой менее 50% вариации признака Y объясняется влиянием фактора Х, и, следовательно, фактор Х влияет на вариацию Y в значительно меньшей степени, чем другие (неучтенные в модели) факторы.
- Общая оценка адекватности регрессионной модели по F-критерию Фишера
- Оценка погрешности регрессионной модели
Практическую пригодность построенной модели можно охарактеризовать по величине линейного коэффициента корреляции r:
Значение индекса детерминации R2 приводится в табл.2.5 в ячейке В79 (термин "R - квадрат").
Вывод:
Значение линейного коэффициента корреляции r и значение индекса детерминации R2 согласно табл. 2.5 равны: r =…….…….., R2 =……..………. Поскольку и , то построенная линейная регрессионная модель связи пригодна (не пригодна) для практического использования.
Адекватность построенной регрессионной
модели фактическим данным (xi, yi) устанавливается по критерию Р.Фишера, оценивающему статистическую значимость (неслучайность) индекса детерминации R2. Рассчитанная для уравнения регрессии оценка значимости R2 приведена в табл.2.6 в ячейке F86 (термин "Значимость F"). Если она меньше заданного уровня значимости α=0,05, то величина R2 признается неслучайной и, следовательно, построенное уравнение регрессии может быть использовано как модель связи между признаками Х и Y для генеральной совокупности предприятий отрасли.
Вывод:
Рассчитанный уровень значимости αр индекса детерминации R2 есть αр=……………… Так как он меньше(больше) заданного уровня значимости α=0,05, то значение R2 признается типичным (случайным) и модель связи между признаками Х и Y ……………………применима (неприменима) для генеральной совокупности предприятий отрасли в целом.
Погрешность регрессионной модели можно оценить по величине стандартной ошибки построенного линейного уравнения регрессии . Величина ошибки оценивается как среднее квадратическое отклонение по совокупности отклонений исходных (фактических) значений yi признака Y от его теоретических значений , рассчитанных по построенной модели.
Погрешность регрессионной модели выражается в процентах и рассчитывается как величина .100.
В адекватных моделях погрешность не должна превышать 12%-15%.
Значение приводится в выходной таблице "Регрессионная статистика" (табл.2.5) в ячейке В81 (термин "Стандартная ошибка"), значение – в таблице описательных статистик (ЛР-1, Лист 1, табл.3, столбец 2).
Вывод:
Погрешность линейной регрессионной модели составляет .100=___________.100=…..……..%, что подтверждает (не подтверждает) адекватность построенной модели ……………………………
Задача 6. Дать экономическую интерпретацию:
1) коэффициента регрессии а1;
3) остаточных величин i.
2) коэффициента эластичности КЭ;
6.1. Экономическая интерпретация коэффициента регрессии а1
В случае линейного уравнения регрессии =a0+a1x величина коэффициента регрессии a1 показывает, на сколько в среднем (в абсолютном выражении) изменяется значение результативного признака Y при изменении фактора Х на единицу его измерения. Знак при a1 показывает направление этого изменения.
Вывод:
Коэффициент регрессии а1 =……………….. показывает, что при увеличении факторного признака Среднегодовая стоимость основных производственных фондов на 1 млн руб. значение результативного признака Выпуск продукции увеличивается (уменьшается) в среднем на ……………..млн руб.
6.2. Экономическая интерпретация коэффициента эластичности.
С целью расширения возможностей экономического анализа явления используется коэффициент эластичности , который измеряется в процентах и показывает, на сколько процентов изменяется в среднем результативный признак при изменении факторного признака на 1%.
Средние значения и приведены в таблице описательных статистик (ЛР-1, Лист 1, табл.3).
Расчет коэффициента эластичности:
=………._________ =………..%
Вывод:
Значение коэффициента эластичности Кэ=…………. показывает, что при увеличении факторного признака Среднегодовая стоимость основных производственных фондов на 1% значение результативного признака Выпуск продукции увеличивается (уменьшается) в среднем на ……….%.
6.3. Экономическая интерпретация остаточных величин εi
Каждый их остатков характеризует отклонение фактического значения yi от теоретического значения , рассчитанного по построенной регрессионной модели и определяющего, какого среднего значения следует ожидать, когда фактор Х принимает значение xi.
Анализируя остатки, можно сделать ряд практических выводов, касающихся выпуска продукции на рассматриваемых предприятиях отрасли.
Значения остатков i (таблица остатков из диапазона А98:С128) имеют как положительные, так и отрицательные отклонения от ожидаемого в среднем объема выпуска продукции (которые в итоге уравновешиваются, т.е. ).
Экономический интерес представляют наибольшие расхождения между фактическим объемом выпускаемой продукции yi и ожидаемым усредненным объемом .
Вывод:
Согласно таблице остатков максимальное превышение ожидаемого среднего объема выпускаемой продукции имеют три предприятия - с номерами……, ……, …….., а максимальные отрицательные отклонения - три предприятия с номерами……, ……, …….. .Именно эти шесть предприятий подлежат дальнейшему экономическому анализу для выяснения причин наибольших отклонений объема выпускаемой ими продукции от ожидаемого среднего объема и выявления резервов роста производства.
Задача 7. Нахождение наиболее адекватного нелинейного уравнения регрессии с помощью средств инструмента Мастер диаграмм.
Уравнения регрессии и их графики построены для 3-х видов нелинейной зависимости между признаками и представлены на диаграмме 2.1 Рабочего файла.
Уравнения регрессии и соответствующие им индексы детерминации R2 приведены в табл.2.10 (при заполнении данной таблицы коэффициенты уравнений необходимо указывать не в компьютерном формате, а в общепринятой десятичной форме чисел).
Таблица 2.10
Регрессионные модели связи
Вид уравнения Уравнение регрессии Индекс детерминации R2
Полином 2-го порядка Полином 3-го порядка Степенная функция
Выбор наиболее адекватного уравнения регрессии определяется максимальным значением индекса детерминации R2: чем ближе значение R2 к единице, тем более точно регрессионная модель соответствует фактическим данным.
Вывод:
Максимальное значение индекса детерминации R2 =…………............ Следовательно, наиболее адекватное исходным данным нелинейное уравнение регрессии имеет вид …………………………
ПРИЛОЖЕНИЕ
Результативные таблицы и графики
Распечатка Листа 2 Рабочего файла
ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-
ЭКОНОМИЧЕСКИЙ ИНСТИТУТ
КАФЕДРА СТАТИСТИКИ
О Т Ч Е Т
о результатах выполнения
компьютерной лабораторной работы
Автоматизированный анализ динамики социально-экономических явлений в среде MS Excel
Вариант № ____
Выполнил: ст. III курса гр._______________
____________________
ФИО
Проверил:_____________________
__
ФИО
Москва ………..г.
1. Постановка задачи статистического исследования
В процессе статистического изучения деятельности одного из предприятий получены данные о годовом выпуске продукции (в стоимостном выражении) за шестилетний период, а также данные о выпуске продукции по месяцам за 6-ой год.
Полученные два ряда динамики представлены на Листе 3 Рабочего файла в формате электронных таблиц процессора Excel, годовые данные – в диапазоне ячеек A6:B12, а данные за 6-ой год по месяцам - в диапазоне D6:E19.
Таблица 3.1
Исходные данные
ВНИМАНИЕ!!! В данной лабораторной работе, в отличие от двух предшествующих лабораторных работ, все Excel-таблицы размещаются не только в ПРИЛОЖЕНИИ, но и по тексту отчета в соответствующих местах.
В процессе автоматизированного анализа динамики выпуска продукции за шестилетний период необходимо решить следующие статистические задачи.
Задание 1. Расчёт и анализ показателей ряда динамики выпуска продукции за шестилетний период.
Задание 2. Прогноз показателя выпуска продукции на 7-ой год методом экстраполяции.
Задание 3. Выявление тенденции развития изучаемого явления (тренда) по данным о выпуске продукции по месяцам за 6-ой год методами скользящей средней и аналитического выравнивания.
2. Выводы по результатам выполнения лабораторной работы2
Задание 1.
Расчёт и анализ показателей ряда динамики выпуска продукции за шестилетний период.
Выполнение Задания 1 заключается в решении двух задач:
Задача 1.1. Расчет цепных и базисных показателей динамики: абсолютный прирост; темп роста; темп прироста и абсолютное значение 1 % прироста.
Задача 1.2. Расчет средних показателей ряда динамики: средний уровень ряда динамики; средний абсолютный прирост; средний темп роста и средний темп прироста.
Задача 1.1.
Аналитические показатели рядов динамики строятся на основе сравнения двух уровней ряда. Используют два способа сравнения уровней:
1) базисный способ, при котором каждый последующий уровень сравнивается с одним и тем же уровнем, принятым за базу сравнения (то есть база сравнения – постоянная);
2) цепной способ, при котором каждый последующий уровень сравнивается с предыдущим уровнем (то есть база сравнения – переменная).
Соответственно различают:
- базисные показатели, обозначаемые надстрочным индексом б;
- цепные показатели, обозначаемые надстрочным индексом ц.
Общеупотребительные обозначения уровней ряда динамики:
yi – данный (текущий) уровень;
yi-1– предыдущий уровень;
y0 – базисный уровень;
yn – конечный уровень;
К числу основных аналитических показателей рядов динамики, характеризующих изменения уровней ряда за отдельные промежутки времени, относятся: абсолютный прирост, темп роста, темп прироста, абсолютное значение одного процента прироста, которые рассчитываются по следующим формулам:
∆уiб = уi – уо,
∆уiц = уi – уi-1
,
Тпрi=Трi-100 (%)
Аналитические показатели годовых изменений уровней ряда приведены в табл.3.2.
Таблица 3.2
Вывод:
Как показывают данные табл. 3.2, объем реализации произведенной продукции постоя
нно (непостоянно) повышался (снижался) . В целом за исследуемый период объем реализации произведенной продукции повысился (снизился) на ………………млн. руб. (гр.4) или на……..% (гр.8). Рост (снижение) объема реализации продукции носит стабильный (скачкообразный) характер, что подтверждается постоянно увеличивающимися (разнонаправленными) значениями цепных абсолютных приростов (гр.3) и цепных темпов прироста (гр.7). Характер изменения объемов реализации продукции подтверждается также систематическим (несистематическим) изменением величины абсолютного значения 1% прироста (гр.9).
Задача 1.2.
В табл.3.2 приведены данные, характеризующие динамику изменения уровней ряда за отдельные периоды времени. Для обобщающей оценки изменений уровней ряда за весь рассматриваемый период времени необходимо рассчитать средние показатели динамики.
В анализе динамики явления в зависимости от вида исходного ряда динамики используются различные средние показатели динамики, характеризующие изменения ряда динамики в целом.
Средний уровень ряда динамики ( ) характеризует типичную величину уровней ряда.
Для интервального ряда динамики с равноотстоящими уровнями средний уровень ряда определяется как простая арифметическая средняя из уровней ряда:
, где n- число уровней ряда.
Средний абсолютный прирост ( ) является обобщающей характеристикой индивидуальных абсолютных приростов и определяется как простая арифметическая средняя из цепных абсолютных приростов:
где n- число уровней ряда.
Средний темп роста ( ) – это обощающая характеристика интенсивности изменения уровней ряда, показывающая во сколько раз изменялись уровни ряда в среднем за единицу времени. Показатель может быть рассчитан по формуле
где n – число уровней ряда.
Средний темп прироста ( ) рассчитывают с использованием среднего темпа роста по формуле:
Средние показатели ряда динамики выпуска продукции представлены в табл.3.3.
Таблица 3.3
Вывод.
За исследуемый период средний объем реализации произведенной продукции составил ………….. млн. руб. Выявлена положительная (отрицательная) динамика реализации продукции: ежегодное увеличение (снижение) объема реализации составляло в среднем ……….. млн. руб. или …….%.
При среднем абсолютном приросте …………млн. руб. отклонения по отдельным годам незначительны (значительны).
Задание 2.
Прогноз показателя выпуска продукции на 7-ой год методом экстраполяции
Применение метода экстраполяции основано на инерционности развития социально-экономических явлений и заключается в предположении о том, что тенденция развития данного явления в будущем не будет претерпевать каких-либо существенных изменений. При этом с целью получения окончательного прогноза всегда следует учитывать все имеющиеся предпосылки и гипотезы дальнейшего развития рассматриваемого социально-экономического явления. Прогноз, сделанный на период экстраполяции (период упреждения), больший 1/3 рассмотренного периода развития явления, не может считаться научно обоснованным (например, по данным за 6 лет научно обоснованным будет прогноз лишь на 2 года вперед).
Выполнение Задания 2 заключается в решении двух задач:
Задача 2.1. Прогнозирование выпуска продукции предприятием на год вперёд с использованием среднего абсолютного прироста и среднего темпа роста.
Задача 2.2. Прогнозирование выпуска продукции предприятием на год вперёд с использованием аналитического выравнивания ряда динамики по прямой, параболе и степенной функции.
Задача 2.1.
Прогнозирование уровня ряда динамики с использованием среднего абсолютного прироста и среднего темпа роста осуществляется соответственно по формулам:
, (1),
(2),
где: – прогнозируемый уровень;
t – период упреждения (число лет, кварталов и т.п.);
yi – базовый для прогноза уровень;
– средний за исследуемый период абсолютный прирост (среднегодовой, среднеквартальный и т.п.);
– средний за исследуемый период темп роста (среднегодовой, среднеквартальный и т.п.).
Формула (1) применяется при относительно стабильных абсолютных приростах Δyц, что с некоторой степенью приближения соответствует линейной форме зависимости . Формула (2) используется при достаточно стабильных темпах ростах ( ), что с некоторой степенью приближения соответствует показательной форме зависимости .
Прогнозные оценки объема реализации продукции на 7-ой год (по данным шестилетнего периода), рассмотренные с использованием среднего абсолютного прироста и среднего темпа роста (рассчитанные в задании 1), приведены в табл.3.4.
Таблица 3.4
Вывод.
Как показывают полученные прогнозные оценки, прогнозируемые объемы выпуска продукции на 7-ой год (по данным шестилетнего периода) достаточно близки (значительно отличаются) между собой: ………… и ……………млн.руб. Расхождение полученных данных объясняется тем, что в основу прогнозирования положены разные методики экстраполяции рядов динамики.
Задача 2.2.
Прогнозирование выпуска продукции предприятием на год вперёд методом аналитического выравнивания ряда динамики по прямой, параболе и степенной функции выполнено с использованием средств инструмента МАСТЕР ДИАГРАММ. Результаты представлены на рис. 3.1 в виде уравнений регрессии и их графиков.
Рис. 3.1
ВНИМАНИЕ!!! Инструмент МАСТЕР ДИАГРАММ строит уравнения, обозначая независимую переменную через Х, зависимую – через Y. В анализе временных рядов рассматриваются зависимости вида y=f(t), где t – время. Следовательно, во всех выводах по результатам анализа рядов динамики для обозначения аргумента в уравнении регрессии используется переменная t, а не x..
Выбор наиболее адекватной трендовой модели определяется максимальным значением индекса детерминации R2: чем ближе значение R2 к единице, тем более точно регрессионная модель соответствует фактическим данным.
Вывод:
Максимальное значение индекса детерминации R2 =…………............ Следовательно, уравнение регрессии, наиболее адекватное данным о выпуске продукции за 6-летний период, имеет вид …………………………
Рассчитанный по данному уравнению прогноз выпуска продукции на 7-ой год составляет ………………млн. руб., что незначительно (существенно) расходится с прогнозами, полученными в задаче 2.1.
Задание 3.
Выявление тенденции развития изучаемого явления (тренда) методами скользящей средней и аналитического выравнивания по данным о выпуске продукции по месяцам за 6-ой год.
Выполнение Задания 3 заключается в решении двух задач:
Задача 3.1. Расчет скользящей средней ряда, полученной на основе трёхзвенной скользящей суммы.
Задача 3.2. Аналитическое выравнивание ряда динамики по прямой и параболе.
Задача 3.1.
Значения скользящей средней, полученные на основе трёхзвенной скользящей суммы, представлены в табл.3.5.
Таблица 3.5
Вывод:
Анализ данных табл.3.5 показывает, что значения скользящей средней изменяются закономерно (незакономерно). Следовательно, можно (нельзя) установить основную тенденцию ряда – возрастание (убывание) объемов выпуска продукции по месяцам за 6-ой год.
График сглаживания ряда динамики выпуска продукции методом скользящей средней представлен на рис. 3.2.
Рис. 3.2
Задача 3.2.
Метод аналитического выравнивания позволяет представить основную тенденцию (тренд) развития явления в виде функции времени y=f(t).
Для отображения трендов
применяются различные функции: линейные и нелинейные. Построение графика выпуска продукции
предприятием методом аналитического выравнивания ряда динамики по прямой и полиному 2-го порядка (параболе) выполнено с использованием средств инструмента МАСТЕР ДИАГРАММ и представлено на рис. 3.3. Рис. 3.3
Выбор наиболее адекватной трендовой модели определяется максимальным значением индекса детерминации R2: чем ближе значение R2 к единице, тем более точно регрессионная модель соответствует фактическим данным.
Вывод:
Максимальное значение индекса детерминации R2 =…………............ Следовательно, уравнение регрессии, наиболее адекватное данным о выпуске продукции за 6-ой год, имеет вид …………………………