Регрессионный анализ

Автор работы: Пользователь скрыл имя, 03 Апреля 2012 в 11:47, курс лекций

Краткое описание

Под регрессионным анализом понимают исследование закономерностей связи между явлениями (процессами), которые зависят от многих, иногда неизвестных, факторов.

Содержимое работы - 1 файл

регрессионный анализ.pdf

— 281.17 Кб (Скачать файл)
Page 1
Регрессионный анализ
Под регрессионным анализом понимают исследование закономерностей связи
между явлениями (процессами), которые зависят от многих, иногда неизвестных,
факторов. Часто между переменными
x
и
y
существует связь, но не вполне
определенная, при которой одному значению
x
соответствует несколько значений
(совокупность) у. В таких случаях связь называют регрессионной. Таким образом,
функция
)
(x
f
y
является регрессионной (корреляционной), если каждому
значению аргумента соответствует статистический ряд распределения у.
Суть регрессионного анализа сводится к установлению уравнения регрессии, т.е.
вида кривой между случайными величинами (аргументами
x
и функцией
y
), оценке
тесноты связей между ними, достоверности и адекватности результатов измерений.
Чтобы предварительно определить наличие такой связи между
x
и
y
, наносят
точки на график и строят так называемое корреляционное поле (рис. 1). По виду
корреляционного поля можно судить о наличии корреляционной связи. Так, из рис. 1-a
видно, что экспериментальные данные имеют определенную связь между
x
и
y
, а
измерения на рис. 1-б такой связи не показывают.
Рис. 1. Корреляционное поле
Различают однофакторные (парные) и многофакторные регрессионные зависимости.
Парная регрессия при парной зависимости может быть аппроксимирована прямой линией,
параболой, гиперболой, логарифмической, степенной или показательной функцией,
полиномом и др. Двухфакторное поле можно аппроксимировать плоскостью,
параболоидом второго порядка, гиперболоидом.
При построении теоретической регрессионной зависимости используется метод
наименьших квадратов (МНК). Суть МНК заключается в следующем: из всего множества
линий, которые можно провести через экспериментальные точки на корреляционном
поле, линия регрессии
x
b
b
y
0
1


выбирается так, чтобы сумма квадратов расстояний
по вертикали между экспериментальными точками и этой линией была наименьшей.
Расстояния между экспериментальными точками и линией регрессии есть отклонения
i
e
.
Следовательно, при использовании МНК минимизируется следующая функция:

Page 2

где
i
y
– фактические ординаты поля,
i
y
– среднее значение ординаты.
Необходимым условием существованием минимума двух переменных является
равенство её частных производных по неизвестным параметрам
0
b
и
1
b
.
Разрешая аналитически данную систему уравнений, получаем:
n
x
b
n
y
b
i
i




1
0
,




 


2
2
1
)
(
i
i
i
i
i
i
x
x
n
y
x
y
x
n
b
Параметр
1
b
показывает среднее значение зависимой переменной
y
при
0

x
,
0
b
– угловой коэффициент линии регрессии (показывает, насколько в среднем
изменяется величина
y
при изменении величины
x
на единицу своего измерения).
Критерием близости корреляционной зависимости между
x
и
y
к линейной
функциональной зависимости является коэффициент корреляции
r
, показывающий
степень тесноты связи
x
и
y
и определяемый отношением










 


2
2
2
2
)
(
)
(
i
i
i
i
i
i
i
i
y
y
n
x
x
n
y
x
y
x
n
r
,
где
n
– число измерений.
1
1



r
Коэффициент корреляции интерпретируется как мера линейной зависимости
случайных величин. При
0

r
между
x
и
y
существует положительная линейная
связь. При
0

r
между
x
и
y
существует отрицательная линейная связь. При
0

r
между
x
и
y
отсутствует линейная связь.
На рис. 2 представлены примеры меры линейной зависимости случайных величин
x
и
y
, линиями изображены прямые уравнения регрессии.

Page 3

Рис. 2. Геометрическая интерпретация коэффициента корреляции
Пример.
Измеряется высота над уровнем моря на выбранных расстояниях
i
x
в выбранном
направлении от заданной точки. Измерения занесены в таблицу.
Необходимо построить по экспериментальным данным уравнение регрессии и
вычислить меру линейной зависимости между величинами
x
и
y
.
Решение.
Построим вспомогательную таблицу.
Далее вычисляем средние значения
x
и
y
.
Вычислим коэффициент корреляции
Вычислим параметры уравнения регрессии

Page 4

Тогда уравнение регрессии имеет вид:
x
y
55
3
48
3
.
. 

(рис. 3).
Рис. 3. Уравнение регрессии

Информация о работе Регрессионный анализ