Дисперсионный анализ

Реферат, 28 Февраля 2012, автор: пользователь скрыл имя

Краткое описание

Цель работы: познакомится с таким статистическим методом, как дисперсионный анализ.
Дисперсионный анализ (от латинского Dispersio – рассеивание) – статистический метод, позволяющий анализировать влияние различных факторов на исследуемую переменную. Метод был разработан биологом Р. Фишером в 1925 году и применялся первоначально для оценки экспериментов в растениеводстве. В дальнейшем выяснилась общенаучная значимость дисперсионного анализа для экспериментов в психологии, педагогике, медицине и др.

Содержание работы

Введение…………………….……………………………………………....3
Дисперсионный анализ………………………………………………....4
1.1 Основные понятия дисперсионного анализа…………………..……4
1.2 Однофакторный дисперсионный анализ………………………….....6
1.3 Многофакторный дисперсионный анализ…………………….........12
Применение дисперсионного анализа в различных задачах и
исследованиях……………………………………………………………………...16
2.1 Использование дисперсионного анализа при изучении
миграционных процессов……………………………………………….……..….16
2.2 Принципы математико-статистического анализа данных
медико-биологических исследований……………...……………….……………17
2.3 Биотестирование почвы……………...…………………………..…...19
2.4 Грипп вызывает повышенную выработку гистамина…………..…..21
2.5 Дисперсионный анализ в химии……………………………...…..….22
2.6 Использование прямого преднамеренного внушения в
бодрствующем состоянии в методике воспитания физических качеств………23
2.7 Купирование острой психотической симптоматики у больных
шизофренией атипичным нейролептиком……………………………………….26
2.8 Снование фасонной пряжи с ровничным эффектом………….....….28
2.9 Сопутствующая паталогия при полной утрате зубов у лиц
пожилого и старческого возраста………………………………...………………29
3 Дисперсионный анализ в контексте статистических
методов…...................................................................................................................31
3.1 Векторные авторегрессии……………………………………...……..34
3.2 Факторный анализ………………………………………………….…37
3.3 Парная регрессия. Вероятностная природа регрессионных
моделей……………………………………………………………………….….…41
Заключение………………………………………………………….…..... 44
Список использованных источников………………………………....….45

Скачать целиком (164.68 Кб) Сколько стоит заказать работу?

Содержимое работы - 1 файл

товары субституты товары комплименты.docx

— 14.19 Кб (Скачать файл)

Усреднение по какому-либо индексу обозначено звездочкой (или точкой) вместо индекса, тогда средний показатель качества изделий i-й партии, или групповая средняя для i-го уровня фактора, примет вид:

, (4)

где _i* – среднее значение по столбцам;

_ij– элемент матрицы наблюдений;

n – объем выборки.

А общая средняя:

. (5)

Сумма квадратов отклонений наблюдений х_ij от общей средней _**выглядит так:

²=²+²+

². (6)

или

Q = Q₁ + Q₂ + Q₃.

Последнее слагаемое равно нулю

=0. (7)

так как сумма отклонений значений переменной от ее средней равна нулю, т.е.

²=0.

Первое слагаемое можно записать в виде:

В результате получается тождество:

Q = Q₁ + Q₂, (8)

где - общая, или полная, сумма квадратов отклонений;

- сумма квадратов отклонений групповых средних от общей средней, или межгрупповая (факторная) сумма квадратов отклонений;

- сумма квадратов отклонений наблюдений от групповых средних, или внутригрупповая (остаточная) сумма квадратов отклонений.

В разложении (8) заключена основная идея дисперсионного анализа. Применительно к рассматриваемой задаче равенство (8) показывает, что общая вариация показателя качества, измеренная суммой Q, складывается из двух компонент – Q₁ и Q₂, характеризующих изменчивость этого показателя между партиями (Q₁) и изменчивость внутри партий (Q₂), характеризующих одинаковую для всех партий вариацию под воздействием неучтенных факторов.

В дисперсионном анализе анализируются не сами суммы квадратов отклонений, а так называемые средние квадраты, являющиеся несмещенными оценками соответствующих дисперсий, которые получаются делением сумм квадратов отклонений на соответствующее число степеней свободы.

Число степеней свободы определяется как общее число наблюдений минус число связывающих их уравнений. Поэтому для среднего квадрата s₁², являющегося несмещенной оценкой межгрупповой дисперсии, число степеней свободы k₁=m-1, так как при его расчете используются m групповых средних, связанных между собой одним уравнением (5). А для среднего квадрата s₂², являющегося несмещенной оценкой внутригрупповой дисперсии, число степеней свободы k₂=mn-m, т.к. при ее расчете используются все mn наблюдений, связанных между собой m уравнениями (4).

Таким образом:

= Q₁/(m-1),

= Q₂/(mn-m).

Если найти математические ожидания средних квадратов и , подставить в их формулы выражение x_ij (1) через параметры модели, то получится:

(9)

т.к. с учетом свойств математического ожидания

(10)

Для модели I с фиксированными уровнями фактора F_i(i=1,2,...,m) – величины неслучайные, поэтому

M(S

) =² /(m-1) +σ².

Гипотеза H₀ примет вид F_i = F_*(i = 1,2,...,m), т.е. влияние всех уровней фактора одно и то же. В случае справедливости этой гипотезы

M(S

)= M(S)= σ².

Для случайной модели II слагаемое F_i в выражении (1) – величина случайная. Обозначая ее дисперсией

получим из (9)

(11)

и, как и в модели I

M(S

)= σ².

В таблице 1.1 представлен общий вид вычисления значений, с помощью дисперсионного анализа.

Таблица 1.1 – Базовая таблица дисперсионного анализа

Компоненты дисперсии	Сумма квадратов	Число степеней свободы	Средний квадрат	Математическое ожидание среднего квадрата
Межгрупповая		m-1	= Q₁/(m-1)
Внутригрупповая		mn-m	= Q₂/(mn-m)	M(S )= σ²
Общая		mn-1

Гипотеза H₀ примет вид σ_F² =0. В случае справедливости этой гипотезы

M(S

)= M(S)= σ².

В случае однофакторного комплекса как для модели I, так и модели II средние квадраты S² и S², являются несмещенными и независимыми оценками одной и той же дисперсии σ².

Следовательно, проверка нулевой гипотезы H₀ свелась к проверке существенности различия несмещенных выборочных оценок S и S дисперсии σ².

Гипотеза H₀ отвергается, если фактически вычисленное значение статистики F = S/S больше критического F_α:K1:K2, определенного на уровне значимости α при числе степеней свободы k₁=m-1 и k₂=mn-m, и принимается, если F < F_α:K1:K2 .

F- распределение Фишера (для x > 0) имеет следующую функцию плотности (для = 1, 2, ...; = 1, 2, ...):

где - степени свободы;

Г - гамма-функция.

Применительно к данной задаче опровержение гипотезы H₀ означает наличие существенных различий в качестве изделий различных партий на рассматриваемом уровне значимости.

Для вычисления сумм квадратов Q₁, Q₂, Q часто бывает удобно использовать следующие формулы:

(12)

(13)

(14)

т.е. сами средние, вообще говоря, находить не обязательно.

Таким образом, процедура однофакторного дисперсионного анализа состоит в проверке гипотезы H₀о том, что имеется одна группа однородных экспериментальных данных против альтернативы о том, что таких групп больше, чем одна. Под однородностью понимается одинаковость средних значений и дисперсий в любом подмножестве данных. При этом дисперсии могут быть как известны, так и неизвестны заранее. Если имеются основания полагать, что известная или неизвестная дисперсия измерений одинакова по всей совокупности данных, то задача однофакторного дисперсионного анализа сводится к исследованию значимости различия средних в группах данных /1/.

1.3 Многофакторный дисперсионный анализ

Следует сразу же отметить, что принципиальной разницы между многофакторным и однофакторным дисперсионным анализом нет. Многофакторный анализ не меняет общую логику дисперсионного анализа, а лишь несколько усложняет ее, поскольку, кроме учета влияния на зависимую переменную каждого из факторов по отдельности, следует оценивать и их совместное действие. Таким образом, то новое, что вносит в анализ данных многофакторный дисперсионный анализ, касается в основном возможности оценить межфакторное взаимодействие. Тем не менее, по-прежнему остается возможность оценивать влияние каждого фактора в отдельности. В этом смысле процедура многофакторного дисперсионного анализа (в варианте ее компьютерного использования) несомненно более экономична, поскольку всего за один запуск решает сразу две задачи: оценивается влияние каждого из факторов и их взаимодействие /3/.

Общая схема двухфакторного эксперимента, данные которого обрабатываются дисперсионным анализом имеет вид:

Рисунок 1.1 – Схема двухфакторного эксперимента

Данные, подвергаемые многофакторному дисперсионному анализу, часто обозначают в соответствии с количеством факторов и их уровней.

Предположив, что в рассматриваемой задаче о качестве различных m партий изделия изготавливались на разных t станках и требуется выяснить, имеются ли существенные различия в качестве изделий по каждому фактору:

А - партия изделий;

B - станок.

В результате получается переход к задаче двухфакторного дисперсионного анализа.

Все данные представлены в таблице 1.2, в которой по строкам - уровни A_i фактора А, по столбцам — уровни B_j фактора В, а в соответствующих ячейках, таблицы находятся значения показателя качества изделий x_ijk(i=1,2,...,m; j=1,2,...,l; k=1,2,...,n).

Таблица 1.2 – Показатели качества изделий

	B₁	B₂	…	B_j	…	B_l
A₁	x_11l,…,x_11k	x_12l,…,x_12k	…	x_1jl,…,x_1jk	…	x_1ll,…,x_1lk
A₂	x_21l,…,x_21k	x_22l,…,x_22k	…	x_2jl,…,x_2jk	…	x_2ll,…,x_2lk
…	…	…	…	…	…	…
A_i	x_i1l,…,x_i1k	x_i2l,…,x_i2k	…	x_ijl,…,x_ijk	…	x_jll,…,x_jlk
…	…	…	…	…	…	…
A_m	x_m1l,…,x_m1k	x_m2l,…,x_m2k	…	x_mjl,…,x_mjk	…	x_mll,…,x_mlk

Двухфакторная дисперсионная модель имеет вид:

x_ijk=μ+F_i+G_j+I_ij+ε_ijk, (15)

где x_ijk - значение наблюдения в ячейке ij с номером k;

μ - общая средняя;

F_i - эффект, обусловленный влиянием i-го уровня фактора А;

G_j - эффект, обусловленный влиянием j-го уровня фактора В;

I_ij - эффект, обусловленный взаимодействием двух факторов, т.е. отклонение от средней по наблюдениям в ячейке ij от суммы первых трех слагаемых в модели (15);

ε_ijk - возмущение, обусловленное вариацией переменной внутри отдельной ячейки.

Предполагается, что ε_ijk имеет нормальный закон распределения N(0; с²), а все математические ожидания F_*, G_*, I_i*, I_*j равны нулю.

Групповые средние находятся по формулам:

- в ячейке:

по строке:

по столбцу:

общая средняя:

В таблице 1.3 представлен общий вид вычисления значений, с помощью дисперсионного анализа.

Таблица 1.3 – Базовая таблица дисперсионного анализа

Компоненты дисперсии	Сумма квадратов	Число степеней свободы	Средние квадраты
Межгрупповая (фактор А)		m-1
Межгрупповая (фактор B)		l-1
Взаимодействие		(m-1)(l-1)
Остаточная		mln - ml
Общая		mln - 1

Проверка нулевых гипотез H_A, H_B, H_AB об отсутствии влияния на рассматриваемую переменную факторов А, B и их взаимодействия AB осуществляется сравнением отношений , , (для модели I с фиксированными уровнями факторов) или отношений , , (для случайной модели II) с соответствующими табличными значениями F – критерия Фишера – Снедекора. Для смешанной модели III проверка гипотез относительно факторов с фиксированными уровнями производится также как и в модели II, а факторов со случайными уровнями – как в модели I.

Дисперсионный анализ

Краткое описание

Содержание работы

Содержимое работы - 1 файл

товары субституты товары комплименты.docx

Информация о работе Дисперсионный анализ

Связанные документы

Основы дисперсионного анализа

Использование дисперсионного анализа в методических исследованиях

Расчет абсолютных, относительных, средних величин, показателей вариации, построение и анализ рядов распределения дисперсионный и корре