Оценка адекватности множественного уравнения регрессии

Множественная линейная регрессия

Понятие множественной линейной регрессии

Множественная линейная регрессия - выраженная в виде прямой зависимость среднего значения величины Y от двух или более других величин X ₁, X ₂,..., X _m. Величину Y принято называть зависимой или результирующей переменной, а величины X ₁, X ₂,..., X _m - независимыми или объясняющими переменными.

Уравнение множественной линейной регрессии для выборки имеет следующий вид:

, (1)

где: - коэффициенты регрессионной модели.

Исходные (экспериментальные) данные

Исходные данные для построения линейной регрессионной модели представляются в виде таблицы.

Таблица 1.

	Результирующая переменная	Независимые переменные
№ п/п	Y	X₁	X₂	…	X_m
	y₁	x₁₁	x₁₂	…	x_1m
	y₂	x₂₁	x₂₂	…	x_2m
…	…	…	…	…	…
i	y_i	x_i1	x_i2	…	x_im
…	…	…	…	…	…
n	y_n	x_n1	x_n2	…	x_nm

Исходные данные получены в результате проведения n экспериментов (наблюдений, измерений). n – объем выборки. В результате каждого i – го (i = 1,2,…,n) эксперимента получены m значений независимых переменных x_i₁, x_i₂, …, x_im и одно соответствующее значение результирующей переменной y_i.

МНК-оценка коэффициентов уравнения множественной регрессии в матричном виде

Данные наблюдений и коэффициенты уравнения множественной регрессии можно представить в виде следующих матриц:

Матрица Х получена из матрицы значений независимых переменных, приведенных в таблице 1, в результате добавления слева столбца из единиц.

Уравнение множественной линейной регрессии в матричном виде имеет вид

(2)

В результате решения матричного уравнения (2) получаем формулу для вычисления коэффициентов множественной линейной регрессии в матричном виде:

, (3)

где - матрица, транспонированная к матрице X,

- матрица, обратная к матрице .

Произведя необходимые вычисления по формуле (3), мы получаем вектор-столбец b, элементами которого являются искомые коэффициенты уравнения множественной линейной регрессии, полученные методом наименьших квадратов.

Множественный коэффициент корреляции

Оценка силы (тесноты) линейной корреляционной связи между результирующей переменной Y и независимыми переменными производится с помощью множественного коэффициента корреляции R, вычисляемого по формуле

где: - корреляционная матрица, элементами которой являются парные коэффициенты корреляции;

- алгебраическое дополнение элемента корреляционной матрицы.

Корреляционная матрица имеет вид

Нулевая строка и нулевой столбец соответствуют результирующей переменной Y, строки и столбцы с номерами от 1 до m - соответствующим независимым переменным .

Свойства корреляционной матрицы:

· корреляционная матрица симметричная, т.е. ;

· элементы, расположенные на главной диагонали, равны 1, т.е. .

Оценка адекватности множественного уравнения регрессии

Оценка адекватности множественного уравнения регрессии (1) может быть произведена с помощью F-критерия Фишера.

Вначале необходимо вычислить фактическое значение F-критерия Фишера .

Вычисляем коэффициент детерминации

где: n – объем выборки (количество экспериментов);

- фактические (экспериментальные) значения результирующей переменной Y;

- теоретические (вычисленные по формуле (1)) значения результирующей переменной Y;

- среднее значение экспериментальных значений .

Вычисляем фактическое значение F- критерия Фишера по формуле:

где: R ² - коэффициент детерминации;

n – объем выборки (количество экспериментов);

k – количество независимых переменных в уравнении регрессии (1), k = m.

Вычисленное значение фактического значения F- критерия Фишера F_факт сравнивается с табличным значением F_табл при степенях свободы и уровне значимости a (обычно a = 0,05).

Модель адекватна, если .

Оценка адекватности множественного уравнения регрессии

Поиск по сайту