Обобщенный метод наименьших квадратов




Диаграмма рассеяния.

Диаграмма рассеяния (рассеивания) -- диаграмма, составленная из точек на координатной плоскости. Диаграммы рассеяния применяют для изучения связей между двумя различными характеристиками, например, ростом и весом животного и т.д. При этом абсцисса и ордината каждой точки на диаграмме -- значения этих характеристик.

Если на плоскости мы видим "облако" точек, вытянутое от левого нижнего угла к правому верхнему, то можно говорить о наличии положительной связи между признаками, т.е. с ростом одного признака другой в среднем растет. Если же это "облако" точек вытянуто от левого верхнего угла к правому нижнему, то характер связи отрицательный, т.е. с ростом одного признака другой признак в среднем убывает. Если "облако" точек вытянуто по горизонтали, по вертикали или же точки более-менее равномерно заполняют круг, то связь между признаками, скорее всего, отсутствует.

На практике применяют также трехмерные диаграммы рассеяния, которые в школьном курсе не изучаются. Их используют для сравнения между собой трёх характеристик. В этом случае точки изображаются в координатном пространстве. Абсцисса, ордината и аппликата каждой точки -- значения этих характеристик.

 

 

Линейная модель парной регрессии

Построение модели парной регрессии заключается в нахождении уравнения связи двух показателей у и х, т.е. определяется как повлияет изменение одного показателя на другой. Основной задачей является нахождение параметров модели и оценке их качества. Уравнение модели парной регрессии можно записать в общем виде:

где у - зависимый показатель (результативный признак);

х - независимый, объясняющий фактор.

Уравнение парной линейной регрессии:

у = а + bx

Линейная модель множественной регрессии

Множественная регрессия – уравнение связи с несколькими независимыми переменными:

где y - зависимая переменная (результативный признак);

- независимые переменные (факторы).

Недостаток множ. регр.: она является линейной, определяющие факторы не зависят друг от друга и существует «проклятие размерности». Но существует метод снижения размерности: проверяют не связаны ли какие-то переменные с помощью к-та корреляции, если они св-ны, то уменьшают размерность.

 

МНК

Метод наименьших квадратов (МНК) - метод оценки параметров модели на основании экспериментальных данных, содержащих случайные ошибки. В основе метода лежат следующие рассуждения: при замене точного (неизвестного) параметра модели приблизительным значением необходимо минимизировать разницу между экспериментальными данными и теоретическими (вычисленными при помощи предложенной модели). Это позволяет рассчитать параметры модели с помощью МНК с минимальной погрешностью.

Мерой разницы в методе наименьших квадратов служит сумма квадратов отклонений действительных (экспериментальных) значений от теоретических. Выбираются такие значения параметров модели, при которых сумма квадратов разностей будет наименьшей – отсюда название метода:

= min

где Y – теоретическое значение измеряемой величины, y – экспериментальное.

При этом полученные с помощью МНК параметры модели являются наиболее вероятными.

Метод наименьших квадратов, а также его различные модификации (нелинейный МНК, взвешенный МНК и т.д.) широко используется в аналитической химии, в частности, при построении градуировочной модели. Как правило, предполагается линейная зависимость (параметры которой требуется установить) между аналитическим сигналом и содержанием определяемого вещества. В этом случае метод наименьших квадратов позволяет оптимизировать параметры градуировки (и получить наименьшую погрешность анализа), а сумма квадратов разностей теоретического и экспериментального значения аналитического сигнала является мерой погрешности градуировки и линейно связана с так называемой остаточной дисперсией (дисперсией адекватности модели)

 

 

Свойства оценок МНК

  1. Свойство несмещенности

Оценка ay параметра αy называется несмещенной если математической ожидание ay = линейному значению параметра αy

Т.е. найденное значение параметра максимально приближено к истинному.

  1. Свойство состоятельности

Дисперсия оценок параметров стремится к нулю при увеличении наблюдений.

  1. Свойство эффективности

Оценка ay называется эффективной параметра αy в классе оценок A, если ее дисперсия является минимальной среди оценок этого класса.

Если модель линейная априорно, то дисперсия линейна aymin по сравнению с …

 

9. Теорема Гаусса-Маркова:

Основ-ся на предпосылках МНК.

Если все 5 предпос-к вып-ся, то оценки коэф-в, получ-е с помощью МНК облад-т след сво-вами:

А). Оценки яв-сянесмещенными, т.е.

Б). Оценки яв-сясостоятельными, т.к. дисп-ии их с ростом объема выборки стрем-ся к 0.

Т.е. ↑ объема выборки приводит к устойчивости оценок коэф-в ур-ия. Сч-ся, что объем выборки д удовл-тьсоот-ию n>3m-1, где m-кол-во объясняющих переем-х.

В). Оценки эфф-ны, т.е. они имеют наименьшую дисп-ию разброса отн-но теорет-х вел-н по срав-ию с такими же оценками полученных с примен-м и люб др методов расчета.

В англоязычнаучлит-ре эти оценки получ-ли название BLUE (голубые оценки) по первыем буквам (наилучлин состоят эффект). Если наруш-ся предпосылки 2 и 3, то дисп-ииоткл-ий не пост-ны, случоткл-ия связаны др с др и коэф-ты теряют св-ванесмещен-ти и эффек-ти.

При этос б сделаны след предположения:

1). Объясняющперем-ые не яв-сяслуч.

2). Случ вел-ныεi имеют норм распр-ие с пар-ми 0 и ε²

εi²~N(0;σ²)

Число набл-ий n>3m-1 сущ-но > числа объясняющперем-х. Отсут-т ошибки специф-ии. М/у объясняющперем-ми в случае m≥2 отсут-т зав-т (мультикол-ть).

 

 

Обобщенный метод наименьших квадратов

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2017-12-07 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: