Пусть в некоторой предметной области исследуются показатели X и Y, которые имеют количественное выражение. При этом есть все основания полагать, что показатель Y зависит от показателя X.
Предположим, что после проведения п наблюдений получены следующие числовые данные:
X | ![]() | ![]() | … | ![]() |
Y | ![]() | ![]() | … | ![]() |
Эти табличные данные также можно представить в виде точек ,
, …,
и изобразить в декартовой системе координат XОY. Требуется подобрать функцию
, график которой проходит как можно ближе к точкам.
,
, …,
. Такую функцию называют аппроксимирующей (аппроксимация – приближение) или теоретической функцией. При этом разыскиваемая функция должна быть достаточно проста, т.е. легка в обработке, и в то же время должна отражать зависимость адекватно.
Один из методов нахождения таких функций называется методом наименьших квадратов. Его суть заключается в следующем. Пусть некоторая функция приближает экспериментальные данные
,
, …,
:
Как оценить точность данного приближения? Вычислим значения функции ,
, …,
и разности (отклонения)
,
, …,
между экспериментальными и функциональными значениями и оценим сумму этих отклонений. При этом, во избежание обнуления сумы из-за наличия отрицательных отклонений, будем возводить их в квадрат:
, после чего будем искать такую функцию
, чтобы сумма квадратов отклонений
была как можно меньше.
Как отмечалось выше, подбираемая функция должна быть достаточно проста. Но таких функций существует немало: линейная, гиперболическая, экспоненциальная, логарифмическая, квадратичная и т.д. Какой класс функций выбрать для исследования? Проще всего изобразить точки ,
, …,
на чертеже и проанализировать их расположение. Если они имеют тенденцию располагаться по прямой, то следует искать уравнение прямой
с оптимальными значениями a и b. Иными словами, задача состоит в нахождении таких коэффициентов a и b, чтобы сумма квадратов отклонений
была наименьшей.
Если же точки расположены, например, по гиперболе, то заведомо понятно, что линейная функция будет давать плохое приближение. В этом случае ищем наиболее «выгодные» коэффициенты a и b для уравнения гиперболы . То есть те, которые дают минимальную сумму квадратов
.
Обратите внимание, что в обоих случаях речь идёт о функции двух переменных, аргументами которой являются параметры разыскиваемых зависимостей:
И по существу нам требуется решить стандартную задачу – найти минимум функции двух переменных. Для этого сначала вычисляют частные производные 1-го порядка. Согласно правилу линейности дифференцировать можно прямо под значком суммы:
Составим стандартную систему:
Сокращаем каждое уравнение на «2» и разделяем суммы:
Перепишем систему в более удобном виде:
Теперь приступаем к решению задачи. Координаты точек ,
, …,
нам известны. Суммы
,
,
,
находим из решения системы двух линейных уравнений с двумя неизвестными(a и b). Систему решаем, например, методом Крамера, в результате чего получаем стационарную точку
. Проверяя достаточное условие экстремума, можно убедиться, что в данной точке функция
достигает именно минимума.
Делаем окончательный вывод: функция наилучшим образом приближает экспериментальные точки
,
, …,
, а её график проходит максимально близко к этим точкам.
В традициях эконометрики полученную аппроксимирующую функцию также называют уравнением парной линейной регрессии.
Источник: https://www.mathprofi.ru/metod_naimenshih_kvadratov.html