Во-первых, построив графики данных и параметрической модели уже можно сделать предварительный вывод о том, насколько хорошо выбранная модель (с найденными значениями параметров) соответствует данным.
Например, при приближении следующих данных
x = 0:0.05:5;
y = x.*sin(3*x)+sqrt(4*x)+0.2*rand(size(x));
степенным полиномом вида f(x) = p1* x n + p2* x (n-1) + p3* x (n-2) +…+ pn* x + p(n+1)
при различных значениях степени n получим следующие графические отображения результатов (Рис. 8,9,10,11)
Рис. 8 Результаты приближения данных полиномом первой степени
Рис. 9 Результаты приближения данных полиномом четвертой степени
Рис. 10 Результаты приближения данных полиномом седьмой степени
Рис. 11 Результаты приближения данных полиномом девятой степени
По виду сглаживающих функций можно судить о качестве приближения.
Во-вторых, визуально о качестве приближения можно судить по распределению ошибок, т.е. разности данных в заданных точках и значений параметрической модели в этих же точках. Если ошибки достаточно равномерно распределены около нуля и в их поведении нет выраженной тенденции, то тем лучше приближение (Рис. 12,13)
Рис. 11 Результаты приближения данных полиномом первой степени и график распределения ошибок в исходных точках приближаемой функции
Рис. 12 Результаты приближения данных полиномом девятой степени и график распределения ошибок в исходных точках приближаемой функции
Для оценки пригодности приближения применяют так же ряд числовых критериев, вычисляемых автоматически в приложении cftol.
Количественная оценка пригодности приближения
Критерий SSE (Sum of squares due to error) - сумма квадратов ошибок.
Критерий SSE вычисляется по формуле:
где w k - веса (если они не заданы при импорте данных, то считаются равными единице), y k - данные в x k, а k - значения параметрической модели в x k. Близость SSE к нулю говорит о хорошем качестве приближения данных параметрической моделью.
Критерий R-квадрат (R-square) - квадрат смешанной корреляции.
Критерий R-квадрат определяется как отношение суммы квадратов относительно регрессии SSR к полной сумме квадратов (SST), т.е.
где - среднее.
Критерий R-квадрат может принимать значения только от нуля до единицы и, как правило, чем ближе он к единице, тем лучше параметрическая модель приближает исходные данные.
Однако, при увеличении числа параметров модели значение критерия R-квадрат может увеличится, хотя вместе с тем, качество приближения не улучшится. В связи с этим часто применяют другой критерий - уточненный R-квадрат, в который входит число коэффициентов параметрической модели.
Уточненный R-квадрат (Adjusted R-square)
Если число данных равно n, а число параметров модели равно m, то критерий уточненный R-квадрат определяется так:
Его значение не может превышать единицы, а близкие к единице значения уточненного R-квадрат свидетельствуют о хорошем приближении исходных данных параметрической моделью.
Корень из среднего для квадрата ошибки RSME (Root mean Squared Error)