Дисциплина «Современные информационные технологии»
ТЕМА ЛАБОРАТОРНОЙ РАБОТЫ№ 1:
«Анализ данных средствами статистических пакетов»
Цель работы: 1. Привить студентам навыки использования пакетов прикладных программ для обработки статистических данных.
Привлекаемые средства:
- Интегрированная вычислительная среда «Mathcad»
- Электронные таблицы Excel.
- Электронные ресурсы Интернет.
Порядок выполнения работы:
1. Уяснение задачи. Составление плана работы.
2. Изучение назначения и возможностей инструментальных программных средств.
3. Сбор статистической информации в Интернете.
4. Ввод информации и настройка программных средств.
5. Визуализация данных. Построение графиков и гистограмм.
6. Выявление тенденции развития процесса. Построение модели тренда.
7. Проверка адекватности модели.
8. Прогнозирование показателей процесса на основе полученной модели.
9. Оформление отчёта о лабораторной работе.
Интернет-ресурсы:
https://www.tspu.tula.ru/
https://ugned.ru/
https://examen.od.ua/
https://phys.adygnet.ru/
https://www.akdi.ru/
1) «Обработка текстовой, графической и числовой информации»;
2) «Анализ данных средствами статистических пакетов»
Н е о б х о д и м о:
1. Составить терминологический словарь и перечень персоналий.
2. По результатам наблюдений за экономическим объектом требуется построить и оценить качество моделей парной регрессии двух видов: А) y=a+b·x; Б) y=a+b·x+cx2 .
Методика выполнения задания:
1. Выделение из таблиц 1, 2, и 3 конкретных массивов изменяемой x и зависимой y переменных в соответствии с порядковым номером варианта курсового задания, который соответствует порядковому номеру фамилии студента в классном журнале.
2. Расчёт оценок коэффициентов a и b уравнения регрессии вида А.
3. Расчёт оценок коэффициентов a, b и с уравнения регрессии вида Б.
4. Расчёт ошибок аппроксимации SА и SБ экспериментальных данных на основе регрессионных моделей вида А и Б.
5. Расчёт коэффициентов эластичности для уравнений вида А и Б.
6. Представление графиков ряда y = f(x) зависимой переменной y (x – независимая переменная - фактор) и зависимой переменной y*, полученнойиз регрессионных уравнений, в прямоугольной системе координат y0x.
В отчёте должны найти отражение вопросы:
1. Терминологический словарь по темам 1-3;
2. Исходные данные варианта контрольного задания;
3. Расчётные формулы с расшифровкой основных параметров;
4. Результаты вычисления коэффициентов регрессии для уравнений А и Б;
5. Графики: результаты наблюдений yi и xi; ряды y* = f(x) зависимой переменной y (x – независимая переменная-фактор), полученные из линейного и параболического регрессионных уравнений - в одной прямоугольной системе координат y0x.
6. Выводы по результатам построения и анализа адекватности моделей А и Б.
Таблица 1. Соответствие вариантов задания и вариантов (рядов) исходных данных
Номер варианта | 1/2 | 3/4 | 5/6 | 7/8 | 9/10 | 11/12 | 13/14 | 15/16 | 17/18 |
Номер ряда x (табл.2) | 1/1 | 1/1 | 1/1 | 1/1 | 2/2 | 2/2 | 2/2 | 2/2 | 2/2 |
Номер ряда y(табл.3) | 1/2 | 3/4 | 5/6 | 7/8 | 9/10 | 1/2 | 3/4 | 5/6 | 7/8 |
Номер варианта | 21/22 | 23/24 | 25/26 | 27/28 | 29/30 | 31/32 | 33/34 | 35/36 | 37/38 |
Номер ряда x(табл.2) | 3/3 | 3/3 | 3/3 | 3/3 | 3/3 | 4/4 | 4/4 | 4/4 | 4/4 |
Номер ряда y(табл.3) | 3/4 | 5/6 | 1/2 | 4/7 | 9/10 | 1/2 | 3/4 | 4/6 | 3/8 |
Таблица 2. Результаты наблюдений независимой переменной x
Номер опыта | Номера вариантов (рядов) переменной x | |||||||||
1,5 | ||||||||||
3,0 | ||||||||||
4,5 | ||||||||||
6,0 | ||||||||||
7,5 | ||||||||||
9,0 | ||||||||||
10,5 | ||||||||||
12,0 | ||||||||||
13,5 | ||||||||||
15,0 |
Таблица 3. Результаты наблюдений зависимой переменной y
Номер опыта | Номера вариантов (рядов) переменной Y | |||||||||
Пример расчётов при выполнении лабораторной работы
Пусть необходимо по результатам наблюдений за показателями x и y
исследуемого объекта (см. табл.4) построить линейную модель парной регрессии вида y(х)= = a+bx+e (a и b – коэффициенты регрессии, y и х - зависимая и независимая переменные) и оценить точность модели.
Таблица 4. Результаты наблюдений за показателями (переменными) x и y
Наблюдения n=10 | y×x | x2 | (по расчетам) | |
x | y | |||
5,91 10,22 14,53 18,84 23,15 27,46 31,77 36,03 40,39 44,7 | ||||
å55 | 253,05 |
Порядок выполнения задания (этап 1):
1. Согласно исходным данным (табл.4) по известным формулам математической статистики определяем:
2. Расчёт коэффициентов а и b регрессионной модели y=a+bx+e осуществляют в соответствии с методом наименьших квадратов (МНК) по формулам:
Подставим данные промежуточных расчётов в приведённые формулы:
3. Определяем значение аппроксимирующей функции в каждом узле xi табл.4:
1) 1,6+4,31×1=5,91; 6) 1,6+4,31×6=27,46;
2) 1,6+4,31×2=10,22; 7) 1,6+4,31×7=31,77;
3) 1,6+4,31×3=14,53; 8) 1,6+4,31×8=36,08;
4) 1,6+4,31×4=18,84; 9) 1,6+4,31×9=40,39;
5) 1,6+4,31×5=23,15; 10) 1,6+4,31×10=44,7.
4. Согласно полученным данным получим график функции (рис.1)
5. Найдем среднюю ошибку аппроксимации по формуле:
. .
6. Найдем коэффициент эластичности, отражающий степень влияния фактора на зависимую переменную:
; Э= .
Вывод: по данным табл.1были найдены значения и построена линейная регрессионная модель, которая аппроксимирует результаты наблюдений. Ошибка аппроксимации составила 13,46 %, а эластичность - 0,937. В интересах повышения точности аппроксимации результатов наблюдений следует применить регрессионную модель второго порядка.