Заняття 20
ОБРАБОТКА ЭКСПЕРиМЕНТАЛЬНЫХ ДАННЫХ В ПАКЕТЕ MathCAD
Рассматривается решение в пакете MathCAD наиболее распространенных задач статистической обработки данных: вычисление числовых характеристик, построение гистограмм и эмпирических зависимостей, сглаживание экспериментальных данных.
Моделирование и обработка статистических данных
При использовании в научных и инженерных исследованиях метода статистического моделирования (метод Монте-Карло) необходимо генерировать случайные (точнее, псевдослучайные) числа, распределенные по определенному закону.
Функции MathCAD для вычисления плотности распределения. В табл. 1.1.1 приведены функции (имена начинаются с буквы d), позволяющие вычислить значения функции плотности наиболее используемых распределений ( значение, для которого вычисляется плотность распределения).
Таблица 1.1.1
Распределение | Функция MathCAD |
Нормальное распределение
![]() | ![]() ![]() ![]() |
Распределение Пуассона
![]() ![]() ![]() | ![]() ![]() ![]() |
Равномерное распределение
![]() ![]() ![]() | ![]() ![]() ![]() |
Биноминальное распределение
![]() ![]() | ![]() ![]() ![]() |
Окончание табл. 1.1.1
Распределение | Функция MathCAD |
![]() ![]() ![]() ![]() ![]() | ![]() ![]() ![]() |
Распределение Стьюдента
![]() ![]() | ![]() ![]() ![]() |
Функции MathCAD для вычисления квантилей распределения. Число называется квантилем уровня
распределения с плотностью
, если оно является решением следующего нелинейного уравнения:
.
В табл. 1.1.1 в правой колонке второй строкой приведены функции MathCAD (имена начинаются с буквы ) вычисления квантилей соответствующих вычислений.
Функции MathCAD генерирования случайных векторов. Вектор, проекции которого являются случайными числами, распределенными по определенному закону, называется случайным вектором.
В табл. 1.1.1 в правой колонке третьей строкой приведены имена функций (начинаются с буквы ), вычисляющих случайный вектор с соответствующим распределением его проекций. Параметр
размерность случайного вектора.
Функция генерирует одно случайное число, равномерно распределенное в интервале [0, 1].
Пример 1.1.1. На рис. 1.1.1 приведен фрагмент документа MathCAD, в котором генерируются два случайных вектора: – проекции имеют нормальное распределение (математическое ожидание равно –20, дисперсия 100);
– проекции имеют
распределение (с числом степеней свободы 10). Размерность векторов равна 100. ♦
Функции MathCAD вычисления выборочных значений числовых характеристик. К числовым характеристикам случайной величины относятся: математическое ожидание (или среднее), дисперсия, среднеквадратическое отклонение и т.д. Часто возникает необходимость оценить эти характеристики по выборке значений случайной величины объема . Такие оценки называют выборочными значениями числовых характеристик.
Рис. 1.1.1. Моделирование и обработка статистических данных
В табл. 1.1.2 приведены имена функций, вычисляющих выборочное значение часто используемых числовых характеристик. Здесь векторы размерности
, составленные из значений случайной величины
и
.
Таблица 1.1.2
Числовые характеристики | Функция MathCAD |
Математическое ожидание случайной величины ![]() | ![]() |
Дисперсия случайной величины ![]() | ![]() |
Среднеквадратическое отклонение
случайной величины ![]() | ![]() |
Медиана случайной величины ![]() | ![]() |
Мода случайной величины ![]() | ![]() |
Корреляционный момент двух
случайных величин ![]() | ![]() |
Пример 1.1.2. На рис. 1.1.1 приведен фрагмент документа MathCAD, в котором вычисляются выборочные значения некоторых характеристик по выборкам, полученным в примере 1.1.1. ♦
функции MathCAD вычисления частот значений случайной величины (построение гистограмм). Введём некоторые определения.
Предположим, что дана выборка случайной величины Х (
– объём выборки). Введём L+1 точку
, при этом:
. (1.1.1)
Тогда число значений , попавших в интервал
обозначим через
и назовём частотой.
Очевидно, что
. (1.1.2)
Величину
(1.1.3)
назовём относительной частотой, для которой выполняется условие
. (1.1.4)
В качестве оценки плотности распределения вероятности непрерывной случайной величины Х используют гистограмму относительных частот, т.е. систему прямоугольников, k -й из которых основанием имеет а высота
определяется по формуле
(1.1.5)
и имеет место приближенное тождество
(1.1.6)
где некоторое число из интервала
. Поэтому при больших объёмах выборки и удачном выборе длин интервалов
гистограмма является ступенчатой аппроксимацией плотности распределения
.
Возникает вопрос: как сформировать интервалы ? Количество интервалов L рекомендуется вычислять по формуле
где
– целая часть числа
. Обычно интервалы берут равной длины
, и тогда узлы
определяются выражением:
(1.1.7)
где
.
Значения wk, вычисляются по частотам
. Поэтому для определения
по выборке
в MathCAD включены две функции: hist(int,X), histogram(int,X).
Параметры функции hist(int,X):
int – массив длины (L +1), составленный из значений
Если параметр int задать целым числом, равным числу интервалов L, то при выполнении функции формируется рабочий массив узлов
по формулам (1.1.7), (1.1.8);
X – массив длиной N, составленный из значений выборки
.
Результатом работы функции является одномерный массив
Параметры функцииhistogram(int,X):
int – массив длины (L+ 1), составленный из значений
Если int задать целым числом, равным числу интервалов L, то при выполнении функции формируется рабочий массив узлов
по формулам (1.1.7), (1.1.8);
Х – массив длиной N, составленный из значений выборки
.
Результатом работы функций является матрица размером , первый столбец содержит значения
(середины отрезков
а второй столбец – значения
.
На наш взгляд, более предпочтительной является функция histogram, так как значения более удобны для дальнейшего графического отображения вычисленных величин
Пример 1.1.3. Построить гистограммы относительных частот по выборкам случайных величин определенных в примере 1.1.1. Объём выборки N = 1000.
На рис. 1.1.2 показано построение гистограммы для случайной величины а на рис. 1.1.3 – для случайной величины
с использованием функции histogram при L = 11. Середины отрезков
«откладываются» по оси абсцисс, а для отображения гистограммы задаётся параметр solidbar (команда Формат контекстного меню, закладка Метки). Точками на рисунках показаны значения соответствующих плотностей распределений, вычисленных при
.
Рис. 1.1.2. Гистограмма выборки с нормальным распределением
Рис. 1.1.3. Гистограмма выборки с распределением