Заняття 20
ОБРАБОТКА ЭКСПЕРиМЕНТАЛЬНЫХ ДАННЫХ В ПАКЕТЕ MathCAD
Рассматривается решение в пакете MathCAD наиболее распространенных задач статистической обработки данных: вычисление числовых характеристик, построение гистограмм и эмпирических зависимостей, сглаживание экспериментальных данных.
Моделирование и обработка статистических данных
При использовании в научных и инженерных исследованиях метода статистического моделирования (метод Монте-Карло) необходимо генерировать случайные (точнее, псевдослучайные) числа, распределенные по определенному закону.
Функции MathCAD для вычисления плотности распределения. В табл. 1.1.1 приведены функции (имена начинаются с буквы d), позволяющие вычислить значения функции плотности наиболее используемых распределений ( значение, для которого вычисляется плотность распределения).
Таблица 1.1.1
Распределение | Функция MathCAD |
Нормальное распределение | |
Распределение Пуассона ( целое неотрицательное число, ) | |
Равномерное распределение , если 0, если | |
Биноминальное распределение , |
Окончание табл. 1.1.1
Распределение | Функция MathCAD |
распределение 0, если ; , если ( число степеней свободы) | |
Распределение Стьюдента ( число степеней свободы) |
Функции MathCAD для вычисления квантилей распределения. Число называется квантилем уровня распределения с плотностью , если оно является решением следующего нелинейного уравнения:
.
В табл. 1.1.1 в правой колонке второй строкой приведены функции MathCAD (имена начинаются с буквы ) вычисления квантилей соответствующих вычислений.
Функции MathCAD генерирования случайных векторов. Вектор, проекции которого являются случайными числами, распределенными по определенному закону, называется случайным вектором.
В табл. 1.1.1 в правой колонке третьей строкой приведены имена функций (начинаются с буквы ), вычисляющих случайный вектор с соответствующим распределением его проекций. Параметр размерность случайного вектора.
Функция генерирует одно случайное число, равномерно распределенное в интервале [0, 1].
Пример 1.1.1. На рис. 1.1.1 приведен фрагмент документа MathCAD, в котором генерируются два случайных вектора: – проекции имеют нормальное распределение (математическое ожидание равно –20, дисперсия 100); – проекции имеют распределение (с числом степеней свободы 10). Размерность векторов равна 100. ♦
Функции MathCAD вычисления выборочных значений числовых характеристик. К числовым характеристикам случайной величины относятся: математическое ожидание (или среднее), дисперсия, среднеквадратическое отклонение и т.д. Часто возникает необходимость оценить эти характеристики по выборке значений случайной величины объема . Такие оценки называют выборочными значениями числовых характеристик.
Рис. 1.1.1. Моделирование и обработка статистических данных
В табл. 1.1.2 приведены имена функций, вычисляющих выборочное значение часто используемых числовых характеристик. Здесь векторы размерности , составленные из значений случайной величины и .
Таблица 1.1.2
Числовые характеристики | Функция MathCAD |
Математическое ожидание случайной величины | |
Дисперсия случайной величины | |
Среднеквадратическое отклонение случайной величины | |
Медиана случайной величины | |
Мода случайной величины | |
Корреляционный момент двух случайных величин |
Пример 1.1.2. На рис. 1.1.1 приведен фрагмент документа MathCAD, в котором вычисляются выборочные значения некоторых характеристик по выборкам, полученным в примере 1.1.1. ♦
функции MathCAD вычисления частот значений случайной величины (построение гистограмм). Введём некоторые определения.
Предположим, что дана выборка случайной величины Х ( – объём выборки). Введём L+1 точку , при этом:
. (1.1.1)
Тогда число значений , попавших в интервал обозначим через и назовём частотой.
Очевидно, что
. (1.1.2)
Величину
(1.1.3)
назовём относительной частотой, для которой выполняется условие
. (1.1.4)
В качестве оценки плотности распределения вероятности непрерывной случайной величины Х используют гистограмму относительных частот, т.е. систему прямоугольников, k -й из которых основанием имеет а высота определяется по формуле
(1.1.5)
и имеет место приближенное тождество
(1.1.6)
где некоторое число из интервала . Поэтому при больших объёмах выборки и удачном выборе длин интервалов гистограмма является ступенчатой аппроксимацией плотности распределения .
Возникает вопрос: как сформировать интервалы ? Количество интервалов L рекомендуется вычислять по формуле где – целая часть числа . Обычно интервалы берут равной длины , и тогда узлы определяются выражением:
(1.1.7)
где
.
Значения wk, вычисляются по частотам . Поэтому для определения по выборке в MathCAD включены две функции: hist(int,X), histogram(int,X).
Параметры функции hist(int,X):
int – массив длины (L +1), составленный из значений Если параметр int задать целым числом, равным числу интервалов L, то при выполнении функции формируется рабочий массив узлов по формулам (1.1.7), (1.1.8);
X – массив длиной N, составленный из значений выборки .
Результатом работы функции является одномерный массив
Параметры функцииhistogram(int,X):
int – массив длины (L+ 1), составленный из значений Если int задать целым числом, равным числу интервалов L, то при выполнении функции формируется рабочий массив узлов по формулам (1.1.7), (1.1.8);
Х – массив длиной N, составленный из значений выборки .
Результатом работы функций является матрица размером , первый столбец содержит значения (середины отрезков а второй столбец – значения .
На наш взгляд, более предпочтительной является функция histogram, так как значения более удобны для дальнейшего графического отображения вычисленных величин
Пример 1.1.3. Построить гистограммы относительных частот по выборкам случайных величин определенных в примере 1.1.1. Объём выборки N = 1000.
На рис. 1.1.2 показано построение гистограммы для случайной величины а на рис. 1.1.3 – для случайной величины с использованием функции histogram при L = 11. Середины отрезков «откладываются» по оси абсцисс, а для отображения гистограммы задаётся параметр solidbar (команда Формат контекстного меню, закладка Метки). Точками на рисунках показаны значения соответствующих плотностей распределений, вычисленных при .
Рис. 1.1.2. Гистограмма выборки с нормальным распределением
Рис. 1.1.3. Гистограмма выборки с распределением