Моделирование и обработка статистических данных




Заняття 20

ОБРАБОТКА ЭКСПЕРиМЕНТАЛЬНЫХ ДАННЫХ В ПАКЕТЕ MathCAD

 

Рассматривается решение в пакете MathCAD наиболее распространенных задач статистической обработки данных: вычисление числовых характеристик, построение гистограмм и эмпирических зависимостей, сглаживание экспериментальных данных.

 

Моделирование и обработка статистических данных

При использовании в научных и инженерных исследованиях метода статистического моделирования (метод Монте-Карло) необходимо генерировать случайные (точнее, псевдослучайные) числа, распределенные по определенному закону.

 

Функции MathCAD для вычисления плотности распределения. В табл. 1.1.1 приведены функции (имена начинаются с буквы d), позволяющие вычислить значения функции плотности наиболее используемых распределений ( значение, для которого вычисляется плотность распределения).

Таблица 1.1.1

Распределение Функция MathCAD
Нормальное распределение  
Распределение Пуассона ( целое неотрицательное число, )
Равномерное распределение , если 0, если
Биноминальное распределение ,

Окончание табл. 1.1.1

Распределение Функция MathCAD
распределение 0, если ; , если ( число степеней свободы)
Распределение Стьюдента ( число степеней свободы)

 

Функции MathCAD для вычисления квантилей распределения. Число называется квантилем уровня распределения с плотностью , если оно является решением следующего нелинейного уравнения:

.

В табл. 1.1.1 в правой колонке второй строкой приведены функции MathCAD (имена начинаются с буквы ) вычисления квантилей соответствующих вычислений.

 

Функции MathCAD генерирования случайных векторов. Вектор, проекции которого являются случайными числами, распределенными по определенному закону, называется случайным вектором.

В табл. 1.1.1 в правой колонке третьей строкой приведены имена функций (начинаются с буквы ), вычисляющих случайный вектор с соответствующим распределением его проекций. Параметр размерность случайного вектора.

Функция генерирует одно случайное число, равномерно распределенное в интервале [0, 1].

Пример 1.1.1. На рис. 1.1.1 приведен фрагмент документа MathCAD, в котором генерируются два случайных вектора: – проекции имеют нормальное распределение (математическое ожидание равно –20, дисперсия 100); – проекции имеют распределение (с числом степеней свободы 10). Размерность векторов равна 100. ♦

 

Функции MathCAD вычисления выборочных значений числовых характеристик. К числовым характеристикам случайной величины относятся: математическое ожидание (или среднее), дисперсия, среднеквадратическое отклонение и т.д. Часто возникает необходимость оценить эти характеристики по выборке значений случайной величины объема . Такие оценки называют выборочными значениями числовых характеристик.

 

 

Рис. 1.1.1. Моделирование и обработка статистических данных

 

В табл. 1.1.2 приведены имена функций, вычисляющих выборочное значение часто используемых числовых характеристик. Здесь векторы размерности , составленные из значений случайной величины и .

 

Таблица 1.1.2

Числовые характеристики Функция MathCAD
Математическое ожидание случайной величины
Дисперсия случайной величины
Среднеквадратическое отклонение случайной величины
Медиана случайной величины
Мода случайной величины
Корреляционный момент двух случайных величин

Пример 1.1.2. На рис. 1.1.1 приведен фрагмент документа MathCAD, в котором вычисляются выборочные значения некоторых характеристик по выборкам, полученным в примере 1.1.1. ♦

 

функции MathCAD вычисления частот значений случайной величины (построение гистограмм). Введём некоторые определения.

Предположим, что дана выборка случайной величины Х ( – объём выборки). Введём L+1 точку , при этом:

. (1.1.1)

Тогда число значений , попавших в интервал обозначим через и назовём частотой.

Очевидно, что

. (1.1.2)

Величину

(1.1.3)

назовём относительной частотой, для которой выполняется условие

. (1.1.4)

В качестве оценки плотности распределения вероятности непрерывной случайной величины Х используют гистограмму относительных частот, т.е. систему прямоугольников, k -й из которых основанием имеет а высота определяется по формуле

(1.1.5)

и имеет место приближенное тождество

(1.1.6)

где некоторое число из интервала . Поэтому при больших объёмах выборки и удачном выборе длин интервалов гистограмма является ступенчатой аппроксимацией плотности распределения .

Возникает вопрос: как сформировать интервалы ? Количество интервалов L рекомендуется вычислять по формуле где – целая часть числа . Обычно интервалы берут равной длины , и тогда узлы определяются выражением:

(1.1.7)

где

.

Значения wk, вычисляются по частотам . Поэтому для определения по выборке в MathCAD включены две функции: hist(int,X), histogram(int,X).

Параметры функции hist(int,X):

int – массив длины (L +1), составленный из значений Если параметр int задать целым числом, равным числу интервалов L, то при выполнении функции формируется рабочий массив узлов по формулам (1.1.7), (1.1.8);

X – массив длиной N, составленный из значений выборки .

Результатом работы функции является одномерный массив

Параметры функцииhistogram(int,X):

int – массив длины (L+ 1), составленный из значений Если int задать целым числом, равным числу интервалов L, то при выполнении функции формируется рабочий массив узлов по формулам (1.1.7), (1.1.8);

Х – массив длиной N, составленный из значений выборки .

Результатом работы функций является матрица размером , первый столбец содержит значения (середины отрезков а второй столбец – значения .

На наш взгляд, более предпочтительной является функция histogram, так как значения более удобны для дальнейшего графического отображения вычисленных величин

 

Пример 1.1.3. Построить гистограммы относительных частот по выборкам случайных величин определенных в примере 1.1.1. Объём выборки N = 1000.

На рис. 1.1.2 показано построение гистограммы для случайной величины а на рис. 1.1.3 – для случайной величины с использованием функции histogram при L = 11. Середины отрезков «откладываются» по оси абсцисс, а для отображения гистограммы задаётся параметр solidbar (команда Формат контекстного меню, закладка Метки). Точками на рисунках показаны значения соответствующих плотностей распределений, вычисленных при .

Рис. 1.1.2. Гистограмма выборки с нормальным распределением

 

 

Рис. 1.1.3. Гистограмма выборки с распределением



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-04-26 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: