Отклонение случайного распределения от нормального.





Нормально распределенные случайные величины широко распространены на практике, например, результаты измерения любой физической величины подчиняются нормальному закону распределения. Нормальным называется распределение вероятностей непрерывной случайной величины, которое описывается плотностью

,

где дисперсия, - среднее значение случайной величины .

Для оценки отклонения распределения данных эксперимента от нормального распределения используются такие характеристики как асимметрия А и эксцесс Е. Для нормального распределения А=0 и Е=0.

Асимметрия показывает, на сколько распределение данных несимметрично относительно нормального распределения: если А>0, то большая часть данных имеет значения, превышающие среднее ; если А<0, то большая часть данных имеет значения, меньшие среднего . Асимметрия вычисляется функцией СКОС. Ее аргументом является интервал ячеек с данными, например, =СКОС (А1:А100).

Эксцесс оценивает «крутость», т.е. величину большего или меньшего подъема максимума распределения экспериментальных данных по сравнению с максимумом нормального распределения. Если Е>0, то максимум экспериментального распределения выше нормального; если Е<0, то максимум экспериментального распределения ниже нормального. Эксцесс вычисляется функцией ЭКСЦЕСС, аргументом которой являются числовые данные, заданные, как правило, в виде интервала ячеек, например: =ЭКСЦЕСС (А1:А100).

 

Задание 1.

 

Одним и тем же вольтметром было измерено 25 раз напряжение на участке цепи. В результате опытов получены следующие значения напряжения в вольтах: 32, 32, 35, 37, 35, 38, 32, 33, 34, 37, 32, 32, 35, 34, 32, 34, 35, 39, 34, 38, 36, 30, 37, 28, 30. Найдите выборочные среднюю, дисперсию, стандартное отклонение, размах варьирования, моду, медиану. Проверить отклонение от нормального распределения, вычислив асимметрию и эксцесс.

1. Наберите результаты эксперимента в столбец А.

2. В ячейку В1 наберите «Среднее», в В2 – «выборочная дисперсия», в В3 – «стандартное отклонение», в В4 – «Максимум», в В5 – «Минимум», в В6 – « Размах варьирования», в В7 – «Мода», в В8 – «Медиана», в В9 – «Асимметрия», в В10 – «Эксцесс». Выровняйте ширину этого столбца с помощью Автоподбора ширины.

3. Выделите ячейку С1 и нажмите на знак «=» в строке формул. С помощью Мастера функций в категории Статистические найдите функцию СРЗНАЧ, затем выделите интервал ячеек с данными и нажмите Enter.

4. Выделите ячейку С2 и нажмите на знак «=» в строке формул. С помощью помощью Мастера функций в категории Статистические найдите функцию ДИСП, затем выделите интервал ячеек с данными и нажмите Enter.

5. Проделайте самостоятельно аналогичные действия для вычисления стандартного отклонения, максимума, минимума, моды, медианы, асимметрии и эксцесса.

6. Для вычисления размаха варьирования в ячейку С6 следует ввести формулу: =МАКС (А1:А25)-МИН(А1:А25).

 

2. Инструменты статистического анализа: Генерация случайных чисел, Гистограмма, Описательная статистика.

Загрузка Пакета анализа.

Пакет анализа без дополнительных установок автоматически не загружается при запуске Excel. Он входит в так называемую Надстройку – набор дополнительных подпрограмм, к которым относятся, например, уже известные вам Мастер диаграмм и Мастер функций. Для загрузки Пакет анализа необходимо:

1) в Основном меню выбрать пункт Сервис;

2) выбрать пункт Надстройки;

3) в появившемся списке Надстроек активизировать переключатель AnalysisToolPak-VBA и нажать ОК.

После этого в меню Сервис добавится пункт Анализ данных. К этому пункту следует обращаться для вызова Пакета анализа.

Инструмент: Генерация случайных чисел.

В Excel имеется встроенная функция СЛЧИСЛ (или RAND) для генерации равномерно распределенных случайных чисел в интервале [0,1].

Пакет анализа позволяет генерировать случайные числа с различными типами распределений: равномерное, нормальное, Бернулли, биномиальное, Пуассона и дискретное (определенное пользователем). Для генерации случайных чисел следует:

1) в меню Сервис выбрать команду Анализ данных;

2) в появившемся диалоговом окне Анализ данных в группе Инструменты анализа выбрать пункт Генерация случайных величин и нажать ОК;

3) в появившемся диалоговом окне Генерация случайных чисел следует заполнить поля ввода:

- в полях Число переменных и Число случайных чисел указать нужное количество столбцов и сколько чисел вы хотите получить в каждом столбце;

- в поле Распределение следует выбрать один из имеющихся типов распределения случайных чисел;

- в группе Параметры следует указать диапазон чисел, т.е. min и max числа распределения для Равномерного распределения; или среднее значение и стандартное отклонение для Нормального распределения и т.д.

- поле Случайное рассеивание заполняется только в том случае, если вам необходимо несколько раз воспроизводить одну и туже последовательность случайных чисел;

- в поле Выходной интервал указывается место, куда следует поместить последовательность чисел, как правило, это интервал ячеек (или столбец целиком).

 

Инструмент: Гистограмма.

Графическое представление результатов обработки статистических данных обычно оформляется в виде гистограммы. Совокупность данных разбивается на частичные интервалы, называемые нормальными. Интервалы разбиения могут быть любой ширины, но обязательно они должны следовать в порядке возрастания. Интервалы разбиения откладываются по оси абсцисс гистограммы. На оси ординат гистограммы откладывается число значений, попавших в интервал разбиения. Это число значений признака совокупности называется частотой.

Для построения гистограммы:

1) в начале следует задать частичные интервалы разбиения;

2) затем в меню Сервис выбрать команду Анализ данных и указать инструмент анализа –Гистограмма и нажать ОК;

3) в диалоговом окне Гистограмма следует указать:

- в группе Входные данные в поле Входной интервал – интервал ячеек с данными, а в поле Интервал карманов – интервал ячеек с частичными интервалами разбиения;

- в группе Параметры вывода указывается интервал ячеек для вывода частот и отмечается галочкой переключатель Вывод графика.

После нажатия ОК инструмент Гистограмма выводит два столбца: карман и частота. Сама гистограмма выводится правее столбца частот. Форматирование гистограммы производится так же, как и любой диаграммы в Excel (см. лабораторную работу №6).

Инструмент: Описательная статистика.

В пакете анализа Excel содержится инструмент Описательная статистика, который создает таблицу основных статистических характеристик для совокупности данных. В этой таблице будут содержаться следующие характеристики: среднее, стандартная ошибка, дисперсия, стандартное отклонение, мода, медиана, размах варьирования интервала, максимальное и минимальное значения, асимметрия, эксцесс, объем совокупности, сумму всех элементов совокупности, доверительный интервал (уровень надежности). Инструмент Описательная статистика существенно упрощает статистический анализ тем, что нет необходимости вызывать каждую функцию для расчета статистических характеристик отдельно.

Для того, чтобы вызвать Описательную статистику, следует:

1) в меню Сервис выбрать команду Анализ данных;

2) в списке Инструменты анализа диалогового окна Анализ данных выбрать инструмент

Описательная статистика и нажать ОК;

3) в появившемся диалоговом окне Описательная статистика необходимо:

- в группе Входные данные в поле Входной интервал указать интервал ячеек, содержащих данные;

- если первая строка во входном диапазоне содержит заголовок столбца, то в поле Метки в первой строке следует поставить галочку;

- активизировать переключатель (поставить галочку) Итоговая статистика, если нужен полный список характеристик;

- активизировать переключатель Уровень надежности и указать надежность в %, если необходимо вычислить доверительный интервал.

 

Задание 2.

 

Сгенерировать 500 случайных чисел, распределенных нормально. Построить гистограмму и полный список статистических характеристик с помощью инструмента Описательная статистика.

1. Выполните команду Сервис®Анализ данных®Генерация случайных чисел;

2..В диалоговом окне Генерация случайных чисел введите в поле число переменных: 1; в поле Число случайных чисел 500; выберите Распределение Нормальное; задайте любое среднее значение (желательно около 100) и небольшое стандартное отклонение (не больше 10); в поле Выходной интервал укажите абсолютный адрес столбца $A$2. Нажмите ОК.

3. Теперь постройте гистограмму по совокупности случайных чисел. Сначала нужно задать интервалы решения. Пусть длины интервалов будут одинаковыми и равны 3. Для автоматического составления интервалов разбиения наберите в ячейку В2 начальное число, например, 75 для наших случайных чисел. Затем выполните команду Правка®Заполнить®Прогрессия. В появившемся диалоговом окне заполните данные:

- в группе переключателей поле Расположение установите по столбцам;

- в поле Шаг наберите 3;

- в поле Предельное значение наберите 125;

- в группе переключателей Тип установите арифметическая и нажмите ОК.

В результате столбец В будет содержать интервалы разбиения (карманы).

4. Выполните команду Сервис®Анализ данных®Гистограмма. В появившемся диалоговом окне Гистограмма заполните:

- входной интервал появится, если щелкнуть мышью по столбцу А;

- интервал карманов появится, если щелкнуть мышью по столбцу В;

- поставьте галочку в поле метки;

- укажите столбец С в поле Выходной интервал;

- активизируйте переключатель Вывод графика; если это поле не содержит галочки, нажмите ОК.

5. Построение гистограммы займет от 5 до 10 минут. За это время письменно ответьте на контрольные вопросы. В результате вычисления получатся столбец под названием Карман, который дублирует ваш столбец интервалов разбиения, и столбец под название Частота с рассчитанными частотами. После того, как появилась гистограмма, измените ее размеры с помощью мыши так, чтобы хорошо были видны все столбцы и подписи.

6. Теперь осталось получить таблицу статистических характеристик с помощью Описательной статистики. Выполните команду Сервис®Анализ данных®Описательная статистика. В появившемся диалоговом окне Описательная статистика укажите:

- в поле Входной интервал появится адрес, если выделить мышью интервал сданными или с клавиатуры набрать адрес $A$2: $A$501;

- в поле Группирование активизировать переключатель по столбцам;

- активизировать переключатель Метки в первой строке;

- в группе Параметры вывода укажите Выходной интервал, щелкнув мышью по какой-либо пустой ячейке ниже столбца частот, например, по С 25;

- активизируйте переключатель Итоговая статистика (если в этом поле нет галочки);

- активизируйте переключатель Уровня надежности и установите 95%;

- снимите галочки с полей наименьший и наибольший и нажмите ОК.

Результаты покажите преподавателю.

 

Контрольные вопросы.

 

1. Для чего предназначена функция СРЗНАЧ?

2. С помощью каких характеристик оценивают разброс статистических данных? Какие функции в Excel их вычисляют? В чем отличие функции оценки разброса данных для генеральной и выборочной совокупности?

3. В чем отличие функций СЧЕТ и СЧЕТЗ?

4. Что такое мода и какая функция ее вычисляет?

5. Что такое медиана и какая функция ее вычисляет?

6. Как вычислить размах варьирования?

7. С помощью каких характеристик оценивают отклонение случайного распределения от нормального? Какой смысл этих характеристик и какие функции в Excel их вычисляют?

8. Что такое Инструменты Анализа? Как загрузить Пакет Анализа?

9. Опишите последовательность действий, которые необходимо совершить для генерации случайных чисел распределенных нормально.

10. Как построить гистограмму?

11. Для чего предназначен инструмент Описательная статистика?





©2015-2018 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Нарушение авторских прав и Нарушение персональных данных

Обратная связь

ТОП 5 активных страниц!