Корреляционное моделирование




Дата занятия: 02.11.2020

Группа 1-БУЭ-20

Тема занятия:

Моделирование корреляционных зависимостей.

Цель: - рассмотреть применение информационных моделей на примере регрессионных математических моделей. Изучить основные понятия, используемые при моделировании корреляционных зависимостей.

План.

1. Математическое моделирование.

2. Корреляционные зависимости.

ХОД РАБОТЫ

 

1. Ознакомьтесь с конспектом лекции и ответьте на контрольные вопросы.

2. В табличном процессоре Excel ввести данные из примера в таблицу, построить точечную диаграмму, найти коэффициент корреляции.

 

Конспект лекции

Математическое моделирование

Математическая модель - это совокупность количественных характеристик некоторого объекта (процесса) и связей между ним и, представленных на языке математики.

Применение математического моделирования постоянно требует учета зависимостей одних величин от других. Приведем примеры таких зависимостей:

1. время падения тела н а землю зависит о т его первоначальной высоты;

2. давление газа в баллоне зависит от е г о температуры

Рассмотрим примеры двух других, не формульных, способов представления зависимостей между величинами: табличного и графического. Представьте себе, что мы решили проверить закон свободного падения тела экспериментальным путем. Эксперимент организуем следующим образом: будем бросать стальной шарик с 6-метровой высоты, 9- метровой и т.д. (через 3 метра), замеряя высоту начального положения шарика и время падения. По результатам эксперимента составим таблицу и нарисуем график

В этом примере мы рассмотрели три способа моделирования зависимости величин: функциональный (формула), табличный и графический. Однако математической моделью процесса падения тела на землю можно назвать только формулу. Формула более универсальна, она позволяет определить время падения тела с любой высоты, а не только для того экспериментального набора значений Н, который отображен на рисунке. Имея формулу, можно легко создать таблицу и построить график, а наоборот – весьма проблематично.

Корреляционное моделирование

Зависимости между величинами, каждая из которых подвергается не контролируемому полностью разбросу, называются корреляционными зависимостями.

Раздел математической статистики, который исследует такие зависимости, называется корреляционным анализом. Корреляционный анализ изучает усредненный закон поведения каждой из величин в зависимости от значений другой величины, а также меру такой зависимости.

Оценку корреляции величин начинают с высказывания гипотезы о возможном характере зависимости между их значениями. Чаще всего допускают наличие линейной зависимости. В таком случае мерой корреляционной зависимости является величина, которая называется коэффициентом корреляции. Как и прежде, мы не будем писать формулы, по которым этот коэффициент вычисляется; их написать нетрудно, гораздо труднее понять, почему они именно такие. На данном этапе достаточно знать следующее:

• коэффициент корреляции (обычно обозначаемый греческой буквой ρ) есть число из диапазона от -1 до +1;
• если это число по модулю близко к 1, то имеет место сильная корреляция; если к 0, то слабая;
• близость ρ к +1 означает, что возрастанию значений одного набора соответствует возрастание значений другого набора, близость ρ к -1 означает, что возрастанию значений одного набора соответствует убывание значений другого набора;
• значение ρ легко найти с помощью Excel, так как в эту программу встроены соответствующие формулы.

Регрессионные математические модели строятся в тех случаях, когда известно, что зависимость между двумя факторами существует и требуется получить ее математическое описание. Давайте рассмотрим задачи другого рода. Пусть важной характеристикой некоторой сложной системы является фактор A, на него могут оказывать влияние одновременно многие другие факторы: B, C, D и так далее.

Рассмотрим два типа задач:

1) Требуется, определить, оказывает ли фактор В какое-либо заметное регулярное влияние на фактор А?

2) Какие из факторов B, C, D и так далее оказывают наибольшее влияние на фактор А?

В качестве примера сложной системы рассмотрим школу. Пусть, для первого типа задач фактором А, является средняя успеваемость учащихся школы, фактором В финансовые расходы школы на хозяйственные нужды: ремонт здания, обновление мебели, эстетическое оформление помещения и т. п. Здесь влияние фактора В на фактор А не очевидно. Наверное, гораздо сильнее на успеваемость влияют другие, причины: уровень квалификации учителей, контингент учащихся, уровень технических средств обучения и другие.

Специалисты по статистике знают, что для того, чтобы выявить зависимость от какого-то определенного фактора, нужно максимально исключить влияние других факторов. Проще говоря, собирая, информацию из разных школ, нужно выбирать такие школы., в которых приблизительно одинаковый контингент учеников, квалификация учителей и пр., нехозяйственные расходы школ разные (у одних школ могут быть богатые спонсоры, у других— нет).

Итак, пусть хозяйственные расходы школы выражаются количеством рублей, отнесенных к числу учеников в школе (руб./чел.), потраченных за определенный период времени (например, за последние 5 лет). Успеваемость же, пусть оценивается средним баллом учеников школы по результатам окончания последнего учебного года (Таблица 1).


 

№ п/п Затраты (руб./чел.) Успеваемость (средний балл)
    3,81
    4,13
    4,30
    3,96
    3,87
    4,33
    4,00
    4,21
    4,40
    3,99
    3,90
    4,07
    4,15
    4,10
    3,76
    4,25
    3,88
    4,50
    4,12
    4,32

 

Итоги сбора данных по 20 школам, введенные в электронную таблицу, представлены на рис. 1.

На рис. 1 приведена точечная диаграмма, построенная по этим данным, достаточно знать следующее: коэффициент корреляции (обычно обозначаемый греческой буквой ρ) есть число, заключенное в диапазоне, если это число по модулю близко к 1, то имеет место сильная корреляция, если к 0, то слабая: близость ρ к +1 означает, что возрастанию одного набора значений соответствует возрастание другого набора, близость к -1 означает обратное: значение ρ легко найти с помощью MS Excel без всяких, формул (разумеется, потому, что в MS Excel они встроены).

В Excel функция вычисления коэффициента корреляции называется КОРРЕЛ и входит в группу статистических функций. К ак же ей воспользоваться? Установим курсор на любую свободную ячейку и запустим функцию КОРРЕЛ. Она запросит два диапазона значений. Укажем В2:В21 и С2:С21. После их ввода выведется ответ: ρ = 0,500273843. Эта величина говорит о среднем: уровне корреляции.

Наличие зависимости между хозяйственными затратами школы и успеваемостью нетрудно понять. Ученики с удовольствием: ходят в чистую, красивую, уютную школу, чувствуют там себя, как дома, и поэтому лучше учатся.

В следующем примере проводится исследование по определению зависимости успеваемости учащихся старших классов от двух факторов: обеспеченности школьной библиотеки учебниками и обеспеченности школы компьютерами. И та и другая характеристика количественно выражаются в процентах от нормы. Нормой обеспеченности учебниками является их полный комплект, то есть такое количество, когда каждому ученику выдаются из библиотеки все нужные ему для учебы: книги. Нормой обеспеченности компьютерами будем считать такое их количество, при котором на каждые четыре старшеклассника в школе приходится: один: компьютер. Предполагается, что компьютерами ученики пользуются не только на информатике, но и на других уроках, а также во внеурочное время.

В таблице 2, приведены результаты измерения обоих факторов в 10 разных школах. Напомним, что влияние каждого фактора исследуется независимо от других (то есть влияние других существенных факторов должно быть приблизительно одинаковым).

Значения обеих величин: финансовых затрат и успеваемости учеников имеют значительный разброс и, на первый взгляд, взаимосвязи между ними не видно. Однако она вполне может существовать.

Зависимости между величинами, каждая из которых подвергается не контролируемому полностью разбросу, называются корреляционнными зависимостями.

Раздел математической статистики, который исследует такие зависимости, называется корреляиионным анализом. Корреляционный анализ изучает усредненный закон поведения каждой из величин в зависимости от значений другой величины, а также меру такой зависимости.

Оценку корреляции величин начинают с высказывания гипотезы о возможном характере зависимости между их значениями. Чаще всего допускают наличие линейной зависимости. В таком случае мерой корреляционной зависимости является величина, которая называется коэффициентом корреляции. Как и прежде, мы не будем писать формулы, по которым он вычисляется; их написать нетрудно, гораздо труднее понять, почему они именно такие.

Обеспечение учебного процесса
Обеспеченность учебниками (%) Успеваемость (ср. балл) Обеспеченность компьютерами (%) Успеваемость (ср. балл)
    3.81   3.98
    4.15   4.01
    4.69   4.34
    4.37   4.41
5.   4.53   3.94
    4:23   3.62
  75о 4.73   4.6
    3.69   4.24
    4.08   4.36
    4.2   3.99
  р= 0,780931 р = 0.572465 .......

Таблица 4. Сравнение двух корреляционных зависимостей

Для обеих зависимостей получены коэффициенты линейной корреляции, как видно из таблицы, корреляция между обеспеченностью учебниками и успеваемостью сильнее, чем корреляция между компьютерным обеспечением, и. успеваемостью (хотя и тот и другой коэффициенты корреляции не очень большие). Отсюда можно сделать вывод, что пока, еще книга остается более значительным источником знаний, чем компьютер.

Домашнее задание: Литература [2, §18,19]

 

Для отчета преподавателю: Прочитать конспект лекции, ответить на контрольные вопросы, выполнить задание.

Контрольные вопросы

 

1. Что такое корреляционная зависимость?

2. Что такое корреляционный анализ?

3. Какие типы задач можно решать с помощью корреляционного анализа?

4. Какая величина является количественной мерой корреляции? Какие значения она может принимать?

5. С помощью какого средства табличного процессора Excel можно вычислить коэффициент корреляции?

Задание

 

1. Заполнить электронную таблицу данными из Табл.1 лекции.

2. Построить точечную диаграмму зависимости величин (ее вид показан в учебнике на рис. 3.8).

3. Выполнить статистическую функцию КОРРЕЛ, указав в диалоговом окне диапазоны значений: В2:В21 и С2:С21.

4. Выписать значение коэффициента корреляции.

 

Сроки выполнения:

Задание необходимо выполнить в течение двух дней после даты задания.

Оценка будет снижена, если задания отправлены с опозданием.

ОБРАТНАЯ СВЯЗЬ

Файл с отчетом отправляется на почту преподавателя - Пожидаева Дениса Александровича denis.pozhidaev.80@gmail.com

тел. 071 362 51 91

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2020-11-23 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: