Основные теоретические положения.




Лабораторная работа № 1

Статистический анализ металлургических процессов в среде Excel

Цель работы: выполнение регрессионного, корреляционного и дисперсного анализа с помощью системы электронных таблиц Excel.

Основные теоретические положения.

При пассивном эксперименте исследователь не вмешивается в процесс функционирования изучаемого объекта, а ограничивается лишь наблюдением за ним и сбором значений как независимых переменных – технологических факторов (входов) Х12, Х3…. Хn, так и отклика на их (выхода) у. этим данным присуще случайная и закономерная изменчивость.

Закономерная изменчивость обусловлена причинно-следственными связями между выходом и входом объекта. Выход, в свою очередь, обладают случайной изменчивостью вследствие колебаний химического состава и свойств сырых материалов, напряжение в сетях электропитания и пр. К случайной изменчивости относят также воздействия на выход, каких-либо факторов, неизвестных или не выявленных на данной стадии исследования. Определённая случайная изменчивость свойственна как входам, так и выходам объекта по причине случайных погрешностей их измерения.

Встроенный математический аппарат электронных таблиц Excel позволяет выполнить простейший статистический анализ данных, включая элементы регрессионного, корреляционного и дисперсионного анализа, не прибегая к программированию этой задачи.

Целью регрессионного анализа является количественное выявление закономерной связи между входами и выходами исследуемого объекта на фоне их случайной изменчивости. Форма этой связи выражается математической моделью объекта в виде уравнения регрессии:

Ȳ=f(x1,x2,x3,…..xn),

где, Ȳ- модельное (т.е. расчётное) значение выхода; n- число факторов.

Fэ – степень адекватности, полученной математической модели, т.е. соответствие её исходным опытным данным, полученным от исследуемого объекта.

Корреляция (корреляционная зависимость) — статистическая взаимосвязь двух или нескольких случайных величин (либо величин, которые можно с некоторой допустимой степенью точности считать таковыми). При этом изменения значений одной или нескольких из этих величин сопутствуют систематическому изменению значений другой или других величин. Математической мерой корреляции двух случайных величин служит корреляционное отношение ƞ, либо коэффициент корреляции R (или)r. В случае, если изменение одной случайной величины не ведёт к закономерному изменению другой случайной величины, но приводит к изменению другой статистической характеристики данной случайной величины, то подобная связь не считается корреляционной, хотя и является статистической.

Дисперсионный анализ — метод в математической статистике, направленный на поиск зависимостей в экспериментальных данных путём исследования значимости различий в средних значениях.

Порядок выполнения:

1. ЗагружаютExcel.

2. Заполняют Лист 1 рабочей книги Excel данными.

3. Из главного меню вводят последовательность команд (СЕРВИС/АНАЛИЗ ДАННЫХ/РЕГРЕССИЯ).

4. В появившемся на экране монитора окне «Регрессия» указывают диапазоны входной интервал по Y (С2:С43) и выходной интервал по Х (В2:В43).

5. Уточнят задание, в том же окне не указывая:

5.1 «константа ноль» (b0 не должна равняться нулю),

5.2 «уровень надёжности», то есть доверительная вероятность (по умолчанию принимается равным 0,95),

5.3 Задают «Вывод- на отдельном листе рабочей книги Excel».

6. Щелкают левой кнопкой мыши на кнопке (ВЫПОЛНИТЬ).

 

Таблица данных №1.

опыт никель Ni% твёрдость HSh
  3,68  
  3,7  
  3,44  
  3,48  
  2,16  
  2,25  
  3,34  
  3,68  
  3,7  
  3,44  
  3,48  
  2,16  
  2,25  
  3,34  
  3,36  
  3,48  
  2,16  
  2,25  
  2,34  
  3,68  
  3,7  
  3,44  
  3,48  
  2,16  
  2,25  
  3,34  
  3,36  
  3,48  
  3,34  
  3,68  
  3,7  
  3,44  
  3,48  
  2,61  
  3,6  
     
  3,55  
  3,37  
  3,2  
  3,45  
  3,15  
  4,08  

 

В соответствии с данными, в которых представлены значения содержания в стали никеля х1=х= Ni %. И твёрдости образца этой стали y= HSh, с целью найти регрессионную математическую модель одномерного типа y = b0+b1x b и выявить её статистические оценки.

В первом опыте исследуем зависимость твёрдости стали (Y) от содержания никеля (X).

Твёрдость — это способность материала сопротивляться проникновению в него другого, более твёрдого тела — индентора во всем диапазоне нагрузки: от момента касания с поверхностью и до вдавливания на максимальную глубину. Существуют методы определения восстановленной и невосстановленной твёрдости.

Вывод итогов

Регрессионная статистика
Множественный R 0,039405314
R-квадрат 0,001552779
Нормированный R-квадрат -0,023408402
Стандартная ошибка 4,640705762
Наблюдения  

 

Дисперсионный анализ

  df SS MS F Значимость F
Регрессия   1,339715353 1,339715353 0,062207746 0,804316311
Остаток   861,4459989 21,53614997    
Итого   862,7857143      

 

Значимость F – уровень значимости ошибки определение экспериментального значения критерия Фишера.

 

 

«t - статистика» - критерий Стьюдента tэ.

«Р - значимость» - уровень значимости ошибки определение коэффициентов bi, математической модели.

«Y-пересечения» - (b0 =74,90126499)

«Переменная х1» - (b1=0,321439845)

 

R-квадрат 0,001552779

 

Критерий R2 – характеризуется степенью тесноты связи между рассматриваемыми переменными, (содержанием никеля в стали и его твёрдостью).

Коэффициент детерминации для модели с константой принимает значения от 0 до 1. Чем ближе значение коэффициента к 1, тем сильнее зависимость. При оценке регрессионных моделей это интерпретируется как соответствие модели данным. Принято считать допустимым R2=0,7.

Таким образом, в нашем случае математическая модель приобретает вид:

Ȳ=74,90126499 - 0,321439845 Х

 

Критерий Fэ позволяет оценить доверительную вероятность вычисленного значения R2.

Значение критерия Фишера F=0,804316311

«Значимость F», число α=1,03211 10-20

Отсюда доверительная вероятность гипотезы об адекватности получаемой математической модели в целом составляет:

β=1-α ~1

Под рубрикой «t - статистика» выведены экспериментальные значения критерия Стьюдента для коэффициентов b0, b1 по которым вычислены «Р - значимость», т.е. уравнение значимости ошибок α0= 0,804316311α1= 1,03211 10-20 определение этих коэффициентов соответственно. Таким образом, данные коэффициенты определены с доверительной вероятностью

β0=1-α0=0,195683689

β0=1-α1~1

Поскольку в данной задаче представлен лишь один фактор х = [P] задача относится к категории одномерного статистического анализа. Коэффициент детерминации для данной задачи равен R2= 0,998 что степень тесноты между переменными большая.Эта связь функциональная, без случайной изменчивости данных.

 

Таблица данных №2.

опыт никель Ni% углерод C % твёрдость HSh
  3,68 3,63  
  3,7 3,7  
  3,44 3,6  
  3,48 3,6  
  2,16 3,46  
  2,25 2,96  
  3,34 3,3  
  3,68 3,2  
  3,7 3,3  
  3,44 3,73  
  3,48 3,62  
  2,16 3,65  
  2,25 3,57  
  3,34 3,7  
  3,36 3,57  
  3,48 3,58  
  2,16 3,76  
  2,25 3,55  
  2,34 3,7  
  3,68 3,6  
  3,7 3,6  
  3,44 3,6  
  3,48 3,6  
  2,16 3,46  
  2,25 2,96  
  3,34 3,3  
  3,36 3,2  
  3,48 3,3  
  3,34 3,73  
  3,68 3,62  
  3,7 3,65  
  3,44 3,57  
  3,48 3,7  
  2,61 3,57  
  3,6 2,96  
    3,3  
  3,55 3,2  
  3,37 3,3  
  3,2 3,73  
  3,45 3,62  
  3,15 3,55  
  4,08 3,56  

 

Вывод итогов

Регрессионная статистика
Множественный R 0,093623275
R-квадрат 0,008765318
Нормированный R-квадрат -0,04206723
Стандартная ошибка 4,682819454
Наблюдения  

 

Дисперсионный анализ

  df SS MS F Значимость F
Регрессия   7,562590778 3,781295389 0,172435141 0,842251009
Остаток   855,2231235 21,92879804    
Итого   862,7857143      

 

Значимость F – уровень значимости ошибки определение экспериментального значения критерия Фишера

«t - статистика» - критерий Стьюдента tэ.

«Р - значимость» - уровень значимости ошибки определение коэффициентов bi, математической модели.

«Y-пересечения» - (b0 =68,87136268)

«Переменная х1» - (b1=0,25698359)

«Переменная х2» - (b2=1,783384585)

R-квадрат 0,008765318

 

Критерий R2 – характеризуется степенью тесноты связи между рассматриваемыми переменными, (содержанием никеля в стали и его твёрдостью).

Коэффициент детерминации для модели с константой принимает значения от 0 до 1. Чем ближе значение коэффициента к 1, тем сильнее зависимость. При оценке регрессионных моделей это интерпретируется как соответствие модели данным. Принято считать допустимым R2=0,7.

Критерий Fэ позволяет оценить доверительную вероятность вычисленного значения R2.

Ход решения отличается от рассмотренного выше лишь тем, что в окне Регрессия указываемый входной диапазон значений Y в виде С2:С42, а общий входной диапазон значений аргументов А2:В42
R2=0,912; b0 =68,87136268; b1=0,25698359; b2=1,783384585.

Таким образом, в нашем случае математическая модель приобретает вид:

Y= 68,87136268 - 0,25698359 Х1 + 1,783384585Х2

Значение критерия Фишера F=0,842251009

«Значимость F», число α=1,3461710-6


P-Значение

Отсюда доверительная вероятность гипотезы об адекватности получаемой математической модели в целом составляет:

β=1-α ~1

Под рубрикой «t - статистика» выведены экспериментальные значения критерия Стьюдента для коэффициентов b0, b1 по которым вычислены «Р - значимость», т.е. уравнение значимости ошибок α0 = 0,84503855α1 = 1,34617 10-6α2 = 0,59725908определение этих коэффициентов соответственно. Таким образом, доверительное вероятности определения коэффициентов определены с доверительной вероятностью

β0=1-α0=0,15496145

β1=1-α1~1

β2=1-α2=0,40274092

Коэффициент детерминации для данной задачи равен R2= 0,912 то степень тесноты между переменными большая. Эта связь функциональная,без случайной изменчивости данных.

Доверительная вероятность определения R2 составила β=1 - 1,34617 10-6=1 т.е. принятая нами модель адекватно описывает исследуемый массив данных.

 

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2022-11-28 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: