МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РФ
Федеральное государственное бюджетное образовательное
учреждение высшего профессионального образования
«Тульский государственный университет»
Кафедра химии
Т.В. Рогова, В.А. Арляпов
СБОРНИК МЕТОДИЧЕСКИХ УКАЗАНИЙ
К самостоятельной работе студентов
по дисциплинам:
«Обработка результатов химического эксперимента», «Планирование и обработка результатов эксперимента» и «Статистическая обработка
Результатов биологического эксперимента».
Направления подготовки: 020100 Химия; 240700 Биотехнология;
020400 Биология.
Тула 2013 г.
УДК 543.08
Сборник методических указаний к самостоятельной работе студентов по дисциплинам: «Обработка результатов химического эксперимента», «Планирование и обработка результатов эксперимента» и «Статистическая обработка результатов биологического эксперимента». / Т.В. Рогова, В.А. Арляпов.– Тула: Изд-во ТулГУ, 2013. – 86 с.
В сборнике методических указаний к самостоятельной работе студентов приведены примеры расчетов, позволяющих определить выборочные характеристики одномерной выборочной совокупности (размаха варьирования, среднего значения, медианы, стандартного отклонения, относительного стандартного отклонения, доверительного интервала) и двумерной выборки (параметров линейной регрессии, коэффициента чувствительности). Расчет коэффициента корреляции позволяет сделать вывод о зависимости двух переменных. Расчеты соответствующих тестовых статистик позволяют на основании статистических критериев принять или опровергнуть ту или иную гипотезу (исключение выпадающих данных, выявление систематической погрешности).
Целью пособия является обучение учащихся корректно, с учетом интервального оценивания, представлять результаты эксперимента; оценивать случайные погрешности эксперимента и метрологические характеристики (воспроизводимость, чувствительность); пользуясь статистическими критериями проверки гипотез, выявлять грубые и систематические погрешности.
Печатается по решению библиотечно-издательского совета Тульского государственного университета
ОГЛАВЛЕНИЕ
Задание 1. 4
1.1. Теоретические сведения. 5
1.2. Пример выполнения задания 1. 11
1.3. Варианты задания 1. 14
Задание 2. 17
2.1. Теоретические сведения. 18
2.2. Пример выполнения задания 2. 22
2.3. Варианты задания 2. 31
Задание 3. 46
3.1. Теоретические сведения. 47
3.2. Пример выполнения задания 3. 52
3.3. Варианты задания 3. 67
Справочные данные. 82
Рекомендуемая литература. 86
ИНДИВИДУАЛЬНЫЕ ЗАДАНИЯ ДЛЯ РАСЧЕТНОЙ РАБОТЫ
Задание 1
1. Выборку (таблица 1) ранжировать и проверить на наличие грубых погрешностей, сформулировав нуль-гипотезу (по Q – критерию). Доверительную вероятность принять равной Р = 0,90.
2. Рассчитать размах варьирования, среднее значение с доверительным интервалом, медиану, стандартное отклонение, относительное стандартное отклонение.
Теоретические сведения
Для решения вопросов об исключении из серии выпадающего результата существует ряд приемов. Простейший из них, применяется при n 5, заключается в отбрасывании наибольшего и наименьшего результатов.
Более строгий подход основан на использовании статических критериев, в частности Q-критерия. В этом случае тестовую статистику рассчитываю как частное от деления разности между выпадающим и ближайшим к нему результатом на размах варьирования. Для проведения Q-теста серию данных упорядочивают по возрастанию: x1≤x2≤…≤xn-1≤xn. В качестве возможного промаха рассматривают одно из крайних значений x1 или xn -то, которое дальше отстоит от соседнего значения, т.е. для которого больше разность x2-x1 либо, соответственно, хn-хn-1. Обозначим эту разность как W1. Размах варьирования всей серии, т.е. разность между максимальным и минимальным значением хn-x1, обозначим W0. Тестовой статистикой является отношение:
Полученное значение Qэксп сравнивают с табличным значением Q-критерия (так называемым критическим значением Qкрит, приложение 1) при заданной доверительной вероятности и числе результатов в выборке. Если Qэксп> Qкрит, то выпадающий результат исключают, и наоборот, если Qэксп< Qкрит, то результат исключить нельзя – он принадлежит выборке.
При исключении промахов необходимо иметь в виду, что грубой погрешностью может являться как минимальный или максимальный результат, так и оба крайних значения. Поэтому после отбрасывания промахов полученную выборку так же следует проверить на наличие грубых погрешностей по Q-критерию.
Если выборка очень мала (n=3), следует провести дополнительные измерения и затем включить их в выборку. Если такой возможности нет, лучше для дальнейшей обработки пользоваться медианой, а не средним.
Результат единичного измерения не может служить надежной оценкой содержания определяемого компонента в образце или основой для заключений, которые можно было бы сделать из экспериментальных данных. Для получения надежного результата проводится серия параллельных измерений в идентичных условиях. Результат единичного измерения в такой серии называется вариантой, а вся серия – рядом вариант, выборочной совокупностью или прост выборкой.
В качестве центра распределения используют среднее значение (реже медиану М):
где - единичный результат серии (варианта); n – число вариант.
Медиана – это единичный результат, относительно которого число результатов с большим или меньшим значениями одинаково. При нечетном количестве результатов медиана совпадает с центральным результатом выборки, при четном – она является средним арифметическом двух центральных результатов.
Критериями воспроизводимости служат отклонения от среднего, среднее отклонение от среднего, отклонение и среднее отклонение от медианы, размах варьирования, дисперсия и стандартное отклонение. Отклонения могут быть выражены как абсолютными, так и относительными величинами.
Отклонение от среднего d - это разность между единичным результатом и средним без учета знака. Среднее отклонение - это среднее арифметическое из единичных отклонений:
Отклонение от медианы - это разность между единичным результатом и медианой выборки без учета знака. Среднее отклонение от медианы - это среднее арифметическое из отклонений от медианы.
Размах варьирования w - это разность между максимальным и минимальным значениями выборки:
w = хмакс - хмин
Более строгими критериями воспроизводимости, чем отклонение и размах варьирования, являются дисперсия и стандартное отклонение.
Следует различать дисперсию и стандартное отклонение генеральной совокупности и выборочной совокупности (ряда из n вариант, выборки). Генеральная совокупность представляет собой гипотетическую совокупность, охватывающую все мыслимые результаты от - до +
. Выборочная совокупность - это конечный ряд из n вариант. При n > 20 ряд можно считать генеральной совокупностью с достаточной степенью приближения. В генеральной совокупности среднее и истинное значение совпадают. В выборочной совокупности среднее может отличаться от истинного значения. В генеральной совокупности все результаты и отклонения от среднего - независимые величины, т.е. число степеней свободы f равно числу вариант n. В выборке число степеней свободы равно числу вариант минус число связей, накладываемых на выборку. Для одномерной выборочной совокупности число степеней свободы меньше числа вариант на единицу, так как исключается степень свободы, связанная с определением среднего.
И дисперсия и стандартное отклонение характеризуют рассеяние вариант относительно среднего. Дисперсию выборки (V) вычисляют по формуле:
Если известно истинное значение (), то:
Стандартное отклонение представляет собой квадратный корень из дисперсии, взятый с положительным знаком, и имеет размерность измеряемой величины:
Если известно истинное значение или выборка достаточно велика, стандартное отклонение выражается так:
Стандартное отклонение генеральной совокупности и выборки связаны между собой:
Приближенно стандартное отклонение можно оценить по размаху варьирования:
или
,
где k – фактор отклонения, приводимый в справочниках для разного числа n.
Для сравнения воспроизводимости выборок, варианты которых имеют различные размерности используют также относительное стандартное отклонение (безразмерная величина):
В качестве точечной оценки истинного значения (математического ожидания) обычно используют среднее арифметическое всех вариант выборки, реже медиану или моду. Более информативной, характеризующей точность и надежность оценивания, является интервальная оценка. Она заключается в нахождении доверительных границ (доверительного интервала ), в пределах которых с определенной доверительной вероятностью находится истинное значение. Доверительная вероятность Р показывает, сколько вариант из 100 попадает в данный интервал. Величина Р может быть выражена в процентах. Иногда вместо доверительной вероятности пользуются уровнем значимости
:
=1-Р.
Величина доверительного интервала определяется воспроизводимостью результатов, их числом и доверительной вероятностью. Связь между всеми этими величинами выводится на основе законов нормального распределения для генеральной совокупности и t-распределения для выборочной совокупности.
В случае известной дисперсии статистика , полученная путем стандартизации выборочного среднего
, будет нормально распределена с параметрами N(0, 1). В данном уравнении
– стандартное отклонение генеральной совокупности; zp – табулированный коэффициент, зависящий от доверительной вероятности Р. Отсюда:
,
где - доверительный интервал для математического ожидания нормально распределенной случайной величины с известной дисперсией.
В случае неизвестной дисперсии разница состоит в том, что среднеквадратическое отклонение заменяется его выборочной оценкой s:
Статистика t имеет t-распределение с n-1 степенями свободы. Отсюда:
,
Доверительный интервал для математического ожидания нормально распределенной случайной величины с неизвестной дисперсией рассчитывается по формуле:
,
где s – стандартное отклонение выборки; t(P, f) – коэффициент Стьюдента, приводимый в таблицах (приложение 2) для различных значений доверительной вероятности Р и степеней свободы f.
При одной и той же доверительной вероятности коэффициент zp меньше, чем коэффициент t(P,f), поэтому доверительный интервал при использовании zp и уже, чем при использовании t(P,f) и s. Если предварительно определить
, проделав большое количество измерений (
20), можно пользоваться коэффициентом zp вместо t(P,f) для оценки доверительного интервала. Такой прием целесообразен при проведении серийных анализов, так как, однажды затратив время и труд на оценку
, можно в дальнейшем ограничиться малым количеством однотипных измерений, сохраняя при этом достаточно узкий доверительный интервал. Помогает в оценке
и объединение выборок.
Располагая статистическими критериями, можно решить вопрос о необходимом и достаточном числе параллельных измерений для получения надежного результата или оценить вероятность попадания результата в определенный интервал при заданном числе измерений.
Пример выполнения задания 1
Таблица 1. Пример задания 1.
Номер опыта | Ответ сенсора, нА/мин |
15,3480 | |
15,2950 | |
14,9850 | |
15,0750 | |
14,4460 | |
16,1540 | |
15,9230 | |
15,1380 | |
16,3910 | |
15,9540 | |
14,8630 | |
16,9940 | |
14,9850 | |
14,6420 | |
16,5110 |
Выборку ранжируем:
14,4460 14,6420 14,8630 14,9850 14,9850 15,0750 15,1380 15,2950 15,3480 15,9230 15,9540 16,1540 16,3910 16,5110 16,9940
Для выявления грубых погрешностей проверяем крайние значения: 14,4460 и 16,9940.
- размах варьирования
Тестовая статистика:
Критической величиной является табличное значение Q(P,n)=0,39 (приложение 1). Так как , то промаха нет, данное значение принадлежит выборке.
Рассчитаем среднее значение выборки:
Медиана: М = 15, 295 нА/мин
Рассчитаем стандартное отклонение от среднего для выборки:
- отклонение от среднего
Ответ сенсора, нА/мин | |xi-x| | |xi-x|2 |
15,3480 | 0,1656 | 0,027423 |
15,2950 | 0,2186 | 0,047786 |
14,9850 | 0,5286 | 0,279418 |
15,0750 | 0,4386 | 0,19237 |
14,4460 | 1,0676 | 1,13977 |
16,1540 | 0,6404 | 0,410112 |
15,9230 | 0,4094 | 0,167608 |
15,1380 | 0,3756 | 0,141075 |
16,3910 | 0,8774 | 0,769831 |
15,9540 | 0,4404 | 0,193952 |
14,8630 | 0,6506 | 0,42328 |
16,9940 | 1,4804 | 2,191584 |
14,9850 | 0,5286 | 0,279418 |
14,6420 | 0,8716 | 0,759687 |
16,5110 | 0,9974 | 0,994807 |
Вычисляем относительное стандартное отклонение:
Расчет доверительного интервала:
f= n– 1 = 15 – 1 = 14
Коэффициент Стьюдента t(0,95;14) = 2,15 (приложение 2)
(доверительный интервал округляем до одной значащей цифры)
нА/мин (в среднем значении оставляем столько знаков после запятой, сколько в доверительном интервале).
Сравнение данных полученных при расчете по статистическим формулам и с помощью компьютерной программы MicrosoftExcel.
Метод расчета | Среднее значение | Медиана | Размах варьирования | Стандартное отклонение | Довери-тельный интервал | ![]() |
Расчет по формулам | 15,5136 | 15,295 | 2,548 | 0,7568 | 0,4 | 15,5 ![]() |
Расчет с помощью программы Microsoft Excel | 15,5136 | 15,295 | 2,548 | 0,7568 | 0,4 | 15,5 ![]() |
Варианты задания 1
Номер опыта | Ответ сенсора, нА/мин | ||||
Вариант 1 | Вариант 2 | Вариант 3 | Вариант 4 | Вариант 5 | |
4,0506 | 46,9338 | 5,6981 | 3,0511 | 7,6260 | |
4,0506 | 47,0628 | 5,2473 | 3,6112 | 5,9970 | |
4,0926 | 47,0628 | 5,6960 | 3,6548 | 6,5641 | |
4,1046 | 47,1186 | 5,3440 | 3,8317 | 7,8300 | |
4,1100 | 47,1486 | 4,5067 | 3,9980 | 6,2671 | |
4,1508 | 47,1678 | 5,5087 | 4,0149 | 6,1773 | |
4,1542 | 47,1678 | 5,5188 | 4,1199 | 7,2066 | |
4,1610 | 47,3994 | 4,7049 | 4,2060 | 5,8810 | |
4,1628 | 47,4738 | 5,4344 | 4,5063 | 6,4282 | |
4,1706 | 47,6592 | 5,4635 | 4,6112 | 7,1349 | |
4,2186 | 47,7060 | 4,6146 | 4,7043 | 8,0830 | |
4,2726 | 47,7361 | 4,0147 | 4,9984 | 6,5641 | |
4,2786 | 47,7672 | 4,0982 | 5,0414 | 6,5641 | |
4,2786 | 47,7672 | 5,3441 | 5,1123 | 6,6001 | |
4,2906 | 47,8086 | 4,7041 | 5,2911 | 5,2060 |
Номер опыта | Ответ сенсора, нА/мин | ||||
Вариант 6 | Вариант 7 | Вариант 8 | Вариант 9 | Вариант 10 | |
1,8978 | 40,8606 | 30,7231 | 18,3598 | 56,1514 | |
1,0187 | 40,6018 | 30,4780 | 18,2964 | 55,9575 | |
1,0639 | 40,4679 | 30,0255 | 17,9255 | 54,8233 | |
1,9486 | 40,4723 | 30,0546 | 18,0332 | 55,1526 | |
1,2511 | 40,5667 | 28,9598 | 17,2808 | 52,8514 | |
1,3229 | 40,3846 | 32,2125 | 19,3239 | 59,1002 | |
1,7933 | 40,4197 | 31,9236 | 19,0476 | 58,2550 | |
1,0186 | 40,2902 | 30,1901 | 18,1085 | 55,3831 | |
1,2511 | 40,4021 | 32,6818 | 19,6074 | 59,9672 | |
2,7789 | 40,4745 | 31,9413 | 19,0847 | 58,3684 | |
1,0482 | 40,1739 | 29,7062 | 17,7796 | 54,3770 | |
2,9520 | 40,1674 | 33,8335 | 20,3288 | 62,1733 | |
2,9720 | 40,2683 | 30,0057 | 17,9255 | 54,8233 | |
1,0437 | 40,1476 | 29,3598 | 17,5152 | 53,5684 | |
3,0871 | 40,2485 | 33,1442 | 19,7510 | 60,4063 |
Номер опыта | Ответ сенсора, нА/мин | ||||
Вариант 11 | Вариант 12 | Вариант 13 | Вариант 14 | Вариант 15 | |
39,4540 | 11,9125 | 46,7744 | 34,9656 | 47,9522 | |
39,3177 | 11,8714 | 46,6129 | 34,8449 | 47,7866 | |
38,5208 | 11,6308 | 45,6682 | 34,1386 | 46,8180 | |
38,7522 | 11,7006 | 45,9425 | 34,3437 | 47,0992 | |
37,1352 | 11,2124 | 44,0255 | 32,9107 | 45,1340 | |
41,5259 | 12,5381 | 49,2308 | 36,8018 | 50,4704 | |
40,9321 | 12,3588 | 48,5268 | 36,2756 | 49,7487 | |
38,9141 | 11,7495 | 46,1344 | 34,4872 | 47,2961 | |
42,1351 | 12,7220 | 49,9531 | 37,3418 | 51,2108 | |
41,0118 | 12,3829 | 48,6213 | 36,3462 | 49,8455 | |
38,2072 | 11,5361 | 45,2964 | 33,8607 | 46,4369 | |
43,6852 | 13,1901 | 51,7908 | 38,7155 | 53,0948 | |
38,5208 | 11,6308 | 45,6682 | 34,1386 | 46,8180 | |
37,6391 | 11,3645 | 44,6228 | 33,3572 | 45,7464 | |
42,4436 | 12,8152 | 50,3188 | 37,6151 | 51,5858 |
Номер опыта | Ответ сенсора, нА/мин | ||||
Вариант 16 | Вариант 17 | Вариант 18 | Вариант 19 | Вариант 20 | |
6,8542 | 15,1977 | 9,0636 | 12,0859 | 12,5777 | |
6,3117 | 13,9948 | 8,3462 | 11,1293 | 11,5822 | |
6,8518 | 15,1923 | 9,0604 | 12,0817 | 12,5733 | |
6,4283 | 14,2535 | 8,5005 | 11,3351 | 11,7963 | |
5,4203 | 12,0184 | 7,1675 | 9,5576 | 9,9465 | |
6,6256 | 14,6909 | 8,7614 | 11,6829 | 12,1583 | |
6,6377 | 14,7176 | 8,7773 | 11,7041 | 12,1804 | |
5,6585 | 12,5465 | 7,4825 | 9,9776 | 10,3836 | |
6,5366 | 14,4935 | 8,6437 | 11,5260 | 11,9950 | |
6,5715 | 14,5709 | 8,6898 | 11,5875 | 12,0590 | |
5,5502 | 12,3064 | 7,3393 | 9,7867 | 10,1849 | |
4,8285 | 10,7061 | 6,3849 | 8,5140 | 8,8605 | |
4,9304 | 10,9320 | 6,5196 | 8,6937 | 9,0475 | |
6,4283 | 14,2535 | 8,5005 | 11,3351 | 11,7963 | |
5,6585 | 12,5465 | 7,4825 | 9,9776 | 10,3836 |
Номер опыта | Ответ сенсора, нА/мин | ||||
Вариант 21 | Вариант 22 | Вариант 23 | Вариант 24 | Вариант 25 | |
2,3538 | 81,7264 | 15,3046 | 9,3949 | 20,5896 | |
2,3538 | 81,9510 | 14,0932 | 11,1198 | 16,1914 | |
2,3782 | 81,9510 | 15,2992 | 11,2578 | 17,7226 | |
2,3852 | 82,0482 | 14,3537 | 11,8006 | 21,1404 | |
2,3883 | 82,1004 | 12,1029 | 12,3150 | 16,9207 | |
2,4120 | 82,1338 | 14,7942 | 12,3643 | 16,6782 | |
2,4140 | 82,1338 | 14,8211 | 12,6600 | 19,4573 | |
2,4180 | 82,5371 | 12,6347 | 12,9557 | 15,8782 | |
2,4190 | 82,6667 | 14,5955 | 13,8798 | 17,3556 | |
2,4235 | 82,9895 | 14,6734 | 14,2032 | 19,2637 | |
2,4514 | 83,0710 | 12,3930 | 14,4897 | 21,8235 | |
2,4828 | 83,1234 | 10,7814 | 15,3965 | 17,7226 | |
2,4863 | 83,1776 | 11,0089 | 15,5277 | 17,7226 | |
2,4863 | 83,1776 | 14,3537 | 15,7403 | 17,8198 | |
2,4933 | 83,2497 | 12,6347 | 16,2978 | 14,0558 |
Номер опыта | Ответ сенсора, нА/мин | ||||
Вариант 26 | Вариант 27 | Вариант 28 | Вариант 29 | Вариант 30 | |
2,3741 | 140,1859 | 109,6764 | 15,4876 | 92,1148 | |
1,2744 | 139,2980 | 108,8014 | 15,4341 | 91,7967 | |
1,3309 | 138,8386 | 107,1860 | 15,1212 | 89,9360 | |
2,4377 | 138,8537 | 107,2899 | 15,2121 | 90,4762 | |
1,5651 | 139,1776 | 103,3817 | 14,5774 | 86,7012 | |
1,6549 | 138,5529 | 114,9933 | 16,3009 | 96,9522 | |
2,2434 | 138,6733 | 113,9619 | 16,0678 | 95,5656 | |
1,2743 | 138,2290 | 107,7736 | 15,2756 | 90,8544 | |
1,5651 | 138,6129 | 116,6686 | 16,5400 | 98,3745 | |
3,4764 | 138,8613 | 114,0251 | 16,0991 | 95,7517 | |
1,3113 | 137,8300 | 106,0462 | 14,9982 | 89,2039 | |
3,6929 | 137,8077 | 120,7800 | 17,1486 | 101,9935 | |
3,7180 | 138,1538 | 107,1154 | 15,1212 | 89,9360 | |
1,3057 | 137,7397 | 104,8096 | 14,7751 | 87,8774 | |
3,8619 | 138,0859 | 118,3193 | 16,6612 | 99,0948 |
Задание 2
В таблице 2 приведены результаты определения этанола в коммерческих образцах водок: а) с помощью биосенсора, б) рефрактометрически, в) пикнометрически.
1. Все выборки ранжировать и проверить на наличие грубых погрешностей, сформулировав нуль-гипотезу (по Q – критерию).
2. Произвести расчет точечной и интервальной оценки математического ожидания (среднего значения с доверительным интервалом) для каждой выборки с помощью компьютерных программ и по статистическим формулам.
3. Проверить выборки попарно на однородность по воспроизводимости, сформулировав нуль-гипотезу (по F – критерию).
4. Выявить наличие систематической погрешности при определении с помощью биосенсора, используя модифицированный тест Стьюдента или приближение Уэлча (в качестве референтной методики выбрать а) рефрактометрический; б) пикнометрический метод).
5. Выявить наличие систематической погрешности, используя простой тест Стьюдента, при определении а) с помощью биосенсора, б) рефрактометрически, в) пикнометрически. Заявленное производителем (истинное) значение концентрации этанола 40,0%.
Теоретические сведения
Чтобы решить вопрос, принадлежат ли разные выборки одной совокупности, можно воспользоваться статистическими методами проверки гипотез, в частности, нуль-гипотезы. Нуль-гипотеза строится на предположении о неразличимости статистических критериев выборок при заданной доверительной вероятности. Подтверждение нуль-гипотезы, полученное из сравнения экспериментальных и табличных значений тестовых статистик, говорит о принадлежности сравниваемых выборок к одной совокупности. В зависимости от имеющихся исходных сведений для проверки выполнения нуль-гипотезы можно использовать разные критерии и решать разные проблемы.
Если известны дисперсии или стандартные отклонения разных выборок, можно сравнить их и решить вопрос о принадлежности этих выборок одной совокупности по воспроизводимости. Например, можно сравнить воспроизводимость двух методов определения одной и той же величины.
При этом целесообразно использовать статистический критерий F-распределения (F- критерий или критерий Фишера).
где s >s
.
Нуль-гипотеза строится на предположении о неразличимости дисперсий или стандартных отклонений. Рассчитывают F-критерий по экспириминтальным данным Fэксп и сравнивают найденное значение с табличным значением Fкр при заданной доверительной вероятности и числе степеней свободы f1 и f2 в сравниваемых выборках (приложение 3). Если Fэксп < Fкр нуль-гипотеза подтверждается, если Fэксп > Fкр – отвергается.
Если выборки однородны, то их можно объединить и вычислить среднюю дисперсию по формуле:
Среднюю дисперсию можно использовать как характеристику воспроизводимости объединенной выборки, для которой число степеней свободы и равно f1+f2, где f1 = n1-l и f2 = n2-1, а n1 и n2 – число вариант в исходных выборках.
Величина систематической погрешности служит оценкой правильности измерения или метода измерения. Правильность – это степень близости среднего значения, полученного на основе большой серии результатов единичных определений к истинному или в его отсутствии к принятому опорному (действительному) значению измеряемой величины. Принятое опорное (действительное) значение - этоэкспериментально полученное или расчетное значение, настолько близкое к истинному, что может быть использовано вместо него.
В качестве опорного значения могут быть приняты: данные независимого анализа, аттестованное значение стандартного образца (СО или ГСО) и математическое ожидание измеряемой характеристики, то есть среднее значение заданной совокупности результатов анализа (лишь в том случае, когда недоступны теоретическое значение и отсутствуют СО).
Во всех этих случаях задача сравнения данных с математической точки зрения сводится к проверке значимости отличия случайной величины от константы а. Для решения этой задачи можно использовать подход, основанный на интервальной оценке неопределенности величины
(простой тест Стьюдента). Доверительный интервал для среднего, рассчитанный по формуле Стьюдента, характеризует неопределенность значения
, обусловленную его случайной погрешностью. Поэтому, если величина а входит в этот доверительный интервал, то нет оснований утверждать о значимом различии между
и а. Если же величина а в этот интервал не входит, различие между
и а следует считать значимым. Таким образом, полуширина доверительного интервала, равная
, является критической величиной для разности |
- a |. Различие является значимым, если:
Отсюда:
Величина, стоящая в левой части выражения, характеризует степень различия между и а с учетом случайной погрешности s(x). Она является тестовой статистикой (tэксп) и рассчитывается по экспериментальным данным для сравниваемых значений. Критическое значение коэффициента берут из приложения 2 при заданных доверительной вероятности Р и числе степеней свободы f = n-1. Если тестовая статистика превосходит критическое значение (tэксп > tкр), различие между сравниваемыми величинами следует признать значимым (систематическая погрешность присутствует).
Присравнении двух результатов анализа одного и того же образца, полученные разными методами, содержащих сравнимые между собой случайные погрешности, нельзя ни один из результатов считать точной величиной и применять простой тест Стьюдента. Математически задача в этом случае сводится к установлению значимости различия между средними значениями двух выборок и
.Для решения этой задачи используют модифицированный тест Стьюдента. Он существует в двух вариантах: точном и приближенном.
Точный вариант применяют тогда, когда дисперсии соответствующих величин s12 =s2(x1) и s22= s2(x2) различаются незначимо (что, в свою очередь, необходимо предварительно проверить с помощью статистического теста - теста Фишера). При значимом различии s12 и s22 применяют приближенный вариант (приближение Уэлча). В точном варианте модифицированного теста Стьюдента экспериментальное значение тестовой статистики вычисляется как:
Критическим значением служит коэффициент Стьюдента t(P,f) для выбранной доверительной вероятности Р (обычно 0,95) и числа степеней свободы:
Таким образом, значимое различие между и
имеет место (систематическая погрешность присутствует) тогда, когда:
В случае неоднородности дисперсий двух выборокв приближении Уэлча тестовая статистика вычисляется следующим образом:
Критическим значением служит коэффициент Стьюдента t(P,f). Число степеней свободы в этом случае вычисляется как:
и округляется до ближайшего целого числа.
Таким образом, значимое различие между и
имеет место (систематическая погрешность присутствует) тогда, когда:
2.2. Пример выполнения задания 2
Таблица 2. Пример задания 2.
номер промера | Содержание этанола, % | ||
а | б | в | |
40,0682 | 39,9586 | 39,9195 | |
38,9979 | 39,9615 | 39,8624 | |
39,6918 | 39,9804 | 39,8098 | |
39,7488 | 39,9557 | 39,6847 | |
40,5785 | 39,9438 | 39,6716 | |
40,7107 | 39,9527 | 39,7264 | |
39,4734 | 39,9468 | 39,7505 | |
39,6913 | |||
39,6891 | |||
39,6935 | |||
39,7856 | |||
39,7834 | |||
39,7791 | |||
39,6891 | |||
39,7374 | |||
39,6672 | |||
39,6540 | |||
39,6014 | |||
39,6935 | |||
39,6847 |
1. Ранжирование выборок и проверка на наличие грубых погрешностей.
Упорядочим серии данных в порядке возрастания (рекомендуется использовать для этого программу Microsoft Excel: данные: сортировка):
Содержание этанола, % | ||
а | б | в |
38,9979 | 39,9438 | 39,6014 |
39,4734 | 39,9468 | 39,6540 |
39,6918 | 39,9527 | 39,6672 |
39,7488 | 39,9557 | 39,6716 |
40,0682 | 39,9586 | 39,6847 |
40,5785 | 39,9615 | 39,6847 |
40,7107 | 39,9804 | 39,6891 |
39,6891 | ||
39,6913 | ||
39,6935 | ||
39,6935 | ||
39,7264 | ||
39,7374 | ||
39,7505 | ||
39,7791 | ||
39,7834 | ||
39,7856 | ||
39,8098 | ||
39,8624 | ||
39,9195 |
а) проверяем значение 38,9979, т.к. оно сильнее отстоит от соседнего чем значение 40,7107.
- размах варьирования
Тестовая статистка рассчитывается по формуле:
Критической величиной является табличное значение Q(P,n)= 0,51 (приложение 1).
Та