Учебный модуль
СТАТИСТИЧЕСКИЕ ОЦЕНКИ ПАРАМЕТРОВ
ПОСТРОЕНИЕ ДОВЕРИТЕЛЬНЫХ ИНТЕРВАЛОВ
Учебный модуль «Статистические оценки параметров. Построение доверительных интервалов» предназначен для студентов специальности «Управление качеством». Основная направленность модуля углубленное и самостоятельное изучение студентами дисциплины «Статистические методы в управлении качеством».
Модуль может быть использован также при подготовке студентов к государственному экзамену и в процессе дипломного проектирования, а также в процессе подготовки аспирантов по специальности 05.02.23 «Стандартизация и управление качеством продукции».
Модуль рассчитан также на широкий круг лиц, занимающихся разработкой систем качества, практическим управлением качеством и анализом результатов самооценки эффективности функционирования систем менеджмента качества.
Требования к уровню подготовки студентов:
Студенты должны предварительно освоить курс «Математическая статистика», знать основные статистические законы и формулы вычисления их параметров: математического ожидания и дисперсии.
Содержание учебного модуля | |
I. Статистическое оценивание | |
II. Построение доверительного интервала для математического ожидания генеральной совокупности при известном стандартном отклонении | |
III. Построение доверительного интервала для математического ожидания генеральной совокупности при неизвестной дисперсии | |
IV. Построение доверительного интервала для доли признака в генеральной совокупности | |
V. Определение объема выборки | |
5.1. Определение объема выборки для оценки математического ожидания | |
5.2. Определение объема выборки для оценки доли признака в генеральной совокупности | |
VI. Применение доверительных интервалов при проведении самооценки СМК | |
6.1. Оценка суммы элементов генеральной совокупности | |
6.2. Оценка разности | |
6.3. Односторонняя оценка доли нарушений установленных правил | |
VII. Вычисление оценок и объема выборок, извлеченных из конечной генеральной совокупности | |
7.1. Оценка математического ожидания | |
7.2. Оценка доли признака | |
7.3. Определение объема выборки | |
Таблица 1. Значения функции Ф (- x £ z£ x) | |
Таблица 2. Критические значения распределения Стьюдента |
В результате изучения данного модуля и выполнения самостоятельной работы студент должен овладеть следующими компетенциями:
|
• Уметь применять методологию построения доверительных интерваловв различных областях производственной и управленческой деятельности
• Выполнять построение доверительного интервала для математического ожидания генеральной совокупности при известной и неизвестной дисперсии
• Уметь выполнять построение доверительного интервала для доли признака в генеральной совокупности
• Определять объем выборки для оценки математического ожидания и доли признака в генеральной совокупности
• Уметь использовать методологию построения доверительных интерваловпри проведении внутреннего аудита и анализа результатов, характеризующих эффективность функционирования систем менеджмента качества
• Проводить вычисления оценок и объема выборок, извлеченных из конечной генеральной совокупности
|
•Уметь разрабатывать вербальные модели бизнес-процессов, качество функционирования которых может быть описано с использованием формул доверительных интервалов
• Уметьиспользоватьпроцедуры Ехсеl при построении доверительных интервалов.
Качество усвоения студентами данного модуля оценивается по результатам защиты индивидуальной контрольной работы, оформляемой каждым студентом в письменном виде.
I. Статистическое оценивание
Статистическое оценивание – это анализ выборочных характеристик. Его преимуществами являются:
• результаты выборочного исследования объективны и обоснованны, поскольку определение объема выборки основано на точно сформулированных статистических принципах;
• метод выборочного исследования позволяет заранее определить объем выборки;
• метод позволяет оценить ошибку выборочного исследования;
• этот подход можно применять для более точной оценки параметров, поскольку исследование большой генеральной совокупности может занять много времени и даже сопровождаться значительными ошибками нестатистического характера;
• Метод выборочного исследования позволяет объективно оценить результаты проверки, поскольку его точность известна заранее.
Случайная выборка из n элементов — это такой отбор, при котором элементы извлекаются по одному из всей генеральной совокупности и каждый из них имеет равный шанс быть отобранным. Требование случайности обеспечивается отбором по таблицам случайных чисел или по жребию. Такая выборка называется собственно-случайной. Одним из примеров использования собственно-случайной выборки является проведение тиражей выигрышей денежно-вещевых лотерей, при которых обеспечивается равная возможность попадания в тираж любого номера лотерейного билета.
|
По способу отбора элементов различают два типа случайных выборок: собственно-случайная повторная (схема возвращенного шара); собственно-случайная бесповторная (схема невозвращенного шара).
Выбор схемы отбора зависит от характера изучаемого объекта. При повторном отборе единица наблюдения после извлечения из генеральной совокупности регистрируется и вновь возвращается в генеральную совокупность, откуда опять может быть извлечена случайным образом. При бесповторном отборе элемент в выборку не возвращается. Следует отметить, что независимо от способа организации выборки она должна представлять собой уменьшенную копию генеральной совокупности, т.е. быть представительной (репрезентативной).
Числовые характеристики генеральной совокупности, как правило, неизвестны (математическое ожидание, дисперсия и др.), называются параметрами генеральной совокупности. Их обозначают: μ, . Доля единиц, обладающих тем или иным признаком в генеральной совокупности, называется генеральной долейи обозначается буквой р.
По данным выборки рассчитывают числовые характеристики, которые называют статистиками. О бозначим выборочные статистики для среднего арифметического, дисперсии и доли соответственно через , и рn. Одноименные статистики, получаемые по различным выборкам, как правило, отличаются друг от друга. Поэтому статистика, полученная из выборки, является только оценкой неизвестного параметра генеральной совокупности. Оценка параметра — это определенная числовая характеристика, полученная из выборки. Желательно, чтобы оценки параметров генеральной совокупности обладали свойствами несмещенности, состоятельности и эффективности.
Несмещенная оценка означает свойство, состоящее в том, что математическое ожидание оценки (например, средняя выборочного распределения) равно параметру генеральной совокупности (М ()= μ). При соблюдении этого свойства в результате осуществления множества выборок для определения оценки одни выборочные показатели будут больше параметра генеральной совокупности, другие меньше, но среднее значение будет равно параметру генеральной совокупности. Напротив, при смещенной оценке среднее значение будет больше или меньше параметра генеральной совокупности.
Состоятельность – это свойство оценки, согласно которому дисперсия оценки уменьшается до нуля с увеличением объема выборки до бесконечности.
Оценки, которые одновременно и несмещенные, и имеют наименьшую дисперсию, называются эффективными оценками.
Когда оценка определяется одним числом, ее называют точечной оценкой.
В качестве точечных оценок параметров генеральной совокупности используются соответствующие выборочные характеристики. Теоретическое обоснование возможности использования этих выборочных оценок для суждений о характеристиках и свойствах генеральной совокупности дают закон больших чисел. Смысл его результатов заключается в том, что при осреднении большого числа (n) случайных слагаемых все менее ощущается характерный для случайных величин неконтролируемый разброс в их значениях, так что в пределе при этот разброс исчезает вовсе или, как принято говорить, случайная величина вырождается в неслучайную. Однако при любом конечном числе слагаемых п случайный разброс у среднего арифметического этих слагаемых остается. Поэтому возникает вопрос исследования характера этого разброса.
Выборочная средняя является точечной оценкой генеральной средней, т.е.
Генеральная дисперсия имеет 2 точечные оценки: σ 2 выб. — выборочная дисперсия; S 2 — исправленная выборочная дисперсия[1]. σ 2 выб исчисляется при п > 30, a S 2 — при п < 30. Причем в математической статистике доказывается, что
При больших объемах выборки σ 2 выб и S 2 практически совпадают.
Поскольку выборочная совокупность представляет собой лишь часть генеральной совокупности, то вполне естественно, что выборочные характеристики не будут точно совпадать с соответствующими генеральными. Ошибка репрезентативности может быть представлена как разность между генеральными и выборочными характеристиками изучаемой совокупности:
Применительно к выборочному методу из теоремы Чебышева следует, что с вероятностью, сколь угодно близкой к единице, можно утверждать, что при достаточно большом объеме выборки и ограниченной дисперсии генеральной совокупности разность между выборочной средней и генеральной средней будет сколь угодно мала и оценивается по формуле:
(1)
где — среднее арифметическое по совокупности выбранных единиц;
μ — среднее арифметическое по генеральной совокупности;
σ ген — среднее квадратическое отклонение в генеральной совокупности;
t – коэффициент доверия.
В дальнейшем нижний индекс при обозначении среднего квадратического отклонения в генеральной совокупности будем опускать, а среднее квадратическое отклонение по выборке обозначать через S.
Согласно центральной предельной теореме, выборочные распределения статистик (при п > 30) будут иметь нормальное распределение независимо от того, какое распределение имеет генеральная совокупность. Следовательно,
(2)
где Ф 0(t) — функция Лапласа. Эта функция часто используемся для вычисления вероятности попадания случайной величины Х, распределеннойпо нормальному закону в интервал от значения α до значения β:
.
Выражение (2) показывает, что о величине расхождения между и μ можно судить лишь с определенной вероятностью, значение которой зависит от стандартной ошибки (standard error) выборочных средних и показателя t. Поэтому в теории статистического анализа для оценки характеристик генеральной совокупности помимо точечных оценок используются и интервальные оценки.
При выборочном исследовании генеральной совокупности и формулировании статистических выводов часто возникают этические проблемы. Основная из них — как согласуются доверительные интервалы и точечные оценки выборочных статистик. Публикация точечных оценок без указания соответствующих доверительных интервалов (как правило, имеющих 95%-ный доверительный уровень) и объема выборки, на основе которых они получены, может породить недоразумения. Это может создать у пользователя впечатление, что точечная оценка — именно то, что ему необходимо, чтобы предсказать свойства всей генеральной совокупности. Таким образом, необходимо понимать, что в любых исследованиях во главу угла должны быть поставлены не точечные, а интервальные оценки. Кроме того, особое внимание следует уделять правильному выбору объемов выборки. Чаще всего объектами статистических манипуляций становятся результаты социологических опросов населения по тем или иным политическим проблемам. Чтобы доказать обоснованность полученных точечных оценок, необходимо указывать объем выборки, на основе которой они получены, границы доверительного интервала и его уровень значимости.
Интервальной оценкой называют оценку, которая определяется 2 числами — концами интервала, который с определенной вероятностью накрывает неизвестный параметр генеральной совокупности. Интервал, содержащий оцениваемый параметр генеральной совокупности, называют доверительным интервалом.
Для его определения вычисляется предельная ошибка выборки, позволяющая установить предельные границы, в которых с заданной вероятностью (надежностью) должен находиться параметр генеральной совокупности.
Предельная ошибка выборки равна t - кратному числу средних ошибок выборки. Коэффициент t позволяет установить, насколько надежно высказывание о том, что заданный интервал содержит параметр генеральной совокупности. Если мы выберем коэффициент таким, что высказывание в 95% случаев окажется правильным и только в 5% — неправильным, то мы говорим: со статистической надежностью в 95% доверительный интервал выборочной статистики содержит параметр генеральной совокупности. Статистической надежности в 95% соответствует доверительная вероятность — 0,95. В 5% случаев утверждение «параметр принадлежит доверительному интервалу» будет неверным, т. е. 5% задает уровень значимости (α),или вероятность ошибки равна 0,05. Обычно в статистике уровень значимости выбирают таким, чтобы он не превысил 5% (α < 0,05). Доверительная вероятность и уровень значимости дополняют друг друга до 1 (или 100%) и определяют надежность статистического высказывания (см. рис.1).
Доверительный уровень равный 95%, интерпретируется следующим образом:
если из генеральной совокупности извлечь все выборки, имеющие объем п, и вычислить их выборочные средние, то 95% доверительных интервалов, построенных на их основе, будут содержать математическое ожидание генеральной совокупности, а 5% — нет.
Рис. 1. Доверительный интервал и предельная ошибка выборки