Лабораторная работа № 1. Исследование эффективности прививок




Краткие теоретические сведения

Многие задачи медицины могут быть решены с помощью статистики и все модули системы STATISTICA, так или иначе, используются в медицине. Прежде всего, в медицине статистика используется в задачах, связанных с выборочными обследованиями, с проверкой эффективности различных доз различных лекарств, диагностика заболеваний на основании проводимых медицинских анализов, выявление сезонных факторов и скрытых периодичностей (например, определение того, как рождаемость зависит от месяца или дня недели), оценка интенсивности вызовов скорой помощи в зависимости от времени суток, прогнозирование выздоровления больных, оценка зависимостей между различными переменными, например, как состояние зубов детей связано со способом кормления (кормление грудью или искусственное кормление) и т.д.

Ситуация осложняется тем, что часто исследователь располагает неполными данными (наблюдения могут быть цензурированными, например, пациент переведен в другой госпиталь или выписан и связь с ним утеряна). Для анализа неполных наблюдений применяются специальные статистические методы, реализованные в модуле Анализ выживаемости.

Кроме того, данные могут содержать много пропусков. Методы обработки пропущенных значений доступны в любом модуле системы.

Если анализируются данные небольшого объема и нет никаких обоснованных предположений о форме распределения наблюдаемых величин, применяются методы, реализованные в модуле Непараметрическая статистика.

Если нужно провести классификацию больных, описываемых несколькими признаками, то следует использовать модуль Дискриминантный анализ. Однако методы дискриминантного анализа "работают", если переменные измерены в достаточно богатой шкале, например, интервальной. Если предикторы измерены в номинальной или порядковой шкале, то используют методы модуля Деревья классификации.

Для задач прогнозирования выздоровления пациентов применяются методы Множественной регрессии. Однако во многих ситуациях приходится иметь дело с кусочно – линейными моделями, т.к. до определенного критического момента (например, спустя 23 дня после операции) адекватна одна линейная модель и хороший прогноз дает одно подмножество предикторов. По прошествии критического момента, модель меняется и меняется множество предикторов, позволяющих строить прогноз. Методы модуля Нелинейное оценивание содержат необходимый инструментарий для анализа таких задач.

Специальные методы анализа многовходовых таблиц сопряженности реализованы в модулях Логлинейный анализ и Анализ соответствий.

Широкий круг задач может быть решен в модуле Основные статистики и таблицы.

Пример выполнения

Рассмотрим следующий пример «Исследование эффективности прививок» с помощью анализа в модуле Основные статистики и таблицы.

Предположим, вы хотите исследовать, как связаны прививка против определенной болезни и заболеваемость этой болезнью. Случайным образом вы выбираете истории болезней из архива и создаете файл данных (рис.2):

 

Рисунок 2

 

В файле содержится дополнительная информация: пол, год рождения, дата прививки и, если обследуемый заболел, то также приводится дата заболевания. Эта информация полезна для последующего, углубленного анализа данных, а в ходе выполнения этого задания она не используется. Вы хотите установить, как связаны два признака (и связаны ли они вообще): прививка и заболеваемость.

Изучаемые переменные: прививка и заболеваемость являются категориальными, т.к. принимают только 2 значения: да или нет (субъект попадает в одну из двух категорий). Такие переменные сильно отличаются, например, от переменных, измеряющих температуру или давление, уровень холестерина, которые измерены в более богатой шкале – интервальной шкале (грубо говоря, являются непрерывными).

Для изучения связей или зависимостей между категориальными переменными разработан специальный аппарат – таблицы сопряженности, к построению которых в системе STATISTICA мы сейчас перейдем.

В данном примере будет построена таблица 2 на 2 или, как ее еще иногда называют, четырехклеточная таблица, т.к. в ней имеется всего 4 комбинации (да, да), (да, нет), (нет, нет), (нет, да) значений переменных: ПРИВИВКА, ЗАБОЛЕЛ. Такая таблица называется таблицей сопряженности. Для этого выберем пункт меню Анализ – Основные статистики и таблицы (рис.3).

Рисунок 3

 

В стартовой панели модуля Основные статистики и таблицы выбираем процедуру Таблицы сопряженности, флагов и заголовков (рис.4).

 

Рисунок 4

 

Нажмите кнопку ОК, затем в диалоговом окне Задайте таблицы нажмите кнопку Задайте таблицы (рис.5).

 

Рисунок 5

 

Выберите переменные, как показано ниже (рис.6):

 

Рисунок 6

 

Всего можно выбрать до 6 списков группирующих переменных (т.е. тех переменных, которые задают разбиение пациентов на группы), нам достаточно выбрать только 2 переменные. Нажмите кнопку ОК. Вы снова вернетесь в диалоговое окно задания таблицы, где следует нажать кнопку Использовать все выбранные коды (рис.7):

 

Рисунок 7

 

Далее нажмите Коды – Все – Все – ОК (рис.8):

 

Рисунок 8

 

Окно Задайте таблицы теперь выглядит следующим образом (рис.9):

 

Рисунок 9

 

Нажмите кнопку ОК. Теперь, в открывшемся диалоговом окне Результаты кросстабуляции, выберете вкладку Дополнительно (рис.10):

 

Рисунок 10

 

Нажмите кнопку Просмотреть итоговые таблицы и вы увидите нужную таблицу сопряженности. Эта таблица содержит в сжатом виде всю информацию, позволяющую оценить зависимость между категориальными переменными: ПРИВИВКА, ЗАБОЛЕЛ (рис.11):

 

Рисунок 11

 

Из полученной таблицы вижно, что 1 человек из числа обследуемых – не имел прививок и не заболел (левая верхняя клетка), 3 человека не имели прививок и заболели (следующая клетка в первой строке), 4 человека имели прививки и не заболели (первая клетка во второй строке), 2 человека имели прививки и заболели (вторая клетка во второй строке).

В нижней строке записаны суммы значений по столбцам. В крайнем правом столбце – суммы значений по строкам. Эти значения иногда называют маргинальными или краевыми, т.к. они находятся на краях таблицы.



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2017-04-20 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: