Что такое доказательная медицина? (Продолжение)




С.В.Недогода, В.И.Петров

Кафедра терапии и семейной медицины ФУВ ВГМУ

Базовые статистические знания, необходимые для интерпретации данных по доказательной медицине
Неправильная оценка статистической достоверности полученной информации может приводить к игнорированию клинически важных сведений и использованию на практике клинически бесполезных данных. Классическим приемом искажения реальных тенденций является значительное увеличение числа наблюдений, что позволяет доказать наличие даже столь небольших различий, которые не имеют реального клинического значения (как это было, например, в исследовании ALLHAT в отношении повышения уровня глюкозы крови при терапии тиазидными диуретиками). Необходимо помнить о том, что статистическая достоверность не является синонимом клинической значимости результатов исследования.
В настоящее время существует много программ для статистической обработки полученных данных и еще больше руководств по медицинской статистике. В них при­ведены все необходимые формулы и даны подробные ­ин­струкции по статистической обработке результатов ­ме­дицинских исследований, что сделало доступным проведение качественного статистического анализа практически любому врачу, имеющему навыки работы с персональным компьютером. Основы медицинской статистики преподаются в медицинских университетах. Поэтому целью настоящей статьи является не изложение сухих математических формул, а попытка дать тот минимум знаний, который необходим практическому врачу для анализа достаточно специфических данных по доказательной медицине. В самых общих чертах можно сказать, что для анализа полученных данных должны применяться адекватные статистические методы:
• для оценки выживаемости – методы, основанные на принципе построения таблиц доживания, кривые Каплана–Мейера, модель Кокса, формулы множественной пошаговой регрессии, показатели абсолютного и относительного риска (ОР);
• для выявления существенности различий между кривыми выживаемости – тест Вилкоксона–Гехана, обобщенный показатель кси-квадрат и критерий logrank.
При проведении клинических исследований наиболее часто используется две модели. Модель постоянных эффектов предполагает, что изучаемое вмешательство во всех исследованиях оказывает один и тот же эффект, а имеющиеся различия обусловлены только дисперсией внутри самих исследований. Модель случайных эффектов предполагает, что влияние вмешательства в разных исследованиях может быть разным. Она уже учитывает дисперсию не только внутри одного исследования, но и между разными исследованиями.
При количественной оценке результата возможны два вида ошибки – систематическая и случайная. Случайная ошибка – отклонение результата отдельного наблюдения или измерения от его истинного значения, обусловленное исключительно случайностью. Систематическая ошибка – систематическое (неслучайное) отклонение результатов от истинных значений. Чтобы понять природу случайной ошибки, представим себе, что мы подкидываем монетку и смотрим, что выпадет – «орел» или «решка». Оба исхода равновероятны, однако, если мы подкинем монетку 10 раз, вполне возможно, что «решка» выпадет 7 раз, а «орел» – только 3. Означает ли это, что «решка» всегда выпадает примерно в 2,5 раза чаще, чем «орел»? Конечно же, нет: чем больше будет число опытов, тем ближе частота выпадения «орла» или «решки» будет приближаться к 50%. Точно так же различия в опытной и контрольной группе пациентов могут быть обусловлены чистой случайностью (часть больных выздоровели благодаря лекарству, а часть просто выздоровели). Чтобы избежать случайных ошибок, эксперимент проводят на как можно большем числе испытуемых. Число больных, как правило, исчисляется десятками тысяч. Для получения ­надежных данных больные наблюдаются и обследуются много лет – от 4 до 10, а иногда и дольше. Нередко для большей достоверности исследование повторяют несколько раз, а также используют доверительные интервалы – ДИ (табл. 1).
Для того чтобы учесть влияние случайности и узнать, насколько результат достоверен, применяют методы статистической обработки данных. Однако остаются еще систематические ошибки, избежать которые гораздо сложнее.
Систематические ошибки могут быть обусловлены:
• эффектом плацебо;
• нарушением правил отбора пациентов;
• неудачно выбранным методом оценки результатов (субъективная оценка всегда дает завышенный результат по сравнению с данными прибора);
• неправильно проведенным статистическим анализом.
В настоящее время предложены разные методы для снижения вероятности систематической ошибки (табл. 2). Главным из них является рандомизированное исследование (англ. random – случайный, произвольный), при котором группы испытуемых подбираются случайным образом. Для того чтобы максимально уменьшить влияние на результаты человеческого фактора, применяют двойной или тройной слепой метод. В этом случае ни пациенты, ни врачи не знают, какая группа получает плацебо, а какая – исследуемый препарат. Для этого на упаковки с препаратом и плацебо наносится маркировка, смысл которой раскрывается только в конце исследования или при появлении тяжелых осложнений, связанных с приемом препарата. Врачи-исследователи узнают о том, чем лечился пациент (плацебо или испытуемый препарат), только после того как все результаты получены, собраны и проанализированы.
Одной из наиболее частых является систематическая ошибка при отборе больных. Она также называется смещением. Причины ее возникновения:
• Центростремительное смещение (centripetal bias). В его основе лежит концентрация больных в специализированных центрах при оказании квалифицированной помощи. Это приводит к тому, что в них собираются самые сложные и тяжелые больные, используются наиболее современные и эффективные методы диагностики и лечения, а также работают наиболее квалифицированные специалисты. Следовательно, результаты, полученные в таком центре, не в полной мере будут соответствовать реальной клинической практике.
• Смещение вследствие популярности (popularity bias). В специализированных центрах в связи с их более мощными диагностическими возможностями и другими субъективными факторами (например, престижность госпитализации в это высокотехнологичное учреждение) часто наблюдаются непрофильные пациенты, которым проводится лечение, не соответствующее принятому в реальной клинической практике, так как у специалистов центра меньше опыта в лечении «атипичной» патологии, что также сказывается на результатах лечения.
• Смещение вследствие фильтрации (referral filter bias). По мере движения пациентов от поликлиники к специализированным центрам происходит фильтрация больных по ряду особенностей: тяжести течения заболевания, демографическим характеристикам, финансовым возможностям. Очевидно, что пациенты, наблюдаемые в специализированных центрах, по качеству обследования и проводимому лечению будут существенно отличаться от контингента сельских участковых больниц и амбулаторий.
• Смещение вследствие доступности диагностики (diagnostic access bias). По сути является частным вариантом приведенного выше смещения вследствие фильтрации.
Поскольку именно в специализированных центрах проводится большинство качественных клинических исследований, то полученные в них данные нельзя игнорировать, но необходимо учитывать приведенные особенности в отборе пациентов при экстраполяции результатов исследования на реальную клиническую практику.
Еще одна частая причина возникновения систематической ошибки – эффект плацебо, который может завышать эффективность лекарства на 30–40%. Поэтому при применении лекарств с доказанной эффективностью число положительных эффектов должно существенно и достоверно превышать их частоту при приеме плацебо.
Исключительно важную роль играет плацебо при оценке безопасности испытуемого препарата. Если новый препарат безопасен, то число побочных, нежелательных и серьезных явлений должно быть одинаковым в группах лечения и плацебо.
При завершении исследования важно не только статистически грамотно доказать достоверность полученных результатов (т.е. насколько эти результаты справедливы для данной группы испытуемых), но и корректно определить клинико-демографические пределы эффективности нового вмешательства, т.е. ответить на вопрос о том, будет ли препарат действовать аналогичным образом на любого пациента с исследуемой патологией. Это очень сложная задача.
Достоверность и обобщаемость, или что делать с ошибками исследования, проводятся на большей или меньшей выборке (части популяции). Даже самая большая выборка всегда будет меньше популяции. Для того чтобы повысить обобщаемость результатов исследования, его проводят в разных исследовательских центрах и клиниках (многоцентровое исследование), на разных по своим демографическим характеристикам выборках.
Важнейшим понятием в клинических исследованиях является исход – клинически значимое явление, изменение лабораторного показателя или признака у лиц опытной и контрольной групп. Исходы являются основными критериями оценки эффективности диагностического, лечебного или профилактического вмешательства (табл. 3).
ЧИЛ – частота исходов в группе лечения A/(A+B).
ЧИК – частота исходов в контрольной группе C/(C+D).
На основании исходов вмешательства строят таблицу сопряженности, с помощью которой рассчитываются другие важные показатели:
1. ОР=(ЧИЛ/ЧИК).
2. Шанс = А/В или С/D.
3. ОШ (отношения шансов)=(А/В)/(С/D).
Большинство результатов клинических исследований выражается в терминах, которые не всегда легко применить для принятия клинического решения или они не очень понятны практическому врачу.
Одним из наиболее часто используемых понятий, описывающих полученные результаты, является термин «риск», который отражает частоту определенного исхода (под риском понимают вероятность какого-либо события, которая может изменяться в диапазоне от 0 до 1. При вероятности, равной 0, событие никогда не произойдет, а при вероятно­сти, равной 1, – происходит всегда).
В качестве примера можно рассмотреть виртуальное исследование, где сравнивается частота госпитализаций пациентов с хронической сердечной недостаточностью в контрольной группе больных, получающих плацебо, и в группе больных, получающих новый препарат Х, способный снижать число сердечных сокращений. Допустим, что в конце исследования госпитализации в стационар наблюдались у 50% больных в контрольной группе (риск госпитализации равнялся 0,5) и только у 10% больных, получавших препарат Х (риск госпитализации равнялся 0,1). Исходя из того, что ОР (т.е. риск в группе лечения, сравниваемый с риском в контрольной группе) – простое ОР в двух группах и является частным от деления риска в группе лечения на риск в контрольной группе, следовательно, в разбираемом примере он составляет 0,10:0,50=0,20. Эти сравнительные данные можно также представить в виде снижения ОР – отношение между снижением риска в группе лечения и риском в контрольной группе или рассчитать как 1 – ОР.
Главным недостатком показателя ОР является то, что его значение (например, 0,2) одинаково вне зависимости от того, снижается ли он с 0,5 до 0,1 или с 0,05 до 0,01. В этой связи большее значение имеет снижение абсолютного риска при вычитании риска в одной группе из риска в другой – риск в группе лечения вычитается из риска в группе плацебо. В нашем примере снижение абсолютного риска будет равно 0,5–0,1=0,4, или 40%. В то же время при снижении риска с 0,05 до 0,01 снижение абсолютного риска составит 0,05–0,01=0,04, или 4%, т.е. будет существенно меньшим.
Таким образом, показатели ОР и снижения ОР количественно отражают результаты вмешательства в относительных величинах, но они не дают информации о размере влияния в абсолютном выражении. Абсолютный риск в меньшей степени отражает относительную эффективность вмешательства, но наглядно показывает, будет ли эффект от вмешательства клинически значимым.
Абсолютный риск является основой для расчета дру­гого, значительно более понятного для практического врача показателя – числа больных, которых необходимо лечить определенным методом в течение определен­ного времени, чтобы достичь определенного эффекта или предотвратить неблагоприятный исход у одного больного (ЧБНЛ).
В тех случаях, когда исследуемое вмешательство снижает вероятность развития неблагоприятного исхода, используются следующие показатели:
• СОР (снижение ОР) – относительное уменьшение частоты неблагоприятных исходов в группе лечения по сравнению с контрольной группой, рассчитываемое как (ЧИЛ–ЧИК)/ЧИК; приводится вместе с 95% ДИ.
• САР (снижение абсолютного риска) – абсолютная арифметическая разница в частоте неблагоприятных исходов между группами лечения и контроля. Рассчитывается как (ЧИЛ–ЧИК).
• ЧБНЛ – число больных, которых необходимо лечить определенным методом в течение определенного времени, чтобы предотвратить неблагоприятный исход у одного больного. Рассчитывается как 1/САР и приводится вместе с 95% ДИ. Низкое значение ЧБНЛ (приближающееся к 1) означает, что благоприятный исход наблюдается почти у каждого больного, получающего лечение.
В случаях, когда исследуемое вмешательство повышает вероятность развития благоприятного исхода, используют следующие показатели:
• ПОП (повышение относительной пользы) – отно­сительное увеличение частоты благоприятных исходов в группе лечения по сравнению с контрольной группой, рассчитываемое как (ЧИЛ–ЧИК)/ЧИК; приводится с 95% ДИ.
• ПАП (повышение абсолютной пользы) – абсолютная арифметическая разница в частоте благоприятных исходов между группами лечения и контроля. Рассчитывается как (ЧИЛ–ЧИК).
• ЧБНЛ – число больных, которых необходимо лечить определенным методом в течение определенного времени, чтобы достичь определенного благоприятного эффекта у одного больного. Рассчитывается как 1/ПАП и приводится вместе с 95% ДИ.
В случаях, когда исследуемое вмешательство повышает вероятность развития неблагоприятного исхода, используются следующие показатели:
• ПОР (повышение ОР) – относительное увеличение частоты неблагоприятных исходов в группе лечения по сравнению с контрольной группой. Рассчитывается как (ЧИЛ–ЧИК)/ЧИК; приводится вместе с 95% ДИ. (ПОР также используется для оценки влияния факторов риска на развитие заболевания.)
• ПАР (повышение абсолютного риска) – абсолютная арифметическая разница в частоте неблагоприятных исходов между группами вмешательства и контроля. Рассчитывается как (ЧИЛ–ЧИК). ПАР также используется для оценки влияния факторов риска на развитие заболевания.
• ИПВ (индекс потенциального вреда) – число больных, которые должны получить экспериментальное лечение, чтобы у одного дополнительного больного развился неблагоприятный исход по сравнению с больными из контрольной группы. Рассчитывается как 1/ПАР и приводится вместе с 95% ДИ.

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2017-04-20 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: