Изложим некоторые основные положения так называемой прикладной теории вероятностей. Наиболее удачно изложен материал в этом плане в книге Дж. Флейса (J. L. Fleiss)[108]. В криминалистике вычисление процентов, что осуществляется, например, при формировании криминалистической характеристики преступлений, представляет собой частный случай ситуации, которая сводится к наблюдению объектов со свойствами, о которых можно сказать лишь, что они либо есть, либо их нет. Если наличие свойства записывается как 1, а его отсутствие – как 0, то вся последовательность наблюдений будет представлять собой чередование единиц и нулей. Вычисление процентов представляет собой подсчет общего количества наблюдений, подсчет числа наблюдений, обозначенных 1 (или 0) и нахождение отношения числа наблюдений, которые записаны 1 (0), к общему числу наблюдений. На этом криминалистическое значение счета заканчивается.
Описанная ситуация сводится к наблюдению только одного признака, тогда как криминалистику интересуют связи между признаками. В связи с чем наблюдению должны подвергаться два и более признаков (всего р признаков). При наблюдении у одного и того же объекта двух признаков (р =2) возникает 4 возможных (22) комбинации признаков между собой. Эти комбинации представляют собой следующие сочетания: 11, 10, 01, 00.
Наблюдение, может быть проведено неоднократно на одном объекте либо на однородной группе объектов. В результате чего получается последовательность пар сочетаний: 11, 10, 01, 00. Если номер наблюдения не информативен, то вся последовательность может быть сведена к таблице из четырех ячеек, то есть таблице 2 х 2.
Обозначим наличие первого признака буквой А, отсутствие – А, наличие второго признака – буквой В, отсутствие – В. Общее число наблюдаемых объектов обозначим N. Число объектов, имеющих признак А, обозначим NA, объектов, обладающих признаком В, – NВ, число объектов, обладающих обоими признаками – NАВ.
|
Используем для выражения долей не проценты, а значение в сто раз меньшее, то есть доли единиц. Это весьма удобно, все последующие преобразования чисел останутся в границе от 0 до 1, кроме того, удобно и то, что операция деления процентов друг на друга замещается операцией умножения, что полностью соответствует логической операции конъюнкции.
Тогда приходим к следующим обозначениям:
Р(А) = NA / N;
Р(В)= NВ / N;
Р(А и В) = NАВ / N,
где Р(А) –доля наблюдений (объектов), в которых встретился признак А;
Р(В) – доля наблюдений (объектов), в которых встретился признак В;
Р(А и В) – доля наблюдений (объектов), в которых встретились одновременно признаки А и В.
Современная научная парадигма не противопоставляет качественные и количественные признаки. Скорее, можно обоснованно считать, что в современной науке возник некоторый новый класс признаков, представляющий собой сплав или синтез тех старых признаков, которые достаточно очевидно разделялись на качественные и количественные.
Оперирование любым признаком из нового синтетического класса качественно-количественных признаков позволяет эффективно использовать каждую из сторон этого признака. При таком подходе осуществляется одновременно и содержательный анализ и количественная оценка, полученные измерением, счетом, ранжированием, а также последующими расчетами. Рассматриваемый класс признаков является результатом формализации и квантификации, несмотря на то что эти методы не выносятся на первый план. Новый класс признаков задает соответствующий понятийный аппарат, который определяет современный научный способ мышления. Этот понятийный аппарат должен быть сформирован у исследователя до самого исследования и является необходимым условием получения соответствующего научного результата. Понятийный аппарат является интеллектуальным инструментарием, обеспечивающим познание. Для нас очевиден тот факт, что в ходе познания любой инструментарий может только применяться, но не создаваться. Если применение имеющегося инструмента не позволяет решить поставленную задачу, то тут и возникает из практики задача совершенствования, а иногда принципиального изменения средств познания. Тогда познание прекращается и формируется новое средство. Таким образом, успешное решение задачи формирования средств деятельности оказывается необходимым условием решения как теоретических, так и практических задач.
|
Место теории вероятностей и теории информации
В версионном методе
Современная наука широко использует методы теории вероятностей для исследования закономерностей, имеющих так называемый случайный характер. Предмет криминалистики содержит указанные закономерности, в связи с чем криминалистика так же, как и иные науки, решая определенный класс задач, вынуждена применять методы теории вероятностей и математической статистики. Поэтому случайные события закономерно становятся предметом научного исследования криминалистики.
|
Случайное событие – одно из основных понятий теории вероятностей. Математический энциклопедический словарь определяет случайное событие следующим образом: «Случайным событием называется событие, наступление или не наступление которого в некотором испытании (эксперименте) зависит от ряда случайных факторов и для которого постулируется определенная вероятность его наступления при данных условиях»[109]. Теория вероятностей – раздел математики, изучающий закономерности случайных явлений[110].
Философские категории «необходимость» и «случайность» в философском словаре рассматриваются следующим образом: «При определенных условиях необходимость – … отражение преимущественно внутренних, устойчивых, повторяющихся, всеобщих отношений действительности … выражение такой ступени движения познания в глубь объекта, когда вскрываются его сущность, закон …».
«Случайность – отражение в основном внешних, несущественных, неустойчивых, единичных связей действительности; выражение начального пункта познания объекта …».
В научном познании этим категориям отводится следующее место: «Движение познания от явления к сущности соответствует аналогичному движению от наблюдения, изучения случайного к познанию необходимого, которое скрывается за случайным так же, как сущность за явлением»[111].
Применение методов теории вероятностей в криминалистике позволяет использовать математическое моделирование тех закономерностей, которые лежат в основе процесса познания, осуществляемого в ходе деятельности по выявлению и расследованию преступлений.
Рассматривая криминалистический аспект собирания, исследования и оценки доказательств, Р. С. Белкин указывал на обязательность, необходимость и повторяемость лежащих в их основе закономерностей. «… Исследование доказательств – повторяющийся процесс, – писал Р. С. Белкин, – осуществляемый каждый раз, когда производится доказывание. Условия, формы, средства, методы и стадии этого процесса, несмотря на их разнообразие, ограничены и поддаются классификации, результаты его возможно предвидеть, прогнозировать. Все сказанное дает основания заключить, что исследование доказательств, как и их возникновение и собирание, носит закономерный характер, а отражение закономерностей данного процесса в науке, их познание приобретают значение научных закономерностей»[112].
Повторяемость явлений – это основа их познания и необходимое условие выделения научных закономерностей. Уникальные, не повторяющиеся события являются чудом и поэтому не попадают в область научных интересов.
В то же время современная наука связывает представление о повторяемости с понятием множества однородных объектов. Множество представляет собой научную категорию, которая лежит в основании современной математики. Формализация криминалистических знаний необходимо осуществляется путем использования категории множество. Под множеством понимается некоторое число любых однородных, то есть сопоставимых друг с другом по общему признаку, объектов. Например, словосочетание «выдвинуты все возможные по делу версии» указывает на множество сопоставимых друг с другом (однородных) объектов.
В статистике такое множество однородных объектов исследования (явлений, событий) называется статистической совокупностью. Статистическая совокупность представлена элементами, которые характеризуются одним или несколькими признаками.
Значение признака меняется при переходе от одного элемента совокупности к другому. Таким образом, именно признаки позволяют различать элементы внутри совокупности. Признак может быть качественным (атрибутивным) или количественным. Качественный признак характеризует некоторое свойство или состояние наблюдаемой единицы совокупности (например, пол, профессия, цвет и т.д.), а также наличие или отсутствие данного свойства. Количественный признак – это признак, отдельные значения которого (варианты), получаемые в результате измерения, наблюдения или счета, выражаются числами[113].
К особой группе относятся признаки, называемые ранговыми показателями. Их значения устанавливаются путем упорядочения (ранжирования) объектов совокупности в соответствии с некоторым признаком и присвоения каждому из объектов в таком упорядоченном ряду некоторого числа (обычно порядкового номера) – ранга. Статистический анализ данных, указанных в ранговой шкале, может производиться лишь определенными, так называемыми непараметрическими, методами[114].
Статистические методы и теория вероятностей широко и эффективно используются в современных научных исследованиях, вне зависимости от предметной области. В конце ХХ в. наибольшее значение статистические методы приобрели в гуманитарных науках. Это обусловлено тем, что если в естественных дисциплинах возможна постановка специальных целенаправленных экспериментов, позволяющих вычленить интересующие нас факторы и зависимости, то при изучении социально-экономических явлений возможности для постановки подобных экспериментов весьма ограничены, а чаще всего такие эксперименты просто невозможны. Поэтому здесь основным источником информации оказывается непосредственное наблюдение реальных процессов во всем их многообразии. Лишь последующие обработка и анализ данных наблюдений позволяют выявить обособленное влияние исследуемого фактора, определить интересующую нас закономерность. Приемы и способы научного анализа данных, относящиеся к массовым явлениям, в целях определения некоторых обобщающих эти данные характеристик и выявления статистических закономерностей и составляют предмет математической статистики. В свою очередь математическая статистика опирается на теорию вероятностей.
В основе современного научного познания лежит гипотетико-дедуктивный метод. В криминалистике он чаще всего ассоциируется с учением о криминалистической версии. В свое время версия рассматривалась как тактический прием, построенный на логике[115]. Однако гипотетико-дедуктивный метод имеет гораздо большее значение и не может быть сведен лишь к учению о криминалистической версии.
Получение нового научного знания, как правило, базируется на методе выдвижения и проверки гипотез. Гипотеза позволяет объединить и объяснить наблюдаемые факты, предсказать ненаблюдаемые факты, подлежащие установлению, предположить характер и вид исследуемых закономерностей. Тем самым с помощью гипотезы происходит переход от незнания к знанию, от неполного знания к более полному.
Наиболее привычно для криминалистики рассматривать применение гипотетико-дедуктивного метода в рамках криминалистического учения о версии.
Как ранее было показано, в основе версионной деятельности лежит формирование дерева версий. Как форма мышления версия представляет собой суждение, которое имеет логическое значение истинности «истина» в том случае, если она правильна. Так как суждение образуется из понятий, то каждое суждение может быть представлено посредством образующих его понятий. В связи с чем версионное дерево может быть представлено понятиями, имеющими различную степень общности.
С точки зрения логики указанное дерево формируется путем деления понятий. Такое деление отражает родо-видовые отношения понятий. Выполняя деление понятия дихотомически, то есть на два, получаем бинарное дерево версий. Это дерево состоит из версии (А) и контрверсии (А или не А).
Как правило, в криминалистике под версией понимается более вероятная гипотеза, а под контрверсией – менее вероятная. Однако выделение версии и контрверсии не должно увязываться с вероятностью указанных гипотез. При дальнейшем использовании понятий «версия» и «контрверсия» мы будем полагать, что версия – это та из двух гипотез, которая подлежит проверке в первую очередь.
Уточняя используемую в криминалистике терминологию, разделим понятия «предположительное знание» (гипотетическое) и «вероятностное знание». Зачастую они используются в качестве синонимов. Полагаем, что термин «гипотетический» указывает на возможность наступления предполагаемого события. А термин «вероятностный» следует понимать в том смысле, который принят в теории вероятностей. Характеристика версии как вероятного знания означает, что речь идет об оценке вероятности Р(А) выдвинутого предположения о возможном наступлении события А.
Отсюда вытекает необходимость существенного дополнения криминалистического учения о версии методами теории вероятности. В частности, поскольку версия и контрверсия представляют собой предполагаемые события, из которых может наступить только одно, но при этом наступает не какое-либо иное событие, а лишь одно из двух указанных, то в сумме вероятность версии и контрверсии составляет 1,0, то есть их комбинация (сумма) является достоверным событием.
Тот факт, что версия (А) и контрверсия (А)являются противоположными событиями, записывается следующим образом: Р(А)=1- Р(А). Предположим, что из криминалистической характеристики этого вида преступлений известна вероятность типовой версии, которая составляет Р(А)=0,6, то, следовательно, вероятность контрверсии равна Р(А)=1-0,6=0.4.
Рассмотрим типичную ситуацию, когда проверяется лишь версия. В этом случае версионное мышление схематически может быть отображено многоуровневым деревом, в котором детализируется только наиболее вероятное предположение (рис. 8).
Рис. 8. Многоуровневое дерево, в котором осуществляется
деление версии
Изображенная на рисунке схема иллюстрирует механизм расчета вероятности версии после того, как она обогатилась тремя дополнительными признаками. Поскольку в дереве три уровня, то вероятность конечного элемента рассчитывается следующим образом: Р(А) = 1 - 0,43 = 1 - 0,064 = 0,96.
Изображенное дерево версий фиксирует логику построения умозаключений и представляет собой информационную модель версионного мышления.
Иного метода оценки вероятностей версий требуют нижеописываемые ситуации. С одной стороны, имеются общие черты. Во-первых, сохраняется бинарная структура дерева, и, во-вторых, проверке подлежит только одна ветвь, представляющая собой версию. С другой стороны, существуют различия, заключающиеся в методах оценки вероятностей ветвей и элементов версионного дерева.
Рассмотрим вначале содержательную сторону механизма формирования такого версионного дерева. Для этого проанализируем пример, приводимый В. А. Образцовым в курсе лекций[116].
«По делу об уличном убийстве в ночь на 5 сентября владельца "Запорожца" Кашникова, на месте происшествия в числе прочих предметов была обнаружена тетрадь, две страницы которой были исписаны явно не почерком Кашникова. На обложке тетради имелся фрагментарный след окровавленного пальца, не принадлежавший потерпевшему. Было высказано предположение, что тетрадь принадлежит преступнику и утеряна им во время убийства. Так как записи в ней были слабо видимыми, неразборчивыми, была назначена криминалистическая экспертиза для восстановления исполненного текста.
После того как текст восстановили, его анализ показал, что в руки следствия попали конспекты писем, написанных тетке и двоюродной сестре призывником по имени Владимир. Он не очень грамотно и толково писал, что недавно находился в отпуске, а перед этим был переведен на участок изготовления поворотных головок».
Как указывает по ходу изложения примера В. А. Образцов, при раскрытии неочевидных убийств в условиях отсутствия данных о субъекте преступной деятельности, типовые версии заключаются в принадлежности последнего к двум группам лиц: местных и приезжих.
«В одном из писем было написано: "Привет из Нижнего!". Что говорило в пользу совершения преступления местным жителем. В то же время, как указывает В. А. Образцов, на возможность совершения преступления не местным жителем указывала фраза из другого письма "… доехали хорошо" (в соответствии с этой версией преступление мог совершить, например, командированный, транзитный пассажир, возможно попутчик…).
Собранная по делу информация позволила составить представление об убийце как о лице, характеризующемся следующими признаками: молодой человек (1 признак), мужского пола (2 признак), призывного возраста (3 признак), по имени Владимир (4 признак), с невысоким общеобразовательным уровнем (5 признак), работающий на промышленном предприятии (6 признак), связанный по своей работе с изготовлением поворотных головок (7 признак), отгулявший отпуск, очевидно, в летний период (8 признак), а незадолго до этого переведенный на новый участок работы (9 признак), состоявший в переписке с теткой и двоюродной сестрой (10 признак).
Из представленных 10 признаков необходимо было составить такую их последовательность, которая позволяла бы начать целенаправленную организацию по выявлению лиц, подлежащих проверке, а также для определения зон предстоящей поисковой деятельности. Как указывает В. А. Образцов, первым был избран признак, отражающий предполагаемую связь преступника по работе с промышленным предприятием (6 признак). Вторым – признак о предприятии, на котором имеется участок по изготовлению поворотных головок (7 признак).
Поскольку в Нижнем Новгороде и других городах Поволжья имеется множество различных промышленных предприятий, естественным и логичным был вопрос, на какой территории и применительно к каким предприятиям целесообразно развертывать поисковую деятельность в первую очередь. Для начала было решено круг объектов ограничить предприятиями города. Чтобы еще более сузить этот круг, а значит, и зону поиска, необходимо было каким-то способом конкретизировать исходную информацию о видовой и территориальной принадлежности искомых предприятий.
В этих целях пришлось обратиться в городскую библиотеку, где путем изучения специальной технической литературы выяснилось, что поворотные головки являются держателем режущего инструмента в металлообрабатывающих станках с программным управлением.
Такого рода предприятия имелись и на прилегающей к месту происшествия территории, и в других районах города. С учетом этого, вначале было решено провести работу на предприятиях первой группы, т.е. ближайших по отношению к месту происшествия. Причем не на всех подряд, а только на тех, на которых имелись участки по изготовлению поворотных головок.
При изучении списков лиц, занятых на этих участках, во внимание принимались только те из них, которых, во-первых, зовут Владимиром (4 признак), во-вторых, которые относятся к категории молодых рабочих (3 и 4 признак).
По мере их выявления круг проверяемых все время суживался на основании исключения из него лиц, которые не переводились на данный участок незадолго до отпуска (9 признак) и не имели родственных связей с женщинами за пределами Нижнего Новгорода.
Такой подход реализовался на всех проверяемых предприятиях, в том числе и в местном объединении по производству фрезерных станков. Здесь был установлен единственный участок, на котором изготавливались поворотные головки. На участке работало 9 человек с именами Владимир. Их проверка показала, что только трое были призывного возраста. На них и было сконцентрировано дальнейшее внимание. Как оказалось, только один из троих проверяемых Владимиров, по фамилии Мирончук, недавно был переведен на этот участок из другого цеха.
На первом этапе проверка версии о его возможной причастности к убийству Кашникова осуществлялась втайне от него.
По имеющимся на предприятии документам было установлено, что в марте текущего года Мирончук подал заявление и был переведен на участок сборки консолей и поворотных головок из другого цеха, в августе он находился в отпуске и приступил к работе 1 сентября, т.е. за 4 дня до убийства.
Даже при беглом сравнении почерка автора тех текстов, которые обнаружены при осмотре места происшествия, и почерком Мирончука (изучалось его заявление о переходе на указанный участок) не осталось никаких сомнений в том, что они исполнены одним и тем же лицом.
В личной карточке Мирончука в отделе кадров значилось, что он закончил ПТУ в одном из населенных пунктов под Нижним Новгородом. Это ПТУ находилось на территории воспитательно-трудовой колонии. Возникла версия, что Мирончук отбывал там наказание за совершенное преступление. Предварительное сравнительное исследование отпечатков рук на дактилокарте Мирончука и окровавленной ладони, оставленной на капоте багажника автомашины потерпевшего, установило полное сходство их признаков.
Лишь после этого Мирончук был вызван на допрос. Узнав о имеющихся против него доказательствах, он не стал запираться и рассказал о том, как совместно со своими дружками Дубовым и Сафоновым, совершил убийство Кашникова».
Представим версионную систему, описанную В. А. Образцовым, в виде дерева решений (рис. 9). Движение от корня дерева, расположенного вверху, вниз является процедурой сужения области поиска.
Рис. 9. Дерево версий, позволившее обнаружить подозреваемого
(на основании данных, приводимых В. А. Образцовым)
Сопоставляя схемы на рис. 8 и 9, видим, что они имеют многие общие черты. С другой стороны, существенное различие в том, что на рис. 9. представлены версии, не являющиеся типовыми. Следовательно, их вероятность не может быть оценена на основании прошлого опыта, то есть за счет применения метода счета и вычисления процентов, в ходе эмпирических исследований.
Итак, понятие частотной вероятности в данном случае не применимо, поскольку речь идет о вероятности нахождения преступника в той или иной группе подозреваемых. Полагаем, что в такой ситуации, когда версия и контрверсия являются конкретными, они должны оцениваться как равновероятные.
Обратим внимание на то, что на первом шаге равновероятной считается возможность обнаружить преступника в следующих группах подозреваемых: группа лиц, выделяемых версией «Работники предприятий, на которых имеются участки по изготовлению поворотных готовок», и группа лиц, выделяемых контрверсией «Иные лица». Тот же подход распространяется и на следующие уровни версионного дерева.
Группы считаются равновероятными, поскольку нам не известно, в какой из них находится преступник. В то же время равная вероятность версий означает, что выбор между версиями (группами подозреваемых) делается в условиях максимальной неопределенности.
В качестве основы дальнейших рассуждений используем утверждение, заключающееся в том, что преступник может находиться с равной вероятностью в обеих группах. Из принятого утверждения вытекает, что вероятность появления отдельного элемента каждой группы обратно пропорционально количеству исходов внутри группы. Это значит, можно вычислить вероятность того, что наугад (случайно) выбранный человек из выделенной версией или контрверсией группы подозреваемых окажется разыскиваемым преступником.
Предположим, что исходное множество подозреваемых (N) ограничивается проживающими в Нижнем Новгороде и других городах Поволжья и составляет приблизительно 40 млн. человек. Смысл выдвижения гипотезы (версии) о том, преступник находится среди «работников предприятий, на которых имеются участки по изготовлению поворотных готовок», заключается в сужении круга лиц, подлежащих проверке на причастность к убийству. Предположим, что таких работников предприятий около 60 тыс. человек (m). Соответственно число иных лиц составляет N-m.
Указанное сужение числа подозреваемых может быть описано посредством понятий и формул теории вероятностей следующим образом.
Определим вероятность Р(А) того, что из группы подозреваемых числом 40 млн. преступником окажется первое случайно выбранное лицо. Поскольку выбор производится случайно, то все элементы указанного множества (подозреваемые, числом N), имеют быть избранными с вероятностью 1/N, то есть Р(А) = 1/40 млн. (одна сорокамиллионная часть).
Вычисленная вероятность является априорной вероятностью (обозначим ее рN(х)) обнаружения преступника, так как рассчитывается без учета признака, позволяющего указать, что преступник относится к «работникам предприятий, на которых имеются участки по изготовлению поворотных готовок».
Апостериорная вероятность (обозначим ее рm(х)) обнаружить преступника среди подозреваемых равна 1/m, то есть 1/60 тыс. (одна шестидесятитысячная). Это означает, что вероятность обнаружит преступника путем случайного выбора повысилась.
Продолжая использовать метод сужения числа подозреваемых на основании установленных признаков, как показывает рассматриваемый пример, можно найти конкретное лицо. В этом случае вероятность того, что мы выберем именно его, составляет 1/1 и равна = 1. Это означает, что в результате построения дерева версий получено достоверное с точки зрения теории вероятностей знание. Выводом из версионной системы является то, что единственным подозреваемым достоверно является человек, обладающий всеми перечисленными в версионном дереве признаками.
Рассмотрим полученный результат с точки зрения теории информации.
Исходная неопределенность, которую следует устранить, вычисляется извлечение двоичного логарифма из исходного числа подозреваемых - N. Таким образом, исходная неопределенность составляет Нисх.=log2 (40 000 000)= 25,83846 бит.
Дерево версий иллюстрирует путь последовательного (пошагового) снятия неопределенности.
На первом шаге априорная вероятность рN(х) составляла 1/40 000 000. После того как был обнаружен признак «работник предприятий, на которых имеются участки по изготовлению поворотных готовок», апостериорная вероятность рm(х) составила 1/60 000. Поэтому полученная информация есть функция отношения рm(х)/рN(х) = (1/m)/(1/N) = N/M.
В этом случае информация, которая получена установленным признаком, рассчитывается по формуле[117]
I(x) = log2[рm(х) / рN(х)].
I(x)=log2[1/60 000: 1/40 000 000] = log2[1500]=10,55075 бит.
Аналогично производятся расчеты и для других шагов. Предположим, что число подозреваемых составило для лиц, работающих на ближайших к месту убийства предприятиях, – 10 тыс. человек; для лиц, носящих имя Владимир и являющихся молодыми рабочими призывного возраста, – 3 человека; для лиц, переведенными на этот участок незадолго до отпуска, – 1 человек. В итоге можно составить следующую табл. 6.
Таблица 6