Малая выборка и критерий точной вероятности Фишера




В какой-то мере работы Л. Г. Видонова могут рассматриваться в качестве попытки построения таблиц сопряженности для исследования связи между признаками. Несмотря на то, что эта идея не выражена в явной форме, тем не менее первый шаг использования подсчетов с последующим построением таблиц был сделан. Одним из наиболее серьезных аргументов против выводов, которые получил в ходе своих исследований Л. Г. Видонов, является недостаточный объем изученного материала. В частности, критика А. М. Ларина была построена прежде всего на том, что в клетках таблицы, если вернуться от процентов, которыми оперировал Л. Г. Видонов, к абсолютным значениям, то получаются числа 5, 3 и даже 1. То есть, всего один случай наблюдался при совместном сочетании двух признаков. Вот что пишет А. М. Ларин: «Столь же не сложна расшифровка указанных автором в процентах данных об убийцах в этих пяти случаях: 60% несудимых мужчин – это три человека; из них 66,7% «из круга супругов и сожителей» – двое, один, по-видимому, супруг, другой – сожитель». И далее: «Такого же порядка числа стоят и за другими процентными показателями распределения признаков, относящихся к потерпевшему, преступному действию и преступнику»[120].

Подчеркивая «мизерные» абсолютные цифры, основное замечание А. М. Ларин формулирует так: «После этого нетрудно догадаться, почему Л. Г. Видонов заменил абсолютные числа процентами. Напиши он открытым текстом, что из пяти уголовных дел можно вывести пять «статистико-вероятностных закономерностей», его бы, пожалуй, осмеяли и читатели, далекие от математики»[121]. После статьи А. М. Ларина в криминалистике прочно утвердилось мнение о том, что выявление связей между теми или иными факторами требует обработки огромного массива уголовных дел.

В результате критических замечаний А. М. Ларина научным исследованиям в этой области было задано вполне определенное направление развития. Эмпирическая база некоторых диссертационных исследований стала насчитывать 100 тысяч компьютерных информационно-поисковых карт, каждая из которых имела 200 позиций[122]. При этом объем эмпирической базы формировался по следующему принципу: «В нашем представлении, важно не максимальное количество уголовных дел, оперативных материалов и опросных листов, составляющих эмпирическую базу данных, а минимальное – не менее десяти – количество частоты «попаданий» в каждый параметр структуры исследовательской модели (позицию анкеты, матрицы)»[123].

Вполне закономерно, что в конечном итоге трудоемкость подобных исследований перестала соответствовать их практической значимости. По этому поводу в 2001 г. Р. С. Белкин заметил: «… Примеру Л. Г. Видонова никто не последовал, и это понятно: легче описывать элементы характеристики, чем заниматься весьма трудоемким процессом выявления корреляционных зависимостей между ними»[124].

Тезис, на котором обосновал свою критику А. М. Ларин, остался до настоящего времени незыблемым. В связи с чем требуется рассмотреть статистическую сторону вопроса.

Для выборок объема (N) до 30 наблюдений существует критерий точной вероятности Фишера. Критерий Фишера позволяет получить точные значения вероятности событий, столь же или еще менее вероятные, чем те, которые в действительности наблюдались. Рассмотрим процедуру использования критерия Фишера для весьма малого объема данных[125]. При этом должны соблюдаться следующие условия: N не превышает 30, сумма по строкам (a+b и c+d) не должна превышать 15.

Пример (условные данные). Исследовалась точно определенная следственная ситуация. Изучаемый вопрос заключается в установлении возможности по полу убитого предсказать то, что убийца, ранее судимый (обратим внимание, что при этом пол преступника не учитывается). Изученных уголовных дел, соответствующих именно этой ситуации, оказалось 18. Из 9 ранее судимых и 9 несудимых лиц, ранее не судимые убили 7 мужчин и 2 женщины. Из ранее судимых убил женщину один, остальные 8 убили мужчин. Приведенные данные сведены в таблицу 2х2 (табл. 18)

 

Таблица 18

 

  Убита женщина Убит мужчина Суммы по строкам
Судимые a b a+b=9
Несудимые c d c+d=9
Суммы по столбцам a+c=8 b+d=10 N=18

 

Проведем пошаговый анализ таблицы.

Шаг 1. Запишем задачу в формальном статистическом виде:

а) нулевая гипотеза (Н0): в генеральной совокупности доли судимых и не судимых, убивших мужчин, совпадают;

б) альтернативная гипотеза (Н1): в генеральной совокупности доли судимых и не судимых, убивших мужчин, не совпадают;

в) статистический критерий: поскольку данные представляют собой результаты подсчета и N≤30, следует использовать критерий точной вероятности Фишера;

г) уровень значимости: α≤0,05, критерий двусторонний.

Шаг 2. Находим значение a+b в таблице в столбце «Суммы по строкам». Для данной задачи a+b=9.

Шаг 3. Здесь же находим значение c+d=9.

Шаг 4. Находим значение b = 8.

Шаг 5. Теперь находим табулированное критическое значение, определяющее границу значимости при выбранном α. Если наблюдаемое значение d меньше или равно критическому значению, Н0 отклоняется.

При a+b=9, c+d=9, b = 8 значение d определяется условием d < 3, является значимым при α=0,05 и двустороннем критерии. В анализируемой таблице в клетке d стоит значение 2. Поскольку оно меньше трех, нулевая гипотеза отклоняется и принимается альтернативная. Таким образом, механизм совершения преступления, заключающийся в реакции судимых и несудимых на создавшуюся ситуацию, различается. Судимые статистически достоверно на уровне 0,05 чаще причиняют смерть мужчинам, тогда как несудимые – женщинам. Следовательно, в той следственной ситуации, которая описывается с помощью табл. 18, можно обоснованно выдвигать версию о судимости преступника на основании признака «пол убитого человека».

Анализ табл. 18 показывает, что статистически обоснованные выводы могут быть сделаны на сравнительно небольшом количестве материала: 30 наблюдений и менее. В связи с чем открывается возможность исследования следственных ситуаций, которые, с одной стороны, не встречаются сотнями или тысячами, а с другой – оказываются типичными для отдельных видов преступлений в данном городе, районе, населенном пункте. Небольшие выборки могут оказаться весьма полезными для решения задач локального характера. Это такие задачи, которые условно можно назвать криминалистической характеристикой следственных ситуаций.

Криминалистическая характеристика следственных ситуаций может рассматриваться как сочетание криминалистической характеристики отдельных видов преступлений и следственных ситуаций.

Применение критерия точной вероятности Фишера показывает, что анализ эмпирических данных может быть проведен и в абсолютных цифрах. При сумме по строкам – всего 3 наблюдения. Тем самым статистически обосновываются требования к объему эмпирического материала.

Требует пояснения и приводимые нами примеры, которые содержат, как правило, условные данные. Следует обратить внимание на то, что при изложении статистических методов исследования данные, которые им обрабатываются, не играют решающей роли. По нашему мнению, пример использования метода должен задавать модель обработки данных, при этом содержательная часть имеет второстепенное значение. Именно поэтому большинство примеров, используемых для иллюстрации наших положений, имеют модельный характер.

 



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-04-02 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: