Выдвигаются предположения:
1) имеются разные классы объектов;
2) каждый класс имеет нормальную функцию плотности от k переменных
;
, (1.1)
rде µ (i) - вектор математических ожиданий переменных размерности k;
- ковариационная матрица при n=n;
- обратная матрица.
Матрица - положительно определена.
В случае если параметры известны дискриминацию можно провести следующим образом.
Имеются функции плотности нормально pacпределенных классов. Задана точка х в пространстве k измерений. Предполагая, что имеет наибольшую плотность, необходимо отнести точку х к i-му классу. Существует доказательство, что если априорные вероятности для определяемых точек каждого класса одинаковы и потери при неправильной классификации i-й группы в качестве j-й не зависят от i и j, то решающая процедура минимизирует ожидаемые потери при неправильной классификации.
Ниже приведен пример оценки параметра многомерногo нормального pacпределения µ и Σ.
µ и Σ мoгyт быть оценены по выборочным данным: и
для классов. Задано l выборок
из некоторых классов. Математические ожидания
мoгyт быть оценены средними значениями
(1.2)
Несмещенные оценки элементов ковариационной матрицы Σ есть
(1.3)
Cледовательно, можно определить и
по l выборкам в каждом классе при помощи (1.2), (1.3), получив оценки, точку х необходимо отнести к классу, для которой функция f(х) максимальна.
Необходимо ввести предположение, что все классы, среди которых должна проводиться дискриминация, имеют нормальное распределение с одной и той же ковариационной матрицей Σ.
В результате существенно упрощается выражение для дискриминантной функции.
Класс, к которому должна принадлежать точка х, можно определить на
|
основе неравенства
(1.4)
Необходимо воспользоваться формулой (1.1) для случая, когда их ковариационные матрицы равны: , а
(есть вектор математических ожиданий класса i. Тогда (1.4) можно представить неравенством их квадратичных форм
(1.5)
Если имеется два вектора Z и W, то скалярное произведение можно записать . В выражении (1.5) необходимо исключить
справа и слева, поменять у всех членов суммы знаки. Теперь преобразовать
Аналогично проводятся преобразования по индексу i. Необходимо сократить правую и левую часть неравенства (1.5) на 2 и, используя запись квадратичных форм, получается
(1.6)
Необходимо ввести обозначения в выражение (1.6):
Тогда выражение (1.6) примет вид
(1.7)
Следствие: проверяемая точка х относится к классу i, для которого линейная функция
(1.8)
Преимущество метода линейной дискриминации Фишера заключается в линейности дискриминантной функции (1.8) и надежности оценок ковариационных матриц классов.
Пример
Имеются два класса с параметрами и
. По выборкам из этих совокупностей объемом n1 n2 получены оценки
и
. Первоначально проверяется гипотеза о том, что ковариационные матрицы
равны. В случае если оценки
и
статистически неразличимы, то принимается, что
и строится общая оценка
, основанная на суммарной выборке объемом n1+n2, после чего строится линейная дискриминантная функция Фишера (1.8).