Главная > Математика > Прикладная статистика: Классификации и снижение размерности
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

1.1.5. Другие многомерные распределения.

В теоретических и прикладных работах по классификации используется ряд многомерных распределений, в различных направлениях обобщающих многомерное нормальное распределение и его частные случаи. Укажем наиболее важные из них.

Эллипсоидальные распределения. Пусть равномерно распределено на -мерной сфере — неотрицательная случайная величина, не зависящая от и имеющая строго возрастающую функцию распределения такую, что — матрица невырожденного линейного преобразования . Будем говорить, что случайная величина

имеет эллипсоидальное распределение . Основанием для названия служит то, что, как и для нормального распределения, на концентрических эллипсоидах вида

(1.34)

где плотность распределения постоянна. В частном случае, когда имеет -распределение с степенями свободы, распределение совпадает с нормальным . Это обстоятельство используется при статистическом моделировании случайных величин . Так, если то равномерно распределено на

В модели независимых выборок из при дополнительном предположении существования плотностей отношение правдоподобия имеет вид:

где

Откуда при в случае, когда — монотонная функция разности общий вид классификатора максимального правдоподобия такой же, что и в (1.12). Сохраняется также и способ нахождения наилучшей разделяющей плоскости в модели независимых выборок из (см. п. 1.1.3 и [25]).

Распределения, трансформируемые к нормальному. Пусть координаты вектора имеют непрерывные одномерные функции распределения с плотностями соответственно . Будем говорить, что имеет трансформируемое к нормальному (короче, Т-нормальное) распределение , где - неотрицательно определенная матрица, a вектор-функция одномерных распределений X, если

где — функция, обратная . Введем одномерных функций тогда Т-нормальное распределение можно также определить как распределение вектора где

Обозначим плотность Т-нормального распределения . Предположим, что и пусть тогда

Пусть — независимая выборка объема n из координата наблюдения, ее ранг в вариационном ряду координат

Замечательная особенность Т-нормальных распределений заключается в том, что для оценки F надо использовать только матрицу , а для оценки — только матрицу

Сформулированные выше модели выборок из нормальных распределений обобщаются на случай Т-нормальных распределений. Так, аналог модели Фишера (см. п. 1.1.2) формулируется: даны две независимых выборки из при этом известно, что для всех X

где — некоторый ненулевой вектор, и матрица 2 положительно определена.

Распределения с простой структурой связей между признаками. С простейшей моделью дискретных распределений с признаками, имеющими древообразную структуру зависимостей, познакомились в п. 1.1.2. Эта модель, естественно, может быть усилена предположением, что признаки имеют -распределение [12, § 4.4]. Однако без дополнительных предположений общий вид для слишком сложен. Вместе с тем предположение о -зависимости признаков для нормальных распределений позволяет заметно уменьшить число параметров, от которых зависит ковариационная матрица, и это дает существенный выигрыш в ряде задач (см. пп. 1.4.1, 2.3.1 и 2.3.3).

Другое обобщение моделей с независимыми признаками — это параметрические модели, в которых вектор параметров и вектор наблюдений X могут быть так разбиты на k взаимно непересекающихся подмножеств что плотность

Распределения, удовлетворяющие (1.36), будем называть распределениями с независимыми блоками. Они широко используются в теоретических исследованиях (см. пп. 2.3.2 и 2.5.3).

<< Предыдущий параграф Следующий параграф >>
Оглавление