Главная > Математика > Прикладная статистика: Классификации и снижение размерности
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

3.5. Рекомендации для k >= 3 классов

Условимся говорить, что объем (обучающей) выборки достаточен, если объем выборки относительно ограничен, если . Знаки (много больше) и (одного порядка) здесь надо трактовать с учетом геометрии расположения классов: при пересечении центральных частей распределений X в разных классах наблюдений должно быть больше, а при упорядоченности центральных частей распределений вдоль какой-либо гладкой кривой — меньше. В первом случае выборочные оценки параметров распределений при аналитических предположениях о форме распределений (см. п. 3.2.1) и прямые описания распределений при использовании полупараметрических и непараметрических методов (см. пп. 1.3.2 и 3.2.2) дают довольно хорошие совпадения реальных распределений и их оценок, поэтому в этом случае полностью можно использовать материал п. 1.5.

Во втором случае, когда объем выборки относительно ограничен, надо использовать упрощающие предположения, но только такие, которые не выводят за рамки распределений. В частности, следует опасаться использовать поправочные члены, возникающие из предельных теорем в традиционной асимптотике теории вероятностей, хотя такие предложения порой и вносятся [184]. Описываемые ниже предположения упорядочены по степени ограничений, накладываемых на распределения в классах: сначала идут наиболее сильные предположения, затем они ослабляются. Конечно, полной упорядоченности достичь не удается, так как ограничения существенно не одномерны.

Независимость одномерных распределений координат в классах. Это предположение довольно часто и успешно использовалось при диагностике в случае большого числа классов.

Но сегодня его следует заменить на более реалистическое предположение, что переменные в классах имеют древообразную структуру зависимостей (см. пп. 1.2.2, 1.1.5, 2.3.3). При этом в случае предположений о нормальных распределениях в классах можно требовать совпадения соответствующих ковариационных или (что не то же самое) корреляционных матриц или вообще ограничиться требованием, чтобы одинаковым в классах был только граф структуры зависимостей [12, § 4.2-4.3], а ковариационные матрицы различны. Наконец, можно потребовать равенства ковариационных матриц, не предполагая ДСЗ.

Предположения о средних: 1) средние лежат в пространстве первых главных компонент одного из классов (см. п. 3.1.2); 2) средние классов лежат на прямой; 3) классы могут быть упорядочены (см. п. 1.5.3).

<< Предыдущий параграф Следующий параграф >>
Оглавление