Главная > Математика > Прикладная статистика: Классификации и снижение размерности
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

6.2. Общая схема решения задачи автоматической классификации в рамках модели смеси распределений (сведение к схеме дискриминантного анализа)

Базовая идея, лежащая в основе принятия решения, к какой из k анализируемых генеральных совокупностей отнести данное классифицируемое наблюдение , состоит в том, что наблюдение следует отнести к той генеральной совокупности, в рамках которой оно выглядит наиболее правдоподобным. Другими словами, если дано точное описание (например, в виде функций плотности в непрерывном случае или полигонов вероятностей в дискретном) конкурирующих генеральных совокупностей, то следует поочередно вычислить значения функций правдоподобия для данного наблюдения X в рамках каждой из рассматриваемых генеральных совокупностей (т. е. вычислить значения , и отнести X, к тому классу, функция правдоподобия которого максимальна.

Если же известен лишь общий вид функций , описывающих анализируемые классы, но не известны значения, вообще говоря, многомерных параметров и если при этом располагают так называемыми обучающими выборками, то данный случай лежит в рамках параметрической схемы дискриминантного анализа и порядок действий будет следующим (см. гл. 2 и 3): сначала по обучающей выборке оцениваем параметр а затем производим классификацию наблюдений, руководствуясь тем же самым принципом максимального правдоподобия, что и в случае полностью известных функций .

В схеме автоматической классификации, опирающейся на модель смеси распределений, как и в схеме параметрического ДА, задающие искомые классы функции также известны лишь с точностью до значений параметров. Но в схеме автоматической классификации неизвестные значения параметров так же, впрочем, как и параметров оцениваются не по обучающим выборкам (их нет в распоряжении исследователя), а по классифицируемым наблюдениям с помощью одного из известных методов статистического оценивания параметров (метода максимального правдоподобия, метода моментов или какого-либо другого; см. о процедурах статистического оценивания параметров смеси в § 6.4). Начиная с момента, когда по выборке (6.7) сумели получить оценки неизвестных параметров модели (6.6) или снова имеем схему дискриминантного анализа и собственно процесс классификации наблюдений (6.7) производим точно так же, как и в схеме параметрического ДА (т. е. относим наблюдение к классу с номером если

Итак, главное отличие схемы параметрического ДА от схемы автоматической классификации, производимой в рамках модели смеси распределений, - в способе оценивания неизвестных параметров, от которых зависят функции, описывающие классы. Но оценивание параметров в модели смеси-процесс неизмеримо более сложный, чем оценивание параметров по обучающим выборкам.

<< Предыдущий параграф Следующий параграф >>
Оглавление