Главная > Математика > Прикладная статистика: Классификации и снижение размерности
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

1.3.5. Коллективы решающих правил.

В прикладных исследованиях для классификации наблюдений - иногда одновременно используется не одно, а несколько решающих правил. При этом, естественно, встает вопрос о выборе правила объединения частных заключений и как ответ на него возникает двухуровневая схема принятия решения (рис. 1.6). На рисунке первый уровень - блоки второй — блок синтеза. В изложенном выше алгоритме «Кора», если считать отдельными правилами отобранные конъюнкции, решение принимается большинством «голосов», осуществившихся при X конъюнкциях. В системах, в которых используются высокоспецифические (см. п. 1.2.1) правила риска, объединение возможно по принципу «максимум предсказанного риска».

В [131] предложен третий подход — выделение областей компетентности каждого из использованных алгоритмов. Пусть функция потерь правила А на множестве R определена по формуле (1.47). Правило считается на R компетентным среди правил , если

Рис. 1.6. Двухуровневая схема принятия решения

При классификации сначала выбирается наиболее компетентный алгоритм, затем с его помощью принимается решение (рис. 1.7, где F — блок выбора наиболее компетентного алгоритма).

Пусть пространство наблюдений R разбито на L областей таких, что при и для каждого указан компетентный на нем алгоритм А. Тогда на первом шаге по значению X находится и по — номер компетентного на нем алгоритма .

Рис. 1.7. Схема классификации с использованием областей компетентности

На втором шаге правило А, применяется к X. В качестве примера изложенного подхода можно указать древообразные классификаторы (см. п. 1.3.3), где механизм нахождения — ветви дерева (без листьев), правило решения — правило соответствующего листа.

Опишем два простейших правила нахождения областей компетентности. Метод априорного разбиения пространства наблюдения R на подобласти основан на профессиональных соображениях конкретной науки. Для каждой из введенных подобластей находят компетентное на ней правило классификации. Этот метод удобен тем, что введенные области легко строить и интерпретировать.

Во втором методе области компетентности строятся локально путем построения алгоритма, с помощью которого для каждого наблюдения можно вычислить, какой области оно принадлежит. Пусть для каждого можно ввести семейство вложенных друг в друга расширяющихся окрестностей. Фиксируем какое-либо число k и для найдем наименьшую окрестность которая включает в себя не менее k точек последовательности (1.46). Пусть далее , если наблюдение последовательности классифицировано алгоритмом правильно, и в противном случае; где суммирование проводится по всем точкам, принадлежащим и .

Тогда точка объявляется принадлежащей области компетентности правила Чтобы обойти случаи, когда максимум в (1.55) достигается не на одном, а на нескольких значениях положим I равным наименьшему из них. Если на R определено расстояние между точками р, то окрестности можно задавать с помощью расстояний и в определении си вместо 1 брать , где g — некоторая убывающая функция от положительного аргумента. Например, , где . В [131] предлагается для выделения областей компетентности использовать также метод потенциальных функций.

<< Предыдущий параграф Следующий параграф >>
Оглавление