Главная > Математика > Прикладная статистика: Классификации и снижение размерности
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

4.3. Другие применения ДА

4.3.1. Распознавание сигналов.

До сих пор рассматривали задачи, в которых ресурсы, используемые на выработку решающего правила и на саму классификацию нового объекта, не учитывались. При распознавании сигналов картина, как правило, другая: и выработка решающего правила должна быть доступна используемому микропроцессору и классификация (идентификация) объекта должна произойти за конечное время (часто доли секунды).

В качестве примера подобной задачи рассмотрим речевое общение с ЭВМ.

Сначала диктор начитывает ЭВМ используемый им словарный фонд (задает «эталоны»), а затем в ходе общения машина должна правильно идентифицировать произносимые им слова и принимать соответствующие, заранее предусмотренные действия.

В работе [1441 образ слова в ЭВМ состоит из (-мат-рицы чисел, столбцы которой соответствуют полосам частот в диапазоне от 200 до 5000 Гц и их число фиксировано, строки — последовательным отсчетам времени через 5—15 миллисекунд и их число зависит от длительности произнесения слова, а элементы соответствуют спектральной плотности сигнала на выходе фильтра соответствующей полосы, оцененной за соответствующий интервал времени, и отдельно числа , показывающею, сколько пересечений нулевого уровня сделано сигналом при произнесении слова.

На повторное произнесение одного и того же слова диктор, вообще говоря, тратит разное время. Поэтому при идентификации слов обязательно производится выравнивание времен так, чтобы допустить небольшие колебания в длительности произношения отдельных звуков.

Отложим по оси абсцисс точки , соответствующие последовательным отсчетам первого слова, а по оси ординат — точки , соответствующие отсчетам второго. Рассмотрим далее прямоугольник с вершинами (рис. 4.2). Точки прямоугольника с целочисленными координатами назовем узлами. Каждой ломаной, выходящей из узла (1,1) и идущей в узел по правилу, что из узла ломаная может попасть только в один из узлов , соответствует вариант сопоставления последовательных отсчетов двух слов. Ограничения на колебания длительности произнесения отдельных звуков можно задать в виде прямых, параллельных диагонали прямоугольника.

Расстояние между двумя словами берется как минимум по разрешенным колебаниям суммы (по столбцам и строкам) квадратов разностей соответствующих элементов матриц, т. е. берется простейшее расстояние. Новое слово идентифицируется с тем эталоном, к которому оно оказывается ближе. В настоящее время на распознавание одного слова при словаре в 100—200 слов и одном дикторе коммерческие системы тратят до 1—2 с времени и обеспечивают среднюю правильность результатов опознания 98-99 %.

Один из путей повышения надежности распознавания — это сопоставление с одним словом нескольких эталонов, как это предложено в п. 1.1.3.

При этом возникает чисто статистическая задача выделения небольшого числа представительных вариантов произнесения слова.

4.3.2. Групповая классификация.

В технической и реже медицинской диагностике иногда априори известно, что поступившая на диагностику партия из объектов извлечена из одного из классов. При этом наблюдения при условии, что класс фиксирован, независимы между собой.

Рис. 4.2. Схема сопоставления координат двух вариантов произнесения одного и того же слова (эталон и образец): — траектория сопоставления (ТС); - границы отклонения ТС

Предположим сначала, что нам известны — априорные плотности классов и — плотности распределения X в классах Тогда байесовское правило классификации должно быть по аналогии с (1.66) следующим: принимается гипотеза если где

Очевидно, что если исследователь не знает и но может оценить их по выборочным данным, то целесообразно в (4.18) заменить на их оценки.

Частный случай, когда изучен в работах [97, 98].

<< Предыдущий параграф Следующий параграф >>
Оглавление