Главная > Математика > Прикладная статистика: Классификации и снижение размерности
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

6.4.2. Процедуры, базирующиеся на методе моментов.

Речь идет о процедурах решения системы уравнений метода моментов [11, соотношения (8.25)] применительно к рассматриваемой в данной главе модели смеси распределений.

При составлении системы уравнений метода моментов реализуется следующая схема:

1) используя знание общего вида функции плотности (полигона вероятностей) смеси (см. формулу (6.6)), вычисляют, в терминах неизвестных параметров всевозможные теоретические моменты компонентов хисследуемого многомерного признака первые моменты вторые моменты — и т. д. в количестве, равном общей размерности оцениваемого параметра 0 (если размерность параметра , определяющего распределение внутри класса, равна q, то общая размерность оцениваемого параметра при заданном числе компонентов смеси k составит ;

2) по выборке классифицируемых наблюдений (6.7) подсчитываются соответствующие выборочные моменты составляется система вида

где левые части уравнений суть известные функции от неизвестных значений параметров , а правые части уравнений — известные числа.

Дальнейшие усилия направлены на решение системы (6 15), которое в каждом конкретном случае (при конкретизации общего вида компонентов имеет свои специфические вычислительные трудности.

«Узкими местами» данного подхода являются чрезмерная громоздкость (а подчас практическая невозможность) его вычислительной реализации в случае многомерных анализируемых распределений и большого числа k смешиваемых классов, весьма скромное качество статистических свойств получаемых при этом оценок (в частности, дисперсия оценок для , а соответственно и дисперсия получаемых решений остается слишком большой даже при возрастании объема выборки и). В работах [312, 178, 205, 291] содержатся примеры использования этого подхода для решения задачи расщепления смеси распределений, предпринимаются попытки преодолеть отмеченные выше трудности.

Пример 6.6 Исследование весового распределения хлопкового волокна по длине [159]. При решении некоторых задач из области технологии текстильной промышленности и, в частности, в задачах о вытягивании, смешивании, расчетах прочности пряжи, оценки неровности полуфабрикатов и т. п. необходимо исследовать весовое распределение хлопка по длине волокна. Предпринимавшиеся ранее специалистами попытки описать это распределение с помощью кривых Гаусса, Шарлье, Пирсона, закона «работали» лишь как формальная аппроксимация данной (обрабатываемой) выборки волокон и теряли свою работоспособность при переходе к другим выборкам, поскольку не отражали самого механизма образования анализируемого распределения.

Визуальный анализ эмпирических плотностей весового распределения хлопкового волокна по длине, построенных по различным выборкам, позволил выявить некоторые общие (присущие всем экспериментальным кривым) закономерности (см. пунктирную кривую на рис. 6.3): каждая кривая имеет в зоне коротких волокон (в диапазоне от 15,5 до 21,5) небольшое, но устойчиво выраженное «плато» (близкое к локальному максимуму) и, кроме того, четко выраженный глобальный максимум в диапазоне от 30 до 40,5 мм с формой кривой в этом диапазоне, близкой к нормальной.

Рис. 6.3 Графики плотностей весового распределения хлопкового волокна по длине — экспериментального, — модельного — модельного, представленного смесью двух нормальных законов

Это привело нас к гипотезе, что каждое из анализируемых распределений может быть представлено смесью двух нормальных распределений: первое из них (коротковолокнистое) с относительно малым удельным весом небольшим средним значением и относительно большим коэффициентом вариации определяет закон распределения волокон в их короткой зоне, а второе (основное) с преобладающим удельным весом средним значением и относительно малым коэффициентом вариации определяет закон распределения волокон в их основной («длинной») зоне.

Итак, модель смеси (6.6") имеет здесь вид

где

Поскольку нужно оценить пять неизвестных параметров то для построения системы уравнений метода моментов вида (6.15) необходимо, с одной стороны, вычислить в терминах этих параметров первые пять теоретических моментов исследуемой случайной величины , а с другой — подсчитать те же самые моменты, но по имеющимся экспериментальным данным, т. е. вычислить выборочные моменты

Здесь М — число интервалов группирования по длине волокон; — вес волокон, отнесенных к интервалу группирования; — длина волокна, соответствующая середине интервала группирования.

Переходя для удобства от моментов к семиинвариантам, получаем следующую систему уравнений относительно неизвестных

В дальнейшем, правда, система была несколько модифицирована: в последнем пятом уравнении вместо использовалась связь теоретических и экспериментальных модальных значений .

При численном решении этой системы мы воспользовались методикой, номограммами и таблицами, предложенными в [312].

В табл. 6.1 приведены результаты -кратной численной «прогонки» этой системы: решалась задача расщепления 30 разных выборок.

Таблица 6.1

Для всех 30 выборок независимо от селекционного сорта и модальной длины хлопкового волокна экспериментальные и теоретические (модельные) кривые плотностей графически хорошо совпадают как в центре диапазона, так и по краям.

Более того, выведенная таким образом модель смеси распределений получила «задним числом» и содержательное обоснование, исходящее из механизма роста волокон хлопка. Данный пример показывает, как статистическое исследование может «натолкнуть» специалистов на некоторые содержательные выводы о физической природе изучаемого явления.

Построенная модель смеси позволила вывести важные новые и уточнить имевшиеся ранее соотношения между базовыми характеристиками распределения хлопкового волокна по длине, используемые в технологии текстильной промышленности.

<< Предыдущий параграф Следующий параграф >>
Оглавление