Главная > Математика > Прикладная статистика: Исследование зависимостей
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

3.2.2. Максимизация F-отношения суммы квадратов отклонений между объектами к полной сумме квадратов отклонений.

Изложение начнем с гипотетического численного примера. Предположим, что 10 экспертов произвели оценку организации труда в четырех лабораториях. Эксперты могли использовать лишь три категории оценок: хорошо, удовлетворительно, неудовлетворительно, и один из экспертов оценивал лишь первые три лаборатории. Пусть полученные данные представлены в виде таблицы сопряженности X, в которой означает число оценок градации полученных i-й лабораторией (табл. 3.2).

Таблица 3.2

Припишем численные значения оценкам: — хорошо, — удовлетворительно, — неудовлетворительно. Тогда набранные лабораториями оценки можно представить в виде односторонней таблицы дисперсионного анализа (см. гл. 13), в которой СКП — полная сумма квадратов отклонений, СКМ — сумма квадратов отклонений между лабораториями и — сумма квадратов отклонений внутри лабораторий (табл. 3.3):

Таблица 3.3

Величину будем называть корреляционным отношением (correlation ratio). Поскольку , то

Если , то не определено. Исключим этот неинтересный случай и подберем численные значения так, чтобы оптимизировать . Полагая для однозначности и временно опуская детали вычислений, имеем

Таким образом, нами одновременно решены следующие задачи: 1) приписаны численные значения градациям оценок, которыми пользовались эксперты; 2) оценена в условных единицах (баллах) организация труда в лабораториях; 3) оптимизировано корреляционное отношение

Дадим общую формулировку принципа, по которому приписываются численные значения, и опишем соответствующую вычислительную процедуру.

Матричная формулировка основного принципа оптимизации. Пусть -матрица таблицы сопряженности; -вектор сумм элементов X по строкам; -вектор сумм элементов X по столбцам; — общая сумма элементов X;

вспомогательные диагональные матрицы; -вектор численных значений, приписанных строкам; -вектор численных значений) приписанных столбцам; — общее среднее значение. В нашем примере определяется по табл. 3.2; ;

векторы V, W определяются из (3.16); .

При сделанных предположениях (ср. с табл. 3.3)

откуда

при условии, что

Оптимизация величины Поскольку уравнениями (3.18) и (3.19) V определяется с точностью до постоянного множителя, положим для определенности

Будем искать максимум числителя (3.18) при ограничениях (3.19) и (3.20) методом множителей Лагранжа. Пусть тогда для нахождения V должны быть решены уравнения

Умножим (3.21) слева на и, воспользовавшись уравнением (3.23), получаем с учетом (3.18), что

Для оценки величины умножим (3.21) слева на и воспользуемся легко проверяемыми равенствами

В силу (3.19) отсюда следует, что Уравнения (3.21) могут теперь быть представлены в виде

таким образом, должно быть собственным значением уравнения (3.25). Поскольку легче работать с симметричными матрицами, произведем замену переменных, положив

Уравнения (3.21)-(3.23) при этом перепишутся в виде

По аналогии с цепочкой уравнений (3.24) непосредственно, проверяется, что вектор является собственным вектором (3.21), отвечающим собственному числу удовлетворяет (3.22) и не удовлетворяет (3.23). Отсюда следует, что искомое будет вторым по порядку после 1 собственным числом , а вектор V — соответствующим ему собственным вектором. При этом будет выполнено и условие (3.23), так как собственные векторы, отвечающие разным числам, взаимно перпендикулярны.

С помощью стандартной алгебраической процедуры [102, гл. 5] можно исключить из матрицы собственное число Для этого R достаточно заменить на

Нахождение максимального собственного числа и соответствующего ему собственного вектора уравнения проводится стандартными методами [102, гл. 4].

<< Предыдущий параграф Следующий параграф >>
Оглавление