Главная > Математика > Факторный анализ (Иберла К.)
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

3.2.1. Происхождение названия центроидного метода

Синонимом названия «центроидный метод» является «метод центра тяжести». Это название объясняет принцип метода. Положение первой координатной оси должно быть определено так, чтобы она проходила через центр тяжести скопления точек. Как уже многократно упоминалось, факторное отображение можно рассматривать как размещение точек-переменных в -мерном пространстве, причем отдельные точки или векторы представляют переменные. На рис. 3.8, А схематично изображены несколько точек-переменных в двумерной системе координат. Кроме того, указана нулевая точка, в которой начинаются все векторы. Это соответствует типичной ситуации перед началом выделения факторов. Переменные представлены точками в -мерном пространстве, положение нулевой точки известно. Разумеется, точное значение необходимой размерности пространства неизвестно.

Таблица 3.16. Главные факторы, вычисленные по данным табл. 3.15

Точки можно изобразить в очень многих ортогональных системах координат, из которых на рис. 3.8, А представлены две — и . Чтобы получить однозначное положение системы координат, уславливаются, что первая ось должна проходить через центр тяжести S скопления точек-переменных. Вторая ось , как показано на рис. 3.8, Б, перпендикулярна к первой. Представим себе, что определено положение отдельных точек-переменных, центра тяжести S и нулевой точки (рис. 3.8, А). Систему координат можно повернуть так, что она, например, займет положение Но результатом вращения должно быть такое ее положение, чтобы ось проходила через центр тяжести S, как показано на рис. 3.8, Б. Это положение осей соответствует позиции факторов в центроидном решении.

В методе главных факторов для определения предпочтительной системы координат требовалось, чтобы вдоль первой оси лежал максимум дисперсии (см. рис. 3.1).

В центроидном методе требуется, чтобы первая ось проходила через центр тяжести. Назначение обоих требований — попытаться однозначно определить положение системы координат.

Проекции точек на оси координат на рис. 3.8, Б определяют факторные нагрузки , которые рассчитываются по корреляционной матрице. Координаты центра тяжести можно вычислить по координатам

Рис. 3.8. Определение положения первой координатной оси с помощью центроидного метода. Диаграмма А: величина проекции центра тяжести s на F, является средним значением проекций всех точек на эту ось; конфигурация векторов не зависит от положения системы координат. Диаграмма Б: первая центроидная ось проводится через центр тяжести; тогда сумма остаточных проекций на ось равна нулю. Показано отражение одной точки переменной с положительной стороны на отрицательную отдельных точек. Если в общем случае рассматривать -мерную систему координат, то координатами центра тяжести являются выражения:

т. е. средние значения координат отдельных точек дают координаты центра тяжести. Это можно увидеть, рассматривая рис. 3.8, А, на котором координаты центра тяжести отмечены пунктиром. Если теперь система координат выбрана так, что первая ось проходит через центр тяжести, то сумма проекций точек на все остальные ортогональные к ней оси равны нулю (это следует из определения центра тяжести) и тогда координаты центра тяжести S становятся равными:

т. е.

в чем можно убедиться по рис. 3.8, Б для случая двумерной задачи.

Сумма проекций на ось равна нулю, так как положительные и отрицательные значения проекций взаимно компенсируются. Условие (3.13) используется в расчетах по центроидному методу. Исходя из равенства можем написать для каждого элемента столбца матрицы R соответствующие выражения:

(3.15) представляет собой сумму равенств (3.14). Оно имеет место для каждого столбца корреляционной матрицы. Если теперь просуммировать все суммы столбцов, т. е. просуммировать обе части равенства (3.15) по всем к, то получим общую сумму Т элементов корреляционной матрицы:

В связи с тем, что (перемена индекса не изменяет смысла суммирования), получаем

(3.17)

т. e. сумма всех элементов корреляционной матрицы равна сумме квадратов сумм столбцов матрицы факторного отображения. Это равенство имеет место только для ортогонального факторного отображения.

Подставив в (3.17) условия (3.13), получим

С учетом условия (3.13) равенство (3.15) примет вид:

Из (3.18) и (3.19) получим

Введя обозначение выразим:

или, опять изменив индекс, получим

Оба сомножителя правой стороны этого равенства легко определяются из R. Таким образом по (3.21) вычисляются нагрузки первого центроидного фактора. Равенство (3.18) служит для контроля правильности вычислений.

После вычисления нагрузок первого фактора по (3.21) определяют остаточные корреляции: , где является вектор-столбцом факторных нагрузок. Матрица содержит так называемые воспроизведенные корреляции. дает остаточные корреляции, которые остаются после выделения первого фактора — остаточная матрица). Если принимают решение выделить второй фактор (критерий см. в гл. 3.3), то повторяется та же самая вычислительная процедура по матрице остатков При этом возникает затруднение, которое можно преодолеть с помощью некоторой уловки. Согласно определению после выделения фактора сумма проекции всех точек на другие ортогональные оси равна нулю. Второй центр тяжести, который не совпадает с началом координат, нельзя поэтому определить и, стало быть, нельзя приступить к выделению другого фактора. Например, по рис. 3.8, Б видно, что сумма проекций на ось равна нулю и совпадает с началом координат. Изменив знаки некоторых переменных таким образом, чтобы новый центр тяжести был удален от начала координат, создают предпосылку проведения вычислительной процедуры по выделению второго фактора. Изменение знака переменных нужно произвести так, чтобы все точки-переменные на рис. 3.8, Б находились по одну сторону от оси Например, если изменить все отрицательные знаки на положительные, то получим новый центр тяжести, который не совпадает с началом координат и используется дальше для вычисления нагрузок второго центроидного фактора. На последующем этапе расчета изменение знака аннулируется. Изменение знаков, или так называемое «отражение» переменных, лучше всего объяснить на конкретном примере. В этом месте вычислительной процедуры центроидного метода играет определенную роль субъективизм исследователя и его опыт. Можно, конечно, выработать определенные твердые правила, исключающие субъективизм в принятии решения. Но несмотря на это, изменение знаков остается слабым местом центроидного метода. Предположим, второй фактор выделен. Затем опять определяется остаточная матрица и принимается решение, выделять ли следующий фактор и пока последняя остаточная матрица не будет достаточно точно соответствовать нулевой матрице (см. 3.3.2). Теперь на числовом примере покажем вычислительную процедуру центроидного метода.

<< Предыдущий параграф Следующий параграф >>
Оглавление