Главная > Математика > Факторный анализ (Иберла К.)
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

6.1. ИЗМЕРЕНИЕ ГЛАВНЫХ КОМПОНЕНТ

При проведении компонентного анализа исходят из корреляционной матрицы. Вычисляя собственные значения и собственные векторы матрицы, приходят к ортогональной матрице А. Более подробно вся процедура расчета была описана в гл. 3.1. Для решения поставленной задачи в компонентном анализе, так же как в факторном анализе, будем использовать равенство (6.1). Умножив обе его части на получим

Так как Z известна, то для получения Р нужно определить лишь . Для обращения матрицы необходимо, чтобы она была квадратна. Матрица А квадратна только тогда, когда R имеет ранг и выделяются все главных компонент. После вычисления обратной матрицы можно приступить к определению матрицы значений главных компонент, которую мы обозначили через по формуле (6.3).

Эта процедура приводит к точным и однозначным результатам, если были выделены все m главных компонент. Процедура связана с большим объемом вычислений в основном из-за обращения матрицы порядка . Кроме того, должны быть вычислены все собственных значений матрицы R, чтобы получить квадратную матрицу А. Но такая процедура на практике не применяется. Кайзер [164; 6], руководствуясь работой Хотеллинга [144; 1], предложил следующий упрощенный способ.

Для факторного отображения, полученного в результате компонентного анализа, имеем

т. е. суммируются квадраты факторных нагрузок в каждом столбце А относительно соответствующего собственного значения. Диагональная матрица М содержит собственные значения, порядок расположения которых зависит от их величины. В этом легко можно убедиться, обратившись к равенству (3.7), по которому выполняется нормирование элементов собственных векторов матрицы. Возведя обе части равенства (3.7) в квадрат и просуммировав по всем получим

Кроме того, умножая обе части равенства (6.1) на А, а затем на получим

(6.6)

В любом случае матрица квадратна, порядком не больше . Если выделяют только первые главных компонент, то ее размерность равна . Следовательно, она всегда имеет обратную матрицу. Подставляя (6.4) в (6.6), получим равенство

которое значительно упрощает все вычисления по сравнению с (6.3). Собственные значения матрицы R, которые стоят по диагонали матрицы М, уже известны по вычислениям, произведенным в компонентном анализе. Так как М является диагональной матрицей, то вычисление обратной матрицы сводится к определению величин, обратных к значениям диагональных элементов. Итак, значения главных компонент Р получаем путем простого перемножения матриц. Формула (6.7) обладает еще тем преимуществом, что она позволяет определить значения не всех , лишь нескольких первых компонент, нужных исследователю. Формулой (6.3) можно пользоваться только в случае, если определены все главные компоненты. Это особенно важно при работе на клавишных вычислительных машинах. Само собой разумеется, формулу (6.7) можно употреблять также при вычислениях на ЭВМ.

Поясним определение значений главных компонент на примере из раздела 2. Мы исходим из данных табл. 2.2 и 2.3. К корреляционной матрице табл. 2.3 был применен метод главных факторов (см. гл. 3.1.3). По этой же матрице (с единицами на главной диагонали) был проведен компонентный анализ. В строке 1 табл. 6.1 записаны два собственных значения главных компонент, а в 3-й и 4-й строках матрица А. Матрица Z заимствована из табл. 2.2 и занесена в строки 7—12 табл. 6.1. Таким образом, мы имеем все необходимое, чтобы производить вычисления по формуле (6.7). Все исходные величины в табл. 6.1 заключены в рамку.

Таблица 6.1. Вычисление значений главных компонент Р

(см. скан)

Вычислив записываем эти значения в строку 2. Элементы строки 5 получаются в результате умножения первого значения строки 2 на все элементы строки 3. Аналогично, перемножая второе значение строки 2 с элементами строки 4, получаем строку 6. Затем, умножая строку 5 на первый столбец матрицы Z, получаем первый элемент строки 13. (В подробной записи это выглядит таким образом: . Остальные элементы строки 13 вычисляются таким же образом путем перемножения оставшихся столбцов матрицы Z с вектором — строкой 5. Строка 14 вычисляется аналогично по строке 6 и столбцам матрицы Z. Строки 13 и 14 содержат искомые значения главных компонент. Для сравнения в строках 15 и 16 указаны стандартизованные значения матрицы Р, которые были заданы в этом примере. Из таблицы видно, что они плохо согласуются с вычисленными значениями главных компонент, даже если изменить знаки у значений второго фактора, что в принципе допускается. Различие между вычисленными и действительными значениями указывает на то, что в большинстве случаев главные компоненты не соответствуют величинам, которые действительно лежат в основе исходных данных. Поскольку факторное отображение, полученное в результате компонентного анализа, не согласуется с произвольно заданным отображением в табл. 2.2, значения главных компонент также не согласуются с заданными наперед значениями факторов. Положение может исправить лишь вращение.

Вычислять значения главных компонент имеет смысл тогда, когда удовлетворяются выделением факторов, линейно независимых друг от друга, которые оттягивают на себя максимум дисперсии наблюдаемых переменных. Но такие факторы не всегда могут быть содержательно проинтерпретированы. Если анализируют переменных, которые попали в выборку более или менее случайно, просто потому, что экспериментатор мог их легко получить, нужно отказаться от модели факторного анализа. В таких случаях, а на практике, к сожалению, они часто встречаются, нужно с самогоначала довольствоваться моделью компонентного анализа. Тем самым отказываются от возможной интерпретации и довольствуются выделением как можно меньшего числа компонент, отбирающих на себя по возможности наибольшую долю дисперсии, насколько позволяют это исходные данные. Тогда описанным здесь способом могут быть определены значения главных компонент для отдельных индивидуумов. Компонентный анализ в некотором роде произвольно уменьшает размерность исходных величин. Он выполняет назначение прокрустова ложа, к которому должны приспосабливаться данные. Конечно, не исключено, чтополучают как раз такие данные, которые хорошо поддаются анализу методом главных компонент. Тогда метод дает удовлетворительное описание наблюдаемых переменных небольшим числом компонент.

В принципе можно результат компонентного анализа подвергнуть вращению. Но чаще всего вращение выполняется с решением, полученным в результате применения модели факторного анализа. Кайзер [164; 5] указал формулы, по которым можно выполнить процедуру вращения главных компонент.

Здесь также различают вторичные оси и первичные факторы. Формулы Кайзера в основном соответствуют тем, которые будут указаны в следующей главе для оценку значений факторов. Поэтому мы здесь их не рассматриваем. Остановимся лишь на частном случае ортогонального преобразования. Пусть матрица А преобразуется в ортогональную матрицу В и матрица преобразования Т известна.

Тогда в новой системе координат для определения значений главных компонент пользуемся формулой

т. е. формула (6.9) получается из (6.7) путем умножения ее на транспонированную матрицу преобразования. Впрочем, этой формулой можно пользоваться также в случае неортогонального вращения. Тогда Т является матрицей преобразования к первичной факторной структуре.

<< Предыдущий параграф Следующий параграф >>
Оглавление