Главная > Математика > Факторный анализ (Иберла К.)
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

5.3. ИТЕРАТИВНАЯ ПРОЦЕДУРА ОСУЩЕСТВЛЕНИЯ ВРАЩЕНИЯ ПРИ ПОИСКЕ ПРОСТОЙ СТРУКТУРЫ

За время развития факторного анализа были разработаны различные графические приемы процедуры вращения для достижения простой структуры. Рабочая группа Каттелла, продолжая традиции школы Тэрстоуна, применяла метод, которому следует по многим причинам отдать предпочтение перед остальными, хотя и было показано, что исследователи исходя из одних и тех же данных, но пользуясь различными методами, приходят к схожим результатам (Каттелл и Дикман [39], Каттелл и Салливэн [50], Каттелл и Горсач [42]). В большинстве случаев результаты, полученные с помощью геометрических представлений, лучше удовлетворяют принципу простой структуры, чем результаты, полученные с помощью аналитических методов. Значимость полученного решения может быть проверена с помощью критерия Баргмана. На примерах с известной структурой можно показать, что с помощью визуальной итеративной процедуры при поиске простой структуры в определенной плоскости достигается наилучшее положение координат осей, которые соответствуют влияющим факторам (см. раздел 7). Кроме того, применяя графические методы, исследователь непосредственно контактирует с исходным материалом, что помогает ему в дальнейшем при интерпретации полученных результатов. К сожалению, все графические приемы очень трудоемки.

Но при проведении серьезных исследований уже не приходится считаться с объемом работы, тем более что время на осуществление процедуры вращения можно сократить, используя так называемую Rotoplot-nporpaммy (см. с. 339). Но даже при проведении расчетов на ЭВМ с помощью этой программы приходится выполнять от 10 до 20 циклов вычислений. Далее покажем процедуру поиска решения с простой структурой на двумерной задаче. Потом перейдем к трехмерной задаче (задаче о ящиках), известной под названием бокс-проблемы (box-problem) Тэрстоуна.

В табл. 3.14 представлен результат выделения двух факторов, полученный методом главных факторов по 12 переменным. Будем продолжать работу с этим примером, приняв указанные в таблице факторные нагрузки за исходные.

Рис. 5.13. Исходная система 12 векторов первоначальной факторной матрицы и вращение оси — первоначальная ортогональная система координат. Ось вращается в направлении, противоположном движению часовой стрелки, до тех пор пока группа точек не попадет в критическую зону гиперплоскости Первая цифра индекса буквы, обозначающей ось, соответствует номеру цикла вращения

Обозначим через факторное отображение, полученное по окончании процесса выделения факторов, а соответствующие факторы — через . На рис. 5.13 обычным образом изображены оба фактора.

Рассмотрим вначале систему координат Первая цифра индекса у букв, обозначающих факторы, соответствует порядковому номеру цикла вращения. Вторая цифра соответствует номерам осей. Проекции точек, представляющих на графике переменные, на обе оси значительны по величине. Так как оба фактора ортогональны, коэффициент корреляции между ними равен нулю. Об этом свидетельствует запись, сделанная в верхней части графика. На графиках, приводимых далее, коэффициент корреляции уже не будет равен нулю. Повернем теперь ось так, чтобы соответствующая ей гиперплоскость подходила как можно ближе к наибольшему числу точек. В качестве величины допустимой зоны опять примем значение ±0,10. Если повернуть ось в направлении, обратном движению часовой стрелки, до положения, обозначенного буквой то гиперплоскость, соответствующая этому новому положению оси, пройдет через второй квадрант. Все точки, находящиеся во втором квадранте, будут лежать в допустимой зоне вокруг гиперплоскости По нижней шкале графика считываем значение тангенса угла поворота, В данном случае оно равно Если бы мы повернули ось в направлении движения часовой стрелки, то получили бы отрицательное значение тангенса угла поворота, приблизительно - 0,40.

При вращении горизонтальной оси значения тангенса углов поворота считываются в нижней шкале графика с учетом указанных на рисунке знаков. Следует заметить, что угол поворота не должен превышать ± 45°, так как в противном случае мы не сможем пользоваться нижней шкалой графика для считывания показаний.

Как теперь вычислить по тангенсу угла поворота коэффициент корреляции между осями и определить величины проекций точек в новой системе координат? Вначале считанные по графику значения тангенсов углов поворота записываем в так называемую матрицу поворота системы координат. Эта матрица отражает все изменения, которые происходят с осями координат при выполнении цикла вращения. Количество строк и столбцов матрицы совпадает с числом факторов. В нашем примере размер матрицы поворота равен двум. Мы вращали только ось . Поэтому элементы главной диагонали равны Строки показывают, какие факторы оставались неизменными, столбцы — какие факторы вращались. Для нашего примера матрица поворота имеет вид:

Первый элемент во второй строке имел бы другое значение, если бы фактор 2 оставался неизменным, а фактор 1 вращался. Для простоты мы ограничимся здесь поворотом только одной оси. Нормализуя матрицу поворота, мы получаем возможность перейти от нее к желаемой матрице преобразования Нормализация матрицы необходима по следующей причине. Если бы мы перемножали ненормализованную матрицу поворота с матрицей , то длина результирующих векторов-факторов могла бы получиться отличным от единицы. При нормализации матрицы поворота достигается то, что факторы остаются нормированными. Отсюда происходит и название этой процедуры — нормализация матрицы поворота. Нормализация заключается в нахождении обратных чисел величин, получаемых при извлечении квадратного корня из элементов матрицы, возведенных в квадрат и просуммированных по столбцам. Эти обратные величины являются элементами диагональной матрицы . В результате умножения получаем искомую матрицу преобразования Это и есть нормализованная матрица поворота. Процедура вычисления приведена в верхней части табл. 5.2. Ее можно разбить на последовательные этапы: сначала находят матрицу поворота затем по ней вычисляют и конечный этап — нахождение по матрицы А. Во второй части таблицы вычисляется произведение В результате получаем корреляционную матрицу между новыми осями. Так как в нашем распоряжении имелись два фактора, мы получили только одно значение внедиагональных элементов, а именно . Это величина коэффициента корреляции между новыми осями. Значение диагональных элементов можно применить для проверки правильности вычислений. С точностью до ошибок округления они должны быть равны единице. В третьей части табл. 5.2 производится вычисление проекций векторов, представляющих переменные, на новые, повернутые оси .

Так как ось не вращалась, . Поэтому по сравнению с исходной факторной матрицей в результате вращения изменились значения элементов только во втором столбце.

Отдельные этапы вычислений, представленные в табл. 5.2, в принципе повторяются при последующих циклах вращения. При самостоятельном выполнении вся процедура вычислений очень быстро запоминается. Через и так далее будем обозначать факторные матрицы вторичного решения, получаемого после каждого цикла вращения. Ранее употребляемый индекс при букве означающий результат вторичного решения, здесь ради упрощения опускается. Отдельные факторы будем обозначать буквами с двойным индексом, причем первая цифра индекса будет указывать номер цикла вращения, а вторая — номер фактора. Итак, является вторым фактором, полученным в результате осуществления первого цикла вращения. Индекс в обозначениях матриц , а также у вводимой далее матрицы Q соответствует порядковому номеру цикла вращения. Факторное решение в виде матрицы полученное в результате первого цикла вращения, представлено на рис. 5.14.

Таблица 5.2. Первый цикл вращения

Левая часть факторной матрицы обозначена через правая — через -Одна группа точек, как мы и желали, сосредоточена вокруг гиперплоскости . На графике эта гиперплоскость совпадает с осью

Хотя обе оси больше не ортогональны, а, напротив, коррелируют между собой, на графике они изображены так, как будто они ортогональны. Значение корреляции между ними, вычисленное нами, указано в верхней части графика. Для удобства на рисунок можно нанести и косоугольные оси.

Рис. 5.14. Система векторов после первого цикла вращения, соответствующая факторному решению и вращение оси Матрица табл. 5.2 представлена в ортогональной системе координат. В верхней части графика указан коэффициент корреляции между и К.т.е. эти оси коррелируют между собой, но, несмотря на это, они изображены ортогональными

Ошибка, которую могут допустить при установлении нового угла поворота, не очень велика, если коэффициент корреляции не превышает 0,50. Она не связана с вычислениями, а может быть вызвана неточным вычерчиванием графика или неточным измерением угла поворота. Самое большое, к чему может привести подобная ошибка, это увеличение циклов вращения. Но с этим приходится мириться ради простоты ортогонального изображения. На рис. 5.14 ось четко определяется точками, которые лежат в соответствующей ей гиперплоскости. Ось также должна быть так проведена, чтобы возможно больше точек лежало вблизи гиперплоскости Как показано на рисунке, вращение выполняем против часовой стрелки. Значение тангенса угла поворота — 0,90 считываем в левой части графика. Итак, при вращении вертикальной оси тангенс угла поворота определяем по левой шкале графика, при вращении горизонтальной оси — по нижней шкале графика (см. рис. 5.13) по отрезкам, отсекаемым соответствующими гиперплоскостями, а не осями. Если бы мы увеличили еще немного угол поворота, то все точки данной группы попали бы в зону вокруг гиперплоскости Мы здесь сознательно провели гиперплоскость не точно через центр тяжести скопления точек, благодаря чему получили возможность выполнить еще один цикл вращения. Это никак не скажется на окончательном результате. Матрица поворота имеет вид:

Мы могли бы опять нормализовать эту матрицу поворота и применить к Но тогда возможные ошибки, допущенные при вычислении факторной матрицы вошли бы в последующий цикл вращения и накапливались бы в ходе выполнения последующих операций. Чтобы избежать этого, каждый раз при выполнении очередного цикла вращения возвращаются к исходной факторной матрице . Итак, второй цикл вращения начинаем с вычисления произведения и нормализации полученной матрицы Нормализованная матрица, обозначенная через умножается на для получения . Произведение мы опять можем использовать для проверки правильности вычислений. Ошибки, которые могли возникнуть при вычислении не окажут никакого влияния на точность получения новой факторной матрицы V2. Вычислительная процедура второго цикла вращения представлена поэтапно в четырех частях табл. 5.3. Вначале умножают матрицу поворота на матрицу преобразования предшествующего цикла вращения и получают матрицу

Рис. 5.15. Система векторов после второго цикла вращения, соответствующая факторному решению . Вращение оси до положения

Эта матрица нормализуется уже известным способом. Во второй части таблицы получаем Дальнейшая процедура аналогична вычислениям в табл. 5.2, а именно определяется корреляционная матрица для вторичных осей. И наконец, в последней части таблицы вычисляется новая факторная матрица на основе исходной матрицы .

Результат вращения обеих осей представлен на рис. 5.15. Вторичные оси отрицательно коррелируют между собой. Обе группы точек уже относительно плотно прилегают к гиперплоскостям. Лишь положение гиперплоскости, соответствующей оси может быть несколько улучшено путем поворота этой оси на небольшой угол против движения часовой стрелки. В левой части графика считываем опять значение тангенса угла поворота —0,09. Дальнейшая процедура полностью аналогична ходу вычислений второго цикла вращения (см. табл. 5.3). Табл. 5.4 содержит отдельные этапы этой процедуры. По сравнению с табл. 5.3 в ней изменены лишь индексы обозначений матриц. В результате соответствующих вычислений получаем окончательную матрицу преобразования матрицу корреляций между вторичными осями и матрицу повернутых факторов с набором проекций 12 векторов (факторных нагрузок) на новые оси .

На рис. 5.16 изображена простая структура, которая вряд ли может быть улучшена путем дальнейшего вращения. Если все-таки оси повернуть еще на небольшой угол, то отдельные точки выйдут за границы зоны вокруг гиперплоскостей.

Таблица 5.3. Второй цикл вращения

Поэтому такое положение осей будем считать окончательным. Данный пример дает однозначные и простые результаты. При осуществлении каждого цикла вращению подвергалась только одна ось. Разумеется, можно одновременно вращать обе оси. Процедура при этом не изменится, но объем вычислений уменьшится. В примере мы имели дело лишь с двумя осями. При большем числе осей на графиках изображаются все возможные комбинации систем отсчета, учитывая каждый раз одновременно только две оси. Отдельно для каждой комбинации осуществляется процедура вращения. Для одного цикла вращения, выполненного на всех графиках, составляется одна матрица поворота. В принципе схема вычислений остается такой же, как вышеприведенная.

Таблица 5.4. Третий цикл вращения

Следует обратить внимание читателя на следующие обстоятельства. Мы нашли новое положение осей координат, не зная, какая точка какой переменной соответствует. При этом мы исходили из всей системы переменных, рассматривая ее в целом как неизменную, и осуществляя вращение так, чтобы возможно больше точек оказалось вблизи координатных гиперплоскостей без изменения взаимного расположения векторов (рис. 5.16). Это положение гиперплоскостей было достигнуто вслепую в том смысле, что не учитывалось смысловое содержание переменных. Если теперь для проверки значимости полученной простой структуры использовать критерий Баргмана, то следует по матрице подсчитать для каждого фактора количество переменных с нагрузкой меньше 0,10. Из табл. 5.4 видно, что на первый фактор приходится пять переменных, а на второй фактор — шесть. Эти переменные лежат в зоне вокруг гиперплоскостей. Сравнивая с данными таблицы приложения, делаем вывод, что полученную структуру можно считать значимой на уровне 1%. Теперь мы можем приступить к интерпретации обоих факторов. (При более точных расчетах на первый фактор будут приходиться только три переменные, для которых выполняется условие

Для второго фактора результат остается неизменным. Собственно говоря, в эксперименте рассматривали 24 переменные, для которых в ходе анализа было установлено однофакторное решение. Для простоты здесь ограничились первыми 12 переменными.) Оказалось, что экспериментальным данным присуща простая структура. Перед началом содержательной интерпретации факторов по переменным со значительными нагрузками заметим, что все результаты измерений систолического кровяного давления лежат вблизи вторичной оси 1, а результаты измерений диастолического — вблизи вторичной оси 2. Обе оси, представляющие факторы, коррелируют между собой.

Рис. 5.16. Финальное факторное решение . Все точки лежат в зонах координатных гиперплоскостей. Путем дальнейшего вращения осей достигнутое распределение переменных по факторам вряд ли сможет быть улучшено в смысле четкости и простоты структуры

При интерпретации связи знак корреляции может быть здесь изменен на обратный. Величина полученного коэффициента корреляции 0,52 соответствует известной по другим экспериментам связи между систолическим и диастолическим кровяным давлением. Результатом вторичного решения является матрица связь которой с другими матрицами будет рассматриваться в гл. 5.4.

Попытаемся далее формально описать операции, соответствующие отдельным этапам итеративной процедуры вращения при поиске простой структуры графическим методом. Для иллюстрации используем пример с тремя факторами.

1. Чертят графиков, число которых соответствует всем возможным комбинациям факторов по два. Факторные нагрузки из каждой строки исходной ортогональной факторной матрицы принимаются в качестве координат векторов, представляющих переменные. Обычно сами векторы не вычерчиваются, а на графике точками обозначаются их концы. Исполнитель не должен знать смыслового содержания переменных.

2. Угол поворота осей определяется по графикам. При этом при вращении горизонтальной оси тангенс угла поворота считывается по отрезку, отсекаемому гиперплоскостью, соответствующей этой оси, от нижней части графика. При вращении вертикальной оси тангенс угла поворота считывается в левой части графика.

Угол поворота осей не должен превышать 45 °. При считывании тангенса угла поворота следует по графику учитывать знаки (см. рис. 5.13 и 5.14). Можно вращать одновременно две оси на одном графике. Так, можно было бы одновременно выполнять процедуру вращения с любым числом переменных на различных графиках. Углы поворота осей фиксируются в матрице поворота S. Эта матрица имеет размер , а ее диагональные элементы равны единице. (Если фактор должен отражаться, т. е. если все его знаки изменяются на противоположные, то на этом месте ставят — 1.) Недиагональные элементы адекватны углам поворота осей в соответствующих плоскостях. Номер столбца обозначает всегда фактор, подвергаемый вращению. По каждому графику мы определяем значения двух элементов матрицы поворота, расположенных выше и ниже главной диагонали. Элементам, показывающим отсутствие вращения, приписывается нулевое значение или соответствующее место в матрице остается пустым.

3. Матрица поворота перемножается с матрицей преобразования предыдущего цикла вращения, в результате чего получают матрицу Q. В первом цикле вращения матрица преобразования приравнивается к тождественной матрице. Тогда имеем, что

4. Матрица Q нормализуется путем умножения ее на диагональную матрицу А. Элементами диагональной матрицы А являются обратные величины из квадратных корней квадратов элементов матрицы Q, просуммированных по столбцам. Нормализованная матрица Q является искомой матрицей преобразования .

5. В результате перемножения получаем — матрицу коэффициентов корреляции между вторичными факторами, диагональные элементы которой с точностью до ошибок округления должны быть равны единице.

6. Умножая матрицу исходных факторов на матрицу преобразования, получаем факторную структуру вторичного решения после цикла вращения: По величине факторных нагрузок, возникших в результате очередного цикла вращения осей координат, решают вопрос: нужна ли дальнейшая корректировка, может ли она привести к получению лучшего отражения простой структуры? Для этого применяется так же, как и в п. 1, графическое изображение факторной матрицы после поворота. Все матрицы получают индекс номера цикла. вращения.

7. При осуществлении каждого цикла поворота подсчитывается число переменных, для которых выполняется неравенство . В этом случае говорят, что эти переменные лежат в зоне ±0,10 вокруг координатных гиперплоскостей. Получают так называемую таблицу подсчета нулевых нагрузок, в которой указывается, для какого количества переменных данное условие выполняется и какой процент переменных это составляет (см. следующий пример). Выраженная в процентах доля переменных, лежащих в гиперплоскости фактора, в процессе вращения должна постепенно достигать уровня, который не может быть превзойден при данном наборе исходных данных. Это предельное значение используется в качестве оптимальности достижения простой структуры.

Исследованием данного критерия занимался Каттелл. Процедура вращения прекращается, когда число переменных, находящихся в зоне гиперплоскостей координат, при поворотах осей больше не увеличивается, а остается на одном и том же уровне или даже начинает уменьшаться. Отдельные этапы процедуры вращения можно записать в матричном виде:

Индекс i означает номер цикла вращения. Умножая матрицу преобразования предыдущего цикла вращения А на матрицу поворота S, получают Q. Для первого цикла

Равенство (5.14) отражает нормализацию матрицы Элементами диагональной матрицы ; являются величины результате получаем искомую матрицу преобразования

По формуле (5.15) определяется корреляционная матрица отражающая связь между вторичными осями. Недиагональные ее элементы являются коэффициентами корреляции между повернутыми факторами. По (5.16) определяется новая матрица факторной структуры

Далее изображают переменные в новой системе координат, т. е. представляют на графике факторную матрицу устанавливают новую матрицу поворота и приступают к следующему циклу вращения по формуле (5.13).

Описанный метод вращения связан с большим объемом вычислений и вычерчиванием значительного количества графиков. При числе факторов более трех один цикл вращения продолжается несколько часов. Осуществление процедуры вращения сильно упрощается при использовании так называемой Rotoplot-прогрaммы, предложенной Каттеллом и Фостером [41]. Эта программа обеспечивает выполнение всех действий над матрицами на вычислительной машине, а на специальном экране могут высвечиваться все графики.

Просматривая проекции точек на все возможные плоскости координат, принимают решение, следует ли подвергать вращению данную пару осей. Машина устанавливает новую матрицу поворота, после чего автоматически вычисляются значения элементов матрицы преобразования и выдается новое положение осей с проекциями векторов на них. Более подробное описание Rotoplot-прогрaммы приводится дальше (см. с. 339). Обсуждаемый здесь пример рассчитан по этой программе.

Ортогональная исходная матрица с тремя факторами для 20 переменных представлена в табл. 5.5, графическое ее изображение в различных плоскостях приведено на рис. 5.17-5.19. Вначале подвергаются вращению оси на рис. 5.17. Угол поворота у них одинаковый, но направление разное.

Таблица 5.5. Первый цикл вращения

Благодаря этому оси остаются ортотональными, а все точки попадают в один квадрант (рис. 5.20). Матрица поворота этого первого цикла вращения, матрица преобразования и матрица коэффициентов корреляций между вторичными осями построены по указанным выше формулам (5.13)-(5.16), а результаты приведены в той же самой табл. 5.5. При подсчете переменных, для которых выполняется условие оказалось, что только в одной гиперплоскости, соответствующей фактору лежат две переменные, не выходя за зону ±0,10. Итак, о достижении простой структуры пока еще рано говорить. Результат первого цикла вращения с некоторыми промежуточными вычислениями для второго цикла вращения приведен в табл. 5.6. Графическое изображение новой факторной матрицы с двумя повернутыми факторами дано на рис. 5.20-5.22. На рис. 5.21 производится поворот оси до положения (тангенс угла поворота, а следовательно, и соответствующий элемент матрицы поворота равен —0,60), а также поворот оси до положения (тангенс угла поворота равен ). Матрицы вычисляются по указанным выше формулам. После поворота вторичные оси коррелируют между собой, что находит отражение в матрице и на графике.

Результат второго цикла вращения в виде факторной матрицы и промежуточные расчеты для третьего цикла вращения приведены в табл. 5.7. На рис. 5.23 и 5.24 производится поворот оси до положения благодаря чему ряд точек попадает на саму координатную гиперплоскость или находится в непосредственной близости от нее.

Рис. 5.17

Рис. 5.18

Рис. 5.19

Рис. 5.20

Рис. 5.21

Рис. 5.22

Таблица 5.6. Второй цикл вращения

Таблица 5.7. Третий цикл вращения

Соответствующие тангенсы углов поворота, записываемые в матрицу поворота, равны —0,10 и 0,08. Конечный результат вращения в виде финальной факторной матрицы представлен в табл. 5.8, а соответствующие ее изображения в различных плоскостях даны на рис. 5.26-5.28. Каждый фактор, как видно из той же табл. 5.8, опре деляется девятью переменными. Дальнейшее вращение осей не улучшит полученную структуру, а приведет только к выпадению точек из критических зон вокруг гиперплоскостей координат. Поэтому принимаем решение прекратить вращение, считая, что достигнутое положение осей обеспечивает простую структуру. В результате вращения доля всех переменных, лежащих в соответствующих координатных плоскостях, увеличилась от 3 (табл. 5.5) до 45% (табл. 5.8). После третьего цикла вращения был достигнут уровень распределения переменных по факторам, который не может быть улучшен. Все три фактора являются значимыми по тесту Баргмана.

Таблица 5.8. Финальное факторное решение после трех вращений

Описанный выше пример вращения известен под названием бокс-проблемы Тэрстоуна и приведен в его книге как учебный пример, но при вращении выбирались другие углы поворота. В данном примере процедура вращения осуществлялась независимо от решения, предлагаемого Тэрстоуном, но в итоге получили сходные результаты. При желании читатель самостоятельно может провести сравнение между методом, описываемым Тэрстоуном [286; 6] и приведенным здесь. Если экспериментальным данным действительно присуща четкая простая структура, то к ней можно прийти различными способами. Различные способы требуют и различных затрат времени. Доказательством объективности процедуры вращения является тот факт, что исследователи независимо друг от друга на основе одних и тех же данных, но используя различные методы вращения, приходят к одинаковым результатам.

Рис. 5.23

Рис. 5.24

Рис. 5.25

Рис. 5.26

Рис. 5.27

Рис. 5.28

Если в приведенном примере из 20 переменных выбрать 9 и в качестве упражнения дать задание нескольким студентам одного курса выполнить процедуру вращения для отобранного числа переменных и трех факторов, то можно убедиться, что независимо друг от друга они придут к одинаковым результатам, вполне согласующимся с финальным факторным решением по всем 20 переменным. К. обсуждению бокс-проблемы мы еще раз вернемся в 7.1.1 совсем по другому поводу.

<< Предыдущий параграф Следующий параграф >>
Оглавление