Главная > Математика > Факторный анализ (Окунь. Я.)
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

3. ГЛАВНЫЕ РАЗНОВИДНОСТИ МЕТОДОВ ОПРЕДЕЛЕНИЯ ФАКТОРОВ

Уже отмечалось, что рамки данной работы не позволяют подробно изложить большую часть методов факторного анализа. Рассмотрим поэтому несколько более подробно метод главных осей, после чего попытаемся дать лишь в самой общей форме классификацию существующих методов, которая поможет читателю ориентироваться в обширной литературе по предмету при изучении конкретных проблем.

Предпринимая попытку иллюстрации факторного анализа на конкретном примере, мы по необходимости ограничились лишь центроидным методом, учитывая широкие возможности его применения в психологии. Однако помимо этого весьма распространенного метода многофакторного анализа существуют родственные ему методы, опирающиеся на ту же самую основополагающую концепцию. Тэрстоун дает еще четыре таких метода. Один их них — так называемый диагональный метод — имеет скорее всего лишь историческое значение, тогда как три остальных сохраняют большое практическое значение, являясь в некотором смысле сокращенными вариантами центроидного метода. Названия этих методов похожи друг на друга: методы групп, методы группировки и методы многократных групп. В отличие от центроидного эти методы не используют с самого начала всю корреляционную матрицу для определения области общих факторов, а исходят из поисков выразительных связок корреляции, свидетельствующих о наличии основ скрытой структуры. С учетом этого ведется дальнейший анализ факторов. Такой подход и составляет, видимо, главную особенность этих методов, отличающую их от центроидного и позволяющую рассматривать их как более экономные способы определения факторов. Так как при этом берется лишь часть корреляционной матрицы, отпадает необходимость в расчете средней корреляции одновременно всех переменных. Важным свойством всех трех методов является также то, что соответствующее им положение системы координат близко к простой структуре, т. е. исходная факторная матрица близка к матрице после поворота. Причина этого достаточно ясна. Если на первой стадии работы учитываются связки корреляций, то процесс выделения факторов из этих связок дает довольно высокие нагрузки определенного фактора для всех переменных в связке и незначительные нагрузки этого фактора при переменных, не входящих в связку.

А именно это и есть свойство простой структуры. Близкое еще не означает точно такое же, и это нужно всегда помнить. Для каждого такого метода характерно то, что некоторые факторы, содержащиеся в корреляционной матрице, не входят в определенные связки и в то же время некоторые связки могут содержать более одного фактора. В любом случае то, что указанные методы дают положение осей координат, близкое простой структуре, является желательным в том смысле, что окончательное положение можно определить при помощи меньшего числа вращений, чем при центроидном методе.

Не вдаваясь в дальнейшие подробности, укажем еще, что недостатком этих методов является большая трудность их использования. Выбор групп для анализа представляет собой в определенном смысле искусство и требует лучшей подготовки и большего опыта у исследователя, чем в случае более формализированного центроидного метода. Кроме того, труднее определить исходную общность, которая в этом случае должна рассчитываться более точно.

Из методов, опирающихся на иные по сравнению с описанными выше процедуры семейства «центроидных методов», можно отметить метод главных осей. Создателем его является Г. Хотеллинг. Т. Келли внес в него ряд улучшений при анализе социально-психологических данных. Этот метод больше всего известен математикам, с точки зрения которых он является одним из главных в факторном анализе. В его основе лежат совершенно другие предположения по сравнению с центроидным методом.

Процедура расчета факторных нагрузок методов главных осей весьма трудоемка при отсутствии современных вычислительных машин. Однако более подробное ознакомление читателя с техникой расчетов, необходимых при использовании этого метода, представляется целесообразным - как с точки зрения его теоретического значения, так и с учетом необходимости более детального рассмотрения хотя бы одного примера расчета факторов, опирающегося на другие, по сравнению с центроидным методом, предположения.

В работе Б. Фрюхтера [84] дан пример расчета факторных нагрузок методом главных осей, там же описан метод Хотеллинга и Келли, отличающийся интересными свойствами. Наиболее существенно, пожалуй, то, что этот метод позволяет определить факторы, объясняющие максимальную область дисперсии и дающие минимальные остатки в корреляционной матрице. С точки зрения расчетов это означает, что сумма квадратов факторных нагрузок будет максимальной для каждого фактора. Из этого вытекает, что матрица может анализироваться при помощи минимального числа ортогональных факторов.

К несомненным преимуществам этого метода относится и то, что расчеты дают решение, которое с чисто математической точки зрения является однозначным для данного набора корреляций.

Б. Фрюхтер высказывает мнение, что метод главных осей может быть в некотором смысле заменен центроидным, требующим меньших расчетов. Если при помощи центроидного метода выделяется один или два положительных фактора, то получается решение, которое с учетом области вычисленной дисперсии более или менее эквивалентно решению по методу главных осей. Нужно, однако, помнить, что предположения обоих методов совершенно различны, а потому различны и возможности содержательной интерпретации рассчитанных факторов. Считается, что дать интерпретацию факторов, рассчитанных методом главных осей, гораздо труднее по сравнению с центроидными факторами.

Метод расчета факторных нагрузок был разработан Хотеллингом в 1935 г. Этот метод основан на принципе последовательных прибли-. жений и позволяет достичь любой степени точности. На главной диагонали корреляционной матрицы записываются общности, относительно которых предполагается, что они истинны. В результате способ получения редуцированной корреляционной матрицы R точно такой же, как и в центроидном методе. Процедура расчетов при этом распадается на два основных этапа: первый из них представляет собой процесс вступительных итераций, т. е. многократного повторения одной и той же расчетной операции для определения достаточно точных значений, необходимых при вычислении факторных нагрузок, второй этап и есть расчет этих нагрузок.

Факторная матрица, рассчитанная методом главных осей, имеет интересное свойство: сумма произведений каждой пары ее столбцов равна нулю.

Другая особенность относится к сумме квадратов факторных нагрузок каждого столбца факторной матрицы. Эти величины называются «скрытыми корнями». Каждая из них соответствует той части полной дисперсии всех тестов, которая приходится на данный фактор. Если величины для разных столбцов, соответствующих отдельным факторам, неодинаковы, то значения строки и будут быстро стремиться к требуемой степени точности в процессе последовательных приближений. Если суммы квадратов факторных нагрузок равны, то ситуация менее благоприятная, так как элементы строки и очень медленно приближаются к требуемому уровню точности.

Редуцированная факторная матрица, полученная методом главных осей, может быть преобразована с учетом правил вращения, описанных в пятой главе (стр. 90). Этим путем можно определить такое положение осей системы координат, при котором набор факторных нагрузок в наибольшей степени соответствует потребностям психологической интерпретации.

Метод главных осей имеет еще одно применение. Если на главной диагонали исходной корреляционной матрицы записать единицы или надежности тестов, то анализ методом Хотеллинга приведет к определению так называемых главных компонент.

Рис. 7.1

Поэтому этот метод называется методом главных компонент. Если главная диагональ корреляционной матрицы состоит из единиц, то перед нами полная матрица анализ которой дает столько факторов, сколько имеется переменных (тестов). Если попытаться геометрически описать проблему, то окажется, что в случае метода главных компонент в качестве осей координат берутся не оси, соответствующие факторам, а векторы, соответствующие переменным. Если предположить, что векторы переменных перпендикулярны друг другу, то точки, соответствующие отдельным наблюдениям (например, результаты ряда лиц в данном тесте), в случае положительной корреляции будут образовывать фигуру, напоминающую эллипс (рис. 7.1.).

Оси, представляющие факторы, проводятся вдоль и поперек эллипса на рис. 7.1), т. е. в соответствии с положением его большой и малой осей. Этим и объясняется общее название метода. Теперь можно проецировать все наблюдения (например, оценки отдельных людей в соответствующих тестах) на оси факторов. Если к двумерной системе добавить вектор третьей переменной, перпендикулярной к двум первым векторам, то получим трехмерную систему, в которой множество точек будет иметь вид яйцеообразного тела — эллипсоида.

Добавляя следующие векторы, соответствующие всем переменным в матрице, получим в итоге «конфигурацию» векторов в -мерном пространстве. Это пространство будет иметь столько осей, сколько переменных в матрице. Поэтому метод главных осей дает столько факторов, сколько переменных.

Как уже отмечалось, результаты всех факторных методов могут быть взаимно преобразованы друг в друга. Теперь можно, кроме того, указать, что они могут преобразовываться в общую структуру, которая будет простой.

В качестве еще одного трудного, но восхваляемого математиками метода можно отметить метод максимального правдоподобия Лоули, с помощью которого можно математически строго определить факторные нагрузки. Этот метод был описан Томсоном [192] и Лоули [128]. В самой сжатой форме этот метод можно описать следующим образом: анализ начинается с первого приближения факторных нагрузок, рассчитанных любым методом, например центроидным.

Затем путем последовательных приближений получим все более однозначно определенные факторные нагрузки. В конечном итоге получаем надежные оценки числа и характера факторов, содержащихся в корреляционной матрице. Следующим шагом может быть вращение факторов для определения положения, позволяющего дать наилучшую содержательную интерпретацию факторов.

В заключение напомним еще о методах, родственных первой в истории факторного анализа концепции Спирмэна. Здесь можно отметить двухфакторный метод и метод биполярных факторов. Классический метод Спирмэна имеет сегодня сугубо историческое значение как иллюстрация путей развития факторного анализа. Однако основная идея Спирмэна, связанная со специфическими проблемами исследования умственных способностей, была развита К- Холзингером [105].

Это развитие старой идеи, позволяющее расширить область ее применения, иногда связывается с двухфакторным методом. По этому методу процедура начинается с определения нагрузок генерального фактора, присущего тестам, не нарушающим иерархию. На следующем шаге принимаются во внимание переменные, нарушающие иерархию Спирмэна, для определения дополнительного влияния, оказываемого групповым фактором на корреляции, включенные в матрицу. Генеральный фактор является при этом основой, на которой надстраиваются взаимно не совпадающие групповые факторы. Вычислительные операции при определении факторных нагрузок по этому методу проще, чем в центроидном методе. Остается еще добавить, что система таких факторов называется в специальной литературе системой «пустых ступеней». Смысл этого образного определения будет объяснен ниже.

Обратимся к методу биполярного фактора, развитого С. Бартом (Burt С. L. Factor of the mind, London, 1940, University of London Press). Этот метод трудно отнести к тому или иному типу, так как он связан одновременно с концепциями общего фактора Ч. Спирмэна и К- Холзингера и с центроидным методом в процессе определения следующих факторов. Не вдаваясь в подробности метода, укажем лишь, что он связан с понятием так называемых биполярных факторов. Это означает, что каждый фактор имеет специальную систему положительных и отрицательных нагрузок у всех переменных. Эта система характеризуется тем, что каждый следующий фактор среди нагрузок предыдущего фактора с одинаковым знаком делает одну половину отрицательной, а вторую положительной. Так как нагрузки первого общего фактора всегда положительны, половина нагрузок второго фактора положительна, а половина отрицательна. Связанное с этим методом понятие биполярного фактора имеет значение в исследовании структуры индивидуальных особенностей, так как здесь мы имеем «биполярность» основных черт, например доминирование — подчинение, интроверсия — экстраверсия, эмоциональная возбудимость — эмоциональное равновесие и т. д.

Интересно, что, по мнению С. Барта, этот метод, как и описанный выше двухфакторный метод, дает с самого начала наборы факторов, поддающихся содержательной интерпретации без вращения осей координат.

Кеттелл придерживается иной точки зрения, полагая, что процесс вращения необходим во всех случаях.

На этом мы заканчиваем беглый обзор основных методов факторного анализа. Было бы целесообразно провести сравнение существующих методов еще с одной очень важной точки зрения, позволяющей лучше уяснить взаимосвязи между ними. Речь идет о созвездии факторных нагрузок. Этот термин применяется большинством авторов для таблиц, характеризующих план размещения нагрузок данного множества факторов по отношению к совокупности переменных с учетом положительных, отрицательных и нулевых нагрузок. Различные факторные методы приводят, как известно, к разным созвездиям факторных нагрузок, или (на языке геометрии) к различным положениям осей системы координат перед вращением. Можно осуществить графическое сопоставление различных созвездий факторных нагрузок при помощи специальных таблиц, в которых нагрузки обозначаются условным знаком. В принципе возможных созвездий больше, чем созвездий, конкретно определяемых в соответствии с фактами и законами статистики. Ниже приводится такое сопоставление только тех созвездий, которые соответствуют некоторым из описанных выше методов (табл. 7.4).

Таблица 7.4

Каждая значительная факторная нагрузка обозначается звездочкой (*). Алгебраические знаки указываются только тогда, когда они строго определяются данным факторным методом. Соответствующие созвездия иллюстрируются на примере 10 переменных.

а) Многофакторный метод Тэрстоуна с простой структурой. Накладывающиеся друг на друга групповые и специфические факторы со всеми возможными комбинациями алгебраических знаков.

б) Метод главных осей Хотеллинга и Келли. Столько общих факторен, сколько переменных. Каждый фактор характеризуется нерегулярным размещением алгебраических знаков.

в) Метод Спирмэна. Один общий фактор и специфичные факторы. Все нагрузки положительные (отрицательную пару факторных нагрузок можно получить путем изменения знаков у любой переменной).

г) Двухфакторный метод Холзингера. Общий фактор и ненакладывающиеся групповые и специфичные факторы. Созвездие нагрузок групповых факторов создает картину «пустых ступеней». Алгебраические знаки как в методе Спирмэна.

д) Метод биполярных факторов Барта. Общие факторы с характерной системой алгебраических знаков и специфичные факторы.

В приведенных таблицах общие факторы обозначены буквой С, специфичные — буквой S. Необходимо отметить, что некоторые созвездия показаны лишь в качестве примера. К ним относятся те, для которых возможны различные варианты, соответствующие действительным корреляционным матрицам, например картина размещения накладывающихся групповых факторов у отдельных переменных при многофакторном методе (табл. 7.4, а) может быть различной в зависимости от конкретных условий. То же можно сказать и о двухфакторном и биполярном методах (табл. 7. 4, г и д). В первом из них могут быть различные количества не накладывающихся групповых факторов, а во втором — биполярных «общих» факторов. Фиксированные схемы для определенного числа переменных дают методы Хотеллинга и Спирмэна (табл. 7. 4, б и в).

Исследователь, использующий факторный анализ для практического решения конкретной задачи, должен осуществлять выбор самого подходящего метода. Во многих случаях такой выбор нетруден, так как по соображениям, изложенным выше, наиболее широкое применение в психологии имеет центроидный метод. Целесообразно, однако, кратко обсудить главные критерии такого выбора. Поскольку, как уже отмечалось, решения, полученные с помощью разных концепций вычислительной процедуры, могут в значительной степени преобразовываться друг в друга (например, путем вращения), психолог при выборе должен руководствоваться прежде всего не математическими соображениями. Представляется, что могут существовать два таких критерия. Первый из них, наиболее важный, - это вид созвездия, который непосредственно дает данный метод без вращения. Второй, скорее вспомогательный критерий, — это трудность вычислительной процедуры, которая иногда имеет чисто практическое значение.

Рассмотрим подробнее первый критерий. Было бы хорошо, если бы существовал метод, дающий созвездие факторных нагрузок, годное при всех условиях для психологической интерпретации. Это созвездие имело бы максимальную полезность и наибольший научный смысл. По мнению большинства специалистов, ни один метод не дает таких реаультатов, которые без вращения могли бы рассматриваться в качестве окончательных и эффективных, т. е. вскрывающих сущность явления.

Правда, как уже указывалось, Барт склонен считать, что двухфакторный и биполярный методы близки к такому идеалу.

Задача факторного анализа состоит прежде всего в определении существенных реально существующих в природе факторов. Различные методы дают определенные отличающиеся друг от друга созвездия факторов, результаты которых непосредственно несопоставимы. Интересно, что накопленный опыт показывает, что вращение для получения простой структуры дает системы факторов, которые в определенной степени постоянны и повторяются в различных условиях. С другой стороны, можно предполагать, что какие-либо реальные, основные влияния, существующие в природе, могут проявляться по-разному. Иногда они могут складываться, в других случаях могут погашать друг друга. Иногда они могут влиять на большее, иногда на меньшее число переменных. С этой точки зрения наилучшим будет максимально гибкое созвездие, которое благодаря этому было бы в состоянии учесть различные структуры, реально существующие в собранной совокупности экспериментальных данных. По мнению Кеттелла, этим условиям в наибольшей степени соответствует метод, использующей вращение — многофакторный метод, учитывающий взаимосвязанные общие факторы со всевозможными комбинациями алгебраических знаков.

В то же время большие сомнения вызывают методы, приводящие к определенным конфигурациям факторных нагрузок, даже если они определены строго математически или их легко использовать. Например, методы, дающие созвездия с разграниченными ненакладывающимися групповыми факторами. Трудно это согласовать со всем тем, что нам известно о взаимосвязи различных влияний психологического или социального характера. Такие методы не дают также повторяемых наборов факторов, т. е. одинаковых факторных систем для различных матриц и экспериментов. Это, естественно, не означает, что такие процедуры совершенно непригодны. Их можно с успехом использовать в качестве средств, описывающих и классифицирующих тесты, содержащиеся в определенной матрице.

Второй критерий имеет скорее вспомогательное значение. С учетом сложности необходимых расчетов, можно приблизительно ранжировать описанные выше методы следующим образом: наиболее быстросходящимся является двухфакторный метод, затем идет центроидный, метод главных осей и метод наибольшего правдоподобия. Понятно, что быстрое развитие все более совершенных ЭВМ будет вносить большие изменения в эту классификацию. Существуют еще и другие свойства различных методов определения факторных нагрузок, которые могут влиять на выбор, осуществляемый исследователем в различных условиях. Иногда этот выбор может зависеть от точности расчетов, в других случаях — лишь от приближенной схемы отыскиваемой структуры. Однако для общей цели определения основных факторов в таких областях, как психология или социология, наиболее подходящим является центроидный метод и его основные варианты.

<< Предыдущий параграф Следующий параграф >>
Оглавление