Главная > Математика > Факторный анализ (Окунь. Я.)
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Глава седьмая. ДРУГИЕ МЕТОДЫ ОПРЕДЕЛЕНИЯ ФАКТОРОВ

1. ВСТУПИТЕЛЬНЫЕ ЗАМЕЧАНИЯ О ПУТЯХ РАЗВИТИЯ ФАКТОРНОГО АНАЛИЗА

Уже отмечалось, что описанный выше в общих чертах центроидный метод выделения факторов из совокупностей корреляции между переменными не является единственным методом факторного анализа. Указывалось также, что в рамках данной работы с учетом ее размеров и того, что она носит характер вступления в проблему, нет возможности детально рассматривать другие методы, используемые на практике. Однако представляется целесообразным дать хотя бы самую общую характеристику важнейших из них в целях лучшего и всестороннего изложения сущности центроидного метода, представляющего собой самый распространенный вариант процедуры многофакторного анализа. Чтобы смысл названия «многофакторный анализ» стал еще яснее, необходимо вернуться немного назад. Мы уже знаем, что начало развития факторного анализа было положено Чарльзом Спирмэном [174].

Эта работа послужила первым толчком к возникновению бурно развивающегося направления исследований и оживленных дискуссий, в которых скрестили шпаги сторонники многих новых концепций факторного анализа. Попытаемся сжато изложить исходную теорию Спирмэиа и условия, в которых она возникла. Спирмэн был одним из первых исследователей, выдвинувших задачу определения факторов, обусловливающих экспериментально обнаруженные корреляции. Внимание этого ученого привлек тот факт, что тесты способностей характеризуются, как правило, заметными положительными корреляциями.

Это наводило на мысль, что все эти возможные совокупности корреляций обусловливаются каким-то одним общим фактором, влияющим на все переменные. Возникла задача обосновать этот тезис с математико-статистической точки зрения. Психологам, применявшим статистические методы, уже давно была известна зависимость величины коэффициента корреляции от надежности коррелируемых тестов способностей. Коэффициент этот тем выше, т. е. ближе к своему максимально возможному в данных условиях значению, чем выше надежность (постоянство) тестов, измеряющих две способности.

Если применяются тесты, дающие погрешности и характеризующиеся низкими коэффициентами надежности, и если тесты реализуются в неодинаковых условиях, то корреляция между ними будет занижена в результате ошибок наблюдения. Правильно рассчитанная корреляция является показателем некой закономерности, некой структуры в потоке событий, а всевозможные неточности, случайные помехи из-за разного рода ошибок всегда снижают значение коэффициента корреляции. Этого нельзя сказать в отношении многих других статистических величин, например, в отношении средней, так как случайные ошибки могут как уменьшать, так и увеличивать ее.

Так же давно был известен метод корректировки отклонения коэффициента корреляции от его теоретической величины, обусловленного ошибкой эксперимента. Существует формула, позволяющая определить теоретическое значение г, т. е. величину этого коэффициента, при отсутствии ошибок. Формула эта довольно сложная, она имеет вид:

где — два последовательных наблюдения способности а, содержащей определенный процент ошибки, — наблюдения способности b. Мы не будем подробно рассматривать математические основы этой формулы; наша цель заключается прежде всего в определении роли, которую она играет в исследованиях Спирмэна. Поэтому укажем лишь, что числитель формулы включает все скорректированные комбинации отдельных наблюдений, тогда как знаменатель содержит два коэффициента надежности. Чем выше эти коэффициенты, тем ближе экспериментально определенные к теоретической величине .

Трактуя эту формулу несколько иначе, Спирмэи вывел свое знаменитое уравнение тетрады (tetrad difference equation). Дадим в сжатой форме основную последовательность рассуждений, которой придерживался Спирмэн, не вдаваясь в алгебраические преобразования. Он рассматривал приведенную формулу как метод расчета корреляции, возникающей между двумя тестами, включающими один и тот же общий фактор, при условии, что элиминированы специфичные соответствующие обоим тестам факторы. Спирмэн, следовательно, считал, что элементы, специфичные для данного теста, в случае измерения общего фактора, играют ту же роль, что и ошибки измерения. Поэтому можно рассмотреть какие-либо четыре теста, в отношении которых допускается, что они содержат общий фактор, и интерпретировать их как соответствующие наблюдения, обозначаемые

Это будут также различные способы измерения одного и того же явления (общего фактора), но при помощи четырех различных тестов. Поэтому указанное уравнение будет способом определения общности в каждом тесте.

Для этой новой трактовки формулы целесообразно использовать другие обозначения, чтобы замысел Спирмэна стал более явным. Вместо обозначающих четыре наблюдения двух способностей, используем номера 1, 2, 3, и 4, обозначающие четыре различных теста, подобранных так, чтобы с помощью каждого из них можно было попытаться измерить один и тот же фактор. Этот общий фактор Спирмэн обозначил g. В результате левая сторона исходного уравнения будет иметь вид так как в соответствии с нашим предположением все четыре теста являются попыткой измерения одного и того же фактора g; другими словами, g в тесте 1 и 2 то же, что и g в тесте 3 и 4. Поэтому

этом произвольные коэффициенты рассматриваются как аналоги коэффициентов надежности. С тем же успехом можно использовать коэффициенты или Отсюда следует, что приведенную формулу можно записать в трех вариантах. Понятно, что левая сторона формулы отражает корреляцию фактора g с ним самим, а потому можно принять, что она равна 1.

Путем ряда преобразований из формулы можно получить следующую пропорцию:

которую легко переписать в виде

Последнее выражение и есть знаменитая тетрада Спирмэна. Если корреляции четырех отдельных тестов удовлетворяют этому уравнению, то все тесты измеряют только один общий фактор.

Кроме того, они измеряют специфичные факторы, присущие каждому их них. Возьмем в качестве примера простую систему корреляции четырех тестов.

Таблица 7.1

Как при помощи метода Спирмэна определить, можно ли для всех коррелированных тестов исходить из существования общего фактора? Нужно взять тесты во всех возможных комбинациях (каждый раз но четыре) и проверить, будут ли все тетрады равны нулю. Если будут, то коэффициенты каждых двух столбцов (не считая пустых клеток на главной диагонали) будут пропорциональны друг другу. Для столбцов 1 и 2 получим:

Для столбцов 1 и 3 получим:

Для столбцов 1 и 4 получим:

Отсюда непосредственно определяем тетрады:

Аналогичные уравнения можно, очевидно, написать для столбцов 2 и 3, 2 и 4, 3 и 4, но они будут повторять уже приведенные уравнения. При выполнении выписанных уравнений считаем, что условие пропорциональности соблюдено и что четыре изучаемых теста имеют один общий фактор.

При большем числе тестов количество таких формул быстро растет, так как нужно проанализировать все возможные комбинации по 4 теста одновременно. Например, при 10 тестах количество уравнений составит 252, при 20 тестах — 2907. Каждый из тестов входит в , а каждый коэффициент корреляции в соответствующих уравнений. Видно, что этот метод весьма трудоемок.

Рассмотрим еще одио понятие, связанное с методом Спирмэна, чтобы все приведенные выше пропорции были более выразительными, заметными как бы с «первого взгляда», столбцы и строки матрицы Должны располагаться в определенном порядке. На первом месте должен находиться столбец с наибольшей суммой коэффициентов корреляции, дальше идти столбцы с последовательно уменьшающимися суммами. При таком подходе в каждых столбце и строке коэффициенты корреляции будут ранжированы в порядке убывания. Такое упорядочение Спирмэн назвал «иерархической системой».

Попытаемся проиллюстрировать сказанное на условном числовом примере.

В случае матрицы корреляции пяти переменных, записанной в виде табл. 7.2, вычисляются прежде всего суммы отдельных столбцов, после чего столбцы и соответствующие им строки меняются местами с учетом сумм их элементов. В результате получим табл. 7.3.

Таблица 7.2.

Таблица 7.3.

В этой «иерархической системе» пропорциональность каждых двух столбцов и строк более очевидна, что легко проверить с помощью соответствующих расчетов:

или

Для корреляций, полученных на основе реальных данных, не существует, видимо, таких совершенных иерархических систем, хотя Спирмэн и его последователи нашли некоторое число тестов способностей, которые давали корреляции, характеризующиеся заметной тенденцией к такой пропорциональности. Тетрады разности в этом случае незначительно отклонялись от нуля, причем эти отклонения не выходили за границы допустимой ошибки.

С учетом этих результатов была сформулирована известная «теория двух факторов», предполагающая, что каждый тест, входящий в «иерархию», включает два фактора: Фактор g — это «фактор общей одаренности», фактор s — это специфичный для каждого теста фактор, соответствующий только ему и только той части дисперсии, которая характерна для данного теста. Эту теорию более правильно было бы назвать теорией одного общего фактора и теоретически неограниченного числа специфических факторов, которых может быть столько, сколько вообще можно себе представить тестов.

Спирмэн стремился очищать серию тестов от тех из них, которые нарушают иерархию, используя для этой цели критерий тетрад. Неподходящие тесты, помимо общего фактора, включали еще какой-то фактор, общий для меньшей группы тестов. Ясно, что если две переменные, помимо общего фактора, объединяющего их со всеми переменными матрицы, имеют еще какой-то дополнительный фактор, связывающий эти две переменные друг с другом, то корреляция между ними будет чрезмерно высокой и исказит пропорциональность. С этой точки зрения тетрада в течение многих лет выполняла роль критерия «иерархической системы». Существенный поворот произошел тогда, когда Тэрстоун предложил другое применение этого инструмента. Он обратил внимание именно на те тесты, которые Спирмэн и его ученики устраняли из серии при помощи правила тетрады. Они заинтересовали Тэрстоуна с точки зрения, содержащихся в них дополнительных групповых факторов. Теперь указанные разности стали средством исследования дополнительных групповых факторов, содержащихся в данной серии. Эти факторы ранее элиминировались путем устранения переменных, нарушающих иерархию. Вместо того, чтобы подгонять совокупность корреляций с учетом рамок, обусловленных концепцией общего фактора, Тэрстоун стремился найти все факторы, которые действительно могут содержаться в корреляциях данной группы переменных. Таким путем и возник замысел многофакторного анализа. Много времени продолжалась дискуссия между сторонниками Спирмэна и Тэрстоуна. В эту дискуссию были вовлечены многие специалисты факторного анализа, разделившиеся на противоборствующие лагери и защищающие противоположные концепции. И лишь по мере разработки теоретических основ становилось понятно, что концепция многофакторного анализа представляет собой просто обобщение идеи Спирмэна. Однако до сегодняшнего дня сохранились некоторые тенденции, являющиеся эхом прошлых противоречий. Английская школа факторного анализа склонна оперировать общим фактором, тогда как американская школа стоит на платформе многофакторного анализа в его чистом виде.

Попытаемся выяснить, почему концепция общего фактора является особым случаем многофакторного анализа. Для того, чтобы читатель смог получить представление о связи между концепциями Спирмэна и Тэрстоуна, введем некоторые общие сведения по проблеме, которые помогут исследователю ориентироваться в том случае, когда он обратится к литературе.

<< Предыдущий параграф Следующий параграф >>
Оглавление