Главная > Математика > Факторный анализ (Окунь. Я.)
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

6. НЕКОТОРЫЕ СПЕЦИФИЧЕСКИЕ ПРОБЛЕМЫ ЦЕНТРОИДНОГО МЕТОДА

а. МЕТОДЫ ОПРЕДЕЛЕНИЯ ОБЩНОСТИ

Необходимо подчеркнуть прежде всего, что описанная выше процедура является лишь исходным, основным вариантом центроидного метода. Существует и ряд других разновидностей этого метода, однако их подробное изложение не входит в нашу задачу. К ним относится, например, довольно простой и сжатый метод группировки и более сложный групповой метод.

К важным процедурным вопросам изложенного здесь варианта центроидного метода относится прежде всего определение элементов главной диагонали.

Значение общности, записываемое на главной диагонали корреляционной матрицы, выражает ту часть корреляции переменной с самой собой, которую можно приписать влиянию общих факторов. Если бы на главной диагонали записывались корреляции каждой из переменных с самой собой с учетом специфической дисперсии и дисперсии, обусловленной ошибкой, то эти корреляции были бы равны +1,00. Однако все другие корреляции в каждом столбце корреляционной матрицы выражают взаимосвязь между парами переменных лишь в той степени, в какой она обусловлена общими факторами, так как предполагается, что специфическая дисперсия двух переменных и дисперсия, обусловленная ошибкой, не коррелируют друг с другом. В корреляционной матрице, подготовленной для анализа, следует записать на главной диагонали аналогичные коэффициенты, в том смысле, что они являются показателями лишь общих изменений. Тогда, как мы знаем, корреляционная матрица становится редуцированной. Трудность заключается в том, что, приступая к анализу, мы не знаем величин ибо они не определяются в процессе эксперимента. В то же время эти величины для нас небезразличны, так как они влияют на сумму элементов столбца и в результате на величину факторных нагрузок и даже на число факторов, которое удается выделить.

Поэтому нужно стремиться к тому, чтобы уже начале процедуры была установлена такая величина элементов главной диагонали, которая была бы максимально близкой к их истинным значениям. Та величина является истинной, которую можно вычислить путем суммирования квадратов факторных нагрузок. Помимо того, что эта операция осуществима лишь в конце процесса выделения факторов, получаемая этим путем величина общности будет надежной только тогда, когда мы располагаем точно рассчитанными факторными нагрузками. Для вычисления же точных факторных нагрузок нужно начинать анализ с правильно определенных значений Таким образом, получается нечто похожее на заколдованный круг. Поэтому нужно искать методы, позволяющие максимально точно оценить исходные элементы главной диагонали корреляционной матрицы.

В литературе по факторному анализу много внимания уделяют этой проблеме. Можно встретить различные мнения о цели, к которой нужно стремиться при оценке элементов главной диагонали. Некоторые авторы считают, что целью должно быть определение таких величин которые дают минимально возможное число факторов для данной матрицы. В соответствии с другим мнением речь идет о получении минимально возможных значений в целях уменьшения до минимума области изменений, обусловленных общими факторами. В этом случае обязательно преувеличиваются специфические изменения, что нежелательно, так как они немного говорят о структуре факторов, скрытой за системой - парных корреляций. Самым правильным представляется подход, в соответствии с которым главной целью является определение таких значений которые облегчают выделение факторных нагрузок и факторов, содержащихся в корреляционной матрице и отражающих какую-то действительную структуру. Учитывая необходимость сокращения расчетных выкладок, можно принять, что это будет такое число факторов, которое одновременно будет минимально необходимым для объяснения анализируемых реляций. Кроме того, необходимо помнить, что слишком большое занижение или завышение величин может привести к существенным ошибкам и определению фиктивных нагрузок. Перейдем теперь к краткому описанию некоторых методов оценки величин

1. Наиболее простым и распространенным методом предварительной оценки элементов главной диагонали является метод наибольшей корреляции. Он заключается в том, что на главной диагонали записывается с положительным знаком наибольший коэффициент корреляции в данном столбце безотносительно к его исходному алгебраическому знаку. Этот способ и был использован в примере с шестью тестами. Он основывается на том факте, что длина вектора может быть определена с наибольшим приближением через его проекцию на вектор, являющийся его ближайшим соседом. Специалисты высказывают ряд сомнений в точности этого метода в особенности применительно к небольшим матрицам, содержащим до 10 переменных, так как в столбцах с относительно большим числом низких коэффициентов корреляции оценка общности может оказаться завышенной, и наоборот, в столбцах с большим числом высоких коэффициентов — заниженной.

Существует способ корректировки исходных значений о котором мы уже упоминали и который состоит в сравнении исходных значений с рассчитанными на основе факторных нагрузок по окончании процесса выделения факторов. В случае больших различий вся процедура повторяется, причем анализ начинается с рассчитанных значений Так поступают до тех пор, пока величины не стабилизируются на требуемом уровне точности. Этот способ при больших матрицах весьма трудоемок.

2. Сходный метод был предложен Бартом (С. L. Burt. Factors of the mind, London, 1940, University of London Press.) Его идея состоит в том, что для переменных, у которых среднее значение коэффициентов корреляции в столбце высоко, принимается общность, несколько превышающая наибольший этого столбца, и наоборот, для переменных с низким средним значением коэффициентов корреляции эта область оценивается несколько ниже наибольшего . Как видим, здесь также применяется величина наибольшего коэффициента корреляции в данном столбце, только в несколько модифицированном варианте.

3. В качестве более точного, но зато и более трудоемкого способа можно привести метод малого центроида. Он требует следующих операций:

з) для каждой переменной строится корреляционная матрица включающая как саму изучаемую переменную, так и три другие переменные, с которыми она теснее всего связана. Затем на главной диагонали записываются наибольшие корреляции в каждом столбце. Элементы определяются по формуле

где — сумма элементов первого столбца,

— сумма элементов всей матрицы 4x4.

Операция выполняется для каждой переменной;

б) вычисленные оценки общности записываются по главной диагонали исходной корреляционной матрицы.

Табл. 4.8 иллюстрирует расчет указанным методом для переменной 1 для матрицы из шести переменных (табл. 4.1). Как видим, полученное значение существенно отклоняется от принятого в нашем примере, который использует первый из описанных методов. Необходимо отметить, что второй метод считается относительно наиболее точным. Другие методы определения величины можно найти в работе Тэрстоуна [203], в которой описано 12 различных методов.

Рассмотрим кратко еще одну проблему, решение которой должно показать, чем нужно руководствоваться при выборе метода оценки величин Здесь можно отметить влияние таких обстоятельств, как, например, размер корреляционной матрицы, вариант используемого метода выделения факторов и т. д. При очень больших матрицах влияние ошибок оценки элементов незначительно с учетом больших значений сумм элементов отдельных столбцов.

Таблица 4.8. Переменная 1

Если для малых матриц (10—12 переменных) применяются упрощенные методы (например, описанные выше два способа), то нужно проверить результаты путем многократного повторения процесса выделения факторов, о чем мы уже говорили выше. При небольших матрицах этот способ, несмотря на трудоемкость, все же может применяться. В случае больших матриц (40—100 переменных) можно без всякого опасения применять первый или второй метод. Третий метод менее оправдан, особенно в случае основной центроидной процедуры, так как он годится скорее для таких способов выделения факторов, которые требуют предварительного выделения связок переменных. К этим способам относится, например, групповой метод. Для него существен еще один важный момент, свидетельствующий в пользу третьего метода оценки . Дело в том, что здесь отсутствует возможность проверки величин путем последовательных приближений, в результате чего нужно использовать такие способы, которые позволяют наиболее точно оценивать эти величины для каждой переменной перед началом факторного анализа.

<< Предыдущий параграф Следующий параграф >>
Оглавление