Главная > Математика > Факторный анализ (Иберла К.)
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

4. ПРОБЛЕМА ОБЩНОСТИ

4.1. ВВЕДЕНИЕ

По определению, общность переменной i равна сумме квадратов нагрузок общих факторов (см. формулу (2.20)). Форма записи общности указывает на то, что речь идет о компоненте дисперсии. Так как дисперсия каждой переменной приводится к единице, общность является долей единичной дисперсии, которая обусловливается общими для нескольких переменных факторами. Из равенств (2.24)- (2.28) следует, что подбор диагональных элементов матрицы R равносилен определению общей дисперсии каждой переменной. Общности, следовательно, являются диагональными элементами корреляционной матрицы. Оценка величин диагональных элементов должна производиться перед выделением факторов, и это составляет проблему общности.

Необходимость подбора значений общностей меньше единицы, вытекает из модели факторного анализа. Модель классического факторного анализа содержит ряд общих факторов и по одному характерному на каждую переменную. Таким образом, каждая переменная обладает общностью, которая должна быть меньше единицы. В предельном случае, когда общая дисперсия приближается к единице, общность также равна единице. Из формулы (2.19) следует, что если сумма членов в скобках, т. е. приближается к единице, то значения специфичности и дисперсии, обусловленной ошибкой, должны быть около нуля, так как полная дисперсия согласно введенному определению не должна превышать единицы. Такой крайний случай, когда дисперсия ошибки и специфичность равны нулю, на практике не встречается, так как погрешности измерения всегда присутствуют в экспериментах в той или иной мере, а только тогда равна нулю, когда одна и та же переменная два раза включается в анализ. В этом случае специфичные факторы обеих одинаковых переменных становятся одним общим фактором. В модели факторного анализа проводится различие между общими и характерными факторами» К модели компонентного анализа это требование не предъявляется (см. с. 103).

Итак, общности могут принимать значения от нуля до единицы. При известной корреляционной матрице эту область принятия значений можно ограничить еще больше. Дуайер [79; 2] доказал, что всегда имеет место неравенство

где - коэффициент множественной корреляции переменной с остальными переменными.

Квадрат этого коэффициента является нижней границей оценки общности. Кроме того, Гуттман [112; 1] показал, что при неограниченном возрастании числа переменных при постоянном числе факторов значение общности каждой переменной приближается к квадрату коэффициента множественной корреляции, т. е. в (4.1) обеспечивается равенство. Верхняя граница значения общности определяется формулой (2.22). К сожалению, коэффициент надежности вычисляется в редких случаях, так как повторные измерения производятся не часто. Таким образом, можно сделать вывод, что общность переменной не меньше квадрата коэффициента множественной корреляции и не превосходит квадрата коэффициента надежности.

Определение общности переменной как суммы квадратов нагрузок общих факторов формально и не дает однозначного ответа при оценке общности. Уже из определения общности видно, что она тесно связана с числом общих факторов. Проблема общности является уязвимым местом многофакторного анализа. Мнения отдельных авторов о способах оценки общностей сильно расходятся. В научной литературе ведется обширная дискуссия на разных теоретических уровнях, результатом которой являются различные предложения от простых вычислительных процедур до сложных математических выкладок. При разработке методов оценки общностей исходят из различных концепций. В итоге в настоящее время разработано довольно много вычислительных процедур; некоторые из них мы коротко разберем. Но это не означает, что мы претендуем на право подвести итоги дискуссии по данной проблеме и тем самым завершить ее.

Тэрстоун предлагал при оценке общности исходить из выборочных коэффициентов корреляции, стремясь при подборе к уменьшению ранга исходной матрицы R. Основная идея состоит в том, что выборочные коэффициенты корреляции должны определять значения общностей или что по меньшей мере выбранные значения общностей должны удовлетворять заданному рангу корреляционной матрицы. Тэрстоун указал только эмпирические методы и разработал практические вычислительные процедуры без достаточного теоретического обоснования. Для проверки проведенных выкладок коэффициенты корреляции, вычисленные по найденным значениям общностей, сравниваются с выборочными характеристиками. Оценка общностей считается удовлетворительной при наименьшем из возможных различий.

Другие авторы много занимались поиском аналитических решений проблемы (например, Альберт [4]. Проблема общности и факторная проблема тесно переплетены между собой.

Если значения общностей установлены, то все элементы Матрицы определены и тем самым установлен ранг этой матрицы, т. е. минимально необходимое число факторов, вызывающих корреляцию переменных. Могут иметь место два альтернативных случая. В первом случае вначале определяют общности, а затем число выделяемых факторов (прямая оценка общностей). Во втором случае сначала устанавливают число факторов, подлежащих выделению, а затем подбирают значения общностей таким образом, чтобы ранг матрицы приближался к этому числу г. Продолжительное время проблема общности формулировалась следующим образом: при известных недиагональных элементах матрицы R нужно подобрать такие значения диагональных элементов, чтобы ранг полученной редуцированной матрицы был по возможности минимальным. Но эта формулировка и нахождение оценок общностей при минимальном ранге используются только при аналитическом подходе к решению проблемы. Имеются другие методы, дающие более правдоподобные оценки общностей.

Определение общностей в статистических терминах дано Лоули [182; 1] и Рао [230; 3]. Это такие величины, которые при статистически значимых факторах делают возможным наилучшее воспроизведение корреляционной матрицы. Значимые факторы и общности получаются в результате итеративных процедур.

На практике при определении общностей в конкретном случае выбор теоретического подхода имеет второстепенное значение. Как будет еще показано, при большом числе переменных вполне достаточно грубых оценок. Читатель, интересующийся теоретическими вопросами, может обратиться к обзору, приведенному у Хармана [117], а также к публикациям Альберта [4; 2], Гуттмана [112] и Райгли [323]. В большинстве случаев решение проблемы общности состоит в нахождении соответствующих значений которые определяют общую дисперсию каждой переменной и удовлетворяют двойному неравенству (4.2).

<< Предыдущий параграф Следующий параграф >>
Оглавление