7.3.2. Точность факторного анализа с неравными нагрузками
При обобщении результатов, полученных выше с помощью моделирования на ЭВМ, может вызвать сомнение тот факт, что рассеяние между абсолютными величинами факторных нагрузок в каждой серии опытов было очень мало, так как для всех переменных в генеральной совокупности каждый раз устанавливалось одно и то же
. Поэтому было проведено исследование для определения влияния величины вариации между факторными нагрузками на точность факторного анализа.
Была выбрана генеральная совокупность, в которой каждый из двух факторов коррелировал с соответствующими пятью переменными.
Для них были установлены следующие значения коэффициентов корреляции
. Среднее значение их равно 0,40. Вот почему эту серию опытов можно сравнить с другой, в которой среднее значение также равно 0,40, причем коэффициент корреляции между каждой переменной и фактором устанавливается ±0,40. Итак, разница между обеими сериями опытов заключается в том, что в первой серии по сравнению со второй имеют дело со значительным по сравнению со второй рассеянием факторных нагрузок. Но в обеих сериях средние значения коэффициентов корреляции
между переменными и факторами равны.

Рис. 7.13. Влияние величины вариации факторных нагрузок на точность оценок значений факторов
Результаты обеих серий опытов приведены на рис. 7.13. Диапазон изменения средних коэффициентов корреляции
между переменными и первым фактором для обеих серий опытов примерно одинаковый. Прямая регрессии, вычисленная по результатам опытов первой серии, лежит выше прямой регрессии, соответствующей опытам второй серии. Отсюда можно сделать вывод, что более сильное рассеяние факторных нагрузок при прочих равных условиях способствует увеличению точности оценок значений фактора. Этот вывод можно объяснить следующим образом. Большое рассеяние факторных нагрузок означает, что переменные, слабо коррелирующие с фактором, практически выпадают из анализа.
Следовательно, число переменных, приходящихся на фактор, уменьшается. Вес оставшихся переменных, которые сильно коррелируют с фактором, в анализе повышается. Из рис. 7.10 видно, что величина коэффициентов корреляции между переменными и фактором влияет на точность оценки сильнее, чем число переменных, связанных с фактором. Итак, оба вышеназванных эффекта не погашают друг друга. Увеличение в анализе веса переменных, сильно коррелирующих с фактором, приводит к повышению точности оценки.
Здесь следует указать на то, что распределение отдельных факторных нагрузок вокруг среднего значения 0,40 было симметрично. Так как факторные нагрузки в принципе являются коэффициентами корреляции, то их распределение отличается от нормального. Если перевести установленные для генеральной совокупности
с помощью
-преобразования в нормально распределенные величины, вычислить по ним среднее значение, а затем сделать обратное преобразование, то для первой серии опытов со значительным рассеянием факторных нагрузок получим среднее значение, равное 0,452 (в то время как для другой серии опытов среднее значение равно 0,40). Следовательно, делая вывод о повышении точности оценок с увеличением рассеяния факторных нагрузок, нужно учесть, что распределение факторных нагрузок отличается от нормального. Применение
-преобразования не решит этого вопроса. Пусть для второй серии опытов имеем
Тогда из рис. 7.10 получим, что
Фактическое среднее значение коэффициента достоверности для второй серии опытов значительно больше, а именно
Если при выборе
для отдельных переменных исходить из их
-значений, одинаково удаленных от среднего значения в ту и другую сторону, то получают коэффициенты достоверности, которые лежат между значениями, указанными на рис. 7.10.
Для второго фактора получим те же самые зависимости, что приведены на рис. 7.13. Теперь возникает вопрос, следует ли ожидать повышения точности оценок при увеличении рассеяния между факторными нагрузками и при других значениях средних коэффициентов корреляции. В результате анализа, проведенного 25 раз, со средним значением
и пятью переменными, связанными с фактором, получалось среднее значение коэффициента достоверности
Из табл. 7.7 видно, что при одном и том же
для всех переменных следует ожидать
. В данном случае сильное рассеяние факторных нагрузок также увеличивает коэффициент достоверности. Тот же самый вывод получим при среднем значении
. Увеличение рассеяния приведет к повышению среднего коэффициента достоверности от 0,48 до 0,56.