Главная > Математика > Факторный анализ (Иберла К.)
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

2.2.4. Наглядное пояснение с помощью числового примера

Чтобы сделать основную концепцию факторного анализа конкретнее и понятнее, приведем пример, который может быть легко просчитан. Благодаря примеру известные уже понятия и соотношения приобретут числовую наглядность.

В примере исходим из того, что решение заранее известно, оно задано. Тогда можно вычислить матрицу исходных данных, корреляционную матрицу и общности. Процедура вычислений в факторном анализе является в известной степени обратимой. В табл. 2.2 по А и Р строится Z матрица исходных данных, записанных в стандартизированной форме. В действительности же при проведении факторного анализа поступают наоборот: по Z определяют А и Р.

Матрица Р в табл. 2.2 содержит значения двух факторов у десяти индивидуумов. Числа были подобраны так, чтобы среднее значение каждого фактора было приблизительно равно нулю, а его дисперсия — единице, причем для простоты использовались только целые числа между —2 и +2. У первого индивидуума проявление первого фактора оценивается нулем, второго фактора +1, у десятого индивидуума — соответственно +2 и 0.

Таблица 2.2. Построение матрицы исходных данных по соотношению

Матрица А в табл. 2.2 задана произвольно. Она отражает связи между двумя факторами и шестью переменными, а именно показывает, что три переменные относительно высоко «нагружают» фактор. Пользуясь равенством (2.13), можно вычислить матрицу стандартизованных исходных данных Z для шести переменных и десяти индивидуумов. Например, измеренным значением первой переменной у первого индивидуума будет число: Аналогично могут быть вычислены все элементы матрицы Z, представленные в табл. 2.2. Таким образом, у нас получается конкретная система уравнений, которая соответствует равенству (2.13) и основной исходной идее факторного анализа. Два фактора определяют вариацию шести переменных у десяти индивидуумов.

В действительности же при проведении факторного анализа была бы известна только Z, и из этой матрицы нужно было бы определять А и Р. Для этого вначале исходя из Z строилась бы корреляционная матрица R. В нашем примере мы получили R простым способом, определив ее как АА, что показано в табл. 2.3. Эта операция соответствует фундаментальной теореме (2.15). Если бы мы исходили из Z, то пришли бы к тому же самому результату, но на главной диагонали стояли бы всегда единицы. Благодаря же нашей маленькой уловке мы получили на диагонали матрицы R общности, обойдя таким образом в примере первую проблему факторного анализа, проблему общности. Общности здесь вычисляются непосредственно. В реальной же ситуации мы бы их оценивали определенным способом.

Таблица 2.3. Построение по равенству, соответствующему фундаментальной теореме

Матрицы , представляют собой конкретную систему чисел, с помощью которых можно уяснить себе процедуру факторного анализа.

По наблюдаемым значениям Y или Z строится R, оцениваются общности и путем выделения факторов определяется А. После процедуры вращения — здесь пока опускается описание этого метода — оцениваются значения факторов Р. В нашем примере они были заданы и известны с самого начала.

Важное значение в факторном анализе имеет матрица А. Ее структура для наглядности изображена графически на рис. 2.7. По А вычисляются общности, как это показано в табл. 2.4. Общность первой переменной по равенству (2.20) равна: . Тогда характерность определяется по равенству (2.21): 1,00 - 0,82 = 0,18. Таким же образом могут быть определены эти величины для всех переменных.

Рис. 2.7. Распределение долей единичных дисперсий переменных по факторам. Доли соответствуют численным значениям табл. 2.4.

Дисперсия каждой переменной была приведена к единице. На рис. 2.7 единичная дисперсия каждой переменной изображена в виде прямоугольника, площадь которого равна единице. Единичная дисперсия с помощью методов факторного анализа разбивается на составляющие, одна из которых является дисперсией Характерного фактора (затушевано), а другая — ее общностью (остальная часть площади прямоугольника). Общность каждой переменной Далее расчленяется на доли дисперсии, связанные с отдельными факторами. В данном примере выделены два фактора. Доля дисперсии йервого фактора изображена косой штриховкой, дисперсии второго фактора соответствует чистая площадка. Количественные соотношения между долями дисперсии взяты из табл. 2.4. Например, единичная дисперсия первой переменной на 81% состоит из дисперсии первого фактора, на 1% - из дисперсии второго фактора и на 18% — из дисперсии характерного фактора. Аналогично из табл. 2.4 берется распределение долей дисперсии других переменных. Взглянув на рис. 2.7, можно оценить, какая часть дисперсии каждой переменной объясняется факторами, выделенными в процессе анализа, и какая доля приходится на характерность.

Таблица 2.4. Вычисление долей дисперсии по матрице А

Также легко уловить, какие переменные с какими факторами связаны. Если рассматривать лишь заштрихованные области, то видно, откуда первый фактор получает свою дисперсию. Рассматривая только пустые клетки в прямоугольниках, определяем источники дисперсии второго фактора. В прямоугольнике с надписью полной дисперсии» сопоставляются Друг с другом доли дисперсии обоих факторов и суммарной характерности. Полная дисперсия переменных всегда равна , поскольку каждая переменная была преобразована так, что ее дисперсия равна единице. В табл. 2 А показано, как определяют доди дисперсии обоих факторов в процентах от полной дисперсии. В последнем прямоугольнике рис. 2.7 за 100% принята сумма и показано соотношение дисперсий обоих факторов, отнесенных к . Дисперсию каждого фактора в свою очередь можно расчленить на доли, связанные с дисперсиями всех переменных. Эти доли, выраженные в процентах, легко определяются по схеме табл. 2.4.

Способ изображения, представленный на рис. 2.7, отличается наглядностью, позволяя быстро оценивать результаты факторного анализа. Им рекомендуется пользоваться при любом методе факторного анализа.

Если ограничиваются лишь вычислением матрицы А, то хотя в ней содержится вся информация, однако, большей частью не уясняют себе, что она означает. Например, легко заметить, какая доля полной дисперсии приходится на общность, специфичность и дисперсию ошибки. Если надежность известна, возможно дальнейшее расчленение дисперсии переменной, как это изображено на рис. 2.5. Подобный способ также рекомендуется при проведении анализа.

Итак, если исходя из Y получено решение в виде матрицы А, то возможны следующие выводы, которые графически изображены на рис. 2.7: 1) два фактора «объясняют» почти всю общую дисперсию, которая даже немного превышает половину полной дисперсии; 2) первые три переменные связаны с первым фактором, последние три — со вторым. Выводы, полученные в результате факторного анализа, относительно общи и одновременно специфичны. К сожалению, еще не имеется сколько-нибудь удовлетворительных методов оценок вероятностей ошибок этих выводов. Однако разбиение дисперсии переменных на составляющие в результате факторного анализа эмпирически оправдало себя. В разделах 3, 4 и 5 обсуждается техника выделения составляющих полной дисперсии, так как к одним и тем же данным можно применить различные способы обработки.

На рис. 2.7 наглядно демонстрируется сущность проблемы общности, которая состоит в определении границ между затушеванными, заштрихованными и чистыми областями для каждой переменной. Проблема факторов касается установления количества факторов, обусловливающих корреляции и определения их связей с переменными. Вполне очевидно, что обе проблемы взаимосвязаны. Чем дальше налево распространяется затушеванная область на рис. 2.7, тем меньше факторов можно осмысленно выделить, и обратно. Если популярно объяснять проблему вращения, то можно сказать, что она состоит в установлении внутри фиксированных общностей границ между заштрихованными и чистыми участками для всех переменных таким образом, чтобы факторы по возможности однозначно определялись переменными.

<< Предыдущий параграф Следующий параграф >>
Оглавление