Главная > Математика > Факторный анализ (Иберла К.)
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

2.2.2. Классификация факторов и связь между отдельными видами факторов

Задачей факторного анализа является определение матрицы А. Следует иметь в виду, что за время развития идей факторного анализа вошел в употребление ряд терминов, строго не дифференцированных. Но они имеют практическое значение, так как часто встречаются в литературе, и, кроме того, заслуживают внимания из-за своего основополагающего значения. Поэтому мы будем останавливаться на этих терминах. Как уже отмечалось, матрица А называется факторным отображением, а ее элементы — факторными нагрузками. При ортогональных факторах, которые мы до сих пор исключительно и рассматривали, элементы принимают значения между —1 и +1.

Если факторы не ортогональны, то элементы могут принимать большие значения. Здесь мы ограничимся только этим замечанием. Каждый фактор характеризуется столбцом, каждая переменная — строкой матрицы А. Если факторная нагрузка значительно больше или меньше нуля, то принята упрощенная форма записи в виде крестика в соответствующем месте факторного отображения (см. рис. 2.3).

Выражение «значительно больше или меньше нуля» здесь означает не в математическом смысле, а такое значение которое превосходит более или менее произвольное или заданное на определенном уровне значимости критическое значение. Это критическое значение не требует более точного определения для введения дальнейших понятий.

Пока нам достаточно лишь указать в каждом конкретном случае это критическое значение, которое позволяет выделить, различные виды факторов, если фактора превосходит это значение. При этом всеми другими нагрузками этого фактора пренебрегают, т. е. факторное отображение упрощается. Нагрузки, которые считаются существенными, обозначаются на схеме факторного отображения крестиком (X), а пустые клетки матрицы А соответствуют нагрузкам, которыми можно пренебречь.

Рис. 2.3. Схематическое изображение факторного отображения. Крестик X означает высокую факторную нагрузку

Фактор называется генеральным (general factor), если все его нагрузки значительно отличаются от нуля. Следовательно, он имеет нагрузки от всех переменных и схематически такой фактор изображается столбиком А на рис. 2.3. Фактор называется общим (common factor), если хотя бы две его нагрузки значительно отличаются от нуля. Столбики А, В, С на рис. 2.3 представляют такие общие факторы. Они имеют нагрузки от двух и более переменных. Они могут взаимно перекрываться, т. е. одни и те же переменные могут давать нагрузки на несколько факторов. Генеральный фактор является частным случаем общих факторов, так как он имеет более двух значимых нагрузок. В противоположность этому факторы являются индивидуальными, если у них только одна нагрузка значительно отличается от нуля (см. столбики на рис. 2.3). В этом случае говорят о характерных факторах (unique factors), которые представляют только одну переменную. По аналогии с факторами можно провести классификацию переменных по числу достаточно высоких нагрузок. Число высоких нагрузок переменной на общие факторы называется ее сложностью (complexity). Например, переменная 1 на рис. 2.3 имеет сложность Два, переменная 4 — три.

Решающее значение в факторном отображении на рис. 2.3 имеют общие факторы А, В, С. Как будет еще показано, характерные факторы получаются автоматически, если общие факторы установлены.

Гипотеза, которая содержит факторное отображение на рис. 2.3, может быть представлена в другой форме на рис. 2.4. Связь трех факторов Л, В, С с восемью переменными изображена прямыми.

Любая матрица, которая, например, содержит общие факторы A, B, C, отражает дифференцированные гипотезы о структуре величин, которые отчасти стоят за наблюдаемыми переменными (т. е. являются факторами), а отчасти сами являются переменными. Рис. 2.3 и 2.4 соответствуют друг другу. Хотя это и наглядно, результат факторного анализа не изображается графически в форме, приведенной на рис. 2.4. Чаще всего используется схема рис. 2.3. При любом факторном отображении легко перейти от одного способа изображения к другому. Общие факторы для отличия их от переменных обозначаются здесь буквами А, В и С. Однако чаще всего они обозначаются римскими цифрами.

Рис. 2.4. Структура гипотезы факторного отображения рис. 2.3. Прямые, соединяющие факторы А, В, С с переменными, соответствуют высоким факторным нагрузкам

Нагрузки общих и характерных факторов связаны определенным соотношением через единичную дисперсию переменных. Действительно, эта единичная дисперсия равна:

Подставляя значения из (2.12) в (2.17) (причем мы берем не факторов, а при этом ), в результате получим

Теперь постулируем, что факторы должны быть стандартизованы и некоррелированы, тогда суммы — и т. д. все равны 1, а суммы в скобках все равны 0. Итак, имеем

Сумма квадратов всех нагрузок одной переменной равна единице. Равенство (2.18) выполняется при условии, что переменные стандартизованы, факторы стандартизованы и некоррелированы и в основу положена линейная модель.

Соблюдение этих условий является необходимым требованием при использовании наиболее употребляемых сегодня методов. Равенство (2.18) можно записать в более модифицированном виде (2.19), где в скобках сначала приведены нагрузки общих факторов, а затем — доля дисперсии характерного фактора. Равенство (2.19) отличается от (2.18) лишь последними тремя членами.

Полная дисперсия переменной по равенству (2.19) раскладывается на отдельные компоненты, которые представляют собой квадраты факторных нагрузок. Для наглядности это разложение графически представлено на рис. 2.5. Суммы квадратов нагрузок общих факторов называются общностью (communality) . Это та доля дисперсии, которая указана в скобках равенства (2.19).

Общность представляет собой часть единичной дисперсии переменной, которую можно приписать общим факторам. Она равна квадрату коэффициента множественной корреляции между переменной и общими факторами. Если из 1 вычесть , то останется доля дисперсии, обозначаемая которая соответствует квадрату нагрузки определенного характерного фактора. Далее и называется характерностью. Она представляет собой часть единичной дисперсии переменной, которая не связана с общими факторами:

Как показывает вторая половина равенства, характерность можно разбить на две составляющие, одна из которых, называется специфичностью, а другая, является дисперсией, обусловленной ошибкой. Такое разделение на практике проводится редко. Специфичность является той долей единичной дисперсии переменной, которая не связана с общими факторами, не может быть также сведена к ошибке и присуща лишь одной определенной переменной. Специфичность и общность образуют надежность (reliability).

Надежность, являясь долей единичной дисперсии, дополняет дисперсию ошибки до единицы. Она может быть измерена различными способами, описание которых можно найти в [69]. Здесь этот вопрос подробно рассматриваться не будет. В любом случае из (2.22) следует, что общность не превышает надежности и равна ей только в случае нулевой специфичности.

Приведенные только что понятия графически представлены на рис. 2.5. Первая строчка на рисунке представляет собой дисперсию любой переменной, приведенную к единице, или 100%.

Эту единичную дисперсию можно разбить на две составляющие: общность , которая обусловливается общими для нескольких переменных факторами, и характерность , которая может быть приписана только этой переменной (вторая строчка на рисунке). Обе составляющие можно расчленить еще дальше (третья строка на рисунке), а именно: на квадраты отдельных факторных нагрузок, дисперсию ошибки и специфичность Сумма общности и специфичности образует надежность, и она является дополнением дисперсии ошибки до единицы (четвертая строка рисунка).

Теперь поставим задачу — получить общность и соответствующий характерный фактор из корреляционной матрицы. Основная модель факторного анализа записывается следующим образом: (равенство ).

Рис. 2.5. Составляющие полной дисперсии переменной по равенству (2.19)

В этой модели не проводите я разницы между общими и характерными факторами. В равенстве (2.23) постулируется для каждой переменной характерный фактор. Эта специальная модель многофакторного метода имеет следующий вид:

или в матричной форме:

При этом Z является, как и в равенстве (2.13), матрицей исходных данных, записанных в стандартизованной форме. F — факторное отображение, включающее характерные факторы, т. е. F является матрицей порядка, имеет размер и содержит значения факторов у отдельных индивидуумов, включая значения характерных факторов. Подробно это записывается в следующем виде:

F можно представить в виде суммы двух матриц, а именно (равенство (2.25)). F представляет собой так называемую полную факторную матрицу. Она содержит нагрузки общих и характерных факторов. А является редуцированной факторной матрицей, содержащей нагрузки общих факторов. Она дополняется справа на столбцов путем присоединения нулевых элементов. Это дополнение необходимо только для последующих математических выкладок. В общем под А понимается так же, как в равенствах (2.13)-(2.15), матрица нагрузок общих факторов. С этой матрицей А обычно работают (и она приводится в литературе), так как полная факторная матрица и U легко получаются из нее (по формуле ). Матрица U является диагональной и содержит нагрузки характерных факторов на главной диагонали. Она дополняется слева на столбцов путем присоединения нулевых элементов.

где

Применив фундаментальную теорему, можем записать:

Путем соответствующих выкладок легко показать, что Следовательно,

Так как (при этом матрицы можем рассматривать без их дополнений), то

или

R — корреляционная матрица с единицами на главной диагонали; — корреляционная матрица с общностями на главной диагонали. Ее называют также редуцированной корреляционной матрицей:

Элементами матрицы соответственно являются

Наконец, является диагональной матрицей с характерностями на главной диагонали, равенства (2.28) видно, что выбором диагональных элементов устанавливаются величины общностей, а в необходимости их определения мы уже убедились во вводных примерах.

До сих пор предполагалось, что факторы не коррелированы друг с другом, т. е. речь шла только об ортогональных факторах. Это было удобно для упрощения формулировки задачи и математической записи решения. Однако, если подходить с общенаучной точки зрения, постулирование только ортогональных факторов сужает проблему, хотя этим достигается упрощенная в математическом смысле «идеальная картина». И надо иметь в виду, что в действительности она встречается редко, так как многие влияющие факторы наверняка коррелируют друг с другом. Поэтому мы хотели бы вначале формально обсудить возможность косоугольных факторов и соотношения между ними.

Выше была выведена формула , где С является матрицей коэффициентов корреляции между факторами. Вначале для упрощения уравнения мы постулировали, что и получали частное решение. Решение же в общем случае усложняется. Однако если вначале вычислить ортогональную матрицу А, то можно вслед за тем искать решение для косоугольных факторов по критериям, которые еще будут обсуждаться. Получение однозначного решения для косоугольных факторов более сложно. Обычно задается либо С, либо матрица которая содержит коэффициенты корреляции между переменными и факторами и называется факторной структурой (factor structure). Далее для матриц с косоугольной факторной структурой используется обозначение V. Индексы обозначают факторную структуру. Позднее остановимся на различных видах этих матриц.

или в подробной записи:

Итак, для коэффициентов корреляции между переменными и факторами имеет место соотношение по (2.29):

(2.30)

При , т. е. в случае ортогональных факторов факторное отображение идентично структуре: Тогда в правой стороне равенства (2.30) остается только один член, а именно тот, множителем которого является с так как при всех .

Все представленные до сих пор равенства и определения содержат важнейшие концепций факторного анализа, а также основную и специальную модели многофакторного анализа. С их помощью теперь можно приступить к описанию общей процедуры решения.

<< Предыдущий параграф Следующий параграф >>
Оглавление