Главная > Математика > Факторный анализ (Окунь. Я.)
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

б. ВАЖНЕЙШИЕ ПОНЯТИЯ, СВЯЗАННЫЕ С ДИСПЕРСИЕЙ

В факторном анализе используется целый ряд понятий и зависимостей, тесно связанных с дисперсией.

Дисперсия — это статистический термин, представляющий собой квадрат стандартного отклонения. Общепринятым обозначением дисперсии является символ Дисперсию в случае тестов можно рассматривать как показатель степени, с которой удается разграничить индивидуальные различия. В более широком смысле дисперсия представляет собой один из показателей вариации или рассеивания.

В факторном анализе необходимо различать отдельные компоненты дисперсии.

Полная дисперсия переменной z может быть разбита на три основные компоненты (при предположении, что три соответствующие компоненты наблюдений между собой не коррелированы):

1) общая дисперсия,

2) специфичная дисперсия,

3) дисперсия, обусловленная ошибкой.

Две первые компоненты полной дисперсии, т. е. общая и специфическая дисперсии, образуют подлинную, постоянную, или надежную, дисперсию. Показателем их совместной значимости является коэффициент надежности, о котором мы говорили в предшествующем разделе. Общую дисперсию можно определить как ту часть постоянной дисперсии, которая коррелирует с другими переменными или является общей для ряда переменных.

Специфичная дисперсия представляет собой ту часть постоянной дисперсии, которая не коррелирует с другими переменными и присуща лишь одной определенной переменной.

Наконец, дисперсия, обусловленная ошибкой, является случайной, вызванной ошибками в процессе выборки, неточностью инструментов наблюдения, отклонением от условий эксперимента, а применительно к тесту также и непредвиденными изменениями изучаемой единицы и целой совокупностью всех других факторов, вызывающих неточность (непостоянство) наблюдений. Обычно предполагается, что эта часть дисперсии не коррелирует с постоянной дисперсией.

Пользуясь терминологией теории дисперсии, одну из основных задач факторного анализа можно определить как исследование полной дисперсии для определения числа и видов тех «общих дисперсий», которые обусловливают корреляции в данной совокупности переменных. Одновременно предполагается, что компоненты общей части наблюдений, соответствующие этим отдельным «общим дисперсиям», не коррелированы.

Полную дисперсию переменной z можно представить как сумму ее компонент в виде формулы

Символ соответствует числу компонент, составляющих общую дисперсию.

Если обе стороны этого уравнения разделить на получится:

Левая сторона уравнения становится равной 1. Это означает, что полная дисперсия переменной равна теперь 1, а все составляющие дисперсии на правой стороне уравнения, т. е. общая, специфичная и дисперсия, вследствие ошибки, оказались выраженными как доли полной дисперсии.

Другими словами, уравнение (3.3) исходит из нормализованных соотношений, т. е. выраженных в единицах стандартного отклонения.

Обозначив каждую компоненту дисперсии соответствующим символом, формулу (3.3) можно переписать в виде:

где — общая дисперсия; — специфичная дисперсия; — дисперсия, обусловленная ошибкой.

Общая дисперсия, составляющая ядро факторного анализа и обозначаемая нами может состоять из компонент (от до ) представляющих собой уже упоминавшиеся выше компоненты «общей дисперсии». Каждый элемент общей дисперсии представляет собой ту ее часть, которую можно приписать некоторому общему фактору. Напомним в этой связи о важном для факторного анализа понятии факторной нагрузки, которую Тэрстоун называет также коэффициентом теста.

Факторные нагрузки представляют собой меру, в соответствии с которой данный тест или задание требуют для своего выполнения данной способности, т. е. данного свойства или данного фактора. Факторную нагрузку можно также назвать «наполнением» теста определенным фактором.

Факторная нагрузка имеет форму коэффициента корреляции. В данном случае имеется в виду корреляция между данным тестом и некоторым фактором. Чем выше эта корреляция, тем в большей степени тест «наполнен» данным фактором и тем в большей степени является мерой этого фактора.

Каким образом можно интерпретировать факторную нагрузку в терминах дисперсии? Выше уже указывалось, что каждая компонента общей дисперсии представляет собой ту ее часть, которая может быть приписана влиянию определенного фактора, общего для ряда переменных. Теперь формулируем следующую теорему.

В случае некоррелированных факторов нагрузка фактора равна квадратному корню из того элемента общей дисперсии, который можно приписать влиянию фактора .

Таким образом, квадрат каждой нагрузки фактора в тесте или будет составлять ту долю общей дисперсии теста которую можно приписать фактору .

Оставим на некоторое время объяснения этого положения и алгебраическое доказательство теоремы; мы вернемся к этой проблеме при геометрической интерпретации основных зависимостей факторного анализа.

Возвращаясь к рассчитанным выше компонентам дисперсии, структуру полной дисперсии представим следующим образом:

Схема 3.1

С точки зрения факторного анализа нас интересует прежде всего общая дисперсия, так как влияние каких-то основных совместных факторов будет находиться в ее границах. Кроме того, использование таких инструментов, как, например, тесты, функции, выражающие определенные свойства и прогноз успехов в работе или учебе, возможно лишь благодаря общей дисперсии. Тест как переменная «предсказывает» только в той мере, в какой он коррелирует с каким-либо критерием или другой переменной. Специфичная дисперсия, связанная исключительно с некоторой переменной и только ее характеризующая, имеет здесь меньшее значение. Дисперсию, обусловленную ошибкой, стремятся обычно свести к минимуму путем создания оптимальных условий на каждом этапе получения данных.

Перейдем теперь к изложению двух основных понятий, имеющих большое значение в факторном анализе и непосредственно связанных с приведенным выше делением полной дисперсии на компоненты.

Рассмотрим прежде всего ту часть полной дисперсии, которая состоит из двух следующих элементов (см. 3.4):

Сумма этих элементов, т. е. отдельных общих дисперсий, которые могут быть приписаны некоторым общим факторам, равна той части дисперсии данной переменной, которая является общей с другими переменными. Она называется общностью и обозначается . Его происхождение будет объяснено при рассмотрении векторного представления переменных. Это понятие кратко можно определить следующим образом: общность данной переменной — это та часть ее дисперсии, которая обусловливается общими для нескольких переменных факторами. Сказанное можно выразить формулой

Вторая часть полной дисперсии связана лишь с определенной переменной и свойственна только ей. Она иногда называется характерностью переменной (теста) и обозначается (имеется в виду та часть дисперсии, которая не является общей для всех переменных).

Следовательно, полную дисперсию можно записать с помощью уравнения

При этом необходимо помнить, что характерность состоит из двух уже упоминавшихся элементов: специфичности, связанной со специфичными факторами, соответствующими только одной определенной переменной, и дисперсии, обусловленной ошибкой. Специфичных факторов также может быть больше одного.

Теперь полную дисперсию можно представить в виде следующего развернутого уравнения:

Из уравнения видно, что как общность, так и характерность переменной имеют сложную структуру. Оно показывает также, что характерность может трактоваться как дополнение общности до единицы:

Аналогично общность может рассматриваться как дополнение до 1:

Надежную дисперсию, о которой мы говорили выше, можно представить так:

т. е. как сумму общности и характерности дисперсии. Из этого уравнения вытекает, что общность переменной всегда меньше надежной дисперсии за исключением теоретического случая, в котором специфичность равна нулю.

К изложенным здесь зависимостям мы еще вернемся при геометрической интерпретации основных понятий факторного анализа.

<< Предыдущий параграф Следующий параграф >>
Оглавление