Главная > Математика > Факторный анализ (Иберла К.)
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

2.2. ОСНОВНЫЕ УРАВНЕНИЯ И КОНЦЕПЦИИ В АЛГЕБРАИЧЕСКОЙ ФОРМЕ

В этой главе намечаются общие границы, внутри которых будут обсуждаться различные виды факторного анализа. Так как факторный анализ не имеет единой и законченной структуры, необходима такая формальная система соотношений, которая помогла бы сопоставить между собой отдельные способы решения.

Очевидно, что приводимые далее уравнения и определения начинающий воспримет с некоторыми затруднениями. Однако они составляют необходимую канву, без которой не обойтись. Читателю рекомендуется при освоении этой вступительной главы выполнять самостоятельно на бумаге соответствующие преобразования. Это поможет ему освежить в памяти или усвоить основные операции с матрицами, которые уже были описаны в гл. 1.4. Факторный анализ невозможен без знания матричного исчисления, поэтому матричная форма записи используется с самого начала. Также сразу даются и матричные уравнения, чтобы ввести читателя в курс дела. При этом задача заключается не просто в ознакомлении с материалом, а в освоении метода. Это освоение облегчается, если чтение сопровождается записью матриц, их элементов и вдумчивым отношением к приводимым матричным уравнениям.

2.2.1. Фундаментальная теорема

Пусть исходные данные записаны в виде матрицы , где индекс относится к переменным, а индекс к индивидуумам. Коэффициент корреляции между двумя переменными i и k вычисляется по известной формуле

где — среднее значение, — стандартное отклонение и — ковариация.

Если все переменных Y подвергнем следующему преобразованию

то матрица будет удовлетворять следующим условиям:

т. е. все средние значения переменных Z равны нулю, а все дисперсии равны единице. Строки матрицы Z называют стандартизованными, или нормированными, переменными, a называют также стандартизованным значением (standard score). Такое нормирование всегда возможно. Если исходить из стандартизованных переменных, то формула (2.8) упрощается:

(2-10)

т. е. для стандартизованных переменных коэффициенты корреляции и ковариации равны.

Для корреляционной и ковариационной матриц R и S имеет место соотношение

В формуле (2.11) выражение является скаляром, -матрицей стандартизованных исходных данных, R — корреляционной матрицей и S — ковариационной матрицей. С корреляционной матрицей мы уже знакомились неоднократно. Она имеет размер , диагональные элементы отражают корреляцию переменных самих с собой, следовательно, они равны единице. Матрица также является симметрической, т. е. Корреляционная или ковариационная матрица является отправной точкой факторного анализа. Хотя обе матрицы при указанных условиях идентичны, но исторически так сложилось, что большей частью выбирали корреляционную матрицу, поэтому далее будем также исходить из стандартизованных переменных и матрицы R. В принципе можно было бы исходить из ковариационной матрицы. В этом случае пришли бы к аналогичным формулировкам.

Целью любого метода факторного анализа является представление величины т. е. элемента матрицы Z, в виде линейной комбинации нескольких гипотетических переменных, или факторов. Положим, что значение может быть выражено в виде линейной комбинации факторов.

(2.12)

Это равенство выражает основную модель факторного анализа. Здесь являются постоянными коэффициентами, которые следует определить; — значениями факторов у индивидуума (factor scores). Используя матричную форму записи, для всех имеем

где Z является матрицей порядка стандартизованных переменных — исходных данных. Это равенство приводится еще раз на следующей странице в развернутом виде. является матрицей порядка , которую нужно определить. Она называется факторным отображением (factor pattern), а ее коэффициенты — факторными нагрузками (factor loadings). А является матрицей коэффициентов регрессии факторов по переменным; — матрицей порядка значений всех факторов у всех индивидуумов и должна быть также пронормирована построчно.

Как видно из равенства 2.13, матрица Z представляет собой произведение двух матриц: А и Р. При этом матрица А отражает связи переменных с факторами, а Р описывает отдельные индивидуумы.

В (2.13) А и Р неизвестны, известна лишь Z. Уравнение без введения дополнительных ограничений имеет бесконечное множество решений. Эти ограничения также составляют основную посылку всех методов факторного анализа. Отдельные наблюдаемые значения являются линейными комбинациями гипотетических, ненаблюдаемых, или скрытых, переменных, называемых факторами, которые не могут быть обнаружены в процессе наблюдения. Равенство (2.12) или (2.13) является математической моделью, причем мы еще не рассматривали ее со статистической точки зрения, например, не касались оценки параметров генеральной совокупности по результатам выборки. Подставив (2.13) в (2.11), получим

Теперь по аналогии с формулой (2.11) можно утверждать, что выражение является корреляционной матрицей, отражающей связи между факторами, т. е.

Если наложить на это равенство условие некоррелированности факторов, т. е. то в результате получим

Тэрстоун называет (2.14) и (2.15) фундаментальной теоремой факторного анализа. С является матрицей коэффициентов корреляции между факторами. В том случае, когда постулируются ортогональные факторы, С становится единичной матрицей и при умножении ее опускают.

Фундаментальная теорема утверждает, что корреляционная матрица может быть воспроизведена с помощью факторного отображения и корреляций между факторами. Это положение уже было проиллюстрировано вводными примерами. Равенство (2.15) является отправной точкой классического метода решения. Однако нам бы хотелось пока воздержаться от обсуждения различных методов решения.

Для наглядности еще раз приведем равенства (2.13) и (2.14) в более подробной записи:

Для каждого отдельного элемента матщы Z имеет место равенство (2.12).

При получаем (2.15); тогда для каждого отдельного элемента матрицы R имеет место выражение

Здесь следует указать на основополагающее значение равенств (2.13), (2.14) и (2.15) и в дальнейшем предполагается их формальное понимание. Они выражают основную модель факторного анализа, из которой далее можно исходить при создании различных специальных моделей.

В гл. 2.1 мы уже познакомились с простым числовым примером. Числа были подобраны так, чтобы можно было легко произвести вычисления. В определенной степени процедура факторного анализа обратима. Так, если в правой части равенства (2.15) находится А, то в левой части обязательно получим R:

Первый элемент матрицы R получается следующим образом: . Он не равен единице, как это должно было быть в корреляционной матрице.

Значение первого элемента заключается в скобки и называется общностью. Это понятие мы будем еще обсуждать более детально. Второй элемент первого столбца равен: . Совершенно аналогично получаются другие элементы матрицы R путем перемножения матриц А и А' по соответствующему правилу. В факторном анализе эта процедура обратима: Может быть задана корреляционная матрица R и по ней находится А. Здесь была задана А и по ней определялась R. Указанные в примере числа удовлетворяют равенству (2.15). Можно легко сконструировать самостоятельно другие примеры.

<< Предыдущий параграф Следующий параграф >>
Оглавление