Главная > Математика > Факторный анализ (Иберла К.)
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

8.7. ПРОВЕРКА ТОЧНОСТИ ФАКТОРНОГО РЕШЕНИЯ ПО МАТРИЦЕ ИСХОДНЫХ ДАННЫХ

В гл. 7.3 было показано, как можно проверить точность результатов факторного анализа путем сравнения действительных значений факторов с их оценками.

Критерием качества факторного решения служил коэффициент корреляции между действительными значениями факторов и их оценками. На практике использованный в гл. 7.3 критерий не может быть применен, так как действительные значения факторов неизвестны.

Вычисляемый обычно по формуле (6.25) коэффициент множественной детерминации является критерием только точности оценок, а не достоверности соответствующего факторного решения. Этот коэффициент свидетельствует лишь о том, как точно можно оценить фактор, а не о том, как точно оценка соответствует фактору. При конкретных исследованиях в качестве критерия достоверности факторного решения используются матрица исходных данных и корреляционная матрица. В общем случае удовлетворяются тем, что оценивают согласие между правой и левой частью равенства (2.28). Вычисляемая по (2.20) общность - является при этом мерой той доли единичной дисперсии каждой переменной, которая является общей для ряда переменных и может быть приписана влиянию общих факторов.

Вполне естественно перенести на матрицу исходных данных критерий, примененный при моделировании в гл. 7.3. Если определены матрица А и оценки значений факторов , то можно вычислить оценки значений стандартизованных переменных, т. е. матрицу Z (по равенству (2.13)):

Так как действительные значения стандартизованных переменных, т. е. матрица Z, известны, то путем сравнения Z и Z оценивают качество факторного решения.

Для сравнения лучше всего использовать коэффициенты корреляции между переменными обеих матриц, соответствующими друг другу. Коэффициент гг. указывает на то, как точно могут быть оценены с помощью уравнения множественной регрессии значения переменной, полученной из ортогонального факторного решения, если система факторов была выделена по переменным. При применении этого критерия мы находимся в порочном кругу, так как сами оцениваемые переменные через факторы входят в свои оценки. Коэффициенты корреляции можно вычислить для всех переменных. В то время как общность является долей дисперсии, общей для переменной i и фактора, содержит ту долю дисперсии переменной i, которая воспроизводится с помощью модели факторного анализа. Это не одно и то же, так как в вносят свою долю также другие переменные (через факторы), в то время как является долей дисперсии одной переменной.

Из формулы (8.5) для сравнения матриц Z и Z выведем ряд соотношений, которые затем используем для оценки качества факторного решения. Для ортогональных факторов были выведены следующие равенства: (6.16) и (6.17). Отсюда следует, что . Подставляя это выражение в (8.5), получим

(8.6)

Матрица является матрицей коэффициентов корреляций, воспроизведенных через факторное отображение. При выделении всех компонент в компонентном анализе что соответствует известному факту: главные компоненты могут быть определены очень точно, и они адекватно отражают исходную информацию, но в более компактной форме. Если мы выделяем все главные компоненты, то матрица исходных данных воспроизводится полностью.

Матрица в (8.6) преобразует Z в . Если ввести обычное обозначение корреляционной матрицы с оценками общностей по диагонали , то является матрицей остатков данного факторного решения. Выразив из последнего равенства и подставив его в (8.6), получим

Теперь можно матрицу выразить по-другому, так как а именно Подставляя последнее выражение в (8.7), получим

Из равенства (8.8) следует, что для получения Z нужно вычесть из матрицы исходных данных Z две матрицы. Матрица является матрицей погрешностей, входящих во вклады характерных факторов. Матрица является матрицей погрешностей, обусловленных остатками корреляционной матрицы. Если обе матрицы погрешностей вычесть из Z, то получим матрицу оценок исходных данных

Равенство (8.8) можно привести к такому виду:

где вычитаемое с правой стороны является суммой двух матриц:

Интересно то, что по матрицам можно получить соответствующие ковариационные матрицы.

Средние значения переменных, представленных в этих матрицах, равны нулю. Рассмотрим вначале матрицу в которой обозначим произведение через матрицу Матрица Q является симметрической квадратной матрицей. Элементы первой строки, или значения первой переменной матрицы вычисляются следующим образом:

Итак, значения образуют первую вектор-строку матрицу Слагаемые правой части равенств представляют собой произведения постоянной величины на значения переменных в матрице Z, которые имеют среднее значение, равное нулю.

Если просуммировать левые и правые части этих равенств, то получим

Так как сумма значений стандартизованной величины равна нулю, то т. е. среднее значение элементов этого вектора также равно нулю. Аналогичный вывод можно сделать для других переменных, входящих в матрицу а также в матрицы и Е. Если переменные, входящие в матрицы Z и Е, не коррелируют между собой и элементы этих матриц по строкам имеют средние значения, равные нулю, то элементы строк матрицы Z, составленной аддитивно из Z и Е, тоже имеют средние значения, равные нулю. Благодаря этому упрощается вычисление ковариационных матриц.

Матрицу ковариаций между переменными, входящими в матрицу пользуясь тем, что средние значения этих переменных равны нулю, можно представить в следующем виде: Подставляя в эту формулу выражение получим

Учитывая, что имеем

Матрица ковариаций между погрешностями, входящими во вклады характерных факторов, пропорциональна матрице элементы которой перемножаются с соответствующими значениями характерностей. Если эти значения равны нулю или очень малы, то ковариационная матрица превращается в нулевую. Но при больших значениях характерностей ковариационная матрица содержит значительные доли дисперсий. Аналогично получается выражение для ковариационной матрицы

Если элементы матрицы остатков корреляций незначительно отличаются от нуля, то также является практически нулевой матрицей.

Ковариационная матрица S (Е), учитывающая оба вида погрешностей, определяется по формуле

Вывод формулы матрицы ковариаций между переменными, входящими в матрицу , производится аналогичным образом. При этом исходят опять из того, что Подставляя в эту формулу выражение для Z, получим

После умножения членов внутри скобок на скаляр имеем

При условии, что матрица остатков корреляций является нулевой, получим

Если же некоторые из остаточных коэффициентов корреляции значительно отличаются от нуля, то мы не можем считать матрицу остатков корреляций эквивалентной нулевой, и тогда

Ковариационную матрицу можно преобразовать в корреляционную, производя соответствующее нормирование ее элементов. Матрица ковариаций между переменными, входящими в матрицы определяется аналогично. Диагональными элементами матрицы являются ковариации между переменными, соответствующими друг другу в матрицах

Внедиагональными элементами являются ковариации между остальными переменными, причем :

Итак,

Полученное выражение согласуется с определением характерных факторов. Вполне объяснимый результат получаем также для ковариационной матрицы

(8.16)

Для матрицы ковариаций между переменными, входящими в матрицу Z и Е, получаем следующее выражение:

Внедиагональными элементами этой матрицы являются остаточные коэффициенты корреляции, которые одновременно являются ковариациями между погрешностями и переменными, входящими в матрицу исходных данных. Так как остатки корреляций большей частью незначительно отличаются от нуля, то и ковариации также очень малы.

Для ковариационной матрицы получается следующее выражение:

Последнее равенство позволяет дать новое истолкование известной матрице . Матрица R является матрицей ковариаций между переменными, значения которых оценены по факторной модели, и действительными переменными. Ковариации, являющиеся диагональными элементами этой матрицы, используются для оценки качества факторного решения. Нормируя ковариации, получаем соответствующие коэффициенты корреляции. Эти коэффициенты корреляции можно вычислять не репосредственно по переменным, а по формуле, полученной из (8.18):

где является воспроизведенной общностью; можно определить по формуле (8.14). Итак,

Так как последние три слагаемых в подкоренном выражений знаменателя содержат диагональные элементы матриц, которые при малых остаточных коэффициентах корреляции практически равны нулю, и, кроме того, они имеют знак, обратный по сравнению с то коэффициент корреляции может вычисляться по следующей приближенной формуле:

Вычисляя непосредственно по переменным либо по формуле (8.19) или по ее аппроксимации (8.20), мы получаем для каждой переменной меру того, как точно она воспроизводится данной моделью факторного анализа.

На величину коэффициента не оказывает влияния вращение координатных осей в пространстве общих факторов. В выражение (8.19) входят только остатки корреляций, и доли дисперсии характерного фактора. Поэтому коэффициент должен оставаться неизменным после выделения главных факторов и после варимакс-вращения (при том же числе факторов). В таком случае остатки корреляций и доли дисперсий характерных факторов равны. Коэффициент поэтому не пригоден для того, чтобы определять предпочтительные решения в пространстве общих факторов. Он лишь указывает, как точно определенная переменная в целом воспроизводится через факторную модель. Все решения в пространстве общих факторов будут для этой переменной давать одинаковую точность.

При вычислении коэффициента мы попадаем в порочный круг, так как переменная i, являясь вектором в пространстве общих факторов, входит в свою собственную оценку. Особенно осложняется дело при больших значениях общностей, когда действительно хотят оценить переменные по значениям факторов. В таком случае можно применить для оценки равенство (8.5). В принципе применяют тогда, когда хотят охарактеризовать качество точности воспроизведения матрицы исходных данных и сравнить с другими методами анализа. Для таких целей коэффициент вполне пригоден, особенно если не упустить из виду вышеупомянутое замечание о порочном круге. Квадрат этого коэффициента — дает наглядную картину качества воспроизведения матрицы исходных данных через модель факторного анализа. При проверке значимости коэффициента корреляции g возникают некоторые затруднения, связанные с определением числа степеней свободы и тем, что математическое ожидание этого коэффициента при высоких значениях общностей отлично от нуля. Кроме того, провести проверку значимости для всех переменных одновременно невозможно, так как переменные коррелируют между собой. Рассмотрим конкретный пример.

В левом нижнем углу табл. 8.5 приведена корреляционная матрица, по которой производятся соответствующие вычисления. В правом верхнем углу табл. 8.5 содержится матрица включая ее диагональные элементы. В последней строке таблицы указаны наибольшие значения элементов каждой строки матрицы R, которые были использованы в качестве оценок общностей. Матрицы Р и Z известны, так как пример является результатом моделирования на ЭВМ.

Таблица 8.5. Корреляционная матрица и

Таблица 8.6. Факторные решения

В табл. 8.6 приведены действительное факторное отображение в выборке, решение, полученное методом главных факторов и варимакс-решение. Была произведена оценка значений факторов. Коэффициент корреляции между действительными значениями первого фактора и его оценками, полученными в результате расчетов, равен Соответствующий коэффициент корреляции для второго фактора По оценкам значений факторов с помощью равенства (8.5) определяется матрица оценок стандартизованных значений исходных данных Z. Переменные, входящие в матрицу Z, коррелируют с переменными, входящими в Z. Кроме того, были вычислены коэффициенты корреляции по формуле . Их значения отличаются от вычисленных непосредственно по переменным, только в третьем знаке после запятой.

Таблица 8.7. Сравнение

Значения приведены в табл. 8.7. Вычисленные общности всегда меньше так как знаменатель в формуле (8.20) меньше 1. Как видно из табл. 8.5, все переменные слабо связаны между собой (только 5 из 45 коэффициентов корреляции значимы). Тем более удивительно, как хорошо отдельные переменные воспроизводятся через факторную модель.

Рис. 8.5. Воспроизведенные доли дисперсии переменных матрицы Z (табл. 8.7)

На рис. 8.5 представлены воспроизведенные доли дисперсий переменных, входящих в матрицу Z. Общности, нанесенные на этот рисунок, составляют при этом только часть дисперсий переменных, которые сами вносят их в свои собственные оценки.

Можно провести дальнейшее сравнение между Z и Z по их разности. Результирующее распределение остатков матрицы Е можно представить раздельно для каждой переменной. Из (8.8) видно, что оно состоит из сумм :

Средние значения элементов строк матрицы Е равны нулю, так как средние значения элементов строк матрицы Z равны нулю. Матрица ковариаций между переменными, входящими в Е, вычисляется по формуле (8.12). Ковариационную матрицу получают по формуле (8.17). Она является нулевой, если остатки корреляций равны нулю.

Формулы (8.5) — (8.21) дают нам важнейшие соотношения, позволяющие произвести оценку факторного решения при конкретных исследованиях. Весьма наглядным является изображение долей дисперсий каждой переменной, воспроизведенной через модель факторного анализа.

<< Предыдущий параграф Следующий параграф >>
Оглавление