Главная > Математика > Факторный анализ (Иберла К.)
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

8. ЧАСТНЫЕ ПРОБЛЕМЫ ФАКТОРНОГО АНАЛИЗА

В разделах 3—6 обсуждались отдельные проблемы факторного анализа и указывались методы их решения. При этом ряд вопросов был оставлен без внимания. Теперь, когда мы в целом представляем себе задачи и возможности факторного анализа, можно перейти к рассмотрению некоторых частных вопросов, которые, на наш взгляд, являются наиболее важными. Последующие главы посвящены различным проблемам, но в основном мы ограничиваемся их постановкой, не приводя окончательных решений. Основной целью этого раздела является возбудить интерес читателя к этим проблемам и указать соответствующую литературу.

8.1. РАЗЛИЧНЫЕ ТЕХНИКИ ПРОВЕДЕНИЯ ФАКТОРНОГО АНАЛИЗА В ЗАВИСИМОСТИ ОТ ВИДА МАТРИЦЫ ИСХОДНЫХ ДАННЫХ

Матрицу исходных данных, подвергающуюся факторному анализу, можно рассматривать двояко. До сих пор мы вычисляли корреляцию между строками (переменными). Но можно определять корреляцию и между столбцами (индивидуумами). Таким образом, к одной и той же матрице исходных данных могут быть применены два способа определения корреляций, которые называются «техниками». Между обеими техниками существует взаимосвязь. В отличие от этих двух техник, оперирующих группами индивидуумов, факторный эксперимент может быть построен на совершенно другой основе. Через определенные интервалы времени на одном и том же индивидууме (объекте) осуществляется исследование нескольких параметров (переменных) или можно один и тот же параметр (переменную) измерять на нескольких индивидуумах в различные моменты времени. Полученные таким образом матрицы исходных данных можно также подвергать факторному анализу. Было бы полезно также рассмотреть влияние условий эксперимента на результаты факторного анализа.

Обычная матрица исходных данных содержит наблюдения по переменным (строки) для индивидуумов (столбцы). Она изображена в виде прямоугольника слева в верхней части рис. 8.1. Если вычислить коэффициенты корреляции между переменными по группам индивидуумов, то получим корреляционную матрицу, с которой мы все время имели дело. Факторный анализ этой корреляционной матрицы приводит к факторному отображению, указанному в правой части рис. 8.1. При этой технике с помощью факторов выявляется структура переменных. Переменные сосредоточены вокруг тех факторов, которые определяют эти переменные и обусловливают их корреляции.

Применение факторного анализа к корреляционной матрице, образованной описанным выше способом, называется техникой R.

Но по той же самой матрице данных можно рассчитать корреляции между индивидуумами и образовать корреляционную матрицу порядка п. На рис. 8.1 она изображена под матрицей исходных данных. В результате факторизации матрицы коэффициентов корреляции между индивидуумами получаем систему факторов D, Е и F. Эти факторы выявляют взаимосвязь между индивидуумами, которые разделяются на группы, не похожие друг на друга. Внутри групп существует высокая корреляция между индивидуумами.

Рис. 8.1. Техники R и Q

Применение факторного анализа к матрице коэффициентов корреляции между индивидуумами называется техникой Q.

Стефенсон [278] одним из первых рассмотрел два способа определения коэффициентов корреляции по одной и той же матрице исходных данных и сравнил результаты факторного анализа, примененного к двум корреляционным матрицам. Барт [27; 5] еще раньше занимался этим вопросом, и они опубликовали совместную работу. [29]. Оба факторных отображения, полученных по одной и той же матрице исходных данных, независимы друг от друга. Собственные значения и собственные векторы одной корреляционной матрицы можно вычислить по собственным значениям и собственным векторам другой. Если оба факторных решения рассматривать с содержательной стороны, то можно заметить, что характер первого общего фактора, определенного с помощью техники Q, будет несколько иным по сравнению с рассчитанным при помощи техники R. Разница между обоими факторными отображениями изучена еще не полностью. С одной стороны, эти решения взаимосвязаны, а с другой стороны, они дают различную информацию о причинах, скрытых за фасадом изучаемого явления.

Различие выделенных факторов связано с тем, что в технике R рассматривается корреляция между переменными по выборке индивидуумов, а в технике Q рассматривается корреляция между индивидуумами по выборке переменных. В общем случае нельзя ожидать, что эти факторы будут точно совпадать друг с другом.

Комбинируя описанные выше два способа рассмотрения матрицы исходных данных с различными категориями переменных, можно получить еще ряд техник факторного эксперимента. Каттелл предложил шесть техник, но их число может быть увеличено.

Рис. 8.2. Диаграмма различных техник факторного эксперимента по Каттеллу (covariation-chart). Оси соответствуют индивидуумам, переменным и времени. Различные техники факторного эксперимента изображены в соответствующих плоскостях в виде полос. В технике R вычисляют корреляцию между переменными по выборке индивидуумов, в технике Q — корреляцию между индивидуумами по выборке переменных, в технике Р — корреляцию между переменными по выборке наблюдений, произведенных в определенные интервалы времени

На рис. 8.2 представлена диаграмма «covariation-chart, отражающая связь между шестью техниками Каттелла. Он исходил из того, что различные наблюдения можно представить в трех измерениях: относительно индивидуумов, переменных и времени или различных ситуаций при проведении эксперимента. Рассмотрим вначале плоскость, образованную осями «переменные» и «индивидуумы». Если по выборке индивидуумов определяют корреляции между переменными и по ним проводят факторный анализ, то имеют дело с техникой R. Она указана на диаграмме в виде полосы на плоскости, образованной осями «переменные» и «индивидуумы». И наоборот, если факторный анализ применяют к матрице коэффициентов корреляции между индивидуумами, рассчитанных по выборке переменных, то имеют дело с техникой Q, которая изображена на этой же плоскости в виде полосы, параллельной оси переменных. Полосы на плоскости проводятся перпендикулярно к осям, соответствующим величинам, между которыми рассчитываются корреляции. Аналогичным образом можно рассмотреть две другие плоскости с соответствующими техниками факторного эксперимента, между которыми существует такая же связь, как между техниками R и Q.

В плоскости, образованной осями «переменные» и «время», проведена полоса, соответствующая технике Р.

При этой технике факторного эксперимента через определенные интервалы времени проводятся повторные исследования индивидуумов. Переменными, между которыми определяют корреляцию в данном случае, являются результаты наблюдений в отдельные моменты времени. По корреляционной матрице определяются факторы, которые вызывают вариацию переменных, относящихся к одному и тому же индивидууму.

Не проведена еще четкая граница между техникой Р и другими методами анализа временных рядов. Техника Р имеет много противников. Одно из возражений против ее применения заключается в том, что наблюдения на одном и том же индивидууме независимы друг от друга и это может послужить источником ложной корреляции. Другое возражение касается запаздывания во времени (time-lag) одной из взаимосвязанных переменных, из-за чего при обычной технике Р корреляция между ними может не выявиться, хотя на самом деле между ними существует тесная зависимость. Это затруднение можно преодолеть, сдвигая по времени обе переменные относительно друг друга и устанавливая, какая величина сдвига приводит к максимальной корреляции между ними. Кроме того, при применении факторного анализа к временным рядам нельзя выявить направление изменений факторов. При изменении порядка чередования интервалов времени, в которых производились наблюдения, результат анализа не изменяется. Отдельные высказывания о применении факторного анализа к временным рядам можно найти в работе Андерсона [5; 5]. Методические указания по применению техники Р имеются у Вудбери и Хольцмана. Хотя еще полностью не выявлены границы применения техники Р, ясно, что она открывает широкие возможности, особенно при изучении индивидуальных свойств объектов. Кроме работ Каттелла [35; 3, 5, 6, 7], предложившего технику Р, полезно познакомиться с публикациями его последователей (см. также Каттелл и Вильямс [521).

Логически возможны и другие виды техник факторного эксперимента, которые не нашли отражения на рис. 8.2. Например, если вычислять корреляцию между переменными через определенные интервалы времени, производя измерения каждый раз на другом индивидууме, то получим технику, которая на диаграмме изобразится полосой, проходящей по диагонали между техниками Р и R. Хорст [142; 3] говорит не о различных техниках, а о категориях вариации (caiegorial variation). Здесь нет необходимости увеличивать список терминов для обозначения различных подходов к факторному эксперименту. Судя по доступным в настоящее время материалам, не все техники нашли еще широкое применение. При выборе техники перед анализом выясняется, каким требованиям должны удовлетворять факторы, лежащие в основе матрицы исходных данных.

При обсуждении проблем факторного анализа часто возникает вопрос: можно ли провести факторный анализ по исходным данным, представленным в трехмерном пространстве? Классический факторный анализ ограничивается матрицей порядка , где — переменные (признаки), — индивидуумы (объекты). Это было бы большим достижением в факторном анализе — создать методику факторного эксперимента для матрицы исходных данных в многомерном пространстве, не представляя ее каждый раз последовательно в двух направлениях, как это обычно делается сейчас (признаки — объекты). Хорст [142; 3] дал обзор возникающих при этом возможных вариантов. Новейшие работы Тукера, Хорста и Левина посвящены распространению методов факторного анализа на матрицу исходных данных в многомерно пространстве.

В настоящее время остается только выжидать, какой из предлагаемых подходов к таким матрицам оправдает себя на практике.

В заключение следует указать на то, что метод факторного анализа Можно применить к результатам классического эксперимента. В этом случае в матрицу исходных данных наряду с обычными наблюдаемыми величинами вводят в качестве переменных варьирование условий эксперимента. Каттелл в своей книге [35; 4] рассмотрел несколько подходов к решению таких задач. Но они не нашли пока практического применения. Теоретически эти подходы также еще не разработаны, на что указал Уолш [300]. В справочнике, изданном под редакцией Каттелла [35; 21], этот вопрос с указанием примеров затрагивается Фрюхтером. Применение факторного анализа к результатам классического эксперимента, в котором произвольно варьируют факторами, позволит использовать достоинства факторного и дисперсионного анализа. Соединение этих двух методов многомерного статистического анализа вполне возможно и перспективно, хотя еще полностью теоретически не разработано.

<< Предыдущий параграф Следующий параграф >>
Оглавление