Главная > Математика > Факторный анализ (Иберла К.)
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

8.3. ПРЕОБРАЗОВАНИЕ МАТРИЦЫ ИСХОДНЫХ ДАННЫХ

До сих пор мы в факторном анализе исходили из матрицы исходных данных, непосредственно полученных в результате эксперимента. Однако иногда бывает полезно преобразовать исходные данные. Этот вопрос, подобно только что рассмотренному нами в гл. 8.2, еще мало изучен.

К преобразованию исходных данных обычно прибегают для того, чтобы перейти от нелинейной связи между переменными к линейной. Это связано с тем, что коэффициент парной корреляции непригоден для оценки степени тесноты связи между переменными, если связь между ними нелинейная. Путем соответствующих преобразований, например путем логарифмирования, извлечения квадратного корня и т. д., пытаются достигнуть линейной связи между переменными, но это не всегда удается. Трудность заключается в подборе функции преобразования.

Проблема преобразования переменных вызывает много споров. В факторном анализе дело осложняется тем, что нельзя преобразовывать только одну переменную или часть их, так как при таком подходе может возникнуть фактор, обусловленный в основном этим преобразованием. Преобразование же всего набора переменных тоже может вызвать нежелательный эффект. Дело в том, что нередко между частью переменных существует линейная связь. Тогда при линеаризации всего набора первоначальные линейные связи между переменными трансформируются. Вопрос подбора такой функции преобразования, которая бы как можно больше связей между переменными, входящими в корреляционную матрицу, приводила к линейной форме, еще окончательно не решен. В настоящее время при большом числе переменных преобразование чаще всего не приводит к желаемому эффекту, так как больше линейных связей теряют, чем приобретают.

Хорст [142; 3] дал обзор методов преобразования матрицы исходных данных, когда все переменные подвергаются преобразованию. Этим же вопросом занимался Каттелл [35; 4, 18]. Формально способы преобразования разделяются на две группы. В первой группе способов смещается среднее значение (по строкам или столбцам матрицы исходных данных). Во второй группе способов изменяют также стандартное отклонение. Заранее ясно, что преобразование оказывает влияние на результат факторного анализа. Шкалирование величин, т. е. выбор единицы измерения или стандартного отклонения, связано также с проблемой общности. Имеются такие методы факторного анализа, применение которых дает решения, не зависящие от выбранной шкалы оценок значений переменных (например, канонический факторный анализ, см. 3.5.1-3.5.3). Но, к сожалению, это нельзя утверждать относительно самого распространенного метода факторного анализа — метода главных факторов.

Рассмотрим три способа преобразования матрицы исходных данных, заключающиеся в том, что средние значения переменных или средние значения результатов наблюдений над переменными у каждого индивидуума, или и те и другие вместе приводятся к нулю. Это преобразование может применяться к матрицам, у которых переменные соответствуют строкам, а индивидуумы — столбцам, и наоборот.

Преобразование строк матрицы исходных данных. Пусть в матрице строки соответствуют переменным, а столбцы — индивидуумам. Чтобы среднее значение каждой переменной было равно нулю, из всех значений элементов строки вычитается соответствующее среднее значение переменной.

Это можно записать следующим образом:

В формуле 8.1, 1 — тождественная матрица, 1 — вектор-столбец, все элементы которого равны единице, — матрица исходных данных, строки которой преобразованы так, что средние значения их элементов равны нулю. Матрица в скобках имеет порядок Диагональные элементы ее равны а внедиагональные — Легко можно убедиться, что матрица содержит отклонения отдельных значений от соответствующих средних значений по строкам. Для наглядности запишем (8.1) в более подробном виде:

Для первого элемента матрицы получим: Аналогично получаются выражения остальных элементов матрицы, как отклонения значений элементов матрицы от средних значений по строкам. Матрицу называют центрированной справа матрицей исходных данных, или центрированной по строкам. Хорст [142; 3] этот способ преобразования называет преобразованием с увеличением (major transformation), так как размер матрицы преобразования больше размера матрицы Y. Итак, все переменные стали центрированными величинами, средние значения которых равны нулю. Этот способ преобразования не изменяет величину коэффициента корреляции между переменными. Поэтому можем записать:

Следует иметь в виду, что ковариационная матрица при таком преобразовании переменных изменится. Но так как в факторном анализе мы исходим из корреляционной матрицы, переход к центрированным величинам, не окажет влияния на его результат.

Преобразование столбцов матрицы исходных данных. Аналогичным образом можно преобразовать столбцы матрицы исходных данных так, чтобы среднее значение элементов каждого столбца было равно нулю. Для этого матрица исходных данных умножается слева на квадратную матрицу в скобках порядка :

Матрица называется центрированной слева или центрированной по столбцам. Хорст [142, 3] этот способ преобразования называет преобразованием с уменьшением (minor transformation). В матрице Y все значения элементов столбцов являются центрированными, т. е. их средние значения равны нулю. Выполнять такое преобразование имеет смысл тогда, когда хотят сравнить различные переменные на одном индивидууме, а различием между индивидуумами не интересуются. Такая задача может возникнуть, например, при изучении мотивов поведения людей, когда всем лицам приписывается одинаковый характер поведения (поэтому средние значения приводятся к нулю), а индивидуальные особенности сильно варьируют. Анализ с такими данными (ipsatized scores) проводился многими исследователями (см., например, Каттелла, Максвелла, Лайта и Унгера [45]; Каттелла и Баггалея [36]; Каттелла и Хорна [43], а также Каттелла [35; 18]). Сравнение результатов факторного анализа, проведенного по обычной матрице исходных данных и по матрице с преобразованными столбцами, показывает, что при этом преобразовании число выделенных факторов уменьшается на один. Соответствующий пример и сравнение двух результатов приведены у Райта [322].

Преобразование столбцов и строк матрицы исходных данных. Оба способа преобразования, описанные выше, можно выполнить последовательно друг за другом на одной и той же матрице исходных данных. В результате получают матрицу, элементы которой по строкам и столбцам имеют средние значения, равные нулю. Такую матрицу называют матрицей с двойным преобразованием, или дважды центрированной. Процесс преобразования можно представить в матричной форме таким образом:

Результаты матричного анализа, проведенного по матрице будут отличаться от результатов анализа по первичной матрице исходных данных Y. Хорст в своей книге [142; 3] установил связь между результатами факторных анализов, проведенных по ковариационным матрицам. Ковариационные матрицы были вычислены по матрице исходных данных, подвергнутой преобразованию дважды, а также центрированной справа и отдельно слева. Вопросы эквивалентности и взаимосвязи между факторными решениями при подобного рода преобразованиях еще до конца не изучены.

Возможны и другие преобразования матрицы исходных данных. Очень редко переменные преобразовывают так, что их средние становятся равными не нулю, а каким-то другим определенным значениям. В некоторых случаях матрицу исходных данных нормируют по строкам или столбцам путем деления значений элементов на соответствующие стандартные отклонения. У нормированной таким образом матрицы стандартные отклонения значений элементов по строкам или соответственно по столбцам равны единице. Какое влияние на факторное решение оказывают подобные преобразования матрицы исходных данных, остается пока еще не выясненным.

<< Предыдущий параграф Следующий параграф >>
Оглавление