1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 331 332 333 334 335 336 337 338 339 340 341 342 343 344 345 346 347 348 349 350 351 352 353 354 355 356 357 358 359 360 361 362 363 364 365 366 367 368 369 370 371 372 373 374 375 376 377 378 379 380 381 382 383
Макеты страниц
5.3. ИТЕРАТИВНАЯ ПРОЦЕДУРА ОСУЩЕСТВЛЕНИЯ ВРАЩЕНИЯ ПРИ ПОИСКЕ ПРОСТОЙ СТРУКТУРЫЗа время развития факторного анализа были разработаны различные графические приемы процедуры вращения для достижения простой структуры. Рабочая группа Каттелла, продолжая традиции школы Тэрстоуна, применяла метод, которому следует по многим причинам отдать предпочтение перед остальными, хотя и было показано, что исследователи исходя из одних и тех же данных, но пользуясь различными методами, приходят к схожим результатам (Каттелл и Дикман [39], Каттелл и Салливэн [50], Каттелл и Горсач [42]). В большинстве случаев результаты, полученные с помощью геометрических представлений, лучше удовлетворяют принципу простой структуры, чем результаты, полученные с помощью аналитических методов. Значимость полученного решения может быть проверена с помощью критерия Баргмана. На примерах с известной структурой можно показать, что с помощью визуальной итеративной процедуры при поиске простой структуры в определенной плоскости достигается наилучшее положение координат осей, которые соответствуют влияющим факторам (см. раздел 7). Кроме того, применяя графические методы, исследователь непосредственно контактирует с исходным материалом, что помогает ему в дальнейшем при интерпретации полученных результатов. К сожалению, все графические приемы очень трудоемки. Но при проведении серьезных исследований уже не приходится считаться с объемом работы, тем более что время на осуществление процедуры вращения можно сократить, используя так называемую Rotoplot-nporpaммy (см. с. 339). Но даже при проведении расчетов на ЭВМ с помощью этой программы приходится выполнять от 10 до 20 циклов вычислений. Далее покажем процедуру поиска решения с простой структурой на двумерной задаче. Потом перейдем к трехмерной задаче (задаче о ящиках), известной под названием бокс-проблемы (box-problem) Тэрстоуна. В табл. 3.14 представлен результат выделения двух факторов, полученный методом главных факторов по 12 переменным. Будем продолжать работу с этим примером, приняв указанные в таблице факторные нагрузки за исходные. Рис. 5.13. Исходная система 12 векторов первоначальной факторной матрицы Обозначим через Рассмотрим вначале систему координат При вращении горизонтальной оси Как теперь вычислить по тангенсу угла поворота коэффициент корреляции между осями Первый элемент во второй строке имел бы другое значение, если бы фактор 2 оставался неизменным, а фактор 1 вращался. Для простоты мы ограничимся здесь поворотом только одной оси. Нормализуя матрицу поворота, мы получаем возможность перейти от нее к желаемой матрице преобразования Нормализация матрицы необходима по следующей причине. Если бы мы перемножали ненормализованную матрицу поворота с матрицей Так как ось Отдельные этапы вычислений, представленные в табл. 5.2, в принципе повторяются при последующих циклах вращения. При самостоятельном выполнении вся процедура вычислений очень быстро запоминается. Через Таблица 5.2. Первый цикл вращения Левая часть факторной матрицы обозначена через Хотя обе оси Рис. 5.14. Система векторов после первого цикла вращения, соответствующая факторному решению Ошибка, которую могут допустить при установлении нового угла поворота, не очень велика, если коэффициент корреляции не превышает 0,50. Она не связана с вычислениями, а может быть вызвана неточным вычерчиванием графика или неточным измерением угла поворота. Самое большое, к чему может привести подобная ошибка, это увеличение циклов вращения. Но с этим приходится мириться ради простоты ортогонального изображения. На рис. 5.14 ось Мы могли бы опять нормализовать эту матрицу поворота и применить к Рис. 5.15. Система векторов после второго цикла вращения, соответствующая факторному решению Эта матрица нормализуется уже известным способом. Во второй части таблицы получаем Результат вращения обеих осей представлен на рис. 5.15. Вторичные оси отрицательно коррелируют между собой. Обе группы точек уже относительно плотно прилегают к гиперплоскостям. Лишь положение гиперплоскости, соответствующей оси может быть несколько улучшено путем поворота этой оси на небольшой угол против движения часовой стрелки. В левой части графика считываем опять значение тангенса угла поворота —0,09. Дальнейшая процедура полностью аналогична ходу вычислений второго цикла вращения (см. табл. 5.3). Табл. 5.4 содержит отдельные этапы этой процедуры. По сравнению с табл. 5.3 в ней изменены лишь индексы обозначений матриц. В результате соответствующих вычислений получаем окончательную матрицу преобразования На рис. 5.16 изображена простая структура, которая вряд ли может быть улучшена путем дальнейшего вращения. Если все-таки оси повернуть еще на небольшой угол, то отдельные точки выйдут за границы зоны вокруг гиперплоскостей. Таблица 5.3. Второй цикл вращения Поэтому такое положение осей будем считать окончательным. Данный пример дает однозначные и простые результаты. При осуществлении каждого цикла вращению подвергалась только одна ось. Разумеется, можно одновременно вращать обе оси. Процедура при этом не изменится, но объем вычислений уменьшится. В примере мы имели дело лишь с двумя осями. При большем числе осей на графиках изображаются все возможные комбинации систем отсчета, учитывая каждый раз одновременно только две оси. Отдельно для каждой комбинации осуществляется процедура вращения. Для одного цикла вращения, выполненного на всех графиках, составляется одна матрица поворота. В принципе схема вычислений остается такой же, как вышеприведенная. Таблица 5.4. Третий цикл вращения Следует обратить внимание читателя на следующие обстоятельства. Мы нашли новое положение осей координат, не зная, какая точка какой переменной соответствует. При этом мы исходили из всей системы переменных, рассматривая ее в целом как неизменную, и осуществляя вращение так, чтобы возможно больше точек оказалось вблизи координатных гиперплоскостей без изменения взаимного расположения векторов (рис. 5.16). Это положение гиперплоскостей было достигнуто вслепую в том смысле, что не учитывалось смысловое содержание переменных. Если теперь для проверки значимости полученной простой структуры использовать критерий Баргмана, то следует по матрице Для второго фактора результат остается неизменным. Собственно говоря, в эксперименте рассматривали 24 переменные, для которых в ходе анализа было установлено однофакторное решение. Для простоты здесь ограничились первыми 12 переменными.) Оказалось, что экспериментальным данным присуща простая структура. Перед началом содержательной интерпретации факторов по переменным со значительными нагрузками заметим, что все результаты измерений систолического кровяного давления лежат вблизи вторичной оси 1, а результаты измерений диастолического — вблизи вторичной оси 2. Обе оси, представляющие факторы, коррелируют между собой. Рис. 5.16. Финальное факторное решение При интерпретации связи знак корреляции может быть здесь изменен на обратный. Величина полученного коэффициента корреляции 0,52 соответствует известной по другим экспериментам связи между систолическим и диастолическим кровяным давлением. Результатом вторичного решения является матрица Попытаемся далее формально описать операции, соответствующие отдельным этапам итеративной процедуры вращения при поиске простой структуры графическим методом. Для иллюстрации используем пример с тремя факторами. 1. Чертят 2. Угол поворота осей определяется по графикам. При этом при вращении горизонтальной оси тангенс угла поворота считывается по отрезку, отсекаемому гиперплоскостью, соответствующей этой оси, от нижней части графика. При вращении вертикальной оси тангенс угла поворота считывается в левой части графика. Угол поворота осей не должен превышать 45 °. При считывании тангенса угла поворота следует по графику учитывать знаки (см. рис. 5.13 и 5.14). Можно вращать одновременно две оси на одном графике. Так, можно было бы одновременно выполнять процедуру вращения с любым числом переменных на различных графиках. Углы поворота осей фиксируются в матрице поворота S. Эта матрица имеет размер 3. Матрица поворота перемножается с матрицей преобразования предыдущего цикла вращения, в результате чего получают матрицу Q. В первом цикле вращения матрица преобразования приравнивается к тождественной матрице. Тогда имеем, что 4. Матрица Q нормализуется путем умножения ее на диагональную матрицу А. Элементами диагональной матрицы А являются обратные величины из квадратных корней квадратов элементов матрицы Q, просуммированных по столбцам. Нормализованная матрица Q является искомой матрицей преобразования 5. В результате перемножения 6. Умножая матрицу исходных факторов на матрицу преобразования, получаем факторную структуру вторичного решения после 7. При осуществлении каждого цикла поворота подсчитывается число переменных, для которых выполняется неравенство Исследованием данного критерия занимался Каттелл. Процедура вращения прекращается, когда число переменных, находящихся в зоне гиперплоскостей координат, при поворотах осей больше не увеличивается, а остается на одном и том же уровне или даже начинает уменьшаться. Отдельные этапы процедуры вращения можно записать в матричном виде: Индекс i означает номер цикла вращения. Умножая матрицу преобразования предыдущего цикла вращения А на матрицу поворота S, получают Q. Для первого цикла Равенство (5.14) отражает нормализацию матрицы По формуле (5.15) определяется корреляционная матрица Далее изображают переменные в новой системе координат, т. е. представляют на графике факторную матрицу Описанный метод вращения связан с большим объемом вычислений и вычерчиванием значительного количества графиков. При числе факторов более трех один цикл вращения продолжается несколько часов. Осуществление процедуры вращения сильно упрощается при использовании так называемой Rotoplot-прогрaммы, предложенной Каттеллом и Фостером [41]. Эта программа обеспечивает выполнение всех действий над матрицами на вычислительной машине, а на специальном экране могут высвечиваться все графики. Просматривая проекции точек на все возможные плоскости координат, принимают решение, следует ли подвергать вращению данную пару осей. Машина устанавливает новую матрицу поворота, после чего автоматически вычисляются значения элементов матрицы преобразования и выдается новое положение осей с проекциями векторов на них. Более подробное описание Rotoplot-прогрaммы приводится дальше (см. с. 339). Обсуждаемый здесь пример рассчитан по этой программе. Ортогональная исходная матрица с тремя факторами для 20 переменных представлена в табл. 5.5, графическое ее изображение в различных плоскостях приведено на рис. 5.17-5.19. Вначале подвергаются вращению оси Таблица 5.5. Первый цикл вращения Благодаря этому оси остаются ортотональными, а все точки попадают в один квадрант (рис. 5.20). Матрица поворота Результат второго цикла вращения в виде факторной матрицы Рис. 5.17 Рис. 5.18 Рис. 5.19 Рис. 5.20 Рис. 5.21 Рис. 5.22 Таблица 5.6. Второй цикл вращения Таблица 5.7. Третий цикл вращения Соответствующие тангенсы углов поворота, записываемые в матрицу поворота, равны —0,10 и 0,08. Конечный результат вращения в виде финальной факторной матрицы Таблица 5.8. Финальное факторное решение Описанный выше пример вращения известен под названием бокс-проблемы Тэрстоуна и приведен в его книге как учебный пример, но при вращении выбирались другие углы поворота. В данном примере процедура вращения осуществлялась независимо от решения, предлагаемого Тэрстоуном, но в итоге получили сходные результаты. При желании читатель самостоятельно может провести сравнение между методом, описываемым Тэрстоуном [286; 6] и приведенным здесь. Если экспериментальным данным действительно присуща четкая простая структура, то к ней можно прийти различными способами. Различные способы требуют и различных затрат времени. Доказательством объективности процедуры вращения является тот факт, что исследователи независимо друг от друга на основе одних и тех же данных, но используя различные методы вращения, приходят к одинаковым результатам. Рис. 5.23 Рис. 5.24 Рис. 5.25 Рис. 5.26 Рис. 5.27 Рис. 5.28 Если в приведенном примере из 20 переменных выбрать 9 и в качестве упражнения дать задание нескольким студентам одного курса выполнить процедуру вращения для отобранного числа переменных и трех факторов, то можно убедиться, что независимо друг от друга они придут к одинаковым результатам, вполне согласующимся с финальным факторным решением по всем 20 переменным. К. обсуждению бокс-проблемы мы еще раз вернемся в 7.1.1 совсем по другому поводу.
|
Оглавление
|