1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 331 332 333 334 335 336 337 338 339 340 341 342 343 344 345 346 347 348 349 350 351 352 353 354 355 356 357 358 359 360 361 362 363 364 365 366 367 368 369 370 371 372 373 374 375 376 377 378 379 380 381 382 383
Макеты страниц
7.4. ОСНОВНЫЕ ВЫВОДЫ ПО РЕЗУЛЬТАТАМ МОДЕЛИРОВАНИЯВ предыдущих главах на отдельных моделях и экспериментах, имеющих методологический характер, было показано, что факторный анализ может по наблюдаемым переменным обнаружить скрытые за ними, непосредственно не измеряемые величины и дать оценку этих величин (факторов) для отдельного индивидуума. Этот вывод, полученный на основе моделей, не может быть безоговорочно распространен на все случаи. Выявление структуры исходных данных с помощью факторного анализа было продемонстрировано на специально подобранных примерах, но строго не доказано. Поэтому к выводам о точности оценок значений факторов тоже нужно относится критически. Поиск простой структуры, заранее заложенной в исходные данные моделей, производился по определенной методике, включающей в себя оценку общностей; как можно более точное определение числа факторов, подлежащих выделению; выделение факторов центроидным методом или методом главных факторов и вращение с целью определения простой структуры. При проведении аналогичного исследования следует иметь в виду, что если не обеспечивается ортогональность факторов, как это выполняется при моделировании на ЭВМ, то необходимо производить вращение осей координат до нахождения косоугольной простой структуры. Факторы, являющиеся значимыми по критерию Баргмана, большей частью содержательно интерпретируются. Нами еще не было проведено исследование на моделях метода максимального правдоподобия. К сожалению, при решении задачи группировки переменных, кроме концепции простой структуры, не имеется других критериев. Задача группировки переменных заключается в разбиении переменных на такие группы, что переменные, входящие в одну группу, сильно коррелируют между собой, а переменные, входящие в разные группы, — слабо. Вполне допустим такой подбор переменных на моделях или при практических исследованиях, что не может быть найдено однозначного положения системы координат, удовлетворяющего принципу простой структуры. В этом случае число выделенных факторов дает лишь формальное описание размерности исследуемого факторного пространства. Но эти факторы не могут быть содержательно проинтерпретированы и оценки их значений носят произвольный характер. В этом случае нельзя сделать никакого определенного вывода о структуре данных. С другой стороны, вполне возможно путем вращения обнаружить простую структуру, обеспечивающую наиболее простое описание переменных в терминах факторов, лежащих в основе данного явления. Но в то же время нахождение простой структуры, удовлетворяющей критерию значимости Баргмана, еще не гарантирует, что выделенные факторы существуют реально. Они могут служить лишь основой для первоначальной гипотезы, которая отличается особой простотой, но требует дополнительной проверки. На все это одним из первых указал Оверолл [217; 2] в своей критике исследований на моделях и привел соответствующие примеры. Известные до сих пор исследования на моделях показывают принципиальную возможность выявления простой структуры, если она действительно присуща исходным данным. В этом случае размерность исследуемого факторного пространства вполне согласуется с выявленными функциональными единицами, причинно обусловливающими взаимодействие переменных. И это нельзя рассматривать как случайное совпадение, особенно если оно подтверждается дальнейшими исследованиями. Но данный вывод, полученный на основе отдельных экспериментов, к сожалению, не может быть обобщен. Мы можем сослаться только на такие поразительные факты, что результаты факторного анализа, примененного различными исследователями к одним и тем же данным с четкой структурой, совпадают друг с другом. Следовательно, методика факторного анализа позволяет исследователям вслепую обнаружить число и вид независимых функциональных единиц, вызывающих вариацию переменных и действительно присущих данному явлению. Примеры (один из которых приведен Овероллом [217; 2]), отрицающие эти утверждения, не могут рассматриваться в качестве опровержения объективности процедур факторного анализа, так же как приведенные здесь примеры поиска простой структуры не могут служить доказательством их объективности. Моделирование на ЭВМ (гл. 7.3) позволяет утверждать, что задача, которая ставится перед факторным анализом, — выявить величины, не поддающиеся непосредственному измерению, и представить их в виде измеренных — вполне разрешима. Факторный анализ в подавляющем большинстве случаев приводит к оценкам значений факторов, которые более тесно коррелируют с действительными их значениями, чем наблюдаемые переменные. Таким образом, объективность процедур факторного анализа эмпирически считается доказанной. Достоверность оценок значений факторов зависит главным образом от степени связи между переменными и факторами. Чем теснее эта связь, тем больше точность оценки. Число переменных, приходящихся на фактор, также оказывает влияние, но в значительно меньшей степени. Большой точности оценивания можно достигнуть только при тесной корреляционной связи между переменными и факторами. Слабая корреляционная связь не может быть компенсирована увеличением числа переменных, связанных с фактором. Увеличение объема выборки не улучшает точности оценок, если связь между переменными и факторами слабая. Если же эта связь тесная, то уменьшение объема выборки не приводит к резкому снижению точности оценивания. При коэффициентах корреляции, занимающих промежуточное положение между этими крайними случаями, возможно некоторое повышение точности за счет увеличения объема выборки. Более сильное рассеяние факторных нагрузок приводит к увеличению точности оценок. При этом сравнение производится с результатами оценивания при одинаковых факторных нагрузках и при совпадении средних значений нагрузок в обеих сериях опытов. Преобразование нормально распределенных случайных величин в переменные с альтернативной вариацией, особенно при неравномерном распределении значений переменных в альтернативных группах, снижает точность оценивания. Это объясняется тем, что уже перед вычислением корреляционной матрицы происходит потеря информации. Если коэффициенты корреляции между переменными с альтернативной вариацией равны коэффициентам корреляции между нормально распределенными переменными, то точность оценок значений факторов будет не хуже. Точность оценок, полученных методом множественной регрессии, только тогда выше точности оценок, полученных с помощью факторного анализа, когда связь между переменными и факторами слабая. Эти выводы были получены в результате моделирования процедур факторного анализа на ЭВМ при одном существенном ограничении — факторы не перекрывались. Переменные нагружали либо первый из двух факторов, либо второй, но не оба сразу. В принципе вполне возможно провести аналогичное исследование с перекрывающимися факторами. Опираясь на приобретенный опыт, можно предположить, что точность оценок значений перекрывающихся факторов будет незначительной в случае отсутствия четкой простой структуры. Приведенные выше выводы справедливы только для той методики факторного анализа, которая была применена при моделировании (в качестве оценок общностей принимались наибольшие значения коэффициентов корреляции в каждом столбце матрицы R, использовались метод главных факторов и варимакс-вращение). Эти процедуры факторного анализа наиболее распространены. Как изменяются точности оценок при других методах факторного анализа, не исследовано. Генерируемые на ЭВМ факторы были ортогональны. Поэтому с помощью варимакс-критерия добивались наилучшей ортогональной аппроксимации простой структуры. В силу того что аналитические методы косоугольного вращения не всегда приводят к эффективным результатам, они не привлекались при моделировании на ЭВМ. В исследованиях на модели выделяли два фактора, так как заранее было известно, что корреляция переменных обусловлена именно двумя факторами. На практике число факторов, подлежащих выделению, оценивается заранее одним из разработанных для этого способов. Однако этот вопрос наряду с различными подходами к решению проблемы общностей остался неисследованным при моделировании процедур факторного анализа на ЭВМ. Итак, хотя ряд частных вопросов еще не решен, в общем можно сделать вывод, что результаты факторного анализа эмпирически подтверждены. Точность метода была изучена при некоторых конкретных условиях. Моделирование на ЭВМ дает возможность получить ответы на вопросы, связанные с применением факторного анализа.
|
Оглавление
|