ЕГЭ и ОГЭ
Хочу знать
Главная > Математика > Факторный анализ (Иберла К.)
<< Предыдущий параграф
Следующий параграф >>
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

8. ЧАСТНЫЕ ПРОБЛЕМЫ ФАКТОРНОГО АНАЛИЗА

В разделах 3—6 обсуждались отдельные проблемы факторного анализа и указывались методы их решения. При этом ряд вопросов был оставлен без внимания. Теперь, когда мы в целом представляем себе задачи и возможности факторного анализа, можно перейти к рассмотрению некоторых частных вопросов, которые, на наш взгляд, являются наиболее важными. Последующие главы посвящены различным проблемам, но в основном мы ограничиваемся их постановкой, не приводя окончательных решений. Основной целью этого раздела является возбудить интерес читателя к этим проблемам и указать соответствующую литературу.

8.1. РАЗЛИЧНЫЕ ТЕХНИКИ ПРОВЕДЕНИЯ ФАКТОРНОГО АНАЛИЗА В ЗАВИСИМОСТИ ОТ ВИДА МАТРИЦЫ ИСХОДНЫХ ДАННЫХ

Матрицу исходных данных, подвергающуюся факторному анализу, можно рассматривать двояко. До сих пор мы вычисляли корреляцию между строками (переменными). Но можно определять корреляцию и между столбцами (индивидуумами). Таким образом, к одной и той же матрице исходных данных могут быть применены два способа определения корреляций, которые называются «техниками». Между обеими техниками существует взаимосвязь. В отличие от этих двух техник, оперирующих группами индивидуумов, факторный эксперимент может быть построен на совершенно другой основе. Через определенные интервалы времени на одном и том же индивидууме (объекте) осуществляется исследование нескольких параметров (переменных) или можно один и тот же параметр (переменную) измерять на нескольких индивидуумах в различные моменты времени. Полученные таким образом матрицы исходных данных можно также подвергать факторному анализу. Было бы полезно также рассмотреть влияние условий эксперимента на результаты факторного анализа.

Обычная матрица исходных данных содержит наблюдения по переменным (строки) для индивидуумов (столбцы). Она изображена в виде прямоугольника слева в верхней части рис. 8.1. Если вычислить коэффициенты корреляции между переменными по группам индивидуумов, то получим корреляционную матрицу, с которой мы все время имели дело. Факторный анализ этой корреляционной матрицы приводит к факторному отображению, указанному в правой части рис. 8.1. При этой технике с помощью факторов выявляется структура переменных. Переменные сосредоточены вокруг тех факторов, которые определяют эти переменные и обусловливают их корреляции.

Применение факторного анализа к корреляционной матрице, образованной описанным выше способом, называется техникой R.

Но по той же самой матрице данных можно рассчитать корреляции между индивидуумами и образовать корреляционную матрицу порядка п. На рис. 8.1 она изображена под матрицей исходных данных. В результате факторизации матрицы коэффициентов корреляции между индивидуумами получаем систему факторов D, Е и F. Эти факторы выявляют взаимосвязь между индивидуумами, которые разделяются на группы, не похожие друг на друга. Внутри групп существует высокая корреляция между индивидуумами.

Рис. 8.1. Техники R и Q

Применение факторного анализа к матрице коэффициентов корреляции между индивидуумами называется техникой Q.

Стефенсон [278] одним из первых рассмотрел два способа определения коэффициентов корреляции по одной и той же матрице исходных данных и сравнил результаты факторного анализа, примененного к двум корреляционным матрицам. Барт [27; 5] еще раньше занимался этим вопросом, и они опубликовали совместную работу. [29]. Оба факторных отображения, полученных по одной и той же матрице исходных данных, независимы друг от друга. Собственные значения и собственные векторы одной корреляционной матрицы можно вычислить по собственным значениям и собственным векторам другой. Если оба факторных решения рассматривать с содержательной стороны, то можно заметить, что характер первого общего фактора, определенного с помощью техники Q, будет несколько иным по сравнению с рассчитанным при помощи техники R. Разница между обоими факторными отображениями изучена еще не полностью. С одной стороны, эти решения взаимосвязаны, а с другой стороны, они дают различную информацию о причинах, скрытых за фасадом изучаемого явления.

Различие выделенных факторов связано с тем, что в технике R рассматривается корреляция между переменными по выборке индивидуумов, а в технике Q рассматривается корреляция между индивидуумами по выборке переменных. В общем случае нельзя ожидать, что эти факторы будут точно совпадать друг с другом.

Комбинируя описанные выше два способа рассмотрения матрицы исходных данных с различными категориями переменных, можно получить еще ряд техник факторного эксперимента. Каттелл предложил шесть техник, но их число может быть увеличено.

Рис. 8.2. Диаграмма различных техник факторного эксперимента по Каттеллу (covariation-chart). Оси соответствуют индивидуумам, переменным и времени. Различные техники факторного эксперимента изображены в соответствующих плоскостях в виде полос. В технике R вычисляют корреляцию между переменными по выборке индивидуумов, в технике Q — корреляцию между индивидуумами по выборке переменных, в технике Р — корреляцию между переменными по выборке наблюдений, произведенных в определенные интервалы времени

На рис. 8.2 представлена диаграмма «covariation-chart, отражающая связь между шестью техниками Каттелла. Он исходил из того, что различные наблюдения можно представить в трех измерениях: относительно индивидуумов, переменных и времени или различных ситуаций при проведении эксперимента. Рассмотрим вначале плоскость, образованную осями «переменные» и «индивидуумы». Если по выборке индивидуумов определяют корреляции между переменными и по ним проводят факторный анализ, то имеют дело с техникой R. Она указана на диаграмме в виде полосы на плоскости, образованной осями «переменные» и «индивидуумы». И наоборот, если факторный анализ применяют к матрице коэффициентов корреляции между индивидуумами, рассчитанных по выборке переменных, то имеют дело с техникой Q, которая изображена на этой же плоскости в виде полосы, параллельной оси переменных. Полосы на плоскости проводятся перпендикулярно к осям, соответствующим величинам, между которыми рассчитываются корреляции. Аналогичным образом можно рассмотреть две другие плоскости с соответствующими техниками факторного эксперимента, между которыми существует такая же связь, как между техниками R и Q.

В плоскости, образованной осями «переменные» и «время», проведена полоса, соответствующая технике Р.

При этой технике факторного эксперимента через определенные интервалы времени проводятся повторные исследования индивидуумов. Переменными, между которыми определяют корреляцию в данном случае, являются результаты наблюдений в отдельные моменты времени. По корреляционной матрице определяются факторы, которые вызывают вариацию переменных, относящихся к одному и тому же индивидууму.

Не проведена еще четкая граница между техникой Р и другими методами анализа временных рядов. Техника Р имеет много противников. Одно из возражений против ее применения заключается в том, что наблюдения на одном и том же индивидууме независимы друг от друга и это может послужить источником ложной корреляции. Другое возражение касается запаздывания во времени (time-lag) одной из взаимосвязанных переменных, из-за чего при обычной технике Р корреляция между ними может не выявиться, хотя на самом деле между ними существует тесная зависимость. Это затруднение можно преодолеть, сдвигая по времени обе переменные относительно друг друга и устанавливая, какая величина сдвига приводит к максимальной корреляции между ними. Кроме того, при применении факторного анализа к временным рядам нельзя выявить направление изменений факторов. При изменении порядка чередования интервалов времени, в которых производились наблюдения, результат анализа не изменяется. Отдельные высказывания о применении факторного анализа к временным рядам можно найти в работе Андерсона [5; 5]. Методические указания по применению техники Р имеются у Вудбери и Хольцмана. Хотя еще полностью не выявлены границы применения техники Р, ясно, что она открывает широкие возможности, особенно при изучении индивидуальных свойств объектов. Кроме работ Каттелла [35; 3, 5, 6, 7], предложившего технику Р, полезно познакомиться с публикациями его последователей (см. также Каттелл и Вильямс [521).

Логически возможны и другие виды техник факторного эксперимента, которые не нашли отражения на рис. 8.2. Например, если вычислять корреляцию между переменными через определенные интервалы времени, производя измерения каждый раз на другом индивидууме, то получим технику, которая на диаграмме изобразится полосой, проходящей по диагонали между техниками Р и R. Хорст [142; 3] говорит не о различных техниках, а о категориях вариации (caiegorial variation). Здесь нет необходимости увеличивать список терминов для обозначения различных подходов к факторному эксперименту. Судя по доступным в настоящее время материалам, не все техники нашли еще широкое применение. При выборе техники перед анализом выясняется, каким требованиям должны удовлетворять факторы, лежащие в основе матрицы исходных данных.

При обсуждении проблем факторного анализа часто возникает вопрос: можно ли провести факторный анализ по исходным данным, представленным в трехмерном пространстве? Классический факторный анализ ограничивается матрицей порядка , где — переменные (признаки), — индивидуумы (объекты). Это было бы большим достижением в факторном анализе — создать методику факторного эксперимента для матрицы исходных данных в многомерном пространстве, не представляя ее каждый раз последовательно в двух направлениях, как это обычно делается сейчас (признаки — объекты). Хорст [142; 3] дал обзор возникающих при этом возможных вариантов. Новейшие работы Тукера, Хорста и Левина посвящены распространению методов факторного анализа на матрицу исходных данных в многомерно пространстве.

В настоящее время остается только выжидать, какой из предлагаемых подходов к таким матрицам оправдает себя на практике.

В заключение следует указать на то, что метод факторного анализа Можно применить к результатам классического эксперимента. В этом случае в матрицу исходных данных наряду с обычными наблюдаемыми величинами вводят в качестве переменных варьирование условий эксперимента. Каттелл в своей книге [35; 4] рассмотрел несколько подходов к решению таких задач. Но они не нашли пока практического применения. Теоретически эти подходы также еще не разработаны, на что указал Уолш [300]. В справочнике, изданном под редакцией Каттелла [35; 21], этот вопрос с указанием примеров затрагивается Фрюхтером. Применение факторного анализа к результатам классического эксперимента, в котором произвольно варьируют факторами, позволит использовать достоинства факторного и дисперсионного анализа. Соединение этих двух методов многомерного статистического анализа вполне возможно и перспективно, хотя еще полностью теоретически не разработано.

<< Предыдущий параграф Следующий параграф >>
Оглавление