ЕГЭ и ОГЭ
Хочу знать
Главная > Математика > Факторный анализ (Иберла К.)
<< Предыдущий параграф
Следующий параграф >>
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

4. ПРОБЛЕМА ОБЩНОСТИ

4.1. ВВЕДЕНИЕ

По определению, общность переменной i равна сумме квадратов нагрузок общих факторов (см. формулу (2.20)). Форма записи общности указывает на то, что речь идет о компоненте дисперсии. Так как дисперсия каждой переменной приводится к единице, общность является долей единичной дисперсии, которая обусловливается общими для нескольких переменных факторами. Из равенств (2.24)- (2.28) следует, что подбор диагональных элементов матрицы R равносилен определению общей дисперсии каждой переменной. Общности, следовательно, являются диагональными элементами корреляционной матрицы. Оценка величин диагональных элементов должна производиться перед выделением факторов, и это составляет проблему общности.

Необходимость подбора значений общностей меньше единицы, вытекает из модели факторного анализа. Модель классического факторного анализа содержит ряд общих факторов и по одному характерному на каждую переменную. Таким образом, каждая переменная обладает общностью, которая должна быть меньше единицы. В предельном случае, когда общая дисперсия приближается к единице, общность также равна единице. Из формулы (2.19) следует, что если сумма членов в скобках, т. е. приближается к единице, то значения специфичности и дисперсии, обусловленной ошибкой, должны быть около нуля, так как полная дисперсия согласно введенному определению не должна превышать единицы. Такой крайний случай, когда дисперсия ошибки и специфичность равны нулю, на практике не встречается, так как погрешности измерения всегда присутствуют в экспериментах в той или иной мере, а только тогда равна нулю, когда одна и та же переменная два раза включается в анализ. В этом случае специфичные факторы обеих одинаковых переменных становятся одним общим фактором. В модели факторного анализа проводится различие между общими и характерными факторами» К модели компонентного анализа это требование не предъявляется (см. с. 103).

Итак, общности могут принимать значения от нуля до единицы. При известной корреляционной матрице эту область принятия значений можно ограничить еще больше. Дуайер [79; 2] доказал, что всегда имеет место неравенство

где - коэффициент множественной корреляции переменной с остальными переменными.

Квадрат этого коэффициента является нижней границей оценки общности. Кроме того, Гуттман [112; 1] показал, что при неограниченном возрастании числа переменных при постоянном числе факторов значение общности каждой переменной приближается к квадрату коэффициента множественной корреляции, т. е. в (4.1) обеспечивается равенство. Верхняя граница значения общности определяется формулой (2.22). К сожалению, коэффициент надежности вычисляется в редких случаях, так как повторные измерения производятся не часто. Таким образом, можно сделать вывод, что общность переменной не меньше квадрата коэффициента множественной корреляции и не превосходит квадрата коэффициента надежности.

Определение общности переменной как суммы квадратов нагрузок общих факторов формально и не дает однозначного ответа при оценке общности. Уже из определения общности видно, что она тесно связана с числом общих факторов. Проблема общности является уязвимым местом многофакторного анализа. Мнения отдельных авторов о способах оценки общностей сильно расходятся. В научной литературе ведется обширная дискуссия на разных теоретических уровнях, результатом которой являются различные предложения от простых вычислительных процедур до сложных математических выкладок. При разработке методов оценки общностей исходят из различных концепций. В итоге в настоящее время разработано довольно много вычислительных процедур; некоторые из них мы коротко разберем. Но это не означает, что мы претендуем на право подвести итоги дискуссии по данной проблеме и тем самым завершить ее.

Тэрстоун предлагал при оценке общности исходить из выборочных коэффициентов корреляции, стремясь при подборе к уменьшению ранга исходной матрицы R. Основная идея состоит в том, что выборочные коэффициенты корреляции должны определять значения общностей или что по меньшей мере выбранные значения общностей должны удовлетворять заданному рангу корреляционной матрицы. Тэрстоун указал только эмпирические методы и разработал практические вычислительные процедуры без достаточного теоретического обоснования. Для проверки проведенных выкладок коэффициенты корреляции, вычисленные по найденным значениям общностей, сравниваются с выборочными характеристиками. Оценка общностей считается удовлетворительной при наименьшем из возможных различий.

Другие авторы много занимались поиском аналитических решений проблемы (например, Альберт [4]. Проблема общности и факторная проблема тесно переплетены между собой.

Если значения общностей установлены, то все элементы Матрицы определены и тем самым установлен ранг этой матрицы, т. е. минимально необходимое число факторов, вызывающих корреляцию переменных. Могут иметь место два альтернативных случая. В первом случае вначале определяют общности, а затем число выделяемых факторов (прямая оценка общностей). Во втором случае сначала устанавливают число факторов, подлежащих выделению, а затем подбирают значения общностей таким образом, чтобы ранг матрицы приближался к этому числу г. Продолжительное время проблема общности формулировалась следующим образом: при известных недиагональных элементах матрицы R нужно подобрать такие значения диагональных элементов, чтобы ранг полученной редуцированной матрицы был по возможности минимальным. Но эта формулировка и нахождение оценок общностей при минимальном ранге используются только при аналитическом подходе к решению проблемы. Имеются другие методы, дающие более правдоподобные оценки общностей.

Определение общностей в статистических терминах дано Лоули [182; 1] и Рао [230; 3]. Это такие величины, которые при статистически значимых факторах делают возможным наилучшее воспроизведение корреляционной матрицы. Значимые факторы и общности получаются в результате итеративных процедур.

На практике при определении общностей в конкретном случае выбор теоретического подхода имеет второстепенное значение. Как будет еще показано, при большом числе переменных вполне достаточно грубых оценок. Читатель, интересующийся теоретическими вопросами, может обратиться к обзору, приведенному у Хармана [117], а также к публикациям Альберта [4; 2], Гуттмана [112] и Райгли [323]. В большинстве случаев решение проблемы общности состоит в нахождении соответствующих значений которые определяют общую дисперсию каждой переменной и удовлетворяют двойному неравенству (4.2).

<< Предыдущий параграф Следующий параграф >>
Оглавление