ЕГЭ и ОГЭ
Хочу знать
Главная > Математика > Факторный анализ (Иберла К.)
<< Предыдущий параграф
Следующий параграф >>
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
<< Предыдущий параграф Следующий параграф >>
Научная библиотека

Научная библиотека

избранных естественно-научных изданий

Научная библиотека служит для получения быстрого и удобного доступа к информации естественно-научных изданий, получивших широкое распространение в России и за рубежом. На сайте впервые широкой публике представлены некоторые авторские издания написанные ведущими учеными страны.

Во избежании нарушения авторского права, материал библиотеки доступен по паролю ограниченному кругу студентов и преподавателей вузов. Исключение составляют авторские издания, на которые имеются разрешения публикации в открытой печати.

Математика

Физика

Методы обработки сигналов

Схемотехника

Астрономия

Разное

Научная библиотека

Научная библиотека

избранных естественно-научных изданий

Научная библиотека служит для получения быстрого и удобного доступа к информации естественно-научных изданий, получивших широкое распространение в России и за рубежом. На сайте впервые широкой публике представлены некоторые авторские издания написанные ведущими учеными страны.

Во избежании нарушения авторского права, материал библиотеки доступен по паролю ограниченному кругу студентов и преподавателей вузов. Исключение составляют авторские издания, на которые имеются разрешения публикации в открытой печати.

Математика

Физика

Методы обработки сигналов

Схемотехника

Астрономия

Разное

Макеты страниц

2.2.2. Классификация факторов и связь между отдельными видами факторов

Задачей факторного анализа является определение матрицы А. Следует иметь в виду, что за время развития идей факторного анализа вошел в употребление ряд терминов, строго не дифференцированных. Но они имеют практическое значение, так как часто встречаются в литературе, и, кроме того, заслуживают внимания из-за своего основополагающего значения. Поэтому мы будем останавливаться на этих терминах. Как уже отмечалось, матрица А называется факторным отображением, а ее элементы — факторными нагрузками. При ортогональных факторах, которые мы до сих пор исключительно и рассматривали, элементы принимают значения между —1 и +1.

Если факторы не ортогональны, то элементы могут принимать большие значения. Здесь мы ограничимся только этим замечанием. Каждый фактор характеризуется столбцом, каждая переменная — строкой матрицы А. Если факторная нагрузка значительно больше или меньше нуля, то принята упрощенная форма записи в виде крестика в соответствующем месте факторного отображения (см. рис. 2.3).

Выражение «значительно больше или меньше нуля» здесь означает не в математическом смысле, а такое значение которое превосходит более или менее произвольное или заданное на определенном уровне значимости критическое значение. Это критическое значение не требует более точного определения для введения дальнейших понятий.

Пока нам достаточно лишь указать в каждом конкретном случае это критическое значение, которое позволяет выделить, различные виды факторов, если фактора превосходит это значение. При этом всеми другими нагрузками этого фактора пренебрегают, т. е. факторное отображение упрощается. Нагрузки, которые считаются существенными, обозначаются на схеме факторного отображения крестиком (X), а пустые клетки матрицы А соответствуют нагрузкам, которыми можно пренебречь.

Рис. 2.3. Схематическое изображение факторного отображения. Крестик X означает высокую факторную нагрузку

Фактор называется генеральным (general factor), если все его нагрузки значительно отличаются от нуля. Следовательно, он имеет нагрузки от всех переменных и схематически такой фактор изображается столбиком А на рис. 2.3. Фактор называется общим (common factor), если хотя бы две его нагрузки значительно отличаются от нуля. Столбики А, В, С на рис. 2.3 представляют такие общие факторы. Они имеют нагрузки от двух и более переменных. Они могут взаимно перекрываться, т. е. одни и те же переменные могут давать нагрузки на несколько факторов. Генеральный фактор является частным случаем общих факторов, так как он имеет более двух значимых нагрузок. В противоположность этому факторы являются индивидуальными, если у них только одна нагрузка значительно отличается от нуля (см. столбики на рис. 2.3). В этом случае говорят о характерных факторах (unique factors), которые представляют только одну переменную. По аналогии с факторами можно провести классификацию переменных по числу достаточно высоких нагрузок. Число высоких нагрузок переменной на общие факторы называется ее сложностью (complexity). Например, переменная 1 на рис. 2.3 имеет сложность Два, переменная 4 — три.

Решающее значение в факторном отображении на рис. 2.3 имеют общие факторы А, В, С. Как будет еще показано, характерные факторы получаются автоматически, если общие факторы установлены.

Гипотеза, которая содержит факторное отображение на рис. 2.3, может быть представлена в другой форме на рис. 2.4. Связь трех факторов Л, В, С с восемью переменными изображена прямыми.

Любая матрица, которая, например, содержит общие факторы A, B, C, отражает дифференцированные гипотезы о структуре величин, которые отчасти стоят за наблюдаемыми переменными (т. е. являются факторами), а отчасти сами являются переменными. Рис. 2.3 и 2.4 соответствуют друг другу. Хотя это и наглядно, результат факторного анализа не изображается графически в форме, приведенной на рис. 2.4. Чаще всего используется схема рис. 2.3. При любом факторном отображении легко перейти от одного способа изображения к другому. Общие факторы для отличия их от переменных обозначаются здесь буквами А, В и С. Однако чаще всего они обозначаются римскими цифрами.

Рис. 2.4. Структура гипотезы факторного отображения рис. 2.3. Прямые, соединяющие факторы А, В, С с переменными, соответствуют высоким факторным нагрузкам

Нагрузки общих и характерных факторов связаны определенным соотношением через единичную дисперсию переменных. Действительно, эта единичная дисперсия равна:

Подставляя значения из (2.12) в (2.17) (причем мы берем не факторов, а при этом ), в результате получим

Теперь постулируем, что факторы должны быть стандартизованы и некоррелированы, тогда суммы — и т. д. все равны 1, а суммы в скобках все равны 0. Итак, имеем

Сумма квадратов всех нагрузок одной переменной равна единице. Равенство (2.18) выполняется при условии, что переменные стандартизованы, факторы стандартизованы и некоррелированы и в основу положена линейная модель.

Соблюдение этих условий является необходимым требованием при использовании наиболее употребляемых сегодня методов. Равенство (2.18) можно записать в более модифицированном виде (2.19), где в скобках сначала приведены нагрузки общих факторов, а затем — доля дисперсии характерного фактора. Равенство (2.19) отличается от (2.18) лишь последними тремя членами.

Полная дисперсия переменной по равенству (2.19) раскладывается на отдельные компоненты, которые представляют собой квадраты факторных нагрузок. Для наглядности это разложение графически представлено на рис. 2.5. Суммы квадратов нагрузок общих факторов называются общностью (communality) . Это та доля дисперсии, которая указана в скобках равенства (2.19).

Общность представляет собой часть единичной дисперсии переменной, которую можно приписать общим факторам. Она равна квадрату коэффициента множественной корреляции между переменной и общими факторами. Если из 1 вычесть , то останется доля дисперсии, обозначаемая которая соответствует квадрату нагрузки определенного характерного фактора. Далее и называется характерностью. Она представляет собой часть единичной дисперсии переменной, которая не связана с общими факторами:

Как показывает вторая половина равенства, характерность можно разбить на две составляющие, одна из которых, называется специфичностью, а другая, является дисперсией, обусловленной ошибкой. Такое разделение на практике проводится редко. Специфичность является той долей единичной дисперсии переменной, которая не связана с общими факторами, не может быть также сведена к ошибке и присуща лишь одной определенной переменной. Специфичность и общность образуют надежность (reliability).

Надежность, являясь долей единичной дисперсии, дополняет дисперсию ошибки до единицы. Она может быть измерена различными способами, описание которых можно найти в [69]. Здесь этот вопрос подробно рассматриваться не будет. В любом случае из (2.22) следует, что общность не превышает надежности и равна ей только в случае нулевой специфичности.

Приведенные только что понятия графически представлены на рис. 2.5. Первая строчка на рисунке представляет собой дисперсию любой переменной, приведенную к единице, или 100%.

Эту единичную дисперсию можно разбить на две составляющие: общность , которая обусловливается общими для нескольких переменных факторами, и характерность , которая может быть приписана только этой переменной (вторая строчка на рисунке). Обе составляющие можно расчленить еще дальше (третья строка на рисунке), а именно: на квадраты отдельных факторных нагрузок, дисперсию ошибки и специфичность Сумма общности и специфичности образует надежность, и она является дополнением дисперсии ошибки до единицы (четвертая строка рисунка).

Теперь поставим задачу — получить общность и соответствующий характерный фактор из корреляционной матрицы. Основная модель факторного анализа записывается следующим образом: (равенство ).

Рис. 2.5. Составляющие полной дисперсии переменной по равенству (2.19)

В этой модели не проводите я разницы между общими и характерными факторами. В равенстве (2.23) постулируется для каждой переменной характерный фактор. Эта специальная модель многофакторного метода имеет следующий вид:

или в матричной форме:

При этом Z является, как и в равенстве (2.13), матрицей исходных данных, записанных в стандартизованной форме. F — факторное отображение, включающее характерные факторы, т. е. F является матрицей порядка, имеет размер и содержит значения факторов у отдельных индивидуумов, включая значения характерных факторов. Подробно это записывается в следующем виде:

F можно представить в виде суммы двух матриц, а именно (равенство (2.25)). F представляет собой так называемую полную факторную матрицу. Она содержит нагрузки общих и характерных факторов. А является редуцированной факторной матрицей, содержащей нагрузки общих факторов. Она дополняется справа на столбцов путем присоединения нулевых элементов. Это дополнение необходимо только для последующих математических выкладок. В общем под А понимается так же, как в равенствах (2.13)-(2.15), матрица нагрузок общих факторов. С этой матрицей А обычно работают (и она приводится в литературе), так как полная факторная матрица и U легко получаются из нее (по формуле ). Матрица U является диагональной и содержит нагрузки характерных факторов на главной диагонали. Она дополняется слева на столбцов путем присоединения нулевых элементов.

где

Применив фундаментальную теорему, можем записать:

Путем соответствующих выкладок легко показать, что Следовательно,

Так как (при этом матрицы можем рассматривать без их дополнений), то

или

R — корреляционная матрица с единицами на главной диагонали; — корреляционная матрица с общностями на главной диагонали. Ее называют также редуцированной корреляционной матрицей:

Элементами матрицы соответственно являются

Наконец, является диагональной матрицей с характерностями на главной диагонали, равенства (2.28) видно, что выбором диагональных элементов устанавливаются величины общностей, а в необходимости их определения мы уже убедились во вводных примерах.

До сих пор предполагалось, что факторы не коррелированы друг с другом, т. е. речь шла только об ортогональных факторах. Это было удобно для упрощения формулировки задачи и математической записи решения. Однако, если подходить с общенаучной точки зрения, постулирование только ортогональных факторов сужает проблему, хотя этим достигается упрощенная в математическом смысле «идеальная картина». И надо иметь в виду, что в действительности она встречается редко, так как многие влияющие факторы наверняка коррелируют друг с другом. Поэтому мы хотели бы вначале формально обсудить возможность косоугольных факторов и соотношения между ними.

Выше была выведена формула , где С является матрицей коэффициентов корреляции между факторами. Вначале для упрощения уравнения мы постулировали, что и получали частное решение. Решение же в общем случае усложняется. Однако если вначале вычислить ортогональную матрицу А, то можно вслед за тем искать решение для косоугольных факторов по критериям, которые еще будут обсуждаться. Получение однозначного решения для косоугольных факторов более сложно. Обычно задается либо С, либо матрица которая содержит коэффициенты корреляции между переменными и факторами и называется факторной структурой (factor structure). Далее для матриц с косоугольной факторной структурой используется обозначение V. Индексы обозначают факторную структуру. Позднее остановимся на различных видах этих матриц.

или в подробной записи:

Итак, для коэффициентов корреляции между переменными и факторами имеет место соотношение по (2.29):

(2.30)

При , т. е. в случае ортогональных факторов факторное отображение идентично структуре: Тогда в правой стороне равенства (2.30) остается только один член, а именно тот, множителем которого является с так как при всех .

Все представленные до сих пор равенства и определения содержат важнейшие концепций факторного анализа, а также основную и специальную модели многофакторного анализа. С их помощью теперь можно приступить к описанию общей процедуры решения.

<< Предыдущий параграф Следующий параграф >>
Оглавление