ЕГЭ и ОГЭ
Хочу знать
Главная > Математика > Факторный анализ (Иберла К.)
<< Предыдущий параграф
Следующий параграф >>
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
<< Предыдущий параграф Следующий параграф >>
Научная библиотека

Научная библиотека

избранных естественно-научных изданий

Научная библиотека служит для получения быстрого и удобного доступа к информации естественно-научных изданий, получивших широкое распространение в России и за рубежом. На сайте впервые широкой публике представлены некоторые авторские издания написанные ведущими учеными страны.

Во избежании нарушения авторского права, материал библиотеки доступен по паролю ограниченному кругу студентов и преподавателей вузов. Исключение составляют авторские издания, на которые имеются разрешения публикации в открытой печати.

Математика

Физика

Методы обработки сигналов

Схемотехника

Астрономия

Разное

Научная библиотека

Научная библиотека

избранных естественно-научных изданий

Научная библиотека служит для получения быстрого и удобного доступа к информации естественно-научных изданий, получивших широкое распространение в России и за рубежом. На сайте впервые широкой публике представлены некоторые авторские издания написанные ведущими учеными страны.

Во избежании нарушения авторского права, материал библиотеки доступен по паролю ограниченному кругу студентов и преподавателей вузов. Исключение составляют авторские издания, на которые имеются разрешения публикации в открытой печати.

Математика

Физика

Методы обработки сигналов

Схемотехника

Астрономия

Разное

Макеты страниц

2.2. ОСНОВНЫЕ УРАВНЕНИЯ И КОНЦЕПЦИИ В АЛГЕБРАИЧЕСКОЙ ФОРМЕ

В этой главе намечаются общие границы, внутри которых будут обсуждаться различные виды факторного анализа. Так как факторный анализ не имеет единой и законченной структуры, необходима такая формальная система соотношений, которая помогла бы сопоставить между собой отдельные способы решения.

Очевидно, что приводимые далее уравнения и определения начинающий воспримет с некоторыми затруднениями. Однако они составляют необходимую канву, без которой не обойтись. Читателю рекомендуется при освоении этой вступительной главы выполнять самостоятельно на бумаге соответствующие преобразования. Это поможет ему освежить в памяти или усвоить основные операции с матрицами, которые уже были описаны в гл. 1.4. Факторный анализ невозможен без знания матричного исчисления, поэтому матричная форма записи используется с самого начала. Также сразу даются и матричные уравнения, чтобы ввести читателя в курс дела. При этом задача заключается не просто в ознакомлении с материалом, а в освоении метода. Это освоение облегчается, если чтение сопровождается записью матриц, их элементов и вдумчивым отношением к приводимым матричным уравнениям.

2.2.1. Фундаментальная теорема

Пусть исходные данные записаны в виде матрицы , где индекс относится к переменным, а индекс к индивидуумам. Коэффициент корреляции между двумя переменными i и k вычисляется по известной формуле

где среднее значение, стандартное отклонение и — ковариация.

Если все переменных Y подвергнем следующему преобразованию

то матрица будет удовлетворять следующим условиям:

т. е. все средние значения переменных Z равны нулю, а все дисперсии равны единице. Строки матрицы Z называют стандартизованными, или нормированными, переменными, a называют также стандартизованным значением (standard score). Такое нормирование всегда возможно. Если исходить из стандартизованных переменных, то формула (2.8) упрощается:

(2-10)

т. е. для стандартизованных переменных коэффициенты корреляции и ковариации равны.

Для корреляционной и ковариационной матриц R и S имеет место соотношение

В формуле (2.11) выражение является скаляром, -матрицей стандартизованных исходных данных, R — корреляционной матрицей и S — ковариационной матрицей. С корреляционной матрицей мы уже знакомились неоднократно. Она имеет размер , диагональные элементы отражают корреляцию переменных самих с собой, следовательно, они равны единице. Матрица также является симметрической, т. е. Корреляционная или ковариационная матрица является отправной точкой факторного анализа. Хотя обе матрицы при указанных условиях идентичны, но исторически так сложилось, что большей частью выбирали корреляционную матрицу, поэтому далее будем также исходить из стандартизованных переменных и матрицы R. В принципе можно было бы исходить из ковариационной матрицы. В этом случае пришли бы к аналогичным формулировкам.

Целью любого метода факторного анализа является представление величины т. е. элемента матрицы Z, в виде линейной комбинации нескольких гипотетических переменных, или факторов. Положим, что значение может быть выражено в виде линейной комбинации факторов.

(2.12)

Это равенство выражает основную модель факторного анализа. Здесь являются постоянными коэффициентами, которые следует определить; — значениями факторов у индивидуума (factor scores). Используя матричную форму записи, для всех имеем

где Z является матрицей порядка стандартизованных переменных — исходных данных. Это равенство приводится еще раз на следующей странице в развернутом виде. является матрицей порядка , которую нужно определить. Она называется факторным отображением (factor pattern), а ее коэффициенты — факторными нагрузками (factor loadings). А является матрицей коэффициентов регрессии факторов по переменным; — матрицей порядка значений всех факторов у всех индивидуумов и должна быть также пронормирована построчно.

Как видно из равенства 2.13, матрица Z представляет собой произведение двух матриц: А и Р. При этом матрица А отражает связи переменных с факторами, а Р описывает отдельные индивидуумы.

В (2.13) А и Р неизвестны, известна лишь Z. Уравнение без введения дополнительных ограничений имеет бесконечное множество решений. Эти ограничения также составляют основную посылку всех методов факторного анализа. Отдельные наблюдаемые значения являются линейными комбинациями гипотетических, ненаблюдаемых, или скрытых, переменных, называемых факторами, которые не могут быть обнаружены в процессе наблюдения. Равенство (2.12) или (2.13) является математической моделью, причем мы еще не рассматривали ее со статистической точки зрения, например, не касались оценки параметров генеральной совокупности по результатам выборки. Подставив (2.13) в (2.11), получим

Теперь по аналогии с формулой (2.11) можно утверждать, что выражение является корреляционной матрицей, отражающей связи между факторами, т. е.

Если наложить на это равенство условие некоррелированности факторов, т. е. то в результате получим

Тэрстоун называет (2.14) и (2.15) фундаментальной теоремой факторного анализа. С является матрицей коэффициентов корреляции между факторами. В том случае, когда постулируются ортогональные факторы, С становится единичной матрицей и при умножении ее опускают.

Фундаментальная теорема утверждает, что корреляционная матрица может быть воспроизведена с помощью факторного отображения и корреляций между факторами. Это положение уже было проиллюстрировано вводными примерами. Равенство (2.15) является отправной точкой классического метода решения. Однако нам бы хотелось пока воздержаться от обсуждения различных методов решения.

Для наглядности еще раз приведем равенства (2.13) и (2.14) в более подробной записи:

Для каждого отдельного элемента матщы Z имеет место равенство (2.12).

При получаем (2.15); тогда для каждого отдельного элемента матрицы R имеет место выражение

Здесь следует указать на основополагающее значение равенств (2.13), (2.14) и (2.15) и в дальнейшем предполагается их формальное понимание. Они выражают основную модель факторного анализа, из которой далее можно исходить при создании различных специальных моделей.

В гл. 2.1 мы уже познакомились с простым числовым примером. Числа были подобраны так, чтобы можно было легко произвести вычисления. В определенной степени процедура факторного анализа обратима. Так, если в правой части равенства (2.15) находится А, то в левой части обязательно получим R:

Первый элемент матрицы R получается следующим образом: . Он не равен единице, как это должно было быть в корреляционной матрице.

Значение первого элемента заключается в скобки и называется общностью. Это понятие мы будем еще обсуждать более детально. Второй элемент первого столбца равен: . Совершенно аналогично получаются другие элементы матрицы R путем перемножения матриц А и А' по соответствующему правилу. В факторном анализе эта процедура обратима: Может быть задана корреляционная матрица R и по ней находится А. Здесь была задана А и по ней определялась R. Указанные в примере числа удовлетворяют равенству (2.15). Можно легко сконструировать самостоятельно другие примеры.

<< Предыдущий параграф Следующий параграф >>
Оглавление