ЕГЭ и ОГЭ
Хочу знать
Главная > Математика > Факторный анализ (Иберла К.)
<< Предыдущий параграф
Следующий параграф >>
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
<< Предыдущий параграф Следующий параграф >>
Научная библиотека

Научная библиотека

избранных естественно-научных изданий

Научная библиотека служит для получения быстрого и удобного доступа к информации естественно-научных изданий, получивших широкое распространение в России и за рубежом. На сайте впервые широкой публике представлены некоторые авторские издания написанные ведущими учеными страны.

Во избежании нарушения авторского права, материал библиотеки доступен по паролю ограниченному кругу студентов и преподавателей вузов. Исключение составляют авторские издания, на которые имеются разрешения публикации в открытой печати.

Математика

Физика

Методы обработки сигналов

Схемотехника

Астрономия

Разное

Научная библиотека

Научная библиотека

избранных естественно-научных изданий

Научная библиотека служит для получения быстрого и удобного доступа к информации естественно-научных изданий, получивших широкое распространение в России и за рубежом. На сайте впервые широкой публике представлены некоторые авторские издания написанные ведущими учеными страны.

Во избежании нарушения авторского права, материал библиотеки доступен по паролю ограниченному кругу студентов и преподавателей вузов. Исключение составляют авторские издания, на которые имеются разрешения публикации в открытой печати.

Математика

Физика

Методы обработки сигналов

Схемотехника

Астрономия

Разное

Макеты страниц

8.3. ПРЕОБРАЗОВАНИЕ МАТРИЦЫ ИСХОДНЫХ ДАННЫХ

До сих пор мы в факторном анализе исходили из матрицы исходных данных, непосредственно полученных в результате эксперимента. Однако иногда бывает полезно преобразовать исходные данные. Этот вопрос, подобно только что рассмотренному нами в гл. 8.2, еще мало изучен.

К преобразованию исходных данных обычно прибегают для того, чтобы перейти от нелинейной связи между переменными к линейной. Это связано с тем, что коэффициент парной корреляции непригоден для оценки степени тесноты связи между переменными, если связь между ними нелинейная. Путем соответствующих преобразований, например путем логарифмирования, извлечения квадратного корня и т. д., пытаются достигнуть линейной связи между переменными, но это не всегда удается. Трудность заключается в подборе функции преобразования.

Проблема преобразования переменных вызывает много споров. В факторном анализе дело осложняется тем, что нельзя преобразовывать только одну переменную или часть их, так как при таком подходе может возникнуть фактор, обусловленный в основном этим преобразованием. Преобразование же всего набора переменных тоже может вызвать нежелательный эффект. Дело в том, что нередко между частью переменных существует линейная связь. Тогда при линеаризации всего набора первоначальные линейные связи между переменными трансформируются. Вопрос подбора такой функции преобразования, которая бы как можно больше связей между переменными, входящими в корреляционную матрицу, приводила к линейной форме, еще окончательно не решен. В настоящее время при большом числе переменных преобразование чаще всего не приводит к желаемому эффекту, так как больше линейных связей теряют, чем приобретают.

Хорст [142; 3] дал обзор методов преобразования матрицы исходных данных, когда все переменные подвергаются преобразованию. Этим же вопросом занимался Каттелл [35; 4, 18]. Формально способы преобразования разделяются на две группы. В первой группе способов смещается среднее значение (по строкам или столбцам матрицы исходных данных). Во второй группе способов изменяют также стандартное отклонение. Заранее ясно, что преобразование оказывает влияние на результат факторного анализа. Шкалирование величин, т. е. выбор единицы измерения или стандартного отклонения, связано также с проблемой общности. Имеются такие методы факторного анализа, применение которых дает решения, не зависящие от выбранной шкалы оценок значений переменных (например, канонический факторный анализ, см. 3.5.1-3.5.3). Но, к сожалению, это нельзя утверждать относительно самого распространенного метода факторного анализа — метода главных факторов.

Рассмотрим три способа преобразования матрицы исходных данных, заключающиеся в том, что средние значения переменных или средние значения результатов наблюдений над переменными у каждого индивидуума, или и те и другие вместе приводятся к нулю. Это преобразование может применяться к матрицам, у которых переменные соответствуют строкам, а индивидуумы — столбцам, и наоборот.

Преобразование строк матрицы исходных данных. Пусть в матрице строки соответствуют переменным, а столбцы — индивидуумам. Чтобы среднее значение каждой переменной было равно нулю, из всех значений элементов строки вычитается соответствующее среднее значение переменной.

Это можно записать следующим образом:

В формуле 8.1, 1 — тождественная матрица, 1 — вектор-столбец, все элементы которого равны единице, — матрица исходных данных, строки которой преобразованы так, что средние значения их элементов равны нулю. Матрица в скобках имеет порядок Диагональные элементы ее равны а внедиагональные — Легко можно убедиться, что матрица содержит отклонения отдельных значений от соответствующих средних значений по строкам. Для наглядности запишем (8.1) в более подробном виде:

Для первого элемента матрицы получим: Аналогично получаются выражения остальных элементов матрицы, как отклонения значений элементов матрицы от средних значений по строкам. Матрицу называют центрированной справа матрицей исходных данных, или центрированной по строкам. Хорст [142; 3] этот способ преобразования называет преобразованием с увеличением (major transformation), так как размер матрицы преобразования больше размера матрицы Y. Итак, все переменные стали центрированными величинами, средние значения которых равны нулю. Этот способ преобразования не изменяет величину коэффициента корреляции между переменными. Поэтому можем записать:

Следует иметь в виду, что ковариационная матрица при таком преобразовании переменных изменится. Но так как в факторном анализе мы исходим из корреляционной матрицы, переход к центрированным величинам, не окажет влияния на его результат.

Преобразование столбцов матрицы исходных данных. Аналогичным образом можно преобразовать столбцы матрицы исходных данных так, чтобы среднее значение элементов каждого столбца было равно нулю. Для этого матрица исходных данных умножается слева на квадратную матрицу в скобках порядка :

Матрица называется центрированной слева или центрированной по столбцам. Хорст [142, 3] этот способ преобразования называет преобразованием с уменьшением (minor transformation). В матрице Y все значения элементов столбцов являются центрированными, т. е. их средние значения равны нулю. Выполнять такое преобразование имеет смысл тогда, когда хотят сравнить различные переменные на одном индивидууме, а различием между индивидуумами не интересуются. Такая задача может возникнуть, например, при изучении мотивов поведения людей, когда всем лицам приписывается одинаковый характер поведения (поэтому средние значения приводятся к нулю), а индивидуальные особенности сильно варьируют. Анализ с такими данными (ipsatized scores) проводился многими исследователями (см., например, Каттелла, Максвелла, Лайта и Унгера [45]; Каттелла и Баггалея [36]; Каттелла и Хорна [43], а также Каттелла [35; 18]). Сравнение результатов факторного анализа, проведенного по обычной матрице исходных данных и по матрице с преобразованными столбцами, показывает, что при этом преобразовании число выделенных факторов уменьшается на один. Соответствующий пример и сравнение двух результатов приведены у Райта [322].

Преобразование столбцов и строк матрицы исходных данных. Оба способа преобразования, описанные выше, можно выполнить последовательно друг за другом на одной и той же матрице исходных данных. В результате получают матрицу, элементы которой по строкам и столбцам имеют средние значения, равные нулю. Такую матрицу называют матрицей с двойным преобразованием, или дважды центрированной. Процесс преобразования можно представить в матричной форме таким образом:

Результаты матричного анализа, проведенного по матрице будут отличаться от результатов анализа по первичной матрице исходных данных Y. Хорст в своей книге [142; 3] установил связь между результатами факторных анализов, проведенных по ковариационным матрицам. Ковариационные матрицы были вычислены по матрице исходных данных, подвергнутой преобразованию дважды, а также центрированной справа и отдельно слева. Вопросы эквивалентности и взаимосвязи между факторными решениями при подобного рода преобразованиях еще до конца не изучены.

Возможны и другие преобразования матрицы исходных данных. Очень редко переменные преобразовывают так, что их средние становятся равными не нулю, а каким-то другим определенным значениям. В некоторых случаях матрицу исходных данных нормируют по строкам или столбцам путем деления значений элементов на соответствующие стандартные отклонения. У нормированной таким образом матрицы стандартные отклонения значений элементов по строкам или соответственно по столбцам равны единице. Какое влияние на факторное решение оказывают подобные преобразования матрицы исходных данных, остается пока еще не выясненным.

<< Предыдущий параграф Следующий параграф >>
Оглавление