ЕГЭ и ОГЭ
Хочу знать
Главная > Математика > Факторный анализ (Окунь. Я.)
<< Предыдущий параграф
Следующий параграф >>
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

ПРИЛОЖЕНИЕ К РУССКОМУ ИЗДАНИЮ

Жан-Пьер Балладур

ФАКТОРНЫЙ АНАЛИЗ СООТВЕТСТВИЙ

ВВЕДЕНИЕ

Существует много методов анализа исходных данных. Такие методы, как простая линейная регрессионная модель или анализ дисперсий и ковариаций, позволяют исследовать количественные переменные. Труды профессора Бензекри ввели во Франции факторный анализ соответствий, который посвящен специально изучению качественных признаков множества исходных данных и который может найти широкое применение как в биологии, так и в общественных науках. Цель настоящей работы состоит в изложении основ этого метода. Анализ соответствий предназначен для изучения качественных признаков и применяется к таблице смежности двух или более признаков. Рассмотрим, например, таблицу смежности, построенную по выборке объема N из самодеятельного французского населения и фиксирующую такие два признака:

1) социально-профессиональную категорию (десять значений, );

2) департамент, в котором данное лицо постоянно проживает (девяносто пять значений,

Эта таблица, состоящая из десяти строк и девяноста пяти столбцов, задает очевидным образом число лиц из выборки, относящихся к категории i и проживающих в департаменте

Относительно какой меры анализ таблицы смежности может сформулировать утверждение о том, что два или более департамента «близки» или «далеки» по социально-профессиональному распределению своего самодеятельного населения, т. е. относительно какой меры можно рассматривать социально-профессиональные структуры двух или более департаментов как сходные или, напротив, весьма несходные? Возникает также симметричная проблема: каким образом на основе географического распределения социально-профессиональных категорий можно сближать те из них, которые мало отличаются по своему географическому профилю? В случае, когда определен способ измерения для проблем такого рода, как рассматривать в целом соотнесение близостей в поведении различных значений одного признака (департамента постоянного местожительства) относительно другого признака (социально-профессиональной категории)?

Анализ соответствий предлагает решение таких проблем. Для этого он вводит способ измерения (расстояние) и способ визуального рассмотрения (проекцию на пространства малых размерностей — чаще всего одномерные или двумерные).

1. ОБЩИЕ ЗАМЕЧАНИЯ

Важно уже сейчас отметить, что анализ соответствий основывается на статистических распределениях значений нескольких признаков в заданной генеральной совокупности. Так, например, в случае анализа типов покупателей автомобилей с точки зрения их социально-профессиональной категории нет никаких оснований полагать, что результаты анализа будут идентичны для немецких и для французских покупателей.

2. ОБОЗНАЧЕНИЯ

2.1. Пусть имеется генеральная совокупность на которой определены два признака принимающие соответственно значений, где М и N — натуральные числа (случай непрерывно изменяющегося признака можно свести к предыдущему, распределив значения, которые он может принимать, по конечному числу классов). Значение признака 1 (соответственно J) указывается индексом i (соответственно ), меняющимся от 1 до М (соответственно N). Вероятность того, что объект из одновременно принимает значение i по признаку I и значение по признаку J, будет обозначаться через . В случае, когда таблица смежности строится по выборке объема Т из генеральной совокупности Q, под вероятностью подразумевают частоту, с которой пара наблюдается в выборке, т. е.:

где

2.2. Вероятность того, что объект принимает значение i, по признаку будет обозначаться через Р; (соответствующая вероятность для значения признака J — через ):

откуда следует, что

2.3. Условные вероятности будут обозначаться через

и

<< Предыдущий параграф Следующий параграф >>
Оглавление