ЕГЭ и ОГЭ
Хочу знать
Главная > Математика > Прикладная статистика: Основы моделирования и первичная обработка данных
<< Предыдущий параграф
Следующий параграф >>
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
<< Предыдущий параграф Следующий параграф >>
Научная библиотека

Научная библиотека

избранных естественно-научных изданий

Научная библиотека служит для получения быстрого и удобного доступа к информации естественно-научных изданий, получивших широкое распространение в России и за рубежом. На сайте впервые широкой публике представлены некоторые авторские издания написанные ведущими учеными страны.

Во избежании нарушения авторского права, материал библиотеки доступен по паролю ограниченному кругу студентов и преподавателей вузов. Исключение составляют авторские издания, на которые имеются разрешения публикации в открытой печати.

Математика

Физика

Методы обработки сигналов

Схемотехника

Астрономия

Разное

Научная библиотека

Научная библиотека

избранных естественно-научных изданий

Научная библиотека служит для получения быстрого и удобного доступа к информации естественно-научных изданий, получивших широкое распространение в России и за рубежом. На сайте впервые широкой публике представлены некоторые авторские издания написанные ведущими учеными страны.

Во избежании нарушения авторского права, материал библиотеки доступен по паролю ограниченному кругу студентов и преподавателей вузов. Исключение составляют авторские издания, на которые имеются разрешения публикации в открытой печати.

Математика

Физика

Методы обработки сигналов

Схемотехника

Астрономия

Разное

Макеты страниц

5.5.3. Многомерные функции распределения и плотности. Статистическая независимость случайных величин.

Из вышеизложенного ясно, что вопрос об удобных способах задания закона распределения случайной величины особенно актуален в непрерывном случае: для описания «поведения» дискретной случайной величины универсальной и одновременно конструктивной формой (при «не слишком большом» числе возможных значений исследуемой случайной величины) является полигон частот, т. е. форма, при которой каждому возможному значению ставится в соответствие вероятность его осуществления

Рис. 5.6. Гистограмма и соответствующим образом подобранная нормальная функция плотности характеризующие распределение числа телефонных разговоров в год, приходящихся на одного абонента

Поэтому сосредоточим теперь свое внимание на непрерывном случае. Специфика многомерных схем в этом случае заключается в том у что в отличие от одномерного случая многомерная функция распределения

перестает быть практически полезной формой задания изучаемого закона распределения.

Многомерными аналогами конечных и полубесконечных отрезков (которые можно получить суммированием и пересечением полубесконечных отрезков вида ) являются конечные и полубесконечные гиперпараллелепипеды. Именно для многомерных областей такого типа и определяет функция распределения (5.9) правило вычисления вероятностей. Однако, если в одномерном случае этого было достаточно для «работы» в соответствующем вероятностном пространстве, то в многомерном случае нас это уже не удовлетворяет.

В частности, знание одной лишь формы (5.9) оказывается недостаточным для конструктивного решения такой важной для статистических приложений задачи, какой является задача описания закона распределения интересующих нас преобразований от исходных случайных величин (общий подход к решению этой проблемы описан в § 7.4).

Поэтому для описания закона распределения многомерной случайной величины в непрерывном случае используют функцию плотности вероятности которую можно определять и отправляясь от функции распределения (5.9), и независимо от нее

Или плотность вероятности -мерной случайной величины — это такая функция от переменных, что для любого (измеримого подмножества А возможных значений вероятность события может быть вычислена с помощью соотношения

где интегрирование ведется по данной области А в соответствующем -мерном пространстве возможных значений (т. е. знак интеграла в (5.10) определяет операцию -кратного интегрирования).

Вероятностный смысл функции плотности тот же, что и в одномерном случае: вероятность осуществления значения случайной величины лежащего в некоторой малой окрестности точки пропорциональна значению функции плотности в этой точке и равна, в частности, «элементу вероятности» , т. е.

Эмпирические (выборочные) аналоги теоретических функций распределения и плотности строятся по выборочным данным (наблюдениям) исследуемой случайной величины так же, как и в одномерном случае;

где — интересующее нас значение многомерного признака, — число выборочных данных компоненты которых удовлетворяют одновременно, условиям:

— номер гиперпараллелепипеда группирования, содержащего в себе точку — число выборочных данных (из общего числа ), попавших в гиперпараллелепипед группирования

Функции, определяемые соотношениями (5.9), а также (5.10) или (5.10), называют соответственно совестной функцией распределения и совместной плотностью вероятности многомерного случайного признака

Для описания частного закона распределения вероятностей некоторой части компонент вектора (см. п. 5.4.1) используются частная (маржинальная) функция распределения и частная (маржинальная) плотность вероятности, задаваемые соотношениями:

где под понимается интегрирование по всему множеству возможных знач ений случайной величины (ср. с (5.3) и (5.3)).

Эмпирическая (выборочная) реализация формул (5.14) и (5.15) очень проста: мы оставляем для статистической обработки по формулам (5.12) и (5.13) лишь часть координат, а именно -мерные точки , не обращая внимания на наблюденные значения остальных координат — . Геометрически это означает, что мы проектируем наши «точки-наблюдения» из исходного -мерного пространства на пространство, «натянутое» на первые s координат (так, при р=2 эта процедура сводится к проектированию «точек-наблюдений» плоскости на ось ).

Условная плотность вероятности случайного подвектора при условии, что значения другого подвектора зафиксированы на уровне (т. е. при условии ) определяется аналогично условным вероятностям (см. (5.4) и (5.4)) с помощью теоремы умножения вероятностей (см. п. 4.1.3, (4.11)):

Аналогично

В знаменателях правых частей (5.16) и (5.16) стоят частные (маржинальные) плотности подвекторов — соответственно , вычисленные в соответствии с (5.15).

Рис. 5.7. Поверхность двумерной плотности вероятности (нормальный закон с «отсеченными» краями)

Обратим внимание на существенное отличие частной (маржинальной) плотности от условной хотя обе они описывают распределение одного и того же набора признаков первая плотность не зависит от того, какие значения имеют остальные компоненты анализируемой многомерной случайной величины, а ее эмпирический аналог строится по всем укороченным наблюдениям в то время как условная плотность существенно зависит от того, на каких именно уровнях зафиксированы значения остальных компонент , а ее эмпирический аналог строится лишь по тем наблюдениям выборки последние координат которых хотя бы приближенно удовлетворяют условию .

На рис. 5.7 изображен график функции плотности двумерного закона распределения вероятностей — двумерного нормального закона (его описание см. в § 6.1).

Там же изображены сечения поверхности двумерной плотности плоскостями т. е. плоскостями, перпендикулярными оси О В сечении получаются с точностью до нормирующего множителя одномерные законы (один из них указан стрелкой), характеризующие условное распределение компоненты при условии Прямая ОА прослеживает характер изменения наиболее вероятного значения случайной величины в условной распределении этого признака (при условии ) в зависимости от зафиксированного значения с.

Статистическая независимость случайных величин (где признаки могут быть дискретными и непрерывными, скалярными и векторными) вводится на базе понятия независимости системы событий (см. (4.12) и Случайные величины называют статистически независимыми, если для любых (измеримых) областей их возможных значений, соответственно имеют место соотношения

В терминах вероятностей (для дискретных случайных величин) и плотностей (для непрерывных случайных величин) условие (5.17) может быть записано в виде:

<< Предыдущий параграф Следующий параграф >>
Оглавление