Главная > Математика > Прикладная статистика: Основы моделирования и первичная обработка данных
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

5.5.3. Многомерные функции распределения и плотности. Статистическая независимость случайных величин.

Из вышеизложенного ясно, что вопрос об удобных способах задания закона распределения случайной величины особенно актуален в непрерывном случае: для описания «поведения» дискретной случайной величины универсальной и одновременно конструктивной формой (при «не слишком большом» числе возможных значений исследуемой случайной величины) является полигон частот, т. е. форма, при которой каждому возможному значению ставится в соответствие вероятность его осуществления

Рис. 5.6. Гистограмма и соответствующим образом подобранная нормальная функция плотности характеризующие распределение числа телефонных разговоров в год, приходящихся на одного абонента

Поэтому сосредоточим теперь свое внимание на непрерывном случае. Специфика многомерных схем в этом случае заключается в том у что в отличие от одномерного случая многомерная функция распределения

перестает быть практически полезной формой задания изучаемого закона распределения.

Многомерными аналогами конечных и полубесконечных отрезков (которые можно получить суммированием и пересечением полубесконечных отрезков вида ) являются конечные и полубесконечные гиперпараллелепипеды. Именно для многомерных областей такого типа и определяет функция распределения (5.9) правило вычисления вероятностей. Однако, если в одномерном случае этого было достаточно для «работы» в соответствующем вероятностном пространстве, то в многомерном случае нас это уже не удовлетворяет.

В частности, знание одной лишь формы (5.9) оказывается недостаточным для конструктивного решения такой важной для статистических приложений задачи, какой является задача описания закона распределения интересующих нас преобразований от исходных случайных величин (общий подход к решению этой проблемы описан в § 7.4).

Поэтому для описания закона распределения многомерной случайной величины в непрерывном случае используют функцию плотности вероятности которую можно определять и отправляясь от функции распределения (5.9), и независимо от нее

Или плотность вероятности -мерной случайной величины — это такая функция от переменных, что для любого (измеримого подмножества А возможных значений вероятность события может быть вычислена с помощью соотношения

где интегрирование ведется по данной области А в соответствующем -мерном пространстве возможных значений (т. е. знак интеграла в (5.10) определяет операцию -кратного интегрирования).

Вероятностный смысл функции плотности тот же, что и в одномерном случае: вероятность осуществления значения случайной величины лежащего в некоторой малой окрестности точки пропорциональна значению функции плотности в этой точке и равна, в частности, «элементу вероятности» , т. е.

Эмпирические (выборочные) аналоги теоретических функций распределения и плотности строятся по выборочным данным (наблюдениям) исследуемой случайной величины так же, как и в одномерном случае;

где — интересующее нас значение многомерного признака, — число выборочных данных компоненты которых удовлетворяют одновременно, условиям:

— номер гиперпараллелепипеда группирования, содержащего в себе точку — число выборочных данных (из общего числа ), попавших в гиперпараллелепипед группирования

Функции, определяемые соотношениями (5.9), а также (5.10) или (5.10), называют соответственно совестной функцией распределения и совместной плотностью вероятности многомерного случайного признака

Для описания частного закона распределения вероятностей некоторой части компонент вектора (см. п. 5.4.1) используются частная (маржинальная) функция распределения и частная (маржинальная) плотность вероятности, задаваемые соотношениями:

где под понимается интегрирование по всему множеству возможных знач ений случайной величины (ср. с (5.3) и (5.3)).

Эмпирическая (выборочная) реализация формул (5.14) и (5.15) очень проста: мы оставляем для статистической обработки по формулам (5.12) и (5.13) лишь часть координат, а именно -мерные точки , не обращая внимания на наблюденные значения остальных координат — . Геометрически это означает, что мы проектируем наши «точки-наблюдения» из исходного -мерного пространства на пространство, «натянутое» на первые s координат (так, при р=2 эта процедура сводится к проектированию «точек-наблюдений» плоскости на ось ).

Условная плотность вероятности случайного подвектора при условии, что значения другого подвектора зафиксированы на уровне (т. е. при условии ) определяется аналогично условным вероятностям (см. (5.4) и (5.4)) с помощью теоремы умножения вероятностей (см. п. 4.1.3, (4.11)):

Аналогично

В знаменателях правых частей (5.16) и (5.16) стоят частные (маржинальные) плотности подвекторов — соответственно , вычисленные в соответствии с (5.15).

Рис. 5.7. Поверхность двумерной плотности вероятности (нормальный закон с «отсеченными» краями)

Обратим внимание на существенное отличие частной (маржинальной) плотности от условной хотя обе они описывают распределение одного и того же набора признаков первая плотность не зависит от того, какие значения имеют остальные компоненты анализируемой многомерной случайной величины, а ее эмпирический аналог строится по всем укороченным наблюдениям в то время как условная плотность существенно зависит от того, на каких именно уровнях зафиксированы значения остальных компонент , а ее эмпирический аналог строится лишь по тем наблюдениям выборки последние координат которых хотя бы приближенно удовлетворяют условию .

На рис. 5.7 изображен график функции плотности двумерного закона распределения вероятностей — двумерного нормального закона (его описание см. в § 6.1).

Там же изображены сечения поверхности двумерной плотности плоскостями т. е. плоскостями, перпендикулярными оси О В сечении получаются с точностью до нормирующего множителя одномерные законы (один из них указан стрелкой), характеризующие условное распределение компоненты при условии Прямая ОА прослеживает характер изменения наиболее вероятного значения случайной величины в условной распределении этого признака (при условии ) в зависимости от зафиксированного значения с.

Статистическая независимость случайных величин (где признаки могут быть дискретными и непрерывными, скалярными и векторными) вводится на базе понятия независимости системы событий (см. (4.12) и Случайные величины называют статистически независимыми, если для любых (измеримых) областей их возможных значений, соответственно имеют место соотношения

В терминах вероятностей (для дискретных случайных величин) и плотностей (для непрерывных случайных величин) условие (5.17) может быть записано в виде:

<< Предыдущий параграф Следующий параграф >>
Оглавление