Главная > Математика > Прикладная статистика: Исследование зависимостей
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Глава 4. АНАЛИЗ СТРУКТУРЫ СВЯЗЕЙ МЕЖДУ КОМПОНЕНТАМИ МНОГОМЕРНОГО ВЕКТОРА

4.1. Связи прямые и опосредованные. Введение в проблематику

4.1.1. Цепи Маркова.

Рассмотрим такую последовательность Случайных (для определенности непрерывных) величин

что для каждого k = 2, условное распределение при совпадает с условным распределением Ел при условии, что Для всех наборов для которых соответствующие условные распределения определены. На языке условных плотностей это условие может быть записано так: для всех

(4.2)

или, для краткости опуская значения случайных величин и нижние индексы у буквы , для всех

Про последовательность (4.1) говорят, что она образует цепь Маркова. В цепи Маркова каждый член зависит от всех предшествующих, но непосредственно зависящими (связанными) можно в силу (4.2) считать только члены, стоящие рядом, рассматривая не рядом стоящие члены как связанные опосредованно через

Пример 4.1. Пусть случайные величины независимы между собой и нормально распределены со средним 0 и дисперсией — некоторая константа

Тогда случайные величины также имеют нормальное распределение с теми же параметрами, что и и связаны в цепь Маркова. Их корреляционная матрица имеет вид

т. е. зависит всего от одного параметра .

Непосредственно связанные члены имеют коэффициент корреляции , а члены, опосредованно связанные и отстоящие друг от друга на k членов последовательности, имеют меньший коэффициент корреляции Таким образом, чем связь непосредственнее, тем она сильнее.

Удобна геометрическая иллюстрация цепи Маркова, при которой случайные величины изображаются точками или кружками, а непосредственные (прямые) связи между ними — соединяющими их отрезками (рис. 4.1). Для обозначения связей мы использовали отрезки, а не стрелки, так как если последовательность (4.1) образует цепь Маркова, то и последовательность как нетрудно убедиться (см., например, [78, с. 590-591]), также является цепью Маркова. Цепи Маркова являются простейшей моделью зависимостей между случайными величинами и нашли очень широкое применение в практике (физика, техника, экономика, биология, лингвистика) особенно в тех случаях, когда есть естественное (например, временное) упорядочение случайных величин [26, 62, 96].

Рис. 4.1. Прямые связи между случайными величинами, образующими цепь Маркова

В кратких обозначениях формулы (4.2) плотность совместного распределения может быть выражена как

Откуда следует, что для описания распределения цепи Маркова достаточно знать распределение первого члена последовательности и для — условные распределения при известном значении , т. е. плотности условных распределений пар векторов, непосредственно связанных друг с другом. Это свойство используется ниже при введении понятий прямой и опосредованной связи между координатами вектора. 4.1.2. Прямые связи между координатами вектора. По аналогии с первым равенством формулы (4.3) по формуле условной вероятности для координат -мерного вектора имеющего невырожденное непрерывное распределение, имеем

Предположим теперь, что для каждого i = 2, ...,p найдется такое что выражение в правой части (4.4) может быть представлено в форме, близкой к правой части (4.3), а именно

В этом случае пары координат с номерами можно назвать непосредственно (прямо) связанными, а остальные координаты считать связанными опосредованно. В общем случае естественно отказаться от ограничений, накладываемых нумерацией координат вектора, предполагая, что существует такая перестановка индексов координат, при которой представление вида (4.5) возможно. Удобно также ввести значение как соответствующее неслучайной дополнительной координате

Рис. 4.2. Прямые связи, выделенные при изучении структуры трудовых ресурсов

Пример 4.2 [150]. На рис. 4.2 графически показаны прямые связи, выделенные при изучении структуры трудовых ресурсов. Рассматривалась -мерная случайная величина, реализациями которой являлись значения показателей по 71 региону РСФСР за 1969 г. Использовались следующие показатели: 1) доля среднегодовой численности рабочих, служащих, колхозников в среднегодовой численности населения; 2) доля специалистов с высшим и средним специальным образованием, занятых в народном хозяйстве, в среднегодовой численности рабочих, служащих, колхозников; 3) доля специалистов с высшим и средним специальным образованием, занятых в сельском хозяйстве, в общей численности работающих в сельском хозяйстве; 4) доля работающих в промышленности и строительстве в среднегодовой численности рабочих, служащих, колхозников; 5) доля работающих в сельском хозяйстве в среднегодовой численности рабочих, служащих, колхозников; 6) доля работающих на транспорте и в связи в среднегодовой численности рабочих, служащих, колхозников; 7) доля работающих в области просвещения, науки, культуры, искусства в среднегодовой численности рабочих, служащих, колхозников; 8) доля работающих в области государственного и хозяйственного управления, кредита, государственного страхования в среднегодовой численности рабочих, служащих, колхозников; 9) доля работающих в области здравоохранения, физической культуры, социального обеспечения в среднегодовой численности рабочих, служащих, колхозников.

На рис. 4.2 хорошо видна на изучаемый год центральная роль в распределении трудовых ресурсов по отраслям народного хозяйства доли занятых в сельском хозяйстве (показатель 5). Это хорошо согласуется с качественными представлениями специалистов по трудовым ресурсам. Обращает на себя внимание тесная связь показателей 2 и 9, что также допускает качественное истолкование.

Предположением (4.5) введен новый малопараметрический класс распределений, обобщающий многомерные распределения, которые возникают в цепях Маркова, и получивший название «распределения с древообразной структурой зависимостей» (ДСЗ). Происхождение этого названия будет ясно из материала следующего параграфа, где в более строгой и полной форме даны все необходимые определения и рассмотрены свойства нормальных распределений с ДСЗ. Можно ожидать, что в приложениях новый класс распределений окажется столь же удобным инструментом, каким сегодня являются цепи Маркова при изучении временных рядов. Первые результаты использования распределений с ДСЗ очень обнадеживают [113].

Распределения с ДСЗ были введены в статистическую практику С. Чоу [174, 175, 176]. Если не считать краткого изложения результатов Чоу в [48], они не нашли еще отражения в монографической литературе. В отечественной литературе разработка теоретических вопросов, примыкающих к этому новому направлению, дана в [40, 61]. На работы В. И. Заруцкого [58, 59] мы существенно опираемся в последующем изложении.

<< Предыдущий параграф Следующий параграф >>
Оглавление