Главная > Математика > Прикладная статистика: Классификации и снижение размерности
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Глава 20. ТЕОРЕТИЧЕСКИЕ ОСНОВЫ ЦЕЛЕНАПРАВЛЕННОГО ПРОЕЦИРОВАНИЯ И ТОМОГРАФИЧЕСКИХ МЕТОДОВ АНАЛИЗА ДАННЫХ

20.1. Проекции многомерных распределений и их свойства

20.1.1. Основные определения.

Рассмотрим евклидово пространство размерности . Проекцией из будем называть линейное отображение А из на все . Фиксировав в ортонормированные базисы можно задать проекцию -матрицей А ранга q, т. е. будет невырожденной матрицей. Здесь А — транспонированная матрица А. Проекция называется ортогональной, если — единичная матрица. Важным частным случаем являются одномерные проекции, т. е. проекции из Они задаются формулой

где — скалярное умножение в

Ортогональные одномерные проекции задаются векторами

Проекцией распределения векторной величины в соответствующей проекции А из в называется распределение -мерной величины, индуцированное проекцией А. Например, если — случайный вектор в с плотностью распределения , то его проекция — случайный вектор в с плотностью

20.1.2. Общие свойства проекции распределения.

Пусть — невырожденные линейные отображения и Тогда

Для данной проекции рассмотрим симметрическую положительно определенную (-матрицу АА. Пусп. С — ортогональная матрица, составленная из собственных вектор-столбцов матрицы — диагональная матрица где — соответствующие собственные числа, т. е. . Положим где Тогда

т. е. — матрица ортогональной проекции из в . Используя формулу (20.4), получаем, что проекция выражается через ортогональную проекцию мулу (20.1) в случае одномерных проекций можно написать в виде преобразования Радона плотности [163]:

где (-функция Дирака) одномерная плотность, сосредоточенная в точке Формулы (20.2) и (20.3) перепишутся теперь в виде:

где — ненулевое число.

Рассмотрим характеристическую функцию случайной величины

Имеет место формула

Следовательно, как функция вектора а является характеристической функцией -мерного случайного вектора Так как рассчитывается по , то из теоремы обращения характеристической функции [129] получаем: распределение -мерного вектора полностью определяется распределениями его одномерных проекций.

Этот важнейший результат в теории преобразования Радона называется теоремой о связи преобразований Радона и Фурье, теоремой о проекциях и сечениях [162, 163], а в многомерном статистическом анализе — теоремой Крамера и Волда [129]. В теории преобразования Радона получены явные формулы, выражающие через семейство , где а пробегает множество а также через семейство , где А пробегает множество ортогональных проекций из

Формула (20.8) описывает частный случай следующего общего свойства проекций плотности :

т. е.

20.1.3. Свойства проекций дифференцируемых распределений.

В тех случаях, когда плотность дифференцируема, то ее градиент выражается в терминах проекций формулой

(20.10)

где b и а — любые ненулевые векторы из .

В частности, когда то

(20.11)

Для описания связи между проекциями и для близких направлений важна следующая формула:

Для случайного вектора с плотностью обозначим через вектор в равный среднему среди векторов, лежащих на гиперплоскости , т. е.

(20.13)

Тогда из (20.12) и получаем:

(20.14)

Рассматривая теперь вектор а как -мерный параметр распределения , составим для каждого а информационную матрицу Фишера с. 2561:

Применяя (20.14), получаем:

(20.15)

где — функция распределения случайной величины

Когда вектор а пробегает сферу получаем поле неотрицательно определенных симметрических матриц на

Это поле можно использовать для построения критерия относительной выразительности направлений проецирования Положим

(20.16)

где Содержательно указывает, какова усредненная по b чувствительность распределения к изменениям направления проецирования вида для малых .

Из (20.15) получаем:

Используя теперь, что если то , где и формулу

верную для всех получаем:

Пример 20.1. Пусть - -нормальный -мерный вектор

Тогда согласно (20.17) получаем:

В частности, если

1) — единичная матрица, то

т. е. критерий принимает минимальное значение, если и максимальное значение, если ;

2) , тогда

т. е. тогда и только тогда, когда , т.е. когда вектор проецирования совпадает с главной компонентой.

20.1.4. Связь многомерного распределения с его одномерной проекцией.

Рассмотрим теперь насколько характеризует данное -мерное распределение с плотностью его единственная одномерная проекция .

Положим называется носителем плотности .

Пусть — некоторая плотность, удовлетворяющая относительно и фиксированного только условию

Тогда согласно свойству (20.9) функция

задает плотность распределения, причем

Таким образом, единственная проекция определяет распределение только с точностью до множителя где — фактически произвольная плотность. Столь же малую информацию о распределении общего вида несет и любой конечный набор его проекций

В связи с этим, как уже отмечалось выше (см. гл. 19), в задачах анализа многомерного распределения по его проекциям первостепенное значение имеет выбор модели этого распределения, либо критерия, при помощи которого среди всех распределений, имеющих данные проекции , отбирается распределение, экстремальное по этому критерию. Алгоритмы решения таких задач рассмотрены в § 19.8.

<< Предыдущий параграф Следующий параграф >>
Оглавление