Главная > Математика > Прикладная статистика: Классификации и снижение размерности
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

17.1.2. Проекции строк и столбцов. Связь с анализом главных компонент.

Рассматривая профиля строк и столбцов как точки в соответствующих пространствах дальше можно действовать несколькими способами, которые приводят к одинаковому результату.

Прежде всего для упрощения датьнейших выкладок нормируем профили строк (столбцов) так, чтобы -метрика стала обычной евклидовой (дальше ):

Легко проверить, что евклидово расстояние между нормированными профилями строк (столбцов) совпадает с расстоянием между соответствующими исходными профилями Нормированные профили-строки являются строками матрицы .

Введем теперь матрицу рассеивания Т, для нормированных профилей строк с учетом их весов

Матрица 1,. имеет размеры . Это аналог ковариационной матрицы системы из точек, но рассеивание измеряется не относительно их центра тяжести, а относительно нулевой точки. Будем теперь искать одномерную проекцию с вектором U, для которой рассеивание (дисперсия) образов точек максимально. Но это задача анализа главных компонент (см гл. 13). В вычислительном отношении это приводит к решению проблемы собственных значений и векторов:

С учетом того, что веса равны диагональным элементам матрицы матрица может быть представлена в виде

Аналогично матрица рассеивания для нормированных профилей столбцов есть

Введем в рассмотрение матрицу

Тогда имеем

Следовательно, матрицы имеют одни и те же положительные собственные числа и количество ненулевых собственных чисел Собственные векторы матриц Т; и с единичной нормой, соответствующие одному и тому же собственному значению связаны соотношением

При практических вычислениях, естественно, выбирается задача на собственные значения с минимальной размерностью

<< Предыдущий параграф Следующий параграф >>
Оглавление