Главная > Математика > Прикладная статистика: Классификации и снижение размерности
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Глава 14. МОДЕЛИ И МЕТОДЫ ФАКТОРНОГО АНАЛИЗА

14.1. Сущность модели факторного анализа, его основные задачи

Описываемые в данной главе методы основаны на общей базовой идее, в соответствии с которой структура связей между анализируемыми признаками может быть объяснена тем, что все эти переменные зависят (линейно или как-то иначе) от меньшего числа других, непосредственно не измеряемых («скрытых», «латентных») факторов которые принято называть общими и которые в большинстве моделей конструируются так, чтобы они оказались взаимно некоррелированными.

При этом в общем случае, естественно, не постулируется возможность однозначного (детерминированного) восстановления значений каждого из наблюдаемых признаков по соответствующим значениям общих факторов (в предположении, что мы их умеем вычислять): допускается, что каждый из исходных признаков зависит также и от некоторой «специфической» (для него) остаточной случайной компоненты которая и обусловливает статистический характер связи между с одной стороны, и — с другой.

Конечная цель статистического исследования, проводимого с привлечением аппарата факторного анализа, как правило, состоит в выявлении и интерпретации латентных общих факторов с одновременным противоречивым стремлением минимизировать как их число, так и степень зависимости от своих специфических остаточных случайных компонент . Как и в любой модельной схеме, эта цель может быть достигнута лишь приближенно.

В некотором смысле искомые общие факторы можно считать причинами, а наблюдаемые признаки — следствиями. Принято считать статистический анализ такого рода успешным, если большое число следствий удалось объяснить малым числом причин.

Таким образом, методы и модели факторного анализа нацелены на сжатие информации или, что то же, на снижение размерности исходного признакового пространства . При этом из трех упомянутых в § 13.1 предпосылок возможности снижения размерности (взаимная коррелированность исходных признаков, малая «вариабельность» некоторых из них, агрегирование) методы факторного анализа базируются, в основном, на первой.

Возникновение схемы и моделей факторного анализа обязано задачам психологии, относится к началу двадцатого века и связано с именами Ч. Спирмэна, Л. Тэрстоуна, Г. Томсона . Однако в силу ряда исторических причин и, в частности, из-за субъективных пристрастий и специфических научных интересов первых исследователей, работавших в данной области, вероятностно-статистические аспекты этого раздела многомерного статистического анализа долгое время оставались практически неразработанными, а интерпретации и анализу различных моделей факторного анализа была присуща некоторая неопределенность.

Лишь с середины 50-х годов начинают появляться интересные результаты именно вероятностно-статистических исследований этого аппарата [180, 294, 185], среди которых работу Т. Андерсона и Г. Рубина следует выделить как основополагающую.

При разработке моделей факторного анализа приходится последовательно анализировать и решать следующие вопросы.

Существование модели. Далеко не для всякой заданной структуры связей между исходными признаками можно (при заданном построить модель факторного анализа, т. е. указать такие общие факторы (или доказать их существование), которые полностью объяснили бы имеющуюся корреляцию между различными парами и При каком характере связей между исходными признаками т. е. при каких корреляционных (ковариационных) матрицах а также при каком соотношении между числом наблюдаемых признаков и числом скрытых общих факторов сделанное допущение о наличии определенных связей между , с одной стороны, и — с другой, является обоснованным и содержательным — в этом и заключается вопрос существования модели.

Единственность (идентификация) модели. Оказывается, что если таковы, что допускают построение модели факторного анализа, то определение соответствующих факторов и коэффициентов линейного преобразования , связывающего , не единственно. Спрашивается, при каких дополнительных ограничениях на матрицу преобразования Q и на ковариационную матрицу остаточных специфических факторов определение параметров искомой модели факторного анализа будет единственным?

Алгоритмическое определение структурных параметров модели. При заданной ковариационной матрице исходных признаков и известном числе общих факторов (и в предположении, что решение задачи определения структурных параметров существует) как конкретно вычислить неизвестные параметры модели?

Статистическое оценивание (по наблюдениям и при заданном ) неизвестных структурных параметров модели.

Статистическая проверка ряда гипотез, связанных с природой модели и значениями ее структурных параметров, таких, как гипотеза об истинном числе общих факторов, гипотеза адекватности принятой модели по отношению к имеющимся результатам наблюдения, гипотеза о значимом от линии от нуля интересующих нас коэффициентов линейного преобразования и т.п.

Построение статистических оценок для ненаблюдаемых значений общих факторов

<< Предыдущий параграф Следующий параграф >>
Оглавление