Главная > Математика > Факторный анализ (Окунь. Я.)
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

ПРЕДИСЛОВИЕ К РУССКОМУ ПЕРЕВОДУ

В последние два десятилетия сфера применения факторного анализа, этого специфического раздела современной многомерной статистики, быстро расширяется. Если в начале нашего века методы факторного анализа были созданы и разрабатывались исключительно для нужд психологии, то теперь становится все более очевидной универсальность этих методов. Сейчас можно назвать уже сотни работ, сообщающих о применении факторного анализа для исследований в области экономики, социологии, биологии, медицины, метеорологии, палеонтологии, физической и экономической географии и др. [235—244]. Накопленный опыт подтверждает ценность факторного анализа как инструмента научного исследования.

Столь широкий интерес к приложению методов факторного анализа связан с тем, что эти методы позволяют с некоторым приближением решать одну из наиболее распространенных задач научного исследования, а именно задачу построения той или иной схемы классификации, т. е. компактного содержательного описания исследуемого явления, на основе обработки больших информационных массивов.

В очень многих случаях информация об изучаемом явлении может быть представлена в форме таблицы данных (как количественных, так и качественных), в которой строки соответствуют множеству наблюдений за состоянием изучаемого явления, а столбцы — множеству характеристик или признаков, описывающих данное явление. Так, в экономических исследованиях в качестве наблюдений (или объектов наблюдения) чаще всего выступают предприятия, виды продукции или отрасли, а при исследовании динамики экономических явлений — члены временных рядов: год, квартал, месяц и т. д. Каждое из наблюдаемых предприятий может быть охарактеризовано такими, например, признаками, как число занятых, стоимость основных производственных фондов, направление и степень специализации, наличие филиалов и др.

В региональных исследованиях такого рода таблицы получили название матриц географических данных: строки матриц соответствуют дробным территориальным единицам, представляющим изучаемый региональный комплекс.

Исследователь может располагать большим объемом наблюдений, в набор признаков теоретически могут быть включены все непосредственно наблюдаемые характеристики изучаемого явления. Но даже в этом случае информация, содержащаяся в таблице подобного рода, явно недостаточна для понимания существа явления и для целенаправленного управления этим явлением. Такая таблица представляет собой лишь набор чисел, т. е. как бы прединформацию», и только анализ позволит выявить закономерности, скрытые за набором чисел.

Перед исследователем, работающим с таблицами подобного рода, часто встает вопрос: нельзя ли выразить заключенную в таблице информацию в более компактной форме, поскольку естественно полагать, что компактная форма отражает наиболее существенные, закономерные аспекты варьирования признаков от объекта к объекту. Компактность представления информации может быть достигнута как путем группировки объектов со сходными сочетаниями значений признаков (задача таксономии), так и за счет группировки признаков, с общим характером изменений от объекта к объекту (задача анализа системы признаков). На практике чаще всего применяется комбинация этих двух подходов, а именно: классификации объектов всегда в той или иной форме предшествует «предклассификация», т. е. анализ системы признаков. Необходимость анализа признаков связана с тем, что в реальных условиях непосредственно наблюдаемые признаки обычно лишь косвенно отражают существо явления: врач о болезни судит по ее внешним проявлениям, учитель или психолог об одаренности ученика — на основе тестов, экономист об эффективности работы предприятия — по системе показателей и т. д. Многие признаки заведомо взаимосвязаны и отражают один и тот же аспект характеристики явления. В таких условиях возникает необходимость как-то «переупаковать» исходную информацию в соответствии с конечной целью исследования, т. е. сгруппировать признаки таким образом, чтобы их группы в наибольшей степени отражали «образ» исследуемого явления или его отдельные аспекты. Выявленными информативными группами признаков или представляющими эти группы синтетическими переменными можно пользоваться как критерием при классификации объектов.

Факторный анализ предоставляет исследователю адекватный инструмент анализа системы признаков. Исследование системы признаков, проведенное по одной из моделей факторного анализа, в ряде случаев позволяет вскрыть логическую структуру сложного явления, отделить взаимозависимые и взаимозаменяемые признаки от независимых, существенные от несущественных, обосновать выбор той или иной системы признаков, оценить ее информативность, проверить или выдвинуть гипотезы о взаимосвязях в рассматриваемой сложной системе признаков.

При классификации объектов факторный анализ применяется на первом, вспомогательном этапе разработки классификационной схемы.

Современные алгоритмы автоматической классификации, разработанные в рамках исследований по распознаванию образов, позволяют осуществлять классификацию объектов непосредственно в многомерном признаковом пространстве, не прибегая к предварительной группировке признаков. Однако схемы такой непосредственной многомерной машинной классификации часто труднее поддаются интерпретации, чем схемы классификации на основе небольшого числа синтетических факторов, выявленных с помощью факторного анализа. В частности, затрудняется использование графических методов анализа и интерпретации результатов. В силу своей адекватности человеческому восприятию факторный анализ сохраняет свои позиции в ряду новейших методов решения классификационных задач.

Интерес к приложению факторного анализа послужил стимулом для его разработки математиками. Появился ряд новых модификаций факторного анализа, разработаны машинные программы, исследуется проблема статистических критериев для оценки надежности результатов. Для исследования информационных массивов большой размерности советскими математиками предложен так называемый структурный, или лингвистический, подход, являющийся комбинацией и развитием моделей факторного анализа и автоматической классификации [227], впервые дана точная формулировка и решение задачи группировки параметров [232], предложен ряд эвристических алгоритмов группировки параметров.

Одновременно растет разнообразие содержательных постановок задач с приложением факторного анализа. Так, помимо «классической» для факторного анализа задачи минимизации описания путем конструирования новых обобщающих параметров-факторов, широкое распространение, главным образом в экономико-географических исследованиях, получили пространственно-временные сопоставления. Сопоставление осуществляется на базе факторных структур, рассчитанных для нескольких однотипных явлений, или для нескольких периодов в развитии одного и того же явления.

Большой интерес представляет применение факторного анализа для разработки типологии отношений, или для анализа диад. В отличие от традиционной постановки задачи матрица исходных данных в этом случае содержит не скалярные, а векторные величины, т. е. характеризует не только уровень проявления рассматриваемых признаков, но и их направление. Такие величины могут описывать, например, различного рода экономические взаимосвязи между каждой парой из определенного множества городов, предприятий, отраслей и т. д. Предложены методы использования факторного анализа для исследования динамики явлений.

Одним из интересных примеров расширения сферы применения факторного анализа путем распространения его на анализ качественных данных является создание факторного анализа соответствий.

Этот метод предназначен для изучения взаимосвязей между качественными признаками, описывающими некоторую изучаемую совокупность. Например, лица, занятые в обрабатывающей промышленности, могут характеризоваться двумя качественными признаками: отраслью производства, в которой они работают, и наряду с этим — городом, где они проживают. Можно составить таблицу с двумя входами, в которой на пересечении столбца, соответствующего отрасли, и строки, соответствующей городу, будет стоять число лиц, которые живут в таком-то городе и заняты в такой-то отрасли. По этой таблице можно изучать сходство и различия изучаемой группы городов с точки зрения структуры их промышленности (поскольку строки таблицы представляют структуру промышленности рассматриваемых городов). Факторный анализ соответствий дает возможность преобразовать эту таблицу, представить города точками в многомерном пространстве, в котором оси переменных соответствуют отраслям. Тем самым исходная задача переформулируется в задачу факторного анализа: задан массив числовых данных, характеризующих изучаемую группу объектов (городов) по набору переменных (отраслей). Далее составляют матрицу корреляций этих переменных, которую исследуют методами факторного анализа. Интерпретация основных факторов выявляет те группы отраслей, которые определяют различия между обнаруженными типами городов.

Несмотря на возросший интерес к факторному анализу, литература на русском языке, посвященная этому методу, все еще очень бедна. Правда, в 1972 г. вышел в свет перевод фундаментальной работы Г. Хармана [234], в которой с достаточной полнотой представлены все основные концепции, история развития и методы факторного анализа. Однако эта работа, как и ранее вышедшая книга, посвященная в основном лишь одной частной модели факторного анализа [231], адресованы в первую очередь математикам и малодоступны исследователям-прикладникам», не имеющим специальной математической подготовки.

Предлагаемая вниманию читателя книга польского ученого Яна Окуня в известной мере восполняет имеющийся пробел. Она рассчитана на первоначальное ознакомление с основами метода, с его возможностями и ограничениями. Автор стремится довести до читателя основные идеи факторного анализа, познакомить его с важнейшими этапами расчетной процедуры, обратить его внимание на наиболее сложные проблемы применения факторных методов. Рассматривается ряд вопросов, непосредственно связанных с приложением факторного анализа к исследованию содержательных задач, в частности, вопрос о влиянии возможных искажений исходной информации на результаты расчетов, а также вопросы, связанные с организацией факторного эксперимента, проблема мотивации при реализации теста и т. д.

Эти вопросы, как правило, мало освешаются в математических работах по факторному анализу. Для иллюстрации автор ссылается на задачи по обработке психологических тестов, однако изложение по существу не привязано к психологии, поэтому книга может быть полезна исследователям в различных областях знаний. Книга Я. Окуня поможет заинтересованному читателю ориентироваться в моделях факторного анализа, подготовит его к чтению более фундаментальных современных исследований.

При переводе книги, стремясь к унификации русской терминологии по факторному анализу, мы придерживались той передачи терминов, которая была принята при переводе работы Г. Хармана [2341. Это относится прежде всего к такому труднопереводимому термину, как общность (communality), определяющему факторную дисперсию, т. е. ту часть полной дисперсии переменной, которая может быть объяснена с помощью выделенных факторов. Тот же принцип выдержан при передаче таких терминов, как уравнение тетрады, коэффициент надежности, вращение осей, матрица до и после поворота и т. д.

В русском переводе книга подверглась некоторому сокращению. В частности, опущено очень подробное описание «ручной» процедуры расчета факторов по методу главных компонент, поскольку сейчас такие расчеты полностью переданы ЭВМ. В то же время в ряде других разделов описание расчетной процедуры сохранено, ибо по замыслу автора подробный показ техники расчетов на числовых примерах должен помочь неискушенному в математике читателю проследить основные зависимости факторного анализа.

При чтении книги Яна Окуня следует учесть, что за время, прошедшее с момента ее издания в Польше, появились новые методы расчетов и новые варианты постановки задач факторного анализа.

Ознакомиться с некоторыми из этих новшеств читатель сможет по работам [227—229, 232, 235, 241]. В этих работах читатель найдет описание машинных алгоритмов факторного анализа и близких ему методов, а также реализующие их программы для ЭВМ на языке АЛГОЛ-60 и АЛМИР [235, 241]. Кроме того, к русскому переводу дано приложение — описание одного из таких вновь разработанных методов: факторного анализа соответствий.

Библиография к польскому изданию охватывает период только до начала 50-х годов. Для ознакомления с более современной литературой по предмету мы отсылаем читателя к библиографическому обзору, опубликованному в работе [234]. В «Дополнение к списку литературы» включены работы по теории и приложению факторного анализа, изданные на русском языке в последние годы.

В. М. Жуковская

<< Предыдущий параграф Следующий параграф >>
Оглавление