Главная > Математика > Факторный анализ (Иберла К.)
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

1. ВВЕДЕНИЕ

1.1. ПОСТАНОВКА ЗАДАЧИ

Наука является процессом, состоящим из непрерывного цикла построения моделей наблюдаемой действительности, которая вначале кажется необозримой в своем многообразии и не может быть охвачена моделью. В естественных науках наряду с накапливанием наблюдений происходит формирование теоретических положений, которые проверяются затем на новых данных и постепенно совершенствуются. В последнем столетии наблюдается значительное дифференцирование методов мышления и подходов к решению естественнонаучных задач, что обусловлено большим числом проведенных исследований и появлением общих и специальных научных методик.

Важным этапом в научном прогрессе явилось применение математических методов. Математика предоставляет возможность построения неограниченного числа моделей, с помощью которых можно точно описывать действительность. Вначале приходилось полагаться на интуицию и гениальность отдельного исследователя, который составлял такую модель и проверял ее соответствие реальным условиям. Однако эти обе функции исследователя, а именно построение модели и проверку ее адекватности, можно систематизировать и формализовать.

Теоретические положения физики, химии и других естественных наук в значительной степени основаны на математических моделях. Для этих наук характерно то, что в условиях одного эксперимента в принципе можно проверить определенную закономерность путем манипулирования величинами в широких пределах, пользуясь их причинной обусловленностью. В науках, занимающихся изучением поведения человека, к которым относится психология, социология, частично медицина и многие смежные области других отраслей знаний, где отсутствует четкая функциональная связь между причиной и следствием, один опыт не играет такой решающей роли. Присущие им закономерности можно обнаружить лишь путем статистической проверки результатов многих опытов, принимая или отклоняя определенные гипотезы. Процедура статистической проверки начинается с формулировки нулевой гипотезы («нет никакого различия») и альтернативной («имеет место различие»). Затем на основании выборки производится проверка нулевой гипотезы относительно альтернативной с помощью соответствующего критерия. Результатом статистической проверки является вывод о том, в скольких случаях на каждые 100 проведенных испытаний в предположении определенной модели отклонения от нее можно считать случайными.

Может быть определена вероятность ошибочного принятия альтернативной гипотезы. Вероятность допустить ошибку при принятии нулевой гипотезы тоже имеет вполне определенное значение. Таким образом, исследователь на заданном уровне значимости может остановиться на одной из этих гипотез. Имеется большой набор критериев значимости, с помощью которых осуществляется проверка различных гипотез. Выполнив процедуру проверки статистических гипотез, исследователь приходит к выводу о возможности принятия определенной модели. Для этой процедуры важно, на основании каких соображений исследователь определяет вид модели, описывающей данное явление.

В то время как статистическую проверку гипотез можно рассматривать в качестве попытки систематизировать процедуру принятия решений на фоне варьирующих наблюдений, статистическое оценивание можно считать попыткой систематизировать интуицию исследователя. При статистическом оценивании в предположении определенной математической модели речь идет о том, чтобы по возможности точно определить истинное значение параметра генеральной совокупности исходя из выборочных наблюдений. Примерами статистического оценивания являются предсказание исходов выборов и оценка недостатков промышленного производства. Если соблюдены предпосылки выборочного метода и принята определенная модель, то можно приступать к построению доверительных границ, определяя интервал, который, например, в 99 из 100 случаев покрывает истинное значение параметра генеральной совокупности.

В попытке систематизировать интуицию факторный анализ представляет шаг вперед по сравнению с методом статистического оценивания. Факторный анализ является методикой, которая в определенном смысле сама является источником возникновения гипотез. Остановимся вначале на специфическом характере гипотез, порождаемых факторным анализом. Мы исходим из того, что несколько измеряемых переменных сильно коррелируют между собой. Это означает, что либо они взаимно определяют друг друга, либо связь между этими переменными обусловливается какой-то третьей величиной, которую непосредственно измерить нельзя. Модель факторного анализа всегда связана с последним предположением, т. е. измеряемая величина является лишь формой проявления величины, остающейся на заднем плане и не поддающейся непосредственному измерению. Это предположение во многих случаях вполне реально. Возникает задача, можно ли по данным переменным выделить величину, так называемый фактор, который объяснил бы наблюдаемые связи. Слово фактор используется в другом смысле, чем это принято обычно: речь идет о математической величине, получаемой на основе наблюдений. Спрашивается, какова самая простая линейная гипотеза о структуре этой величины, скрывающейся за коррелированными переменными. Сколько нужно гипотетических величин, или факторов, и каких, чтобы по возможности более точно воспроизвести и объяснить наблюдаемые связи между переменными? Каким образом свести большое количество данных к возможно более простой концепции с минимальной потерей информации?

Получить ответы на такие вопросы — давняя сокровенная мечта исследователей. Факторный анализ пытается это сделать. Образно говоря, он заглядывает за кулисы того, что непосредственно измеряется, и стремиться определить истинные функциональные величины, лежащие в основе данного явления. Основная цель факторного анализа состоит в выявлении гипотетических величин, илиуфакторов, по большому числу экспериментальных данных. Факторы должны быть по возможности простыми и достаточно точно описывадъ и объяснять наблюдаемые величины. Итак, факторный анализ является методом, упорядочивающим кажущуюся хаотичность изучаемого явления и генерирующим новые гипотезы. Число выделяемых факторов должно быть меньше набора исходных величин, структура этих факторов и их взаимосвязь должны быть возможно более простыми. Возникает вопрос: что же находится за кулисами экспериментальных данных и как может выглядеть система выделенных факторов в самом простом случае?

Исходной предпосылкой анализа является наличие взаимосвязи между несколькими одновременно наблюдаемыми переменными. В качестве количественной меры связи между двумя переменными используется коэффициент корреляции (см. с. 24). Он может принимать значения от —1 до + 1. При этом если он приближается к нулю, то это свидетельствует об отсутствии линейной связи, и чем более он близок к +1 или к -1, тем более тесная линейная связь существует между переменными. Все вычисленные коэффициенты корреляции располагаются соответствующим образом в корреляционной матрице. В этой матрице содержится важная информация о взаимоотношениях переменных с учетом влияния помех, причиной которых может являться, например, неоднородность материала. При анализе такой корреляционной матрицы получают гипотетические величины, так называемые факторы, которые находятся в определенных взаимоотношениях с переменными. На рис. 1.1 схематично показано, как может выглядеть связь между переменными и факторами. Значения переменных от 1 до 8 были получены в результате наблюдения над рядом индивидуумов. Факторный анализ этих данных показал, что в основном два фактора, а именно А и Б, достаточно точно определяют взаимосвязь переменных. При этом фактор А тесно связан с переменными 1, 2, 3, 6 и 7, а фактор Б — с переменными 4, 5, 6, 7 и 8. Факторы представляют собой влияющие величины, не поддающиеся непосредственному измерению. Они находятся за кулисами изучаемого явления, служат его фоном и могут быть определены только в результате анализа. Примечательно то, что факторный анализ делает возможным выдвижение дифференцированных гипотез о структуре взаимосвязи переменных и факторов, не задаваясь этой структурой заранее и не имея о ней никаких сведений. Эта структура находится по результатам наблюдений. Полученные гипотезы могут быть проверены в ходе дальнейших экспериментов.

Итак, задачей факторного анализа является нахождение простой структуры, которая бы достаточно точно отражала и воспроизводила реальные, существующие в природе зависимости. При этом на реализацию принципа простой структуры оказывают сильное влияние вид и количество экспериментальных данных.

Односторонний подход к подбору переменных неизбежно приведет к таким факторам, которые не будут соответствовать изучаемому явлению. Результат факторного анализа определяемся постановкой всего исследования. Нельзя надеяться на то, что Хаотически собранные данные, подвергнутые факторному анализу по имеющейся стандартной программе, дадут осмысленные результаты. Но не исключено, что конечный результат факторного анализа может оказаться неудовлетворительным также в том случае, когда сбор данных проводился целенаправленно, согласно намеченному плану исследования.

Теоретические положения факторного анализа относительно трудны для восприятия. Практическое осуществление факторного анализа предполагает применение ЭВМ для обработки, данных.

Рис. 1.1. Взаимосвязь переменных с факторами. Гипотезы о связи факторов с переменными, выдвинутые с помощью факторного анализа на основе экспериментальных данных, обозначены пунктиром. Факторы — влияющие величины, не поддающиеся непосредственному измерению, находящиеся за кулисами изучаемого явления. Переменные — наблюдаемые величины, подвергающиеся непосредственному измерению, находятся на поверхности изучаемого явления

Метод не имеет однозначного математического решения, для получения такового на некоторых этапах используются различные вспомогательные приемы. Из-за этой неопределенности факторного анализа некоторые исследователи ставят под сомнение его полезность как орудия научного познания действительности. Сторонники факторного анализа объясняют встречающиеся в методе противоречия. Как в любой прикладной науке, здесь следует обращать внимание на различие между математической моделью и реальным содержанием изучаемого явления. Алгебраически-вычислительная сторона метода, в которой речь идет только о решении системы уравнений и точности вычислений, является лишь одним аспектом проблемы. Для факторного анализа характерен также статистический подход, применяемый, например, при проверке гипотезы о числе факторов, подлежащих выделению. Наряду с этим существует еще проблема содержательной интерпретации выделенных факторов, что не имеет места при построении математико-статистической модели. Три вышеназванных аспекта — алгебраически-вычислительную сторону, статистический подход и интерпретацию факторов — следует учитывать при проведении факторного анализа и разграничивать их.

Применение факторного анализа особенно эффектно в таких областях, где невозможно манипулировать наблюдаемыми переменными. Исследование поведения человека или его физиологических параметров, а также различных общественных явлений нельзя проводить классическим способом, поддерживая на одном и том/же уровне определенные величины или вводя различные ограничения. Однако для большинства явлений природы характерна вариация признаков. Ковариация различных признаков в неизменном окружающем мире дает возможность после точного анализа делать выводы, аналогичные результатам классических экспериментов.

Далее будут коротко затронуты некоторые существенные вопросы, возникающие при проведении факторного анализа, для того, чтобы на конкретных примерах показать, при каких условиях какой метод окажется особенно пригодным. Естественно, в первую очередь примеры будут относиться к области психологии, из которой и развился факторный анализ.

Классическим примером применения факторного анализа является теория интеллектуальных возможностей. Можно предположить, что интеллектуальные возможности состоят из большого числа параметров, характеризующих различные способности человека, такие, как память, внимательность, компетентность и т. д. Этим способностям с помощью психологических тестов пытаются дать количественные оценки и определяют их взаимосвязь. Тесты способностей, как правило, характеризуются положительными корреляциями. Спирмэн предположил, что все возможные совокупности корреляций обусловливаются одним генеральным фактором g, влияющим на все переменные. Этот генеральный фактор совпадает с тем, что обычно в обиходе называют смышленостью. После его психометрической изоляции можно определить, какие методы измерения более всего пригодны для его оценки, т. е. вычисляют нагрузки этого фактора по различным тестам. Обширные исследования показали, что одного генерального фактора недостаточно для описания наблюдений над интеллектуальными способностями. Может быть постулирована более сложная гипотеза, допускающая несколько факторов для адекватного статистического описания интеллекта. Это достигается путем введения новых методов измерения, связанных с решением арифметических задач, с проверкой способностей .к абстрактному мышлению, с проверкой словарного запаса и т. д. Другими словами, методы измерения представляют собой набор тестов, применяемый к репрезентативной выборке индивидуумов. Этим самым исследователи получили в руки измерительный инструмент для оценки гипотетической величины интеллекта, расчлененного на отдельные факторы. С помощью факторного анализа было показано, что интеллектуальные возможности человека можно представить в виде эмпирических показателей, а не только в виде слов или понятий. Эти показатели имеют количественные оценки. Понятие интеллекта заменяется рядом факторов, чьи отображения устанавливаются с помощью методов факторного анализа.

На основе психологических тестов, выявляющих интеллектуальные возможности человека, можно выделить набор факторов, которые большей частью коррелированы положительно, например факторы пространственного воображения, понимания слов и "К д. С помощью факторного анализа эмпирическим путем проверялись различные психологические теории интеллектуальных возможностей и умственных способностей человека. Такие исследования нашли практическое применение при оказании помощи в выборе профессии, при распределении рабочей силы по имеющимся рабочим местам, в решении проблем воспитания детей в семье и школе, в психотерапии и т. д.

Аналогично исследованию интеллектуальных возможностей с помощью факторного анализа многие ученые занимались изучением индивидуальных особенностей. Среди этих ученых прежде всего следует назвать Каттелла, который с помощью почти 2000 различных психологических тестов выделял в многочисленных экспериментах от 50 до 60 факторов. Каждый из этих факторов оценивался с помощью набора психологических тестов, примененных к отдельному испытуемому. По поводу психологического смысла выделенных факторов проводится много дискуссий, но уже стало очевидно, что эмпирический путь выявления структуры психологических понятий перспективен. Различные теории, которые возникли в результате использования факторного анализа, хорошо согласуются с известными клиническими наблюдениями и делают возможной классификацию людей по их характеру. Например, с помощью набора тестов можно определить, является ли испытуемый неврастеником или обладает бодрым и детерминированным характером, причем опыт показал, что результаты тестов соответствуют заключениям врачей.

Из области медицины пока еще нельзя привести таких убедительных примеров. В настоящее время дискутируется возможность диагностирования с помощью ЭВМ, где факторный анализ играет подчиненную роль. Он позволяет выработать единый подход к распознаванию болезней пациентов. В качестве примера можно привести исследование функционального состояния щитовидной железы, выполненное Овероллом и Вильямсом. Факторный анализ в этом случае сделал возможной оценку по ряду измеримых параметров величины, непосредственно не измеримой, а именно содержания тироксина в крови, не производя прямых измерений на щитовидной железе. Бочник и его сотрудники разработали с помощью факторного анализа некоторые комплексные вопросы из области психиатрии и неврологии. Основной проблемой в медицине в настоящее время является определение биологических типов. Методы факторного анализа уже привлекались к исследованию морфологических параметров для нахождения факторов, характеризующих конституционные особенности человека. Опыт показывает, что факторный анализ может с успехом применяться для решения многих медицинских задач.

Факторный анализ начинает применяться и в других областях знаний, например в экономике — для выявления факторов, действующих в народном хозяйстве, или в социологии — для анализа результатов выборов.

Но надо признаться, что, несмотря на эти попытки применения, факторный анализ как научная методика оправдал себя лишь в отдельных направлениях психологии. Аппарат факторного анализа привлекают в первую очередь к исследованию таких явлений, где необходимо выявить наиболее простую структуру по большому числу наблюдаемых переменных. По мере/накопления наблюдаемого материала выявить структуру только с помощью логических рассуждений становится труднее и на это затрачивается много времени. Факторный анализ позволяет произвести упорядочение данных, коротко описать взаимоотношения между переменными и получить вспомогательный материал для проверки интуитивных соображений исследователя.

В заключение хотелось бы предостеречь читателя от возможных ошибочных выводов, которые могут быть получены в результате неправильной содержательной интерпретации факторов. Кроме того, факторному анализу присущи некоторые трудности, которые обычно формулируются не полностью и описываются лишь в отдельных статьях. Несмотря на это — или как раз поэтому, - имеет смысл приложить усилия к овладению методом. Главной целью данной книги является возможно более широкое освещение трудностей и дискутирование основных проблем факторного анализа, даже если от этого повысятся требования к подготовке читателя и пострадает простота изложения. Естественно, что при таком способе изложения придется ожидать «ловушек», которых не избежать ни доверчивому новичку, ни опытному исследователю.

<< Предыдущий параграф Следующий параграф >>
Оглавление