Главная > Математика > Факторный анализ (Иберла К.)
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

7.2.1. Модель, сконструированная по результатам измерения кровяного давления

Описываемая далее модель позволяет подтвердить выводы, сделанные при обсуждении задач о ящиках и мячах. Модель дает возможность уяснить, что произойдет, если в анализ включают повторные измерения переменных. Модель показывает, при каких условиях и как точно может быть определена корреляция между факторами. На примере небольшой ошибки, вкравшейся в исходные данные и выявленной в ходе анализа, показывается, какое влияние оказывают ошибки на результат факторного анализа.

У 90 американских студентов мужского пола в течение 30 мин 12 раз измерялось систолическое и диастолическое кровяное давление. В распоряжении экспериментатора в итоге имеются 24 переменные, вариация которых в основном определяется двумя влияющими величинами, а именно систолическим и диастолическим кровяным давлением. Оба фактора должны быть выявлены в результате анализа. Ожидаемое факторное отображение представлено в табл. 7.3. Переменные поочередно нагружают то первый, то второй фактор.

Корреляционная матрица для первых 12 переменных была представлена в табл. 3.14. Результаты различных оценок общностей были приведены в табл. 4.1. Процедура вращения 12 переменных обсуждалась в гл. 5.3 и 5.5. Распределение остаточных коэффициентов корреляции между 24 переменными было приведено в табл. 3.25 и изображено на рис. 3.14. Мы отказываемся от воспроизведения всей корреляционной матрицы из-за отсутствия места. В качестве оценок общностей были выбраны КМК. В табл. 7.3 представлены три решения, полученные в процессе факторного анализа, а именно: система главных факторов, варимакс-решение и косоугольная простая структура, достигнутая графическим вращением. Путем сравнения можно убедиться, что главные факторы не согласуются с ожидаемым факторным отображением. Варимакс-вращение также не позволило четко разделить оба фактора, как это было достигнуто при косоугольном вращении на основе Rotoplot-программы. Проверка значимости факторов варимакс-решения не дала положительных результатов. Хотя точки-переменные расположены на плоскости в виде двух плотных скоплений и четко разделены между собой, они не ортогональны друг другу. В косоугольном решении оба фактора являются значимыми по критерию Баргмана. Каждый фактор определяется двенадцатью переменными, для которых соблюдается условие . На рис. 7.3-7.5 представлены результаты всех трех решений. При анализе главных факторов первый фактор не позволяет отделить систолические переменные от диастолических. Второй фактор биполярен. В варимакс-решении оба скопления точек находятся вблизи осей координат, но при сохранении ортогональности осей нельзя добиться, чтобы переменные четко определяли оба фактора. Лишь косоугольное вращение приводит к желаемому результату.

В данном примере было достигнуто согласие с ожидаемым факторным отображением, несмотря на то что вся процедура вычислений, начиная с корреляционной матрицы до косоугольного вращения, выполнялась вслепую.

Таблица 7.3. Модель, построенная на данных измерения кровяного давления

Знание заданной структуры не оказывало влияния на результат. Факторный анализ позволил разделить 24 переменные по двум факторам. Каждый из этих факторов нагружается либо только «систолическими», либо только «диастолическими» переменными. Этот пример примечателен тем, что в нем выявилась особенно четкая структура.

Коэффициент корреляции между обоими факторами равен 0,49. Для сравнения было проверено наличие корреляции между результатами измерения систолического и диастолического давления крови. С этой целью вычислили сначала средние значения систолического и диастолического кровяного давления для каждого индивидуума и по полученным значениям для всей выборки индивидуумов вычислили коэффициент корреляции. Он оказался равным 0,53, что достаточно точно согласуется с корреляцией между факторами. Применение облимакс-вращения приводит практически к тому же самому факторному отображению, что и Rotoplot-программа с 12 переменными. В облимакс-решении коэффициент корреляции между факторами оказался равным 0,54. В 5.5.2 уже указывалось, что метод облимакс имеет тенденцию к завышению коэффициентов корреляции между факторами по сравнению с действительными их значениями.

При одном из предварительных исследований измерений кровяного давления методом главных факторов было получено решение, изображенное на рис. 7.6. По сравнению с рис. 7.3 переменные 4, 5, 6 и 18 имеют значительно меньшую общность, о чем можно судить по расстоянию до нулевой точки. Кроме того, они расположены немного в стороне от обеих групп точек. Никакого серьезного объяснения отличия этих переменных от остальных не было найдено. Не представляется возможным объяснить также это отклонение за счет случайной вариации.

Рис. 7.3. Решение методом главных факторов. Кружочками обозначены результаты измерений систолического кровяного давления, крестиками — диастолического

Рис. 7.4. Варимакс-вращение. Кружочками обозначены результаты измерений систолического кровяного давления, крестиками — диастолического

После проверки данных выяснилось, что в результате измерений, представляющих переменные 4,6 и 18, была допущена грубая ошибка — промах. У одного студента неправильно измерили давление, в результате чего были получены заниженные значения переменных 4 и 6. Поэтому эти переменные сильнее коррелируют друг с другом, чем с остальными. После выделения двух факторов остаточная корреляция была вызвана только этими переменными. Значение КМК, используемое в качестве оценки общности, было занижено в связи с этой ошибкой. Все это дает основание предположить, что переменные 4 и 6 связаны с третьей величиной, а именно с одним общим фактором. Этим общим фактором является, как выяснилось, допущенная ошибка в измерениях. Значение переменной 18 также связано с ошибкой измерения давления, но уже у другого студента. Вот почему эта переменная слабо коррелирует с другими переменными и оценка общности для нее получилась заниженной. После исключения указанных ошибок получено факторное решение, изображенное на рис. 7.3.

Отсюда ясно, что исходные данные нужно подвергать проверке, чтобы не допустить ошибок любого вида.

Погрешность, допущенная при измерении одной переменной, приводит к уменьшению ее общности. Если ошибка была допущена при измерении нескольких переменных на одном и том же индивидууме, то это приводит к появлению специфичного фактора. В данном примере ожидаемая структура была известна, так что ошибку было легко обнаружить. Но при неизвестной структуре пришлось бы интерпретировать решение, полученное по недоброкачественным исходным данным, в результате чего можно прийти к ложному выводу.

Рис. 7.5. Косоугольное вращение. Кружочками обозначены результаты измерений систолического кровяного давления, крестиками — диастолического

Рис. 7.6. Решение методом главных факторов по данным, содержащим ошибки измерений. Кружочками обозначены результаты измерений систолического кровяного давления, крестиками — диастолического

Факторным решениям присущ и другой вид погрешности — случайный, который носит вероятностный характер. Нужно прилагать усилия к тому, чтобы уменьшать и случайную погрешность в измерениях с целью сделать выявляемую структуру более однозначной и четкой.

<< Предыдущий параграф Следующий параграф >>
Оглавление