1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192
Макеты страниц
2. КОРРЕЛЯЦИЯЭлементами исходной матрицы в факторном анализе являются коэффициенты корреляции. Вся процедура расчетов начинается с определения коэффициентов корреляции внутри изучаемой совокупности переменных. Не вдаваясь глубоко в теорию корреляции, составляющей часть математической статистики, мы осветим лишь те вопросы, которые имеют непосредственное отношение к факторному анализу и его расчетной реализации. Поскольку корреляция рассчитывается применительно к переменным, необходимо прежде всего определить, что такое переменная. Переменную можно просто определить следующим образом: это такая величина, которая в ходе данного процесса может изменяться, т. е. принимать различные значения. Например, если под переменной понимать тест, используемый для определенной группы лиц, то он представляет собой переменную в том смысле, что результаты этого теста у отдельных обследованных людей будут изменяться в определенных границах. Как трактуется зависимость между двумя переменными с помощью корреляции? Прежде всего осуществляется серия наблюдений за двумя интересующими нас в данном случае переменными. Это могут быть, например, такие переменные, как рост отцов и сыновей. Затем попытаемся определить, существует ли какая-нибудь связь между ростом отцов и сыновей. Одной переменной будут различные значения (наблюдения) роста отцов, второй — роста сыновей. Для этого осуществляется максимально возможное количество таких наблюдений (в практике оно должно быть не менее 100), в ходе которых накапливаются пары наблюдений: рост отца и рост его сына. При изучении зависимости между двумя переменными необходимо всегда выбирать какие-либо пары наблюдений. Подбор этих пар определяется содержательной постановкой задачи анализа. В приведенном примере мы хотим определить, существует ли зависимость между ростом отцов и сыновей. Следовательно, нужно составить пары наблюдений, составленные из: а) наблюдения роста отца и б) наблюдения роста его сына. В случае, когда изучается связь между ростом и весом, осуществляются наблюдения над некоторым множеством объектов, причем каждая пара наблюдений относится к одному и тому же объект}. Собрав соответствующее количество таких пар наблюдений, можно по определенному методу рассчитать коэффициент корреляции (коэффициент взаимосвязи), величина и алгебраический знак которого показывают, существует ли связь и если существует, то каковы ее степень и направление. Положительная связь, когда коэффициент корреляции имеет знак плюс, говорит о том, что обе переменные изменяются в одном направлении, т. е. чем выше отец, тем выше сын, чем ниже отец, тем, вообще говоря, ниже сын. Отрицательная связь, когда коэффициент корреляции имеет знак минус, говорит, что переменные изменяются в противоположном направлении. В нашем примере — чем выше отец, тем ниже сын, и наоборот: чем ниже отец, тем выше сын. Нулевое или близкое к нулю значение коэффициента корреляции означает, что обе переменные изменяются независимо друг от друга. Значения коэффициента корреляции находятся в границах от —1 до +1. Значение -1 соответствует случаю линейной положительной корреляции, —1 — линейной отрицательной связи. Оба эти случая редко встречаются в практике. Выше уже говорилось, что нулевой коэффициент корреляции означает полное отсутствие взаимосвязи. Значения коэффициента корреляции в границах от +1 до -1 соответствуют промежуточным степеням взаимосвязи переменных. В нашем примере линейная положительная связь существует тогда, когда во всех наблюдениях более высокий отец имеет более высокого сына, и наоборот, более низкий отец имеет менее высокого сына. Соответственно этому линейная отрицательная связь существует в том случае, когда во всей совокупности наблюдений более высокому отцу соответствует более низкий сын, и наоборот. Решающее значение имеет еще одна проблема. Из показателей корреляции чаще всего пользуются коэффициентом корреляции смешанного момента Пирсона—Бравэ, обозначаемым буквой Выбор наиболее подходящего для факторного анализа метода зависит от разных обстоятельств, имеющих более или менее существенный характер. Помимо основных особенностей показателей корреляции имеют значение и такие факторы, как экономия на расчетах. Сточки зрения простоты расчетов весьма удобным является четырехпольный коэффициент корреляции В других случаях один показатель требует больших расчетов по сравнению с другим. Наиболее подходящим для факторного анализа представляется коэффициент корреляции Пирсона—Бравэ. Он используется для непрерывных переменных и больших выборок (N 50). Для упрощения расчетов часто рекомендуется определенная разновидность показателя Пирсона — формула для необработанных оценок. Она имеет следующий вид: где X и Y — необработанные результаты наблюдений двух переменных, Эта формула может иметь также следующий вид: Приведенные формулы Пирсона не требует того, чтобы наблюдения выражались в терминах стандартного отклонения. Стандартные отклонения часто используются в статистике. Подробное изложение содержания этой категории не входит в нашу задачу, поэтому мы лишь напомним, что она явится одним из показателей разброса наблюдений вокруг их средней арифметической. Представляется целесообразным использование в каждом исследовании какого-либо одного коэффициента корреляции. Помимо уже отмеченного важного условия, что зависимость, выраженная коэффициентом корреляции, должна быть линейной, необходимо учитывать некоторые общие обстоятельства, влияющие на значимость коэффициента корреляции. Сюда относятся такие проблемы, как размер и репрезентативность исследуемой выборки по отношению к генеральной совокупности, однородность изучаемой группы с точки зрения каких-либо важных переменных, точность и аккуратность наблюдений и т. д. В случае психологических тестов точность наблюдений имеет особое значение. Точность, называемая также надежностью, определяется разными методами. Необходимо различать точность как свойство данного инструмента наблюдений и различные способы ее определения. Укажем в этой связи на одну из точек зрения по данному вопросу, высказанную в «Технических рекомендациях для психологических тестов и диагностических методов», которыми руководствуется Американская психологическая ассоциация. Точность как свойство данного инструмента наблюдений можно в широком смысле определить как степень, в которой этот инструмент всегда дает одинаковые наблюдения одной и той же величины. Если речь идет о тестах, то можно говорить о степени устойчивости результатов, полученных при нескольких реализациях одного и того же теста или при параллельных реализациях близких вариантов этого теста. Способы измерения точности разнообразны. Можно указать на следующие часто применяемые показатели: 1. Коэффициент корреляции между оценками, полученными в отстоящих друг от друга на определенный период времени двух последовательных обследованиях с помощью данного теста одной и той же группы людей. Этот показатель называется коэффициентом стабильности. 2. Коэффициент корреляции между оценками, полученными в двух обследованиях одной и той же группы, проведенных примерно в одно и то же время с помощью двух параллельных форм данного теста. Этот показатель называется коэффициентом эквивалентности. 3. Сначала рассчитываются корреляции между половинами данного теста, а затем используется формула Спирмэна — Брауна: где Этот способ упрощает сбор данных, так как можно получить информацию для расчета точности после одноразового применения данного теста. Некоторые трудности иногда возникают при определении эквивалентных половин теста. На практике применяются различные способы. Например, если тест состоит из большого числа элементов, то определяется корреляция между оценками всех четных и оценками всех нечетных элементов. На этом мы заканчиваем общие рассуждения о корреляции и переходим к более детальному рассмотрению проблем, непосредственно связанных с теорией факторного анализа.
|
Оглавление
|