<< Предыдущий параграф

Следующий параграф >>

100

101

102

103

104

105

106

107

108

109

110

111

112

113

114

115

116

117

118

119

120

121

122

123

124

125

126

127

128

129

130

131

132

133

134

135

136

137

138

139

140

141

142

143

144

145

146

147

148

149

150

151

152

153

154

155

156

157

158

159

160

161

162

163

164

165

166

167

168

169

170

171

172

173

174

175

176

177

178

179

180

181

182

183

184

185

186

187

188

189

190

191

192

193

194

195

196

197

198

199

200

201

202

203

204

205

206

207

208

209

210

211

212

213

214

215

216

217

218

219

220

221

222

223

224

225

226

227

228

229

230

231

232

233

234

235

236

237

238

239

240

241

242

243

244

245

246

247

248

249

250

251

252

253

254

255

256

257

258

259

260

261

262

263

264

265

266

267

268

269

270

271

272

273

274

275

276

277

278

279

280

281

282

283

284

285

286

287

288

289

290

291

292

293

294

295

296

297

298

299

300

301

302

303

304

305

306

307

308

309

310

311

312

313

314

315

316

317

318

319

320

321

322

323

324

325

326

327

328

329

330

331

332

333

334

335

336

337

338

339

340

341

342

343

344

345

346

347

348

349

350

351

352

353

354

355

356

357

358

359

360

361

362

363

364

365

366

367

368

369

370

371

372

373

374

375

376

377

378

379

380

381

382

383

<< Предыдущий параграф

Следующий параграф >>

Научная библиотека

Математический справочник

ЕГЭ и ОГЭ

Forex4you

Живые анекдоты

Научная библиотека

избранных естественно-научных изданий

Научная библиотека служит для получения быстрого и удобного доступа к информации естественно-научных изданий, получивших широкое распространение в России и за рубежом. На сайте впервые широкой публике представлены некоторые авторские издания написанные ведущими учеными страны.

Во избежании нарушения авторского права, материал библиотеки доступен по паролю ограниченному кругу студентов и преподавателей вузов. Исключение составляют авторские издания, на которые имеются разрешения публикации в открытой печати.

Математика

Физика

Методы обработки сигналов

Схемотехника

Астрономия

Разное

Научная библиотека

Математический справочник

ЕГЭ и ОГЭ

Forex4you

Живые анекдоты

Научная библиотека

избранных естественно-научных изданий

Математика

Физика

Методы обработки сигналов

Схемотехника

Астрономия

Разное

Макеты страниц

2.2.2. Классификация факторов и связь между отдельными видами факторов

Задачей факторного анализа является определение матрицы А. Следует иметь в виду, что за время развития идей факторного анализа вошел в употребление ряд терминов, строго не дифференцированных. Но они имеют практическое значение, так как часто встречаются в литературе, и, кроме того, заслуживают внимания из-за своего основополагающего значения. Поэтому мы будем останавливаться на этих терминах. Как уже отмечалось, матрица А называется факторным отображением, а ее элементы — факторными нагрузками. При ортогональных факторах, которые мы до сих пор исключительно и рассматривали, элементы принимают значения между —1 и +1.

Если факторы не ортогональны, то элементы могут принимать большие значения. Здесь мы ограничимся только этим замечанием. Каждый фактор характеризуется столбцом, каждая переменная — строкой матрицы А. Если факторная нагрузка значительно больше или меньше нуля, то принята упрощенная форма записи в виде крестика в соответствующем месте факторного отображения (см. рис. 2.3).

Выражение «значительно больше или меньше нуля» здесь означает не в математическом смысле, а такое значение которое превосходит более или менее произвольное или заданное на определенном уровне значимости критическое значение. Это критическое значение не требует более точного определения для введения дальнейших понятий.

Пока нам достаточно лишь указать в каждом конкретном случае это критическое значение, которое позволяет выделить, различные виды факторов, если фактора превосходит это значение. При этом всеми другими нагрузками этого фактора пренебрегают, т. е. факторное отображение упрощается. Нагрузки, которые считаются существенными, обозначаются на схеме факторного отображения крестиком (X), а пустые клетки матрицы А соответствуют нагрузкам, которыми можно пренебречь.

Рис. 2.3. Схематическое изображение факторного отображения. Крестик X означает высокую факторную нагрузку

Фактор называется генеральным (general factor), если все его нагрузки значительно отличаются от нуля. Следовательно, он имеет нагрузки от всех переменных и схематически такой фактор изображается столбиком А на рис. 2.3. Фактор называется общим (common factor), если хотя бы две его нагрузки значительно отличаются от нуля. Столбики А, В, С на рис. 2.3 представляют такие общие факторы. Они имеют нагрузки от двух и более переменных. Они могут взаимно перекрываться, т. е. одни и те же переменные могут давать нагрузки на несколько факторов. Генеральный фактор является частным случаем общих факторов, так как он имеет более двух значимых нагрузок. В противоположность этому факторы являются индивидуальными, если у них только одна нагрузка значительно отличается от нуля (см. столбики на рис. 2.3). В этом случае говорят о характерных факторах (unique factors), которые представляют только одну переменную. По аналогии с факторами можно провести классификацию переменных по числу достаточно высоких нагрузок. Число высоких нагрузок переменной на общие факторы называется ее сложностью (complexity). Например, переменная 1 на рис. 2.3 имеет сложность Два, переменная 4 — три.

Решающее значение в факторном отображении на рис. 2.3 имеют общие факторы А, В, С. Как будет еще показано, характерные факторы получаются автоматически, если общие факторы установлены.

Гипотеза, которая содержит факторное отображение на рис. 2.3, может быть представлена в другой форме на рис. 2.4. Связь трех факторов Л, В, С с восемью переменными изображена прямыми.

Любая матрица, которая, например, содержит общие факторы A, B, C, отражает дифференцированные гипотезы о структуре величин, которые отчасти стоят за наблюдаемыми переменными (т. е. являются факторами), а отчасти сами являются переменными. Рис. 2.3 и 2.4 соответствуют друг другу. Хотя это и наглядно, результат факторного анализа не изображается графически в форме, приведенной на рис. 2.4. Чаще всего используется схема рис. 2.3. При любом факторном отображении легко перейти от одного способа изображения к другому. Общие факторы для отличия их от переменных обозначаются здесь буквами А, В и С. Однако чаще всего они обозначаются римскими цифрами.

Рис. 2.4. Структура гипотезы факторного отображения рис. 2.3. Прямые, соединяющие факторы А, В, С с переменными, соответствуют высоким факторным нагрузкам

Нагрузки общих и характерных факторов связаны определенным соотношением через единичную дисперсию переменных. Действительно, эта единичная дисперсия равна:

Подставляя значения из (2.12) в (2.17) (причем мы берем не факторов, а при этом ), в результате получим

Теперь постулируем, что факторы должны быть стандартизованы и некоррелированы, тогда суммы — и т. д. все равны 1, а суммы в скобках все равны 0. Итак, имеем

Сумма квадратов всех нагрузок одной переменной равна единице. Равенство (2.18) выполняется при условии, что переменные стандартизованы, факторы стандартизованы и некоррелированы и в основу положена линейная модель.

Соблюдение этих условий является необходимым требованием при использовании наиболее употребляемых сегодня методов. Равенство (2.18) можно записать в более модифицированном виде (2.19), где в скобках сначала приведены нагрузки общих факторов, а затем — доля дисперсии характерного фактора. Равенство (2.19) отличается от (2.18) лишь последними тремя членами.

Полная дисперсия переменной по равенству (2.19) раскладывается на отдельные компоненты, которые представляют собой квадраты факторных нагрузок. Для наглядности это разложение графически представлено на рис. 2.5. Суммы квадратов нагрузок общих факторов называются общностью (communality) . Это та доля дисперсии, которая указана в скобках равенства (2.19).

Общность представляет собой часть единичной дисперсии переменной, которую можно приписать общим факторам. Она равна квадрату коэффициента множественной корреляции между переменной и общими факторами. Если из 1 вычесть , то останется доля дисперсии, обозначаемая которая соответствует квадрату нагрузки определенного характерного фактора. Далее и называется характерностью. Она представляет собой часть единичной дисперсии переменной, которая не связана с общими факторами:

Как показывает вторая половина равенства, характерность можно разбить на две составляющие, одна из которых, называется специфичностью, а другая, является дисперсией, обусловленной ошибкой. Такое разделение на практике проводится редко. Специфичность является той долей единичной дисперсии переменной, которая не связана с общими факторами, не может быть также сведена к ошибке и присуща лишь одной определенной переменной. Специфичность и общность образуют надежность (reliability).

Надежность, являясь долей единичной дисперсии, дополняет дисперсию ошибки до единицы. Она может быть измерена различными способами, описание которых можно найти в [69]. Здесь этот вопрос подробно рассматриваться не будет. В любом случае из (2.22) следует, что общность не превышает надежности и равна ей только в случае нулевой специфичности.

Приведенные только что понятия графически представлены на рис. 2.5. Первая строчка на рисунке представляет собой дисперсию любой переменной, приведенную к единице, или 100%.

Эту единичную дисперсию можно разбить на две составляющие: общность , которая обусловливается общими для нескольких переменных факторами, и характерность , которая может быть приписана только этой переменной (вторая строчка на рисунке). Обе составляющие можно расчленить еще дальше (третья строка на рисунке), а именно: на квадраты отдельных факторных нагрузок, дисперсию ошибки и специфичность Сумма общности и специфичности образует надежность, и она является дополнением дисперсии ошибки до единицы (четвертая строка рисунка).

Теперь поставим задачу — получить общность и соответствующий характерный фактор из корреляционной матрицы. Основная модель факторного анализа записывается следующим образом: (равенство ).

Рис. 2.5. Составляющие полной дисперсии переменной по равенству (2.19)

В этой модели не проводите я разницы между общими и характерными факторами. В равенстве (2.23) постулируется для каждой переменной характерный фактор. Эта специальная модель многофакторного метода имеет следующий вид:

или в матричной форме:

При этом Z является, как и в равенстве (2.13), матрицей исходных данных, записанных в стандартизованной форме. F — факторное отображение, включающее характерные факторы, т. е. F является матрицей порядка, имеет размер и содержит значения факторов у отдельных индивидуумов, включая значения характерных факторов. Подробно это записывается в следующем виде:

F можно представить в виде суммы двух матриц, а именно (равенство (2.25)). F представляет собой так называемую полную факторную матрицу. Она содержит нагрузки общих и характерных факторов. А является редуцированной факторной матрицей, содержащей нагрузки общих факторов. Она дополняется справа на столбцов путем присоединения нулевых элементов. Это дополнение необходимо только для последующих математических выкладок. В общем под А понимается так же, как в равенствах (2.13)-(2.15), матрица нагрузок общих факторов. С этой матрицей А обычно работают (и она приводится в литературе), так как полная факторная матрица и U легко получаются из нее (по формуле ). Матрица U является диагональной и содержит нагрузки характерных факторов на главной диагонали. Она дополняется слева на столбцов путем присоединения нулевых элементов.

где

Применив фундаментальную теорему, можем записать:

Путем соответствующих выкладок легко показать, что Следовательно,

Так как (при этом матрицы можем рассматривать без их дополнений), то

или

R — корреляционная матрица с единицами на главной диагонали; — корреляционная матрица с общностями на главной диагонали. Ее называют также редуцированной корреляционной матрицей:

Элементами матрицы соответственно являются

Наконец, является диагональной матрицей с характерностями на главной диагонали, равенства (2.28) видно, что выбором диагональных элементов устанавливаются величины общностей, а в необходимости их определения мы уже убедились во вводных примерах.

До сих пор предполагалось, что факторы не коррелированы друг с другом, т. е. речь шла только об ортогональных факторах. Это было удобно для упрощения формулировки задачи и математической записи решения. Однако, если подходить с общенаучной точки зрения, постулирование только ортогональных факторов сужает проблему, хотя этим достигается упрощенная в математическом смысле «идеальная картина». И надо иметь в виду, что в действительности она встречается редко, так как многие влияющие факторы наверняка коррелируют друг с другом. Поэтому мы хотели бы вначале формально обсудить возможность косоугольных факторов и соотношения между ними.

Выше была выведена формула , где С является матрицей коэффициентов корреляции между факторами. Вначале для упрощения уравнения мы постулировали, что и получали частное решение. Решение же в общем случае усложняется. Однако если вначале вычислить ортогональную матрицу А, то можно вслед за тем искать решение для косоугольных факторов по критериям, которые еще будут обсуждаться. Получение однозначного решения для косоугольных факторов более сложно. Обычно задается либо С, либо матрица которая содержит коэффициенты корреляции между переменными и факторами и называется факторной структурой (factor structure). Далее для матриц с косоугольной факторной структурой используется обозначение V. Индексы обозначают факторную структуру. Позднее остановимся на различных видах этих матриц.

или в подробной записи:

Итак, для коэффициентов корреляции между переменными и факторами имеет место соотношение по (2.29):

(2.30)

При , т. е. в случае ортогональных факторов факторное отображение идентично структуре: Тогда в правой стороне равенства (2.30) остается только один член, а именно тот, множителем которого является с так как при всех .

Все представленные до сих пор равенства и определения содержат важнейшие концепций факторного анализа, а также основную и специальную модели многофакторного анализа. С их помощью теперь можно приступить к описанию общей процедуры решения.

<< Предыдущий параграф

Следующий параграф >>

Оглавление