Главная > Математика > Прикладная статистика: Исследование зависимостей
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

ВЫВОДЫ

1. При практическом применении мнк-оценок исследователь часто сталкивается с явлением мультиколлинеарности, когда объясняющие переменные сильно коррелированы, т. е. существуют выраженные, хотя и неточные, линейные связи между несколькими или всеми объясняющими переменными.

В этой ситуации точность обычных мнк-оценок резко падает: ошибки некоторых параметров уравнения регрессии становятся очень большими, эти ошибки сильно скоррелированы, выборочные дисперсии резко возрастают. Резко сокращаются возможности интерпретации уравнения регрессии. Степень мультиколлинеарности измеряется либо обратной величиной минимального собственного числа нормированной (корреляционной) матрицы, либо числом обусловленности, равным отношению максимального собственного числа к минимальному. Если минимальное собственное число равно нулю, то степень мультиколлинеарности и число обусловленности являются бесконечно большими, и мы имеем дело с точной мультиколлинеарностью или вырожденной системой линейных уравнений.

2. Оценивание параметров уравнения регрессии в случае сильной мультиколлинеарности основано на различных методах регуляризации задачи — модификациях регрессии на главные компоненты, гребневых и редуцированных оценках. Со статистической точки зрения получаемые оценки являются, в отличие от мнк-оценок, смещенными. Однако они обладают рядом оптимальных свойств, в частности обеспечивают лучшие прогностические свойства оцененного уравнения регрессии на объектах, не вошедших в обучающую выборку.

3. Одним из методов получения оценок параметров уравнения регрессии при мультиколлинеарности является отбор существенных (информативных) объясняющих переменных. Существует ряд мер качества набора переменных, которые используются алгоритмами отбора. Все они являются функциями от коэффициента детерминации, объема выборки и количества переменных, входящих в набор. В отличие от коэффициента детерминации, который не может уменьшаться при расширении набора объясняющих переменных, меры качества, используемые при отборе переменных, могут при этом убывать.

4. Алгоритмы отбора переменных отличаются используемым критерием качества набора и способом генерации наборов переменных для их сравнения. Из схем генерации удобными с вычислительной точки зрения являются пошаговые схемы — простого добавления, простого удаления, добавления с удалением и схемы выметания.

В настоящее время в связи с ростом возможностей ЭВМ получают распространение и схемы прямого перебора, и различные его оптимизации на основе метода ветвей и границ. Пошаговые схемы хотя и не гарантируют получения оптимального по выбранному критерию набора, однако позволяют обычно получить наборы, вполне удовлетворительные для практического применения.

<< Предыдущий параграф Следующий параграф >>
Оглавление