Главная > Математика > Прикладная статистика: Исследование зависимостей
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

10.3.2. Выбор порядка сплайна, числа и положения узлов.

Это важная и ответственная задача, по своей методической роли эквивалентная выбору класса аппроксимирующих функций в обычном регрессионном анализе. От ее успешного решения существенно зависит, удастся ли при анализе данных использовать все преимущества, представляемые сплайнами, или нет. Здесь трудно дать рекомендации, верные для всех практических задач.

Однако, следуя [2581, мы попытаемся высказать некоторые общие соображения для случая, когда наблюдений относительно немного или они распределены крайне неравномерно вдоль оси регрессора. В этих условиях желательно:

1) использовать сплайны 3-го порядка;

2) вводить настолько мало узлов, насколько это возможно. На интервал между узлами иметь не менее 4 или 5 наблюдений. Это правило вызвано тем, что проблема «сверхподгонки» представляет для сплайнов реальную опасность;

Рис. 10.2. Базисные сплайны с равноотстоящими узлами: а) ; б)

3) иметь не более одной экстремальной точки (максимум или минимум) на интервале. Желательно, чтобы эта точка приходилась на центр соответствующего интервала, а точки перегиба линии регрессии были в окрестности узлов.

Другой подход к выбору узлов можно найти в [197, 245].

<< Предыдущий параграф Следующий параграф >>
Оглавление