Главная > Математика > Прикладная статистика: Исследование зависимостей
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

В.2. Какова конечная прикладная цель статистического исследования зависимостей?

С этого вопроса должно начинаться любое статистическое исследование зависимостей. Ведь от ответа на этот вопрос существенно зависят план исследования, выбор общей структуры математической модели, интерпретация получаемых статистических характеристик и выводов и т. д.

Итак, для чего же строятся математические модели типа (В.3), описывающие статистические зависимости между исследуемыми переменными: результирующими показателями с одной стороны, и соответствующими объясняющими (предикторными) переменными с другой стороны?

Выделим три основных типа конечных прикладных целей подобных исследований, расположив их как бы по нарастанию глубины проникновения в содержательную сущность анализируемой конкретной задачи.

Тип 1: Установление самого факта наличия (или отсутствия) статистически значимой связи между Y и X. При такой постановке задачи статистический вывод имеет двоичную (альтернативную) природу — «связь есть» или «связи нет» — и сопровождается обычно лишь численной характеристикой (измерителем) степени тесноты исследуемой зависимости. Выбор формы связи (т. е. класса допустимых решений F и конкретного вида функции в модели (В.3)) и состава предикторов X играет подчиненную роль и нацелен исключительно на максимизацию величины этого измерителя степени тесноты связи: исследователю часто не приходится даже «добираться» до конкретного вида функции f(X) и тем более он не претендует на анализ причинных влияний переменных X на результирующие показатели.

Тип 2: прогноз (восстановление) неизвестных значений интересующих нас индивидуальных или средних значений исследуемых результирующих показателей по заданным значениям X соответствующих (предикторных) переменных. При такой постановке задачи статистический вывод включает в себя описание интервала (области) вероятных значений прогнозируемого показателя или и сопровождается величиной доверительной вероятности Р, с которой гарантируется справедливость нашего прогноза, формализуемого с помощью утверждения вида или . Как и в предыдущем случае, выбор формы связи (т. е. класса допустимых решений F и конкретного вида функции в модели и состава предикторов X играет подчиненную роль и нацелен исключительно на минимизацию ошибки получаемого прогноза. Однако в данном случае (в отличие от предыдущего) исследователь существенно использует значения функции , которые являются отправной точкой при построении прогнозных интервалов (областей) . Последние обычно определяются в форме множества всех тех значений Y, которые удовлетворяют неравенствам

где — гарантируемая (с вероятностью не меньшей заданного значения Р) максимальная величина ошибки прогноза. Таким образом, исследователя интересуют в данном случае лишь значения функции , но не ее структура, определяющая, в частности, соотношение удельных весов влияния объясняющих переменных на каждый из результирующих показателей . Так, например, если при статистическом оценивании неизвестной истинной зависимости

исследователю удалось получить оценку функции f(X) в виде

и при этом было установлено, что объясняющие переменные связаны между собой «почти функциональной» линейной зависимостью

то функция будет обладать хорошими прогностическими свойствами, несмотря на существенное отличие ее коэффициентов при от соответствующих коэффициентов истинной функции . (Обращаем внимание читателя на тот факт, что коэффициенты при в функциях и отличаются даже по знаку!) При подстановке заданных значений объясняющих переменных в правые части (В.9) и (В.9'), при условии, что эти значения связаны приближенным соотношением (В.10), мы будем получать совпадающие (или приближенно совпадающие) результаты , характеризующие усредненную величину исследуемого результирующего показателя.

Тип 3: выявление причинных связей между объясняющими переменными X и результирующими показателями Y, частичное управление значениями Y путем регулирования величин объясняющих переменных X.

Такая постановка задачи претендует на проникновение в «физический механизм» изучаемых статистических связей, т. е. в тот самый механизм преобразования «входных» переменных в результирующие показатели Y (см. рис. В.1), который в большинстве случаев исследователь, не будучи в состоянии его конструктивно описать, вынужден именовать (следуя сложившейся кибернетической терминологии) «черным ящиком».

И при выявлении причинных связей, и при намерении исследователя использовать модели типа (В.3) или (В.4) для управления значениями результирующих показателей или путем регулирования величин объясняющих переменных X на первый план выходит задача правильного определения структуры модели (т. е. выбора общего вида функции ), решение которой обеспечивает возможность количественного измерения эффекта воздействия на каждой из объясняющих переменных в отдельности. Однако как раз это место (правильный выбор общего вида функции f(X)) и является самым слабым во всей технике статистического исследования зависимостей: к сожалению, не существует стандартных приемов и методов, которые образовывали бы строгую теоретическую базу для решения этой важнейшей задачи (некоторые рекомендации по проведению этого этапа исследования содержатся в гл. 6).

Заметим, что исследователи, пожалуй, чаще других ставят перед собой именно цели типа 3. И в таких прикладных задачах, как управление качеством продукции с помощью регулирования хода технологических процессов [95, 47], прогноз и анализ объемов произведенной продукции по затратам на трудовые ресурсы и капитальные вложения [31, 152], построение интегральных целевых функций, описывающих эффективность функционирования экономических единиц (предприятий, семей) по набору частных характеристик [9, 11, 128] и др., это вполне оправдано. Однако, к сожалению, далеко не всегда целевые установки исследователей подкреплены объективными возможностями их реализации.

<< Предыдущий параграф Следующий параграф >>
Оглавление