Главная > Математика > Прикладная статистика: Исследование зависимостей
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

В.4. Некоторые типовые задачи практики

Накопленный опыт практического использования аппарата статистического исследования зависимостей позволяет выделить те типы основных прикладных направлений исследований, в которых этот аппарат работает особенно часто и плодотворно. Если попытаться расщепить общую проблему оптимального управления сложной системой (т. е. центральную проблему кибернетики) на основные составляющие (рис. В.3), то в качестве этих составляющих как раз и фигурируют именно те направления прикладных исследований, в разработке которых существенную роль играет математический аппарат статистического исследования зависимостей.

Рис. В.3. Основные направления практического использования аппарата статистического исследования зависимостей и центральная проблема кибернетики

Естественность предложенного здесь расщепления общей проблемы оптимального управления сложной системой легко пояснить практически на любом примере принятия управленческого решения. Остановимся, скажем, на примере принятия управленческого решения руководителем производственного или учрежденческого подразделения при зачислении в штат нового сотрудника. Основываясь на знании необходимой информационной базы (в данном случае это целевые установки и возможности подразделения и основные сведения о принимаемом сотруднике), лицо, принимающее решение (ЛПР), должно последовательно проанализировать и решить следующие задачи:

а) определить нормативные требования к деятельности сотрудников, т. е. пронормировать их труд (направление l на рис. В.3);

б) спрогнозировать возможности сотрудника и, сопоставив их с основными целевыми установками подразделения, спланировать его деятельность, включив ее в план общего фронта работ, выполняемых подразделением (направление

И);

в) при прогнозировании потенциальных возможностей нового сотрудника (а в ряде случаев — и при последующей оценке эффективности его деятельности) весьма существенным оказывается умение оценить ряд таких не поддающихся непосредственному измерению его качеств, как инициативность, творческая активность, дисциплинированность, трудолюбие, обязательность, «контактность» с другими членами коллектива и т. п. (направление III);

г) в некоторых (особенно не производственных) областях деятельности человека оценка эффективности его работы (без которой невозможно оптимальное управление) сводится к весьма трудной задаче построения агрегированного показателя (латентного, т. е. скрытого, непосредственно не измеряемого) ее качества (направление IV);

д) и наконец, опираясь на решение задач а)-г) и на возможность регулирования параметров (в данном случае стимулирующего и «штрафного» характера), от которых в определенной мере и в соответствии с некоторой, как правило, статистической закономерностью зависит уровень эффективности работы сотрудника, ЛПР осуществляет такую «настройку» значений этих параметров, которая обеспечивает, по возможности, оптимальный режим функционирования всей системы, т. е. вверенного ему подразделения (направление V).

Остановимся кратко на роли методов статистического исследования зависимостей в разработке каждого из упомянутых направлений.

1. Нормирование. Общая схема формирования нормативов с использованием методов статистического исследования зависимостей может быть представлена следующим образом. Нормативный показатель играет в моделях типа (В.3)-(В.4) роль результирующей (объясняемой) переменной у, а факторы, участвующие в расчете нормативного показателя, — роль объясняющих (предикторных) переменных .

Предполагается, что привлечение для расчета норматива у полной системы определяющих его факторов, т. е. такой системы, с помощью которой возможно детерминированное (однозначное) определение величины у, либо принципиально невозможно, либо нецелесообразно из-за чрезмерного усложнения расчетных формул. Поэтому анализируется связь между у и вида

где — остаточная случайная компонента, обусловливающая возможную погрешность в определении норматива у по известным значениям факторов — функция из некоторого известного параметрического семейства однако численное значение входящего в ее уравнение параметра (вообще говоря, векторного) неизвестно. С целью подбора «подходящего» значения проводится контрольный эксперимент (наблюдение), в результате которого исследователь получает исходные статистические данные вида (В.1). Далее на основании этих данных проводится необходимый статистический анализ модели (В.11) с целью получения оценки неизвестного параметра и анализа точности полученной расчетной формулы , в которой величина условной (экспериментальной) средней интерпретируется как средний нормативный показатель при значениях определяющих факторов, равных X.

Данный подход использовался, в частности, при разработке методик расчета численности служащих (по различным их функциям) на промышленном предприятии отрасли по набору технико-экономических показателей, характеризующих предприятие, при построении автоматизированных систем нормирования ремонтных работ [82] и в других областях (см., например, ГОСТ 22015—76 «Качество продукции. Нормирование и статистическая оценка качества металлических материалов и изделий по механическим характеристикам»).

II. Прогноз, планирование, диагностика. Отправляясь от общей формулировки задачи статистического исследования зависимостей (см. § В. 1) и от ее модельной записи (В. 11), определим в качестве результирующей переменной у интересующий нас прогнозируемый (планируемый, диагностируемый) показатель, а в качестве объясняющих (предикторных) переменных — сопутствующие факторы, значения которых содержат основную информацию о величине этого показателя.

Наличие остаточной случайной компоненты , как и прежде, отражает тот факт, что переменные содержат не всю информацию об и обусловливает неизбежность погрешности в определении прогнозируемого (планируемого, диагностируемого) показателя по известным значениям объясняющих факторов . Исходные статистические данные вида (В.1) исследователь получает, регистрируя одновременно значения у и на анализируемых объектах в прошлом (в базовом периоде) или на других объектах, но однородных с анализируемыми.

Имеется обширная литература по решению задач прогноза, планирования и диагностики с использованием аппарата статистического исследования зависимостей [4, 29, 31, 47, 80, 93, 128, 144, 152, 163]. В табл. В.3 приведены примеры некоторых типичных задач этого направления прикладных исследований.

Можно было бы продолжить перечень примеров табл. В.3, заполнив их аналогичными, задачами из энергетики (задача оперативного и долгосрочного прогноза потребления электроэнергии), гидрологии, социологии, физики и других областей деятельности человека.

III. Оценка труднодоступных для непосредственного наблюдения и измерения параметров системы. Восстановление возраста археологической находки по ряду косвенных признаков; прочности бетона с помощью косвенных (неразрушающих) методов контроля (например, по отношению диаметров отпечатков на поверхности испытуемого образца бетона и на воздействующем на него эталонном молотке [16]); денежных сбережений семьи по ее доходу (в среднедушевом исчислении) — во всех этих ситуациях исследователь вынужден иметь дело с показателями, труднодоступными для непосредственного измерения (они выделены в тексте курсивом). Очевидно, для того чтобы иметь принципиальную возможность статистически выявить связь, существующую между труднодоступным показателем у и косвенно связанными с ним, но легко поддающимися наблюдению и измерению признаками исследователю необходимо располагать исходными статистическими данными вида (В.1), которые получают с помощью специально организованного контрольного эксперимента или наблюдения [16]. После того как эта связь выявлена (и оценена степень ее точности), она используется для косвенного определения значений труднодоступных показателей лишь по значениям объясняющих переменных

IV. Оценка эффективности функционирования (или качества) анализируемой системы.

Пытаясь оценить (в целом) эффективность деятельности отдельного специалиста, подразделения или предприятия, проранжировать страны по некоторому интегральному качеству (например, по степени прогрессивности структуры их фондов потребления или всего национального дохода [11]), наконец, проставить балльные оценки спортсмену — участнику командных соревнований в игровых видах спорта за качество его игры в определенном цикле [11], мы каждый раз, по существу, решаем (на интуитивном уровне) одну и ту же задачу: отправляясь в своем анализе от набора частных показателей каждый из которых может быть измерен и характеризует какую-нибудь одну частную сторону понятия «эффективность», мы их как бы взвешиваем (т. е. внутренне оцениваем удельный вес их влияния на общее, агрегированное, понятие эффективности) и выходим на некоторый скалярный агрегированный показатель эффективности у. Этот показатель — латентный (скрытый), так как он принципиально не поддается непосредственному измерению (не существует или нам не известна объективная шкала, в которой он мог бы быть измерен). Но он с некоторой точностью восстанавливается по значениям частных показателей эффективности Это значит, что между латентным агрегированным показателем у и набором частных критериев эффективности существует статистическая связь типа (В. 11).

Главная особенность (и трудность) описываемой ситуации заключается в том, что при получении (сборе) исходной статистической информации вида (В.1) значения результирующего показателя у могут быть получены только с помощью специально организованного экспертного опроса (значения частных критериев эффективности как правило, поддаются непосредственному измерению). Форма экспертной информации о значениях у может быть различной (балльные оценки, упорядочения, парные сравнения [11]). Но только располагая наряду со статистической информацией об одной из форм соответствующей экспертной информации об у, мы можем статистически построить некоторую аппроксимацию для агрегированного критерия эффективности функционирования системы и использовать ее затем в качестве формализованного метода оценки интегрального понятия эффективности (т. е. уже без привлечения экспертов, а лишь по частным критериям ). Такая модифицированная форма использования аппарата статистического исследования зависимостей предложена в [9], развита в [68] и носит название экспертно-статистического метода построения неизвестной целевой функции.

Таблица В.3

(см. скан)

Таблица В.3 (продолжение)

(см. скан)

Таблица В.3 (продолжение)

(см. скан)

В описанную схему вкладывается широкий класс задач теории и практики измерения комплексного понятия «качество» сложногоизделия (т. е. квалиметрии [5]): в этих задачах у интерпретируется как агрегированный (комплексный) показатель качества изделия, — как отдельные частные характеристики его качества (надежность, экономичность, удобство пользования, эстетический вид и т. п.). В качестве параметрических семейств привлекаемых при статистическом анализе задач данного типа, чаще других используются функции линейные

и степенные

последняя особенно характерна для задач квалиметрии).

Остается отметить, что и традиционные подходы аппарата статистического исследования зависимостей (классический регрессионный анализ, метод наименьших квадратов и т. п.) широко используются в практике оценки технического уровня и качества продукции. Это, в частности, отражено и в соответствующей официальной документации (см., например, РД 50—149—79: Методические указания по оценке технического уровня и качества промышленной продукции. Основные положения; ГОСТ 22732—77: Методы оценки уровня качества промышленной продукции и др.).

V. Оптимальное регулирование параметров функционирования анализируемой системы. Рассмотрим пример [10]. При анализе производительности мартеновских печей на одном из заводов исследовалась, в частности, зависимость между производительностью в тонно/часах (для исключения влияния задержек и простоев часовая производительность мартеновской печи определялась как частное от деления массы плавки на продолжительность периода от начала завалки до выпуска) и процентным содержанием углерода в металле по расплавлении ванны (пробу брали через час после первого скачивания шлака). Результаты замеров по 130 плавкам (т. е. объем обрабатываемой статистической выборки вида (В.1) равен 130) приведены на рис. В.4. Очевидно, величины производительности и процентного содержания углерода подвержены некоторому неконтролируемому разбросу, обусловленному влиянием множества не поддающихся строгому учету и контролю факторов.

Другими словами, последовательность пар чисел представляет в данном случае результаты 130 независимых наблюдений двумерной случайной величины Однако сквозь кажущуюся хаотичность расположения точек на рис. В.4 просматривается вполне определенная закономерность зависимости условного среднего значения производительности от величины процентного содержания углерода . Поэтому, располагая статистической зависимостью мы можем дать рекомендации технологу по оптимальному (с точки зрения максимизации производительности) управлению процессом выплавки: поддерживать процентное содержание углерода в пределах 0,6-1,0%.

Рис. В.4. Зависимость производительности от процентного содержания углерода в металле до расплавления

Мы не случайно начали с этого примера. Использование методов статистического исследования зависимостей в задачах оптимального регулирования хода технологического процесса и построения соответствующих автоматизированных систем управления технологическими процессами (АСУТП) можно отнести к примерам грамотных и относительно распространенных актуальных приложений этого аппарата [47, 145]. Общая схема таких приложений предусматривает (в дополнение к приведенному выше частному примеру одновременное рассмотрение нескольких результирующих показателей (производительность, качество продукции, расход сырья и энергии и т. п.) и многих регулируемых параметров технологического процесса возможность сбора исходной статистической информации вида (В.1) в условиях активного эксперимента (см. § В.1, задача 7).

Менее освоенным (но не менее правомерным и актуальным) является этот подход в задачах оптимального регулирования: характеристик социально-экономического поведения людей и целых коллективов в ситуациях, когда существует принципиальная возможность выявления статистических связей между этими характеристиками и набором объясняющих (и хотя бы частично регулируемых) факторов [40, 128]; характеристик курса медицинского лечения; структуры и объемов нагрузок и видов заданий в процессе профессиональной подготовки специалистов.

<< Предыдущий параграф Следующий параграф >>
Оглавление