Главная > Математика > Прикладная статистика: Основы моделирования и первичная обработка данных
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

6.1.11. Некоторые комбинации основных модельных распределений, используемые в прикладной статистике.

Существуют модели законов распределения, получающиеся в результате конструирования тех или иных комбинаций описанных выше (и других) модельных распределений. Некоторые из таких «удобных» в методологически-прикладном плане комбинаций описываются ниже.

Модель, близкая к нормальной, но учитывающая наличие ненулевых значений асимметрии и эксцесса , см. п. 5.6.6), может быть задана плотностью

где — плотность нормального закона, а — ее производные. Эта модель возникла из асимптотических разложений в центральной предельной теореме (см. [48]), показывающих, как распределение суммы независимых случайных величин сближается с нормальным законом. Как влияет на плотность учет ненулевых значений асимметрии и эксцесса, легко видеть из рис. 6.4. Следует иметь в виду, что приведенное выше представление функции получено из асимптотических соображений, поэтому оно, вообще говоря, не при всех значениях и (52 задает плотность распределения.

Для того чтобы иметь некоторое представление о значениях встречающихся в приложениях, укажем, следуя [87], что для ряда распределений в технике, биологии, химии и метеорологии

Вместе с тем в демографии встречаются очень большие значения ; так, для распределения возраста невест, выходящих замуж в Австралии в 1907—1914 гг., — (2,0; 6,3) то же и для распределения возраста женихов — (2,0; 5,3).

Рис. 6 4. Плотность нормального закона и ее производные

Модель смеси распределений заданного типа описывается формулой

в которой — плотности (в непрерывном случае) или полигоны частот (в дискретном случае) соответственно компоненты смеси и результирующего закона распределения, — априорная вероятность появления в случайной выборке наблюдения с законом распределения (т. е. удельный вес таких наблюдений в общей генеральной совокупности), a k — число компонент смеси. С законами распределения подобной структуры исследователь сталкивается, например, в ситуациях, когда ему приходится анализировать генеральную совокупность, объединяющую в себе несколько подсовокупностей, каждая из которых в определенном смысле однородна (что выражается, например, в унимодальности соответствующего закона распределения ), но существенно отличается от других (например, значением параметра ). При этом параметр может определять как центр группирования соответствующих наблюдений (тогда он интерпретируется как параметр сдвига), так и их меру случайного рассеивания (тогда он интерпретируется как параметр масштаба).

Более подробные сведения о смесях распределений можно найти в [8, с. 57—74].

Примеры естественных реальных механизмов распределения в экономике и природе, приводящих к необходимости рассмотрения смеси, описаны, например, в [79], [105].

Упомянем здесь лишь о тех частных случаях модели смеси, в рамках которых ряд исследователей рассматривает различные аспекты получения устойчивых статистических выводов.

Модель Тьюки «засоренного» нормального закона рассматривается, например, при исследовании влияния «утяжеленных хвостов» распределения на свойства оценок неизвестного среднего значения (см. п. 8.6.4). При этом исходят из того, что наблюдения «извлекаются» из генеральной совокупности, заданной функцией плотности вида

где — плотность нормального распределения со средним значением а и дисперсией — доля (обычно относительно небольшая) «засоряющих» наблюдений, а между дисперсиями двух компонент имеет место неравенство

Модель засорения Шурыгина. Встречающиеся на практике засорения часто несимметричны. Для того чтобы отразить этот факт, в модель смеси распределений можно ввести дополнительный параметр а, отражающий сдвиг засорения относительно основного распределения, имеющего функцию плотности . Тогда следует рассмотреть модель смеси вида

где — параметры места группирования (сдвига) и масштаба соответственно, a h — плотность некоторого симметричного закона распределения. Чтобы снять неопределенность в выборе h и громоздкость в представлении результатов исследования модели для разных значений а, было предложено (см. [90]) рассматривать схему серий испытаний, таких, что внутри серии производится обычная выборка из смеси, причем для простоты предполагается, что засорение всегда сосредоточено в одной точке но параметр а при переходе из одной серии к другой выбирается случайным образом из некоторого нормального закона с нулевым средним и стандартным отклонением . Модель Шурыгина оказалась удобной для аналитического исследования.

<< Предыдущий параграф Следующий параграф >>
Оглавление