Главная > Математика > Прикладная статистика: Основы моделирования и первичная обработка данных
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

5.5.2. Функция плотности вероятности одномерной случайной величины.

В классе таких непрерывных случайных величин, функции распределений которых всюду непрерывны и дифференцируемы как уже отмечалось, этот класс охватывает подавляющее большинство представляющих практический интерес непрерывных случайных величин), другой удобной формой задания генеральной совокупности (исследуемой случайной величины ) является функция плотности вероятности определяемая как предел

или, что то же,

т. е. — это производная функции распределения в точке Из эквивалентных соотношений (5.7) и (5.7), определяющих функцию плотности вытекают непосредственно следующие ее свойства:

а) так как функция неубывающая;

б) для малых отрезков А (следует из сравнения первых двух членов тождества (5.7));

в) для любых

г) любых ;

д)

Прокомментируем некоторые из этих свойств функции плотности.

Свойство б) позволяет пояснить вероятностный смысл функции плотности. Так, предположив для определенности область возможных значений исследуемой случайной величины конечной и разбив ее на одинаковые и достаточно мелкие интервалы группирования А с центрами

и т. д., мы можем поставить в соответствие каждому i-му интервалу вероятность осуществления событий

приближенно равную в соответствии со свойством б) величине . Таким образом, по своему смыслу значения функции пропорциональны вероятности того, что исследуемая случайная величина примет значение где-то в непосредственной близости от точки

Рис. 5.5. Функции (а) распределения и (б) плотности ; нормального закона

Этот факт, в частности, может служить основанием к тому, что дискретным аналогом функции плотности в случае дискретной случайной величины является полигон частот, т. е. последовательность точек с координатами . Отсюда же следует, что наиболее вероятным (модальным) значением исследуемой непрерывной случайной величины является такое ее возможное значение , в котором функция плотности достигает своего максимума, т. е.

Геометрическая интерпретация свойства г) состоит в том, что вероятность события оказывается (при любых заданных ) равной площади «столбика» под кривой плотности с основанием

На рис. 5.5 показаны функции распределения и плотности одного из распространенных законов распределения — нормального (подробнее см. § 6.1 и 7.3). Заштрихованная площадь на рис. 5.5, б дает геометрически наглядное представление о величине вероятности

Располагая лишь выборочными данными (выборкой) мы должны суметь составить по ним приближенное представление о неизвестной теоретической функции плотности Если нас интересует малый отрезок и мы подсчитали, что в этот отрезок попало наблюдений нашей выборки, то, очевидно, выборочным аналогом величины

будет величина

Очевидно, значение характеризует плотность наблюдений исследуемой случайной величины в окрестности точки т. е. относительную частоту этих наблюдений, приходящуюся на единицу длины интервала ее возможных значений. Поэтому функцию определенную соотношением (5.8), называют эмпирической (или выборочной) функцией плотности. Это же обстоятельство может служить основанием выбора такой терминологии и применительно к теоретической плотности так как в соответствии со свойством статистической устойчивости частот (см. § 7.2) эти две характеристики неограниченно сближаются в процессе увеличения объема выборки и сужения длины интервала

Для построения эмпирической функции плотности на всей области ее определения (т. е. для всех возможных значений исследуемой величины) используют предварительно сгруппированные данные (см. п. 5.4.2) и полагают

где — порядковый номер того интервала группирования, который накрывает точку как и прежде, число наблюдений, попавших в этот интервал, и его длина соответственно. Геометрическое изображение таким образом определенной эмпирической функции плотности носит название гистограммы.

Пример 5.2. Объект (совокупность единиц) обследования — 995 телефонных абонентов города Буффало, штат Нью-Йорк.

Цель обследования — фиксация общего числа телефонных разговоров за год на каждом абоненте. Таким образом, в данном случае — число телефонных разговоров в году на обследованном абоненте. В табл. 5.4 приведены выборочные данные, сгруппированные методом, описанным в п. 5.4.2.

Таблица 5.4

Были выбраны число интервалов группирования и соответственно длина интервала группирования . Графики соответствующих эмпирической (гистограмма) и теоретической плотностей приведены на рис. 5.6 (для построения теоретической кривой плотности в нормальную модель распределения, см. § 6.1, подставлялись вместо неизвестных параметров — среднего а и дисперсии значения соответствующих выборочных характеристик а и , см. § 10.4).

Более подробные сведения о методах построения эмпирических функций плотности и их статистического анализа приводятся в § 10.3, 10.4, 11.1 и 11.2.

<< Предыдущий параграф Следующий параграф >>
Оглавление