Главная > Математика > Прикладная статистика: Основы моделирования и первичная обработка данных
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

5.5. Способы задания закона распределения: функция распределения, функция плотности и их выборочные (эмпирические аналоги)

5.5.1. Функция распределения вероятностей одномерной случайной величины.

Как установлено выше (см. § 5.4), всякая генеральная совокупность (случайная величина) определяется своим законом распределения вероятностей Поскольку интересующие нас области ДХ могут быть в общем случае подмножествами общей природы, то возникает вопрос: каковы те способы задания числовых функций определенных на подмножествах , которые были бы достаточно удобны в плане конструктивном, практическом?

Оказывается, для описания распределений одномерных случайных величин достаточно задать способ вычисления вероятностей лишь для подмножеств ДХ некоторого специального вида, а именно лишь для полузамкнутых слева интервалов вида

где — минимально возможное значение исследуемой случайной величины (оно может быть равно и ), — любое «текущее» (т. е. задаваемое нами) возможное значение . Вероятность же однозначно определяется заданием правого конца интервала, т. е. числа а потому может интерпретироваться как обычная функция от одного числового аргумента

Функцией распределения вероятностей (накопленной частотой) случайной величины называют функцию, ставящую в соответствие любому заданному значению величину вероятности события т. е.

В дальнейшем, если это не будет вызывать недоразумении, будем опускать нижний индекс у функции F и называть ее просто «функцией распределения».

Рассмотрим поведение функции распределения. Во-первых, отметим, что в дискретном случае событие состоит из всех элементарных событий таких, что Поэтому в соответствии с определением вероятности составного события (см. п. 4.1.3) имеем

(суммирование в правых частях (5.5) проводится по всем тем i, для которых

Из (5.5) видно, что значения функции изменяются при увеличении аргумента скачками, а именно при «переползании» величины через очередное возможное значение функция скачком увеличивает свое значение на величину

Несколько иную картину мы будем наблюдать, анализируя поведение функции распределения в случае непрерывного исследуемого признака . Подавляющее большинство представляющих практический интерес непрерывных случайных величин обладают тем свойством, что для любого отрезка вероятности стремятся к нулю по мере стремления к нулю длины этого отрезка, и, следовательно, вероятности принятия отдельных возможных значений равны нулю (конкретный пример такого рода приведен в п. 4.2.2 в задаче с экспертным оцениванием вероятности интересующего нас события). Нетрудно понять, что для таких случайных величин их функции распределения оказываются непрерывными.

На рис. 5.4, а-г представлены графики функций распределения случайных величин, рассмотренных соответственно в примерах 4.1, 4.2, 4.5 (с учетом табл. 5.2) и в примере с экспертным оцениванием вероятности интересующего нас события (п. 4.2.2).

Рис. 5.4. Графики функций распределения для: а — оцифрованного результата подбрасывания монеты (нуль соответствует аверсу, единица — реверсу); б — числа очков, выпадающих при бросании правильной игральной кости; в — числа дефектных изделий, обнаруженных в наугад выбранной партии, состоящей из 30 изделий (см. табл. 5.2); г — экспертной оценки вероятности интересующего нас события (при полной некомпетентности экспертов), см. примеры п. 2.1.3 и 4.2.2

Из определения функции распределения непосредственно вытекают следующие ее основные свойства:

а) — неубывающая функция аргумента х;

б) для всех

в) для всех — соответственно минимальное и максимальное возможные значения исследуемой случайной величщсы );

г) для любых заданных значений а и b (для доказательства последнего свойства следует воспользоваться теоремой сложения вероятностей (см. п. 4.1.3), а также тем обстоятельством, что события связаны между собой соотношением .

В практике статистической обработки данных точный вид функции распределения, как правило, бывает неизвестен. Эмпирическим (или выборочным, т. е. построенным по выборке объема ) аналогом теоретической функции распределения является функция определяемая соотношениями:

или, в случае группированных данных (см. п. 5.4.2),

где — число наблюденных значений исследуемой случайной величины в выборке меньших — число наблюденных значений в выборке, попавших в интервал группирования, — номер самого правого из интервалов группирования, правый конец которых не превосходит . Из определения эмпирической функции распределения непосредственно следует объяснение часто используемого ее другого названия — «накопленная частота». Свойство статистической устойчивости относительных частот (см. § 7.2) является основанием использования в качестве приближенного значения неизвестной теоретической функции распределения и того факта, что по мере роста объема выборки (т. е. при ) ошибка этой аппроксимации неограниченно убывает. Такая оценка значений , т. е. оценка, не связанная с предварительным выбором общего модельного вида этой функции, называется непараметрической. Более подробные сведения, относящиеся к статистическому изучению эмпирических функций распределения, даны в § 10.3 и 11.1.

<< Предыдущий параграф Следующий параграф >>
Оглавление