Главная > Математика > Прикладная статистика: Основы моделирования и первичная обработка данных
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

4.1.3. Вероятностное пространство. Вероятности и правила действия с ними.

Для полного описания механизма исследуемого случайного эксперимента недостаточно задать лишь пространство элементарных событий. Очевидно, наряду с перечислением всех возможных исходов исследуемого случайного эксперимента мы должны также знать, как часто в длинной серии таких экспериментов могут происходить те или другие элементарные события. Действительно, возвращаясь, скажем, к примерам 4.1-4.7, легко представить себе, что в рамках каждого из описанных в них пространств элементарных событий можно рассмотреть бесчисленное множество случайных экспериментов, существенно различающихся по своему механизму.

Так, в примерах 4.1-4.3 мы будем иметь существенно различающиеся относительные частоты появления одних и тех же элементарных исходов, если будем пользоваться различными моментами и игральными костями (симметричными, со слегка смещенным центром тяжести, с сильно смещенным центром тяжести и т. п.) В примерах 4.4-4.7 частота появления дефектных изделий, характер засоренности дефектными изделиями проконтролированных партий и частоты появления определенного числа сбоев станков автоматической линии будут зависеть от уровня технологической оснащенности изучаемого производства: при одном и том же пространстве элементарных событий частота появления «хороших» элементарных исходов будет выше в производстве с более высоким уровнем технологии.

Для построения (в дискретном случае) полной и законченной математической теории случайного эксперимента — теории вероятностей помимо уже введенных исходных понятий случайного эксперимента, элементарного исхода и случайного события необходимо запастись еще одним исходным допущением (аксиомой), постулирующим существование вероятностей элементарных событий (удовлетворяющих определенной нормировке), и определением вероятности любого случайного события.

Аксиома.

Каждому элементу пространства элементарных событий соответствует некоторая неотрицательная числовая характеристика шансов его появления, называемая вероятностью события , причем

(отсюда, в частности, следует, что для всех ).

Определение вероятности события.

Вероятность любого события А определяется как сумма вероятностей всех элементарных событий, составляющих событие А, т. е. если использовать символику для обозначения «вероятности события А», то

Отсюда и из (4.2) непосредственно следует, что всегда причем вероятность достоверного события равна единице, а вероятность невозможного события равна нулю.

Все остальные понятия и правила действий с вероятностями и событиями будут уже производными от введенных выше четырех исходных определений (случайного эксперимента, элементарного исхода, случайного события и его вероятности) и одной аксиомы.

Таким образом, для исчерпывающего описания механизма исследуемого случайного эксперимента (в дискретном случае) необходимо задать конечное или счетное множество всех возможных элементарных исходов и каждому элементарному исходу поставить в соответствие некоторую неотрицательную (не превосходящую единицы) числовую характеристику интерпретируемую как вероятность появления исхода причем установленное соответствие типа должно удовлетворять требованию нормировки (4.2).

Вероятностное пространство как раз и является понятием, формализующим такое описание механизма случайного эксперимента. Задать вероятностное пространство — это значит задать пространство элементарных событий Q и определить в нем вышеуказанное соответствие типа

Очевидно, соответствие типа (4.4) может быть задано различными способами: с помощью таблиц, графиков, аналитических формул, наконец, алгоритмически.

Как же построить вероятностное пространство, соответствующее исследуемому реальному комплексу условий? С наполнением конкретным содержанием понятий случайного эксперимента, элементарного события, пространства элементарных событий, а в дискретном случае — и любого разложимого случайного события затруднений, как правило, не бывает. А вот определить из конкретных условий решаемой задачи вероятности отдельных элементарных событий не так-то просто! С этой целью используется один из следующих трех подходов.

Априорный подход к вычислению вероятностей заключается в теоретическом, умозрительном анализе специфических условий данного конкретного случайного эксперимента (до проведения самого эксперимента). В ряде ситуаций этот предопытный анализ позволяет теоретически обосновать способ определения искомых вероятностей.

Например, возможен случай, когда пространство всех возможных элементарных исходов состоит из конечного числа N элементов, причем условия производства исследуемого случайного эксперимента таковы, что вероятности осуществления каждого из этих N элементарных исходов нам представляются равными (именно в такой ситуации мы находимся при подбрасывании симметричной монеты, бросании правильной игральной кости, случайном извлечении игральной карты из хорошо перемешанной колоды и т. п.). В силу аксиомы (4.2) вероятность каждого элементарного события равна в этом случае MN. Это позволяет получить простой рецепт и для подсчета вероятности любого события: если событие А содержит NA элементарных событий, то в соответствии с определением (4.3)

Смысл формулы (4.3) состоит в том, что вероятность события в данном классе ситуаций может быть определена как отношение числа благоприятных исходов (т. е. элементарных исходов, входящих в это событие) к числу всех возможных исходов (так называемое классическое определение вероятности). В современной трактовке формула (4.3) не является определением вероятности: она применима лишь в том частном случае, когда все элементарные исходы равновероятны.

Апостериорно-частотный подход к вычислению вероятностей отталкивается, по существу, от определения вероятности, принятого так называемой частотной концепцией вероятности (подробнее об этой концепции см., например, в [48], [51]). В соответствии с этой концепцией вероятность определяется как предел относительной частоты появления исхода в процессе неограниченного увеличения общего числа случайных экспериментов т. е.

(4.5)

где — число случайных экспериментов (из общего числа произведенных случайных экспериментов), в которых зарегистрировано появление элементарного события Соответственно для практического (приближенного) определения вероятностей предлагается брать относительные частоты появления события в достаточно длинном ряду случайных экспериментов

Подобный способ вычисления вероятностей не противоречит современной (аксиоматической) концепции теории вероятностей, поскольку последняя построена таким образом, что эмпирическим (или выборочным) аналогом объективно существующей вероятности любого события А является относительная частота осуществления этого события в ряду из независимых испытаний. Разными в этих двух концепциях оказываются определения вероятностей: в соответствии с частотной концепцией вероятность не является объективным, существующим до опыта, свойством изучаемого явления, а появляется только в связи с проведением опыта или наблюдения; это приводит к смешению теоретических (истинных, обусловленных реальным комплексом условий «существования» исследуемого явления) вероятностных характеристик и их эмпирических (выборочных) аналогов. Как пишет Г. Крамер, «указанное определение вероятности можно сравнить, например, с определением геометрической точки как предела пятен мела неограниченно убывающих размеров, но подобного определения современная аксиоматическая геометрия не вводит» ([48, с. 172]). Мы не будем здесь останавливаться на математических изъянах частотной концепции вероятности. Отметим лишь принципиальные сложности реализации вычислительного приема получения приближенных значений с помощью относительных частот . Во-первых, сохранение неизменными условий случайного эксперимента (т. е. сохранение условий статистического ансамбля), при котором оказывается справедливым допущение о тенденции относительных частот группироваться вокруг постоянного значения, не может поддерживаться неограниченно долго и с высокой точностью. Поэтому для оценки вероятностей с помощью относительных частот не имеет смысла брать слишком длинные ряды (т. е. слишком большие ) и потому же, кстати, точный переход к пределу (4.5) не может иметь реального смысла.

Во-вторых, в ситуациях, когда мы имеем достаточно большое число возможных элементарных исходов (а они могут образовывать и бесконечное, и даже, как это было уже отмечено в § 4.1, континуальное множество), даже в сколь угодно длинном ряду случайных экспериментов мы будем иметь возможные исходы ни разу не осуществившиеся в ходе нашего эксперимента; да и по остальным возможным исходам полученные с помощью относительных частот приближенные значения вероятностей будут в этих условиях крайне мало надежными.

Апостериорно-модельный подход к заданию вероятностей отвечающему конкретно исследуемому реальному комплексу условий, является в настоящее время, пожалуй, наиболее распространенным и наиболее практически удобным. Логика этого подхода следующая. С одной стороны, в рамках априорного подхода, т. е. в рамках теоретического, умозрительного анализа возможных вариантов специфики гипотетичных реальных комплексов условий разработан и исследован набор модельных вероятностных пространств (биномиальное, пуассоновское, нормальное, показательное и т. п., см. § 6.1). С другой стороны, исследователь располагает результатами ограниченного ряда случайных экспериментов. Далее с помощью специальных математико-статистических приемов (основанных на методах статистического оценивания неизвестных параметров и статистической проверки гипотез, см. гл. 8 и 9) исследователь как бы «прилаживает» гипотетичные модели вероятностных пространств к имеющимся у него результатам наблюдения (отражающим специфику изучаемой реальной действительности) и оставляет для дальнейшего использования лишь ту модель или те модели, которые не противоречат этим результатам и в некотором смысле наилучшим образом им соответствуют.

Опишем теперь основные правила действий с вероятностями событий, являющиеся следствиями принятых выше определений и аксиомы.

Вероятность суммы событий (теорема сложения вероятностей).

Сформулируем и докажем правило вычисления вероятности суммы двух событий .

Для этого разобьем каждое из множеств элементарных событий, составляющих события на две части:

где объединяет все элементарные события со, входящие в но не входящие в состоит из всех тех элементарных событий, которые одновременно входят и в Пользуясь определением (4.3) и определением произведения событий имеем:

В то же время в соответствии с определением суммы событий и с (4.3) имеем

Из (4.6), (4.7) и (4.8) получаем формулу сложения вероятностей (для двух событий):

Формула (4.9) сложения вероятностей может быть обобщена на случай произвольного числа слагаемых (см., например, [83, с. 105]):

где «добавки» вычисляются в форме суммы вероятностей вида

причем суммирование в правой части производится, очевидно, при условии, что все различны, a .

В частном случае, когда интересующая нас система состоит лишь из несовместных событии, все произведения вида будут пустыми (или невозможными) событиями и соответственно формула (4.9) дает

Вероятность произведения событий (теорема умножения вероятностей). Условная вероятность.

Рассмотрим ситуации, когда заранее поставленное условие или фиксация некоторого уже осуществившего события исключают из числа возможных часть элементарных событий анализируемого вероятностного пространства. Так, анализируя совокупность из N изделий массового производства, содержащую изделий первого, — второго, — третьего и — четвертого сорта мы рассматриваем вероятностное пространство с элементарными исходами и их вероятностями — соответственно (здесь означает событие, заключающееся в том, что наугад извлеченное из совокупности изделие оказалось сорта). Предположим, условия сортировки изделий таковы, что на каком-то этапе изделия первого сорта отделяются от общей совокупности и все вероятностные выводы в частности, подсчет вероятностей различных событий) нам предстоит строить применительно к урезанной совокупности, состоящей только из изделий второго, третьего и четвертого сорта. В таких случаях принято говорить об условных вероятностях, т. е. о вероятностях, вычисленных при условии уже осуществленного некоторого события. В данном случае таким осуществленным событием является событие , т. е. событие, заключающееся в любое наугад извлеченное изделие является либо второго, либо третьего, либо четвертого сорта. Поэтому, если нас интересует подсчет условной вероятности события А (при условии, что событие В уже имеет место), заключающегося, например, в том, что наугад извлеченное изделие окажется второго или третьего сорта, то, очевидно, эта условная вероятность (обозначим ее ) может быть определена следующим соотношением:

Как легко понять из этого примера, подсчет условных вероятностей — это, по существу, переход в другое, урезанное заданным условием В пространство элементарных событий, когда соотношение вероятностей элементарных событий в урезанном пространстве остается тем же, что и в исходном (более широком), но все они нормируются (делятся на ) для того, чтобы и в новом вероятностном пространстве выполнялось требование нормировки (4.2). Конечно, можно было бы не вводить терминологии с условными вероятностями, а просто использовать аппарат обычных («безусловных») вероятностей в новом пространстве. Запись в терминах вероятностей «старого» пространства бывает полезной в тех случаях, когда по условиям конкретной задачи мы должны все время помнить о существовании исходного, более широкого пространства элементарных событий.

Получим формулу условной вероятности в общем случае. Пусть В — событие (непустое), считающееся уже состоявшимся («условие»), а А — событие, условную вероятность которого Р(А|В) требуется вычислить. Новое (урезанное) пространство элементарных событий состоит только из элементарных событий, входящих в В, и, следовательно, их вероятности (с условием нормировки (4.2)) определяются соотношениями

По определению, вероятность Р(А|В) — это вероятность события А в «урезанном» вероятностном пространстве , и, следовательно, в соответствии с (4.3) и (4.10)

т. е.

или, что то же,

Эквивалентные формулы (4.11) и (4.11') принято называть соответственно формулой условной вероятности и правилом умножения вероятностей.

Еще раз подчеркнем, что рассмотрение условных вероятностей различных событий при одном и том же условии В равносильно рассмотрению обычных вероятностей в другом (урезайном) пространстве элементарных событий пересчетом соответствующих вероятностей элементарных событий по формуле (4.10). Поэтому все общие теоремы и правила действий с вероятностями остаются в силе и для условных вероятностей, если эти условные вероятности берутся при одном и том же условии.

Независимость событий. Два события А и В называют независимыми, если

Для пояснения естественности такого определения вернемт. е.ся к теореме умножения вероятностей (4.11) и посмотрим, в каких ситуациях из нее следует (4.12). Очевидно, это может быть тогда, когда условная вероятность равна соответствующей безусловной вероятности , т.е., грубо говоря, тогда, когда знание того, что произошло событие никак не влияет на оценку шансов появления события А.

Распространение определения независимости на систему более чем двух событий выглядит следующим образом. События называются взаимно независимыми, если для любых пар, троек, четверок и т.д. событий, отобранных от этого набора событий, справедливы следующие правила умножения:

Очевидно, в первой строке подразумевается

(число сочетаний из k по два) уравнений, во второй — и т. д. Всего, следовательно, (4.13) объединяет условий. В то же время условий первой строки достаточно для обеспечения попарной независимости этих событий. И хотя попарная и взаимная независимость системы событий, строго говоря, не одно и то же, их различие представляет скорее теоретический, чем практический интерес: практически важных примеров попарно независимых событий, не являющихся взаимно независимыми, по-видимому, не существует.

Свойство независимости событий сильно облегчает анализ различных вероятностей, связанных с исследуемой системой событий. Достаточно сказать, что если в общем случае для описания вероятностей всевозможных комбинаций событий системы нужно задать 2 вероятностей, то в случае взаимной независимости этих событий достаточно лишь k вероятностей

Независимые события весьма часто встречаются в изучаемой реальной действительности они осуществляются в экспериментах (наблюдениях), проводимых независимо друг от друга в обычном физическом смысле.

Именно свойство независимости исходов четырех последовательных бросаний игральной кости позволило (с помощью ) легко подсчитать вероятность невыпадения (ни при одном из этих бросаний) шестерки в задаче п. 2.2.1. Действительно, обозначив событие, заключающееся в невыпадении шестерки в бросании , и учитывая, что для всех получаем

Формула полной вероятности.

При решении многих практических задач зачастую сталкиваются с ситуацией, когда прямое вычисление вероятности интересующего нас события А трудно или невозможно, в то время как вполне доступно вычисление (или задание) условных вероятностей того же события (при различных условиях).

В случае, когда условия при которых известны (или легко вычисляемы) условные вероятности события А, образуют полную систему событий (см. п. 4.1.2), для подсчета вероятности можно использовать соотношение

которое принято называть формулой полной вероятности.

Для доказательства формулы (4.14) заметим, что элементарные события, составляющие событие А, можно разбить на k непересекающихся групп, каждая из которых является общей частью (пересечением) события А с одним из событий (эта возможность непосредственно вытекает из того, что события исчерпывают в сумме все пространство элементарных событий и попарно не пересекаются), т. е.

Далее, воспользовавшись теоремой сложения вероятностей (применительно к несовместным событиям, каковыми являются события ) и вычислив вероятность каждого из произведений по формуле произведения вероятностей (4.11'), мы и получаем (4.14).

Формула Байеса.

Обратимся вначале к следующей задаче. На складе имеются приборы, изготовленные тремя заводами: 20 % приборов, имеющихся на складе, изготовлено заводом № 1, 50 % — заводом № 2 и 30 % — заводом № 3. Вероятности того, что в течение гарантийного срока прибору потребуется ремонт, для продукции каждого из заводов равны соответственно 0,2; 0,1; 0,3. Взятый со склада прибор не имел заводской маркировки и потребовал ремонта (в течение гарантийного срока). Каким заводом вероятнее всего был изготовлен этот прибор? Какова эта вероятность? Если обозначить событие, заключающееся в том, что случайно взятый со склада прибор оказался изготовленным на заводе , а В — событие, заключающееся в том, что наугад отобранный от продукции всех трех заводов прибора оказался дефектным (потребовал ремонта), то сформулированная выше задача, очевидно, сводится к вычислению условных вероятностей по заданным вероятностям Поскольку события образуют полную систему, воспользуемся для выражения искомых вероятностей известными нам основными правилами действий с вероятностями.

По формуле условной вероятности (4.11)

Числитель этой дроби по теореме умножения вероятностей (4.11) может быть представлен в виде

а знаменатель выражается с помощью формулы полной вероятности (4.14):

Подставляя (4.16) и (4.17) в (4.15), получаем

Воспользовавшись этой формулой, нетрудно подсчитать искомые вероятности:

Следовательно, вероятнее всего некондиционный прибор был изготовлен на заводе № 3.

Доказательство формулы (4.18) в случае полной системы событий, состоящей из произвольного числа k событий, в точности повторяет доказательство формулы (4.18). В таком общем виде формулу

принято называть формулой Байеса.

<< Предыдущий параграф Следующий параграф >>
Оглавление