Главная > Разное > Математика в биологии и медицине
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

2.2. ПРИМЕНЕНИЕ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ

В предыдущем разделе мы показали, что самые разнообразные типы изменчивости, встречающиеся в природе, часто удается описать с помощью одного надлежащим образом выбранного распределения вероятностей. Оно, разумеется, не позволяет определить конкретное значение какого-либо данного параметра или результата наблюдения, но в то же время точно описывает ожидаемую общую картину. Говоря об изменчивости, случайных колебаниях и распределениях, мы употребляем слова «вероятностный» и «статистический» почти в одинаковом смысле, отдавая некоторое предпочтение первому термину. На данном этапе удобно провести определенное различие между ними, хотя в мнениях разных авторов на этот счет нет полного единства.

Распределения вероятностей и связанные с ними теоретические построения представляют собой по существу математические конструкции, хотя они и выводятся из повседневных представлений о случае и шансах и должны приводить к результатам, которые можно истолковать в практическом смысле. Для построения правильной математической модели некоторого явления, характеризующегося сильными случайными колебаниями, вводятся вероятностные идеи, и для раскрытия смысла модели используется теория вероятностей.

Чтобы модель была удовлетворительной хотя бы в некоторых отношениях, она должна обеспечить возможность практической проверки получаемых с ее помощью результатов. Это означает, что математические результаты должны в определенной мере соответствовать данным, которые были или могли быть получены. Задачей математической статистики и является изучение соответствия между теоретическими моделями и реальной действительностью и проверка их адекватности. Короче говоря, в то время как теория вероятностей относится к области дедуктивной логики, математическая статистика охватывает помимо всего прочего и область индуктивной логики. Роль этих различных дисциплин и их значение для всего процесса научного исследования подробно рассматриваются в гл. 3.

В разд. 2.1 мы уже указывали, каким образом с помощью понятий теории вероятностей может быть произведена редукция данных до объема, поддающегося обработке. Для этого сосредоточивают внимание лишь на наиболее существенных аспектах реального явления, а остальными факторами не пренебрегают, но и не дифференцируют их, учитывая их влияние в совокупности (независимо от того, какие распределения вероятностей используются). Успех такого упрощающего допущения зависит от того, позволит ли построенная статистическая модель получить полезные результаты, несмотря на то что в нее не входят в явном виде факторы, которые в определенном смысле несомненно имеют важное значение. Поэтому крайне важно еще на начальном этапе проверить, достаточно ли хорошо согласуется принятая модель с полученными данными. Вследствие существования естественной изменчивости — основной причины, по которой приходится применять теорию вероятностей, — на практике не могут быть в точности воспроизведены прогнозы или результаты, вытекающие из модели. Но ее можно считать вполне удовлетворительной, если соответствие окажется достаточно хорошим при достаточно большой выборке данных. Совершенно ясно, что при оценке модели существенно важен выбор критериев, на основании которых решается вопрос о том, является ли соответствие достаточно хорошим и число наблюдений достаточно большим.

Для статистической проверки вероятностной модели важнейшую роль играет понятие статистического критерия значимости. Конкретный способ выполнения проверок в некоторой степени зависит от того, какая из нескольких моделей статистического вывода выбирается. Не следует удивляться тому, что хорошо обоснованные разные модели нередко могут приводить к одинаковым практическим методам и результатам.

Этот вопрос поднимается снова и подробно рассматривается в разд. 3.3. Здесь мы остановимся лишь на наиболее широко используемой так называемой «частотной» интерпретации вероятности. В соответствии с этим подходом необходимо проводить четкое различие между «вероятностью» применительно к результатам экспериментов, которые были или могли быть проведены, и «вероятностью», характеризующей степень нашей уверенности в некоторой гипотезе. По возможности мы употребляем слово «вероятность» в первом значении, что согласуется с определением вероятностных моделей, описывающих реальные процессы, которое давалось в разд. 2.1. Таким образом, «вероятность» характеризуется частотой, которую, во всяком случае в принципе, можно наблюдать.

Построенная первоначально математическая модель представляет собой так называемую нулевую гипотезу. Нулевая гипотеза может быть довольно простой, например допущение о том, что распределение числа детей в семье по полу является биномиальным с (т. е. отношение полов равно единице). Чтобы проверить справедливость этой гипотезы для данной семьи, нужно изучить фактические данные; при этом может оказаться, что, скажем, в семье пять детей и все они девочки. Оценим теперь вероятность фактического события, которое произошло, и вероятность любого другого столь же вероятного или более редкого события, которое может произойти. Несколько необычная форма данной методики вызывается тем, что какой-либо конкретный экспериментальный результат может иметь очень малую вероятность, особенно если число различных наблюдаемых событий очень велико. (Строго говоря, для непрерывных случайных величин вероятность появления любого заданного значения равна нулю.) Поэтому нас больше интересует, принадлежит ли наблюдаемый результат к классу необычных событий, резко отличающихся от наиболее вероятного результата. В приведенном выше примере наиболее вероятным является наличие в семье, насчитывающей пятеро детей, двух или трех девочек; менее вероятно появление одной или четырех девочек; наименее вероятно отсутствие девочек или наличие пяти девочек. Наблюденное значение, равное пяти, принадлежит к последнему классу «0 или 5», вероятность Р которого равна или 6,25%.

Если вероятность Р наблюдаемого события велика, например не менее 30%, то это означает, что оно является весьма распространенным. Если же значение Р достаточно мало, например менее 5%, то наблюдаемое событие принадлежит к классу довольно редких. В этом случае можно вообще отвергнуть нулевую гипотезу, вместо того чтобы придерживаться ее и считать, что произошло маловероятное событие. Выводы, к которым мы приходим при таком подходе, в значительной мере зависят от того, где проводится граница между приемлемыми и неприемлемыми значениями Р, т. е. от уровня значимости.

Разумеется, необходимо отдавать себе отчет в том, что применение такого критерия для проверки значимости еще не гарантирует полностью отсутствия ошибки. Даже если нулевая гипотеза справедлива, то в доле случаев, равной Р, при использовании данного критерия она будет отвергнута. Если значение Р очень велико, то довольно часто истинная гипотеза будет отвергаться, что приведет к ложным выводам. Если же значение Р очень мало, то мы лишимся возможности отвергнуть ложную гипотезу и развить новые идеи. Широко используется 5%-ный уровень значимости, который, как показывает опыт, в общем случае вполне пригоден. В некоторых особых случаях могут ставиться и другие требования. Ясно, что более осторожный исследователь (скажем, тот, кто занимается испытанием сильнодействующих лекарственных препаратов) будет считать желательным более низкий уровень значимости — возможно, 1%-ный или даже меньше.

Возвращаясь к приведенному выше примеру, можно видеть, что наблюденное значение как раз и не является статистически значимым при 5%-ном уровне. Принимая такой уровень значимости, мы допускаем, что первоначальная гипотеза все еще приемлема и вероятность того, что следующим ребенком в семье будет мальчик, по-прежнему равна . Однако если в семье появилось шесть девочек, то значение Р становится равным примерно 3%, и следует отвергнуть нулевую гипотезу, согласно которой соотношение полов равно единице.

Проверка значимости рассматривается здесь лишь для того, чтобы на простом конкретном примере проиллюстрировать характер связанных с ней рассуждений. Более точное изложение теоретических вопросов, связанных с проверкой значимости, и описание разнообразных критериев, используемых для проверки в различных случаях, читатель найдет в любом учебнике по математической статистике. Основная мысль, которую мы хотели подчеркнуть, заключается в том, что существуют численные методы, позволяющие определить соответствие конкретной математической модели эмпирическим данным. Если модель не согласуется с эмпирическими данными, то необходимо либо переделать ее каким-то образом (возможно, изменяя значения входящих в нее параметров), либо, в более серьезном случае, полностью отказаться от нее и перейти к некоторому другому описанию изучаемого явления.

Если рассматривается семья, в которой все шестеро детей — девочки, то, возможно, придется отклонить исходную гипотезу, согласно которой хотя, по-видимому, потребуется сохранить подразумеваемое допущение, что при любом значении распределение будет биномиальным.

Какое же значение (или значения) приемлемо в данном случае? Этот вопрос приводит нас к проблеме нахождения оценок — другой важной области математической статистики. Существует несколько способов решения этой задачи. Один из них состоит в нахождении некоторой области значений параметра (ее называют доверительным интервалом), в пределах которой с заданной вероятностью находится истинное значение. При частотной интерпретации вероятности это правило получает следующую формулировку: если при многократном повторении эксперимента вычисляется 95%-ный доверительный интервал, то вычисленный интервал будет включать истинное значение в 19 случаях из 20. (Заметим, что при частотной интерпретации вероятности только интервал может иметь некоторое распределение. Истинным значением параметра является некоторая фиксированная, хотя и неизвестная постоянная.) Можно показать, что для семьи, где все шестеро детей девочки, 95%-ным доверительным интервалом является интервал от 0,61 до 1,00 (пределы его вычислены приближенно). Этот интервал не включает значения первоначальной нулевой гипотезы, соответствующего данным, которые статистически значимы для этого значения при 5%-ном уровне.

Разумеется, в этом примере выборка очень мала и соответственно велик доверительный интервал. Однако при достаточно больших выборках можно ожидать, что интервалы будут значительно меньше, и в других случаях они, по-видимому, будут более приемлемы. Как известно, нередко средние значения имеют распределения, близкие к нормальному, даже если отдельные значения параметров и не распределены по нормальному закону. Это означает, что в качестве показателя достоверности среднего значения можно использовать среднее квадратическое отклонение нормального распределения. Обычно среднее квадратическое отклонение среднего значения или другой величины (например, оценки неизвестного параметра, полученной методом максимального правдоподобия), имеющей приближенно нормальное распределение, предпочтительнее называть средней квадратической ошибкой. Так, если расчет покажет, что при употреблении данного лекарственного препарата при определенном заболевании выздоравливает 25% больных, а средняя квадратическая ошибка (Т составляет 2%, то можно ожидать, что при повторных экспериментальных проверках выборок такого же объема в 95% случаев истинный процент выздоравливающих будет лежать в интервале, равном этому среднему значению , т. е. в интервале 25±4%. Проще говоря, мы будем на 95% уверены в том, что истинный процент выздоравливающих находится в интервале между 21 и 29%.

Со всеми этими рассуждениями, которые довольно хорошо известны (во всяком случае, на элементарном уровне) большинству научных работников в области биологии и медицины, связан следующий важный вопрос: насколько полезны статистические методы на практике и насколько близки они к тем проблемам, которые в действительности старается решить ученый-практик? Более подробно о логике научных исследований говорится в гл. 3. На данном этапе мы только заметим, что большинство научных исследований (если не все) начинается с принятия гипотезы, сформулированной на основе существующих знаний или предположений, а затем эта гипотеза проверяется с помощью соответствующих экспериментальных данных. Если согласие оказывается удовлетворительным, то гипотеза сохраняется и развивается дальше, в противном случае она отвергается или изменяется. Поворотным моментом в развитии и применении такого статистического подхода, по-видимому, явилась вышедшая в 1925 г. первым изданием книга Р. Фишера «Статистический метод исследований» [23], которая с тех пор выдержала много изданий. Критерий Фишера, по сути дела, переводит обычную практику интуитивных оценок результатов исследований на количественную основу. Для очень широкого круга приложений такое уточнение понятий оказалось крайне полезным. Если в некоторых частных случаях статистическая проверка гипотез и встречает определенные затруднения, то, во всяком случае, она дает хорошую основу для строгого вывода более адекватных методов.

<< Предыдущий параграф Следующий параграф >>
Оглавление