Главная > Разное > Математика в биологии и медицине
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

9.5. ЦЕПОЧЕЧНО-БИНОМИАЛЬНЫЕ МОДЕЛИ

Хотя рассмотренные выше модели предназначены главным образом для описания эпидемий в больших популяциях, их, безусловно, можно использовать и в случае малочисленных групп, просто приняв размер популяции достаточно малым. Затруднение состоит в том, что при изучении более тонких деталей в такой небольшой группе, как, скажем, семья, допущения о нулевом латентном периоде и экспоненциальном распределении длительностей заразного периода оказываются чрезмерно упрощенными. Поэтому в таких случаях целесообразно остановиться на одной-двух моделях другого типа.

В случае кори, например, обычно допускается, что имеет место очень короткий заразный период, характеризуемый высокой контагиозностью, и инкубационный период почти постоянной длительности. Для теоретических целей сожмем заразный период в точку. Тогда после появления одного первоначального случая заболевания (или нескольких одновременно) дальнейшие случаи будут появляться дискретными группами, отделенными друг от друга инкубационным периодом. Рассмотрим более детально соответствующую модель для дискретного времени (в отличие от изучавшихся ранее моделей для непрерывного времени).

Допустим, что — число восприимчивых индивидуумов в группе непосредственно перед моментом t и что — число индивидуумов, заразившихся в этот момент. Удобно также определить вероятность достаточного контакта , т. е. вероятность того, что любые два члена группы в какой-либо момент времени будут находиться в контакте, достаточном для появления нового источника инфекции, если один из индивидуумов восприимчив к инфекции, а другой является источником инфекции.

Тогда вероятность того, что какой-либо данный восприимчивый индивидуум избежит заражения в момент t, равна а вероятность того, что он заразится, — . Таким образом, условная вероятность появления новых случаев в момент имеет биномиальное распределение

Итак, этот процесс определяется последовательностью биномиальных распределений, откуда и происходит его название — цепочечно-биномиальный процесс.

Распределение (9.37) первоначально использовали и Фрост. Более простой вариант, принадлежащий Гринвуду, основан на допущении, что вероятность заражения не меняется при изменении фактического числа источников инфекции, циркулирующих в группе, при условии, что имеется хотя бы один из них. В этом случае вероятность заражения данного индивидуума в какой-либо момент времени равна , и выражение, соответствующее (9.37), принимает вид

С помощью формулы (9.37) или (9.38) не представляет труда записать вероятности наблюдения любой последовательности случаев. К сожалению, общая теория эпидемических процессов для дискретного времени, определяемых таким способом, еще не разработана, но поскольку можно записать вероятность появления любого наблюдаемого значения, то можно хотя бы оценить неизвестные параметры и, если имеется достаточное число степеней свободы, выполнить проверку с помощью критериев значимости. Рассмотрим элементарный пример, используя некоторые данные, полученные во время эпидемии кори в . Провиденс за 1924— 1934 гг.

Любую цепь случаев, начинающуюся в момент можно описать последовательностью , где — последний отличный от нуля член последовательности значений .

В семье, где имеется трое детей и первоначально заболевает один из них, единственно возможными последовательностями являются следующие: (1), (1,1), (1,1,1), (1,2). Мы будем условно записывать их в виде . Математические ожидания для таких семей и результаты наблюдений приведены в табл. 6. (В группах такого размера отсутствует различие между вариантом Гринвуда и вариантом Рида и Фроста.)

Таблица 6. Биномиальная цепь для семей с тремя детьми

Допустим, что семей распределены между четырьмя типами цепей так, как показано в третьем столбце табл. 6. Метод максимального правдоподобия дает следующую оценку для и ее дисперсию по большой выборке:

Подставляя в выражения (9.39) данные, полученные для эпидемии кори в . Провиденс, получаем следующую оценку: . Приведенные в последнем столбце табл. 6 значения, полученные путем подбора кривой распределения, явно неудовлетворительны. Действительно, величина для двух степеней свободы при равна 59,8. Нетрудно выполнить аналогичный анализ и для более крупных семей, однако мы не будем останавливаться здесь на этом вопросе. Для семей, в которых имеется четверо детей, также наблюдается плохое соответствие с данными, полученными в г. Провиденс. Возможно, это обусловлено неоднородностью данных, которые собирались в течение нескольких лет.

Существует, однако, один вид неоднородности, учесть который относительно легко. Предположим, что для различных семей характерны различные значения и при этом вероятность достаточного контакта внутри любой данной семьи остается постоянной. Это вполне могло иметь место для данных, полученных в г. Провиденс, особенно если они относились к группам, живущим в различных географических и социальных условиях. Для выполнения математического анализа очень удобно допущение о том, что вероятность следует бета-распределению, т. е.

где — бета-функция. Путем соответствующего выбора можно получить ряд распределений, имеющих самую различную форму.

Применим теперь это допущение к математическим ожиданиям, записанным во втором столбце табл. 6, которые должны быть усреднены по распределению (9.40). По чисто техническим статистическим соображениям проводить проверку на значимость и искать оценки, пользуясь непосредственно величинами , очень неудобно. Лучше вместо использовать величины

из которых и представляет собой среднее значение вероятности . Результаты, полученные при таком способе анализа, приведены в табл. 7.

Таблица 7. Биномиальная цепь для семей с тремя детьми (в различных семьях значение различно)

Естественно, что получить оценки для и и z сложнее, чем для одного параметра, и в этом случае лучше применить метод максимального правдоподобия, который дает следующие максимально правдоподобные оценки для и

При: этом наблюдаемые информационные функции имеют вид

Вычислить эти функции с помощью настольной счетной машины довольно легко, хотя для повторных вычислений необходимы соответствующие начальные значения. Оценки для и и z можно получить методом максимального правдоподобия только на первой стадии эпидемии, т. е. объединяя цепи второго и третьего типов. Полученные оценки имеют вид

Применяя этот метод в целом к данным, полученным в . Провиденс, находим следующие результаты: . Цифры, приведенные в последнем столбце табл. 7, говорят о том, что на этот раз соответствие оказывается довольно хорошим: величина для одной степени свободы равна 0,32. Интересно заметить, что соответствующие значения равны 1,09 и 0,26, что определяет -образную форму кривой бета-распределения с бесконечной ординатой при Полученные результаты являются весьма обнадеживающими. На основе данных о заболеваемости корью в . Провиденс аналогичные оценки были получены для семей, имеющих четырех детей, и соответствие вновь оказалось вполне удовлетворительным. Конечно, весьма желательно повторение таких исследований на другом материале.

Цепочечно-биномиальный метод можно несколько видоизменить и обобщить. Например, колебания длительности инкубационного периода могут помешать точному определению типа цепи, хотя общее число случаев будет зарегистрировано безошибочно.

В этой ситуации лучше строить оценки на основе наблюдаемого распределения общего числа случаев. Включая новые параметры в соответствующим образом построенную модель, можно также принять во внимание и ряд других факторов (например, ошибочную диагностику, обусловленную незаметной иммунизацией или потерей постинфекционного иммунитета у ранее болевшего лица). Увеличение числа параметров усложняет анализ в случае малых семей, так как число степеней свободы оказывается недостаточным для получения оценок. Тем не менее стоит всемерно развивать этот подход, так как многие факторы, влияние которых может быть изучено таким способом, имеют существенное значение с биологической и клинической точек зрения. Однако для такого анализа необходимы тщательно собранные данные об эпидемиях в семьях достаточно большого размера.

<< Предыдущий параграф Следующий параграф >>
Оглавление