Главная > Разное > Математика в биологии и медицине
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

2.3. ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТОВ

Статистический подход, рассмотренный в предыдущем разделе, можно использовать в любом случае, когда требуется выяснить, отличается ли реально или, во всяком случае, статистически значимо некоторая полученная в эксперименте величина — среднее значение, коэффициент корреляции и т. п. от ее теоретического значения. Нас, скажем, может интересовать, достаточно ли отличается от 0,5 наблюдаемая частота рекомбинаций между двумя генетическими локусами в потомстве от возвратного скрещивания для того, чтобы можно было заключить, что данные локусы лежат в одной и той же хромосоме. Или, например, требуется выяснить, значимо ли статистически наблюдаемое различие между числом образующихся мужских и женских гамет. Далее, может возникнуть необходимость в определении частоты случаев выздоровления после какого-то заболевания — либо при испытании того или иного препарата, либо при сравнении эффективности двух препаратов. Замечательная особенность такого статистического анализа состоит в том, что все виды неизбежной естественной изменчивости, составляющей как бы «фон», на котором проявляется изменчивость, связанная с исследуемым фактором, учитываются в комплексе путем использования соответствующего распределения вероятностей.

Если фоновая изменчивость очень велика, то для получения окончательных результатов может потребоваться очень большое число наблюдений, а когда она сравнительно мала, результат будет получен значительно быстрее.

Если какой-либо эффект вызывается очень большим числом различных факторов, то вполне возможно, что фоновая изменчивость будет весьма велика. В таких случаях целесообразно попытаться выделить некоторые из этих факторов, даже если их невозможно полностью контролировать или исключить. Часто оказывается возможным разбить общую изменчивость на отдельные компоненты, из которых один соответствует исследуемому фактору, несколько других — другим воздействиям, допускающим возможность раздельной оценки, и последний — остальным воздействиям, раздельная оценка которых невозможна. Поскольку влияние последней группы факторов, безусловно, будет слабее, чем влияние исследуемого фактора, то это обеспечивает более точную статистическую проверку. Искусство располагать наблюдения в определенном порядке или проводить специально спланированные проверки с целью полного использования возможностей этих методов и составляет содержание предмета «планирование эксперимента». Детальное изложение существующих методов планирования эксперимента можно найти в литературе (см., например, [14]). В настоящем разделе мы осветим лишь некоторые основные преимущества сознательного и продуманного планирования эксперимента.

Допустим, например, что требуется сравнить болеутоляющее действие двух различных лекарственных препаратов А и В. Пусть подобрано 16 больных и принято решение разделить их случайным образом (во избежание какой-либо сознательно или непроизвольно вносимой систематической ошибки) на две группы, по 8 больных в каждой. Одна группа получает препарат А, а другая — препарат В. Затем измеряют время, в течение которого каждый из больных испытывает облегчение, и сравнивают средние значения по обеим группам. Если среднее время для препарата А значимо превышает среднее время для препарата В, то можно сделать вывод, что первый препарат более эффективен. (В данном случае несущественно, какой статистический критерий используется. Поскольку рассматривается небольшое число объектов, это может быть один из критериев Стьюдента.) Известно, что больные по-разному реагируют на один и тот же лекарственный препарат, поэтому продолжительность периода облегчения обычно сильно варьирует, что значительно понижает точность сравнения этих двух препаратов.

Однако в данном эксперименте различия между больными не представляют для нас особого интереса, и этот источник погрешности можно исключить следующим образом. Вместо того чтобы делить больных на две группы, проверяют на каждом из них оба препарата, назначая их последовательно через достаточно большие промежутки времени (чтобы избежать взаимодействия) и в случайном порядке (или, возможно, в одном порядке для одной половины больных и в другом порядке для другой). Теперь для каждого больного определяют относительное преимущество препарата А перед препаратом В, для чего вычисляют суммарную продолжительность периода облегчения для каждого из них и находят разность этих двух величин. Таким образом получают 16 чисел, характеризующих относительное преимущество одного препарата перед другим, что позволяет проверить, значимо ли отличается от нуля их среднее значение. Положительная разность свидетельствует о статистически значимом преимуществе препарата А, отрицательная — об обратном соотношении. Рассматривая показатели относительного преимущества, мы исключаем влияние реакции отдельных больных и в общем случае добиваемся более эффективного сравнения этих двух лекарств.

Такая простая проверка методом попарного сравнения представляет собой простейший план эксперимента, имеющий целью извлечь максимальное количество информации из данного числа наблюдений. Заметим, что этот план имеет и свои дополнительные особенности, так как требует особого внимания к ряду практических вопросов, например к тому, чтобы препараты назначались в случайном порядке (во избежание нежелательной систематической ошибки) и через достаточно большие промежутки времени (для исключения эффектов взаимодействия); однако здесь мы не можем детально рассматривать эти вопросы.

Мы показали, каким образом при проверке методом попарного сравнения можно контролировать или исключать из рассмотрения какой-либо один важный и явный источник изменчивости. В более общем случае могут быть спланированы факторные эксперименты, с помощью которых можно определить вклад каждого из нескольких факторов в общую изменчивость. Некоторые из этих факторов могут представлять особый интерес, тогда как другие имеют второстепенное значение. Идея и практическое применение этого нового подхода, принадлежащего главным образом Р. Фишеру, получили широкое распространение после появления его книги «Планирование экспериментов», вышедшей первым изданием в 1935 г. Большинство фундаментальных работ в области планирования эксперимента было посвящено сельскохозяйственным приложениям.

Допустим, требуется сравнить среднюю урожайность нескольких сортов пшеницы при применении различных удобрений в различной концентрации, учитывая при этом колебания в плодородии почвы на достаточно больших участках земли, которые можно разбить на делянки подходящих размеров. Для начала можно попытаться составить план эксперимента, в котором будут рассматриваться все возможные комбинации значений, или уровней, различных факторов. Так, если имеются четыре сорта пшеницы и три различных вида удобрений, применяемых в трех различных концентрациях, то общее число комбинаций условий будет равно 36. Таким образом, исходное число делянок в одном блоке факторного эксперимента будет равно 36 — по одной делянке на каждую комбинацию условий. Вследствие возможного колебания в плодородии почвы от одного блока к другому может оказаться целесообразным иметь не менее двух полных блоков.

Применение факторного плана вместо классической схемы, согласно которой каждый раз изменяется только один фактор, имеет ряд серьезных и даже несколько неожиданных преимуществ. Прежде всего в этом случае становится значительно более полной картина влияния каждого фактора, поскольку оно изучается в самых различных условиях (вследствие одновременного изменения других факторов). Во-вторых, большое число комбинаций факторов, используемых в эксперименте, облегчает предсказание результатов, которые могут быть достигнуты при определенной комбинации условий. В-третьих, если эффекты, вызываемые каждым фактором, включаемым в эксперимент, статистически независимы, то о каждом факторе можно получить не меньше информации, чем если бы в процессе эксперимента изменялся только один этот фактор, а остальные оставались постоянными. В-четвертых, если (как это часто бывает) различные факторы не являются независимыми, а вызывают эффекты, которые в большей или меньшей степени коррелированы, то в этом случае только факторный эксперимент может дать информацию о характере этих взаимодействий. При наличии нескольких взаимосвязанных существенных факторов обойтись без постановки факторного эксперимента невозможно. Для ряда часто встречающихся специальных задач разработано большое число стандартных планов такого типа.

Согласно некоторым из этих простейших планов, эксперимент проводят на нескольких блоках и внутри каждого из них на отдельных делянках проверяют влияние всех уровней какого-то одного фактора. При правильном планировании получают рандомизированный блочный план. В сельскохозяйственных задачах блоками могут служить участки земли на различных полях, а уровнями одного фактора — ступенчатая последовательность концентраций удобрений или просто различные сорта пшеницы.

В лабораторном эксперименте, в котором, скажем, проверяется влияние различных рационов питания на крыс, рационы питания будут испытываемыми условиями, а крысы — отдельными экспериментальными единицами (соответствующими делянкам в сельскохозяйственном эксперименте). Если бы мы могли использовать в эксперименте животных отдельных пометов, подвергая каждому воздействию по одному животному из каждого помета, то каждый помет можно было бы рассматривать как отдельный блок.

В рассмотренной выше простой проверке методом попарного сравнения также можно было бы применить рандомизированный блочный план; тогда каждого больного можно было бы рассматривать как отдельный блок, а лекарственные препараты — как условия эксперимента.

Хотя иногда бывает трудно перенести планы экспериментов, разработанные для одной области, особенно для сельского хозяйства, в совершенно другую область, лежащая в их основе логическая схема часто оказывается весьма сходной. Поэтому целесообразно тщательно обдумать возможность того, чтобы при надлежащей интерпретации элементов какого-либо определенного плана эксперимента можно было обеспечить его успешное применение в задачах совершенно иного характера. Это иллюстрирует большие возможности математических методов планирования эксперимента. В основе планирования должна, разумеется, лежать некоторая исходная математическая модель. Опишем самую простую из них, которая в том или ином варианте используется наиболее широко. Пусть требуется исследовать влияние только двух факторов А и В. Допустим, что наблюдаемое на некоторой экспериментальной единице влияние уровня фактора А и уровня фактора В можно записать в виде

где — наблюдаемая величина, — общее среднее, — относительные вклады этих двух факторов при заданных уровнях каждого из них, — случайное изменение, налагаемое на основную линейную аддитивную схему. Кроме того, часто принимается, что все величины имеют одно и то же нормальное распределение и независимы друг от друга. Эти ограничения весьма серьезны, однако часто принятие их в качестве первого приближения вполне оправданно. Так, если влияние этих факторов мало, то заметную величину будут иметь только линейные члены и возможными членами второго порядка можно пренебречь. При независимости факторов формула (2.4) вполне удовлетворительна. Но если они взаимодействуют друг с другом, то следует включить в нее дополнительные члены с, учитывающие это взаимодействие.

Можно, однако, выполнить проверку значимости на основе формулы (2.4), чтобы убедиться, нужны ли члены, характеризующие взаимодействие. Кроме того, если случайные величины не распределены по нормальному закону, то можно использовать какую-либо функцию эмпирических результатов (например, квадратные корни или логарифмы), для которой сохраняется нормальный закон распределения.

На основе элементарной формулы (2.4) легко построить модели, учитывающие множество факторов, блоков, взаимодействий и других усложнений, вызываемых практической необходимостью в каждом данном эксперименте. Дело в том, что в очень многих случаях необходимые вычисления относительно просты и выполняются непосредственно. Обычно приходится производить повторяющиеся вычисления сумм и сумм квадратов данных, выбранных соответствующим образом. Результаты представляют в виде таблицы дисперсионного анализа, с помощью которой можно установить значимость всех различных факторов, влияющих на результаты эксперимента.

Одним из современных вариантов планирования экспериментов, который следует рассмотреть особо, является последовательностная схема эксперимента. В эксперименте стандартного типа необходимо заранее решить, сколько наблюдений нужно набрать. Если после анализа обнаружится, что число наблюдений слишком мало, то нужно попытаться продолжить эксперимент, однако может оказаться, что на данном этапе сделать это трудно или невозможно. Если же выяснится, что получено значительно больше наблюдений, чем необходимо для достижения требуемой точности, то будут потеряны время и деньги. В медицинских задачах это имеет особенно существенное значение. Ни один врач не заинтересован в том, чтобы эксперимент длился дольше, чем это строго необходимо, так как его цель — дать своим больным наилучший из существующих препаратов, как только он пройдет клинические испытания. Таким образом, в медицине выбор и планирование эксперимента теснейшим образом связаны с этическими соображениями. Последовательностная схема предусматривает проведение эксперимента отдельными сериями. Оценка результатов производится на каждом этапе, с тем чтобы немедленно можно было решить, применять препарат А, препарат В или же продолжать эксперимент, поскольку окончательного вывода сделать еще нельзя. При такой схеме эксперимента длительность его будет минимальна и он закончится значительно раньше, чем в любом другом случае. Кроме того, в медицине часто бывает очень трудно или даже вообще невозможно провести обычную экспериментальную проверку, так как после нескольких неудачных исходов, которые могут закончиться смертью больного, начинаются острые споры о том, следует ли продолжать эксперимент вообще.

Последовательностная схема означает, что заранее можно тщательно и спокойно рассмотреть различные линии поведения, обусловливаемые различными исходами эксперимента. При этом значительно легче выбрать наилучшие решения непосредственно в ходе эксперимента и совместить требования этики со статистической эффективностью. Более детально методы последовательностного анализа в медицине рассмотрены в книге Эрмитажа [1].

Недостаток места не позволяет продолжать здесь изложение теории планирования эксперимента, тем более что этому предмету посвящена уже огромная литература г. Наша основная цель состояла в том, чтобы показать, каким образом с помощью простой математической модели процесса, на который одновременно воздействуют несколько факторов (носящих, возможно, в значительной мере вероятностный характер), можно с достаточной точностью выяснить степень влияния каждого из этих факторов в отдельности. Это позволяет применять для проверки значимости влияния крайне изменчивых и одновременно действующих факторов простые статистические критерии, описанные в разд. 2.2. А именно такой подход и необходим для исследования всего огромного многообразия явлений, встречающихся в биологии и медицине.

<< Предыдущий параграф Следующий параграф >>
Оглавление