Главная > Разное > Математика в биологии и медицине
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

7.3. ПРИНЦИПЫ ЧИСЛОВОЙ ТАКСОНОМИИ

Попытки использования некоторых количественных методов в таксономии восходят еще к концу XIX в., когда возникла наука, называемая биометрией. Так, в 1898 г. Гейнке использовал определенный показатель фенетического расстояния, чтобы установить различие между отдельными расами сельдей. Позже при решении ряда задач физической антропологии широко применялся введенный Карлом Пирсоном коэффициент расового сходства, который довольно точно характеризовал степень таксономического подобия. Такого же рода коэффициентом является обобщенный показатель расстояния Махаланобиса. Однако все эти методы были разработаны в основном для того, чтобы облегчить распределение индивидуумов по уже существующим таксонам.

Нас же интересует вопрос о том, каким образом формировать сами таксоны, пользуясь теми эмпирическими данными, которые непосредственно касаются биологических единиц, подлежащих классификации.

Как уже указывалось, эти единицы могут быть и отдельными организмами (как в случае внутривидовых классификаций), но для сравнения на более высоких уровнях в ботанике и зоологии обычно за единицу принимается целый вид. Хотя по поводу определения некоторых видов имеются известные разногласия, как правило, считают, что виды установлены с достаточной степенью надежности. Основную единицу, используемую в каком-либо определенном таксономическом исследовании, обычно называют операбельной таксономической единицей, или О. Т. Е. (operational taxonomic unit — OTU). Изложенные ниже различные методы вычисления сходства относятся к любым операбельным таксономическим единицам, будь то отдельные организмы или какой-нибудь абстрактный класс единиц.

В предыдущем разделе было уже введено важное понятие политетической классификации, основанной на наличных признаках. В числовой таксономии предполагается, что все признаки можно представить в количественной форме. Простейший случай классификации — дихотомическая классификация, производимая в соответствии с наличием или отсутствием того или иного признака; в этом случае наличие может обозначаться, скажем, через 1, а отсутствие — через 0. Признаки могут также образовывать ступенчатый ряд дискретных классов, обозначаемых соответствующими числами, или же представлять собой непрерывные переменные (например, размер или вес). В некоторых случаях, например при вычислении обобщенных расстояний или коэффициентов корреляции, можно оперировать непосредственно с непрерывными переменными. Но для вычисления многих коэффициентов ассоциации необходимо обращаться к дихотомии. Более сложную задачу составляет описание качественных признаков, распадающихся не на две группы, а на большее число групп, расположение которых не характеризуется определенной упорядоченностью. В этом случае может оказаться удобным разделить каждый признак на две или большее число отдельных дихотомических частей. Большое значение имеет проблема правильного кодирования используемых признаков, однако этот вопрос относится не только к работам данного типа. В большей или меньшей степени эта проблема возникает при любой форме количественных исследований. Здесь мы ее рассматривать не будем. Более полное изложение специальных проблем кодирования, встречающихся в числовой таксономии, читатель найдет в разд. 5.3 книги Сокэла и Снита [59].

Основные этапы, на которые распадается процедура образования таксонов с помощью математических методов, кратко состоят в следующем (детали будут изложены в последующих разделах):

1. Прежде всего выбирают t операбельных таксономических единиц, подлежащих классификации, и по каждой из них исследуют и кодируют достаточно большое число соответствующих признаков.

Обычно рекомендуется, чтобы было порядка 50—100 или больше. Если будет слишком мало, то окончательная конструкция таксонов может оказаться чрезмерно чувствительной к произвольному выбору признаков и будет слишком мала статистическая точность коэффициентов сходства. Исходные данные можно записать в виде матрицы . Очевидно, что в общем случае эта матрица будет содержать весьма значительный объем числового материала.

2. После этого приступают к сравнению всех О. Т. Е. друг с другом, чтобы определить степени сходства на основе соответствующей совокупности численно закодированных признаков. Одним из простейших показателей сходства некоторой пары О. Т. Е. служит доля признаков, которые у них совпадают (т. е. имеют одно и то же кодированное значение). Однако во многих случаях более точные результаты дает применение иного, более сложного метода (см. разд. 7.4). Веса всех признаков обычно полагают одинаковыми, так как невозможно найти какие-либо разумные доводы в пользу той или иной схемы предпочтений, не впадая в порочный круг. Полученное множество измеренных коэффициентов сходства можно представить в виде матрицы t X t. Эта матрица, конечно, симметрична, и поэтому необходимо вычислить и записать только половину ее элементов, лежащих под главной диагональю или над ней. (Элементы матрицы, лежащие на главной диагонали, описывают лишь сходство операбельной таксономической единицы с самой собой и не дают никакой специальной информации.)

3. Теперь на основе матрицы вычисленных коэффициентов сходства можно расположить все О. Т. Е. по группам. Часто таких групп бывает несколько. Внутри любой группы таксономические единицы обнаруживают значительно большее взаимное сходство, чем единицы, принадлежащие к различным группам. Во многих случаях, объединяя по нескольку групп в группы более высокого ранга, можно получить иерархическую структуру. Полную схему такого таксономического «древа» представляют затем в виде дендрограммы. Существует целый ряд способов определения групп, и некоторые из них детально рассматриваются в разд. 7.5.

Полученные таким способом группы представляют собой по существу вычисленные таксоны. Сокэл и Снит называют их фенонами, поскольку они основаны на чисто фенетических признаках. «Таксон» является более общим термином, обозначающим точно определенную таксономическую группу.

4. Последний этап этой процедуры — проверка правильности классификации путем экспериментальной оценки возможности прогнозирования. Если вновь определенные феноны имеют какую-либо объективную ценность в том смысле, как это было указано в разд. 7.1, то любой новый индивидуум можно будет поместить в соответствующую группу.

Другими словами, для любого нового индивидуума можно будет найти такую группу, что его свойства или признаки будут достаточно точно совпадать со свойствами или признаками, характерными для данной группы.

Все эти операции, за исключением, разумеется, первоначального выбора признаков, могут быть выполнены более или менее автоматически. Другими словами, для этой цели может быть использован весь арсенал мощных математических и вычислительных методов. Таким образом, мы получаем метод таксономического анализа, имеющий четкую логическую основу. Если с его помощью будут получены результаты, имеющие практическую ценность, то тем самым применение данного метода уже будет оправдано. Если же окажется, что полученный результат не достигает цели и не выдерживает критики, то все же можно будет более отчетливо, чем при преимущественно словесном описании, увидеть, в чем здесь ошибка и какие дальнейшие исследования необходимы.

В последующих трех разделах более подробно рассматриваются вопросы, кратко затронутые в пп. 2—4.

<< Предыдущий параграф Следующий параграф >>
Оглавление