Главная > Разное > Математика в биологии и медицине
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

5.3. ОБРАБОТКА ДАННЫХ

В разд. 5.1 мы уже указывали, что электронная вычислительная машина способна не только выполнять с огромной скоростью арифметические действия, но и хранить огромное количество данных. Это привело к развитию новой широкой области математики, связанной с обработкой данных. Эта область в значительной степени отличается от численного анализа, хотя обе они, безусловно, взаимосвязаны и дополняют друг друга.

В большинстве научных дисциплин, а также в области права, торговли, промышленности, государственного управления и т. д. непрерывно накапливается огромное количество все более сложных данных, зафиксированных в виде записей. В сфере административного управления записи используются для установления различных правил и предписаний, в сфере науки — для формулировки и проверки научных гипотез. Как показано в гл. 2, в некоторых случаях удобно обобщать большое количество численных данных путем применения соответствующего статистического метода. Если вычислены надлежащие статистические показатели, то они могут использоваться и при последующих численных расчетах, и при этом не возникает необходимости снова детально изучать исходный материал. Однако нередко исходные данные необходимо сохранять почти полностью в их первоначальном виде — как для проверки различных методов исследования, так и потому, что некоторые из них могут иметь особо важное значение.

В простейшем случае регистрация данных связана с хранением исходных документов — семантической информации или результатов количественных измерений. Если документов очень много, то их необходимо расклассифицировать и хранить по определенной системе; при этом нужна специальная картотека, позволяющая быстро найти любой требуемый материал. Огромное множество историй болезни в больницах и в поликлиниках хранится именно в такой форме. В этом случае можно сравнительно быстро найти истории болезни отдельных больных, но когда требуется получить сводные данные в виде таблиц, показывающих частоту появления тех или иных событий или связь между различными аспектами материала, обычно возникают почти непреодолимые трудности, если только не принимаются специальные меры, облегчающие такой анализ. При небольшом числе факторов удобно проводить текущие проверки соответствующих вопросов по мере накопления записей. Например, больных, поступающих в больницу на стационарное лечение, можно регистрировать в специальной книге, где записывается возраст, пол, диагноз, длительность пребывания в больнице, фамилия лечащего врача и т. д., а затем каждую неделю или каждый месяц составлять специальные таблицы, отражающие их состояние вплоть до выписки. Выполнение такого рода исследований обычными канцелярскими методами требует больших затрат труда и времени, нередко бывает неточным, значительно ограничивает объем материала, который можно обработать, и позволяет применять лишь ограниченное число методов анализа.

Более совершенный метод — запись соответствующих данных на специальные карточки, на которых пробиваются определенным образом расположенные отверстия, кодирующие классификацию данных. Эти отверстия (перфорации) могут пробиваться у краев карты, как в системе Коуп-Чета и системе Макби, так что сортировку карт можно выполнять вручную на конторском столе с помощью спицы или какого-либо другого инструмента. Например, отверстие может означать отсутствие определенного фактора, а сквозная щель или прорезь — его присутствие. Вставляя спицу в пачку карточек через отверстие, занимающее определенную позицию, и приподнимая спицу, можно отсортировать все карточки с прорезями, соответствующие группе больных, у которых наблюдается данный фактор. При надлежащем выборе комбинаций доверстий можно получить численную или алфавитную классификацию.

Еще удобнее использовать всю площадь карточки. Так, типичная перфокарта вычислительной машины IBM имеет 80 столбцов по 12 перфорационных позиций в каждом.

Это позволяет записать значительно большее количество информации, и такие карты можно сортировать и подсчитывать автоматически с помощью электрического датчика, сообщающего о наличии отверстия в данной перфорационной позиции. В настоящее время во многих больницах помимо основных историй болезни ведутся записи на перфокартах, используемые для административных и научных целей. Такой метод обработки материала все же еще довольно громоздок и требует много времени, хотя это значительный шаг вперед по сравнению с сортировкой карточек вручную на столе. Он значительно облегчает составление обычных административных отчетов, если только они не требуются слишком часто. Обычно нетрудно найти годовые или квартальные цифры, но данные за сутки в большинстве случаев получить невозможно. Составить представление об общем положении дел можно довольно быстро, но детальные исследования, сопряженные с составлением больших многокоординатных таблиц и, главное, с проведением сложных статистических вычислений, могут оказаться невыполнимыми.

В настоящее время электронные вычислительные машины позволяют в огромной степени ускорить обработку таких записей. Для удобства данные переносят сначала из первоначальных записей на перфокарты. Затем машина считывает информацию, записанную на перфокартах, и хранит ее на магнитных дисках или магнитной ленте в очень компактной и удобной форме. Вся последующая обработка и анализ данных выполняются машиной с очень большой скоростью. По мере надобности данные, хранящиеся в машине, считывают с магнитного диска или магнитной ленты, но и эта операция производится очень быстро. Кроме того, в результате однократного просмотра хранимого материала можно составить большое число сводных таблиц или выполнить другие виды анализа. Сравним эти возможности с трудоемкой многократной сортировкой оригинальных карточек, производимой при описанных выше механических методах классификации. Если требуется обработать лишь несколько сотен записей, то это можно сделать на конторском столе, используя оригинальные документы или их варианты на карточках с краевой перфорацией. Однако если имеется несколько тысяч записей, то почти всегда стоит приложить дополнительные усилия, чтобы передать материал на хранение в электромагнитное запоминающее устройство и составить соответствующие программы для вычислительной машины, позволяющие обрабатывать данные, записанные в таком виде. Это значительно повышает скорость, точность и гибкость обработки. Вопрос повышения скорости вряд ли нуждается в специальном комментарии. Точность повышается благодаря тому, что вычисления производятся почти без вмешательства человека и имеется возможность предусмотреть большое число перекрестных проверок и испытаний непротиворечивости.

Увеличение гибкости означает, что значительно расширяется диапазон возможных видов анализа и что операции сортировки и обработки данных могут играть роль предварительного этапа научных вычислений, о которых шла речь в предыдущем разделе. Примерам взаимосвязи между обработкой данных и научными вычислениями будет уделено особое внимание в гл. 11 и 12.

Наряду с обработкой данных, компактно представленных в обычном письменном или печатном виде, существует проблема обработки большого количества сырого материала такого типа, как, например, электрокардиограммы, электроэнцефалограммы и т. п. Существуют самые различные способы анализа таких данных, и выбор какого-либо одного из них зависит от специфики конкретной задачи, стоящей перед исследователем. Но смысл любого такого способа заключается по существу в увеличении отношения сигнала к шуму, с тем чтобы более отчетливо выявить основные характеристики формы сигнала. Так, усреднение реакции дает возможность получить более четкую картину формы повторяющегося сигнала. Этот метод очень ценен, если известно, что определенные формы сигнала имеют диагностическое значение. Кроме того, можно попытаться выделить основные компоненты колебаний с помощью частотного анализа. В тех случаях когда основной биологический процесс имеет характер случайной функции, может оказаться предпочтительным корреляционный подход. В настоящее время все эти методы можно применять в реальном масштабе времени, когда наблюдаемые величины в виде электрических напряжений вводятся непосредственно в соответствующую вычислительную машину. Для некоторых целей вполне удобна аналоговая техника, которая часто применяется на первом этапе исследований. Однако при использовании ряда более сложных математических методов необходимо преобразовывать данные в цифровую форму.

Дальнейшее развитие методов обработки данных на ЭВМ в реальном масштабе времени привело к созданию систем автоматического обследования больных. Сейчас разрабатываются системы, позволяющие непрерывно регистрировать различные показатели состояния больного (температура, частота пульса, кровяное давление, частота дыхания и т. д.). Прежде всего, конечно, нужно найти удовлетворительные способы, которые позволяли бы непрерывно измерять и регистрировать эти физиологические параметры, надлежащим образом представлять их визуально, получать сигналы о наступлении тревожного или опасного состояния и т. п. без применения сложных вычислительных методов. Но в тех случаях, когда, например, необходимо анализировать форму сигналов на электрокардиограммах и электроэнцефалограммах, вычислительные методы могут оказаться крайне полезными.

Предполагается, что в общем случае системы автоматического обследования больных позволят очень быстро определить резкое ухудшение состояния у тяжелых больных. При возникновении тревожных или опасных ситуаций медицинские сестры и врачи должны принимать соответствующие меры. Однако вполне возможно предусмотреть автоматическое выполнение некоторых терапевтических приемов, особенно в тех случаях, где важна быстрота.

Еще один тип обработки данных возникает в рамках задачи распознавания образов, например при автоматической классификации хромосом. Для оценки фотографических данных исполь зуются методы электронного сканирования, позволяющие перейти от графической формы к цифровому коду и путем вычислений произвести соответствующий анализ.

Широкое обсуждение современных работ в области получения и обработки данных читатель может найти в опубликованных трудах Рочестерских конференций [19—21].

<< Предыдущий параграф Следующий параграф >>
Оглавление