ЕГЭ и ОГЭ
Хочу знать
Главная > Математика > Численные методы
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

2. Величина и доверительный интервал.

Пусть измерение проводят несколько раз, причем условия эксперимента поддерживают, насколько возможно, неизменными. Поскольку строго соблюдать неизменность условий невозможно, результаты отдельных измерений будут несколько различаться. Их можно рассматривать как значения случайной величины g, распределенной по некоторому закону, заранее нам неизвестному.

Очевидно, математическое ожидание равно точному значению измеряемой величины (строго говоря, точному значению плюс систематическая ошибка).

Обработка измерений основана на центральной предельной теореме теории вероятностей: если с есть случайная величина, распределенная по любому закону, то

есть также случайная величина, причем

а закон распределения величины стремится к нормальному (гауссову) при . Поэтому среднеарифметическое нескольких независимых измерений

является приближенным значением измеряемой величины, причем с тем большей надежностью, чем больше число измерений .

Однако равенство не является точным, и нельзя даже строго указать предел его ошибки; в принципе может сколь угодно сильно отличаться от хотя вероятность такого события ничтожно мала.

Ошибка приближенного равенства (2) носит вероятностный характер и описывается доверительным интервалом Р, т. е. границей, которую с доверительной вероятностью не превышает разность . Символически это записывают следующим образом:

Доверительный интервал зависит от закона распределения (а тем самым от постановки эксперимента), от числа измерений , а также от выбранной доверительной вероятности . Из (3) видно, что чем ближе к единице, тем шире оказывается доверительный интервал.

Доверительную вероятность выбирают, исходя из практических соображений, связанных с применениями полученных результатов. Например, если мы делаем игрушечный воздушный змей, то вероятность благополучного полета нас устроит, а если конструируем самолет, то даже вероятность недостаточна. Во многих физических измерениях считается достаточной.

Замечание 1. Пусть требуется найти величину z, но измерять удобнее величину связанную с ней известным соотношением например, нас интересует джоулево тепло, а измерять легче ток. При этом следует помнить, что

так, среднее значение переменного тока равно нулю, а средний джоулев нагрев отличен от нуля. Поэтому, если мы вычислим сначала а затем положим это будет грубая ошибка. Следует по каждому измерению вычислять и далее обрабатывать полученные значения .

Ширина доверительного интервала. Если известна плотность распределения величины то доверительный интервал можно определить из (3), разрешая уравнение

относительно . Выше отмечалось, что при распределение стремится к нормальному

здесь — дисперсия распределения, а величину называют стандартным отклонением или просто стандартом.

Подставляя (5) в (4) и полагая , т. е. измеряя доверительный интервал в долях стандарта, получим соотношение

(6)

Интеграл ошибок, стоящий в правой части (6), табулирован, так что из этого соотношения можно определить доверительный интервал . Зависимость дается в таблице 23 строкой, соответствующей

Из таблицы 23 видно, что доверительный интервал соответствует доверительной вероятности так что отклонение от более чем на маловероятно. Но отклонение более чем на довольно вероятно, поскольку ширине соответствует

Таким образом, если известна дисперсия то нетрудно определить стандарт и, тем самым, абсолютную ширину доверительного интервала . В этом случае даже при выполнении одного измерения можно оценить случайную ошибку , а увеличение числа измерений позволяет уменьшать доверительный интервал, поскольку

Критерий Стьюдента. Чаще всего дисперсия D? неизвестна, поэтому выполнить оценку ошибки указанным выше способом обычно не удается. При этом точность однократного измерения неизвестна. Однако, если измерение повторено несколько раз, можно приближенно найти дисперсию:

Точность этого выражения невелика по двум причинам: во-первых, число членов суммы обычно мало; во-вторых, использование замены вносит ошибку значительную при малых n. Более хорошее приближение дает так называемая несмещенная оценка дисперсии:

где величину s называют стандартом выборки.

Далее будем пользоваться только оценкой (8).

Оценка (8) также является приближенной, поэтому нельзя пользоваться формулой (6), заменяя в ней на Надо вносить в нее поправку, тем большую, чем меньше . Если распределение считать нормальным при любых , то связь доверительного интервала со стандартом выборки устанавливается критерием Стьюдента:

где коэффициенты Стьюдента представлены в таблице 23.

Таблица 23

Коэффициенты Стьюдента

Очевидно, при больших с хорошей точностью выполняется . Поэтому при критерий Стьюдента переходит в формулу (6); выше отмечалось, что этой формуле соответствует строка таблицы 23. Однако при малых доверительный интервал (8) оказывается много шире, чем по критерию (6).

Пример 1. Выбрано и выполнено 3 измерения; по таблице 23 доверительный интервал равен

К сожалению, не все физики и инженеры знакомы с понятием доверительного интервала и критерием Стьюдента. Нередко встречаются экспериментальные работы, в которых при малом числе измерений пользуются критерием или даже считают, что значение является погрешностью величины , и вдобавок оценивают дисперсию по формуле (7).

Для приведенного выше йримера при первой ошибке был бы дан ответ при второй а при третьей что сильно отличается от правильного значения.

Замечание 2. Зачастую одна и та же величина измерена в разных лабораториях на разном оборудовании. Тогда следует найти среднее и стандарт по формулам (2) и (8), где суммирование проводится по всем измерениям во всех лабораториях, и определить доверительный интервал по критерию Стьюдента.

Нередко при этом суммарный стандарт s оказывается больше, чем стандарты определенные по данным отдельных лабораторий. Это естественно. Каждая лаборатория делает при измерениях систематические ошибки, и часть систематических ошибок в разных лабораториях совпадает, а часть различается. При совместной обработке различающиеся систематические ошибки переходят в разряд случайных, увеличивая стандарт.

Значит, при совместной обработке разнотипных измерений обычно систематическая ошибка значения будет меньше, а случайная больше. Но случайную ошибку можно сколь угодно уменьшить, увеличивая число измерений. Поэтому такой способ позволяет получить окончательный результат с большей точностью.

Замечание 3. Если в разных лабораториях используется оборудование разного класса точности, то при такой совместной обработке надо суммировать с весами

где относятся, как квадраты точности приборов.

Произвольное распределение. Чаще всего число измерений невелико и заранее неясно, можно ли считать распределение нормальным и пользоваться приведенными выше критериями.

Для произвольного распределения справедливо неравенство Чебышева

Отсюда можно оценить доверительный интервал:

Коэффициент в этой оценке приведен в дополнительной строке таблицы 23.

Из таблицы видно, что если в качестве доверительной вероятности принять то для произвольного закона распределения сизвестной дисперсией доверительный интервал не превышает . Для симметричного одновершинного распределения аналогичные оценки показывают, что доверительный интервал не превышает напомним, что для нормального распределения он равен (при выбранном ).

Разумеется, если вместо используют найденное по тем же измерениям значение то надо строить критерий, аналогичный критерию Стьюдента. Оценки при этом будут существенно хуже приведенных.

Проверка нормальности распределения. Из сравнения критериев (6) и (11) видно, что даже при невысокой доверительной вероятности оценки доверительного интервала при произвольном распределении вдвое хуже, чем при нормальном. Чем ближе к единице, тем хуже соотношение этих оценок. Поэтому целесообразно проверять, существенно ли отличается распределение от нормального.

Распространенный способ проверки — исследование так называемых центральных моментов распределения:

Два первых момента, по определению, равны Для нормального распределения два следующих момента равны Обычно ограничиваются этими моментами. Вычисляют их фактические значения по проведенным измерениям и проверяют, согласуются ли они со значениями, соответствующими нормальному распределению.

Удобно вычислять не сами моменты, а составленные из них безразмерные комбинации — асимметрию и эксцесс для нормального распределения они обращаются в нуль. Аналогично дисперсии, вычислим их по несмещенным оценкам:

где s определяется формулой (8). Собственные дисперсии этих величин известны и зависят только от числа измерений:

причем собственное распределение А является симметричным.

Поэтому, если выполняются соотношения

то по критерию Чебышева (11) отличие А и Е от нуля недостоверно, так что можно принять гипотезу о нормальности распределения

Формулы (13)-(15) непосредственно относятся к распределению единичного измерения. На самом деле надо проверить, нормально ли распределение среднеарифметического при выбранном . Для этого делают большое число измерений разбивают их на групп по измерений в каждой и среднее значение в каждой группе рассматривают как единичное измерение. Тогда проверка выполняется по формулам (13)-(15), где вместо надо подставить .

Разумеется, такую тщательную проверку проводят не в каждой измеряемой точке, а лишь во время отработки методики эксперимента.

Замечание 4. Аналогично проверяют любые естественнонаучные гипотезы. Производят большое число экспериментов и выясняют, нет ли среди них событий, маловероятных с точки зрения этой гипотезы. Если найдутся такие события, то гипотезу отвергают, если нет — условно принимают.

Выбор . За счет увеличения числа измерений можно неограниченно уменьшать доверительный интервал. Однако систематическая ошибка при этом не уменьшается, так что суммарная ошибка все равно будет больше Поэтому целесообразно выбрать я так, чтобы ширина доверительного интервала составляла Дальнейшее увеличение числа измерений бессмысленно.

Чтобы найти удовлетворяющее этому требованию , надо отдельные точки измерить достаточное число раз, вычислить стандарт s, убедиться в нормальности распределения и на основании критерия Стьюдента (9) подобрать такое , чтобы выполнялось неравенство

где коэффициенты Стьюдента даются таблицей 23.

Из таблицы 23 видно, что при доверительный интервал чересчур велик, так что следует производить не менее 3—4 измерений. При дальнейшем увеличении коэффициенты Стьюдента убывают слабо и доверительный интервал сужается почти пропорционально т. е. довольно медленно. Поэтому обычно считают нецелесообразным брать так как возрастающая трудоемкость эксперимента не оправдывается достигаемой точностью.

Пример 2. Отношение систематической ошибки к стандарту выборки оказалось и принята доверительная вероятность Возьмем соответствующий столбец таблицы 23 и будем перебирать по очереди , пока не получим этому условию удовлетворяет

Обнаружение грубых ошибок. Отличить грубую ошибку от случайной не всегда легко. Если число измерений мало, то широк доверительный интервал и даже значительные отклонения от среднего в него укладываются. Если же велико, то возрастает вероятность того, что хотя бы одно измерение сильно отклонится от среднего случайно, т. е. на законном основании.

Пусть сделано измерений и вычислены среднее и стандарт s. Чтобы с вероятностью ни одно из этих измерений не отличалось от более чем на, некоторое , каждое измерение должно оставаться в указанных пределах с вероятностью т. е. должно выполняться условие

Предполагая, что g имеет нормальное распределение, сравнивая (17) с критерием Стьюдента (9) и учитывая, что величина s вычислена по всей выборке, а применяется к отклонению единичного измерения, получим

Вместо неизвестной величины мы вынуждены подставлять в (17) величину имеющую доверительный интервал Сравним неравенства

поскольку они носят вероятностный характер, то к ним надо применять не неравенство треугольника, а суммирование квадратов, что дает

Подставляя сюда найденные , можно сделать следующий вывод:

Если для всех измеренных величин выполняется оценка

то нет оснований считать одну из них грубо ошибочной. Если какое-либо измерение не укладывается в пределы (20), то его можно считать грубо ошибочным и отбрасывать.

Общепринятых критериев для выбора вероятности нет; естественно полагать

Пример 3. Пусть проведено измерений и выбрано Тогда и вычисления по формуле (20) при помощи таблицы 23 дают . Если при той же вероятности взять , то получим условие

<< Предыдущий параграф Следующий параграф >>
Оглавление