Главная > Математика > Прикладная статистика: Основы моделирования и первичная обработка данных
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

11.1. Проверка соответствия выбранной модели распределения исходным данным (критерии согласия)

Пусть нами высказано предположение, что ряд наблюдений (11.1) образует случайную выборку, извлеченную из генеральной совокупности с некоторой модельной функцией распределения , где общий вид функции (т. е. тип модели) считается известным, а параметры, от которых она зависит, могут быть как известными, так и неизвестными.

Описываемые в данном параграфе критерии согласия предназначены для проверки гипотезы

и основаны на использовании различных мер расстояний между анализируемой эмпирической функцией распределения (определяемой по выборке (11.1), см. § 5.5) и гипотетической модельной

11.1.1. Критерий «хи-квадрат» Пирсона.

Критерий согласия позволяет осуществлять проверку гипотезы (11.2) в условиях, когда значения параметров модельной функции распределения не известны исследователю. Для измерения степени отклонения эмпирического распределения от модельного этот критерий использует введенную в п. 6.2.1 статистику (см. формулу (6.20)). Процедура статистической проверки гипотезы (11.2) складывается в данном случае из следующих этапов.

1. Весь диапазон значений исследуемой случайной величины I разбивается на ряд интервалов группирования не обязательно одинаковой длины. Это разбиение на интервалы необходимо подчинить следующим условиям:

а) общее количество интервалов k должно быть не меньшим ;

б) в каждый интервал группирования должно попасть не менее 7—10 выборочных значений причем желательно, чтобы в разные интервалы попало примерно одинаковое число точек;

в) если диапазон исследуемой случайной величины — вся числовая прямая (полупрямая), то крайние интервалы группирования будут полупрямыми (соответственно один из них).

2. На основании выборочных данных строятся статистические оценки неизвестных параметров от которых зависит данный закон распределения F (о построении оценок см. гл 8). Более корректным способом действий считается тот, при котором оценки вычисляются на основе сгруппированных данных.

3. Подсчитываются числа точек, попавших в каждый из интервалов группирования и вычисляются вероятности событий т. е. вероятности

попадания в те же интервалы суть левый и правый концы интервала группирования).

4. Вычисляется величина критической статистики по формуле

Далее из табл. 2.2 а [16] находятся -ная точка И -ная точка -распределения с степенями свободы как обычно, уровень значимости, которым мы задаемся заранее).

Если

то гипотеза о том, что исследуемая случайная величина действительно подчиняется закону распределения принимается.

Выполнение неравенства

говорит о слишком большом отклонении исследуемого закона распределения от гипотетического .

Случай

требует дополнительного исследования.

Так, например, при проверке гипотезы нормальности гипотетический закон будет иметь соответственно вид:

а в качестве оценок двух неизвестных параметров а и будут фигурировать величины

(через обозначается, как и прежде, средняя точка интервала ).

Значения необходимые для подсчета вероятностей можно найти, например, из табл. 1.1 [16] значений функции нормированного нормального распределения с учетом соотношения Число степеней свободы закона распределения процентные точки которого нам понадобятся, будет равно в данном случае где k — число интервалов группирования.

<< Предыдущий параграф Следующий параграф >>
Оглавление