Главная > Математика > Прикладная статистика: Исследование зависимостей
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

ИСПОЛЬЗУЕМЫЕ В КНИГЕ ОБОЗНАЧЕНИЯ

Исходные наблюдения

— число статистически обследованных объектов, объем выборки из многомерной генеральной совокупности;

— число объясняющих (предикторных) переменных, регистрируемых на каждом из объектов;

— обозначение объясняющей переменной на обследуемом объекте;

— значение исследуемого результирующего показателя («отклика») на обследованном объекте;

— вектор-столбец значений объясняющих переменных зарегистрированных на обследованном объекте;

— значения входных («объясняющих») и выходных («результирующих») переменных, зарегистрированные в наблюдении (или на обследованном объекте); — выборка объема , исходные статистические данные;

— система подвыборок выборки

- вектор-столбец наблюденных значений результирующей переменной («отклика»);

матрица (размера ) исходных данных по объясняющим (предикторным) переменным, матрица плана (здесь ),

— известные базисные функции, по которым разложена функция регрессии в частном случае линейной (по объясняющим переменным) модели регрессии матрица плана имеет вид:

В гл. 3 X используется для обозначения матрицы исходных данных таблицы сопряженности (т. е. ее элемент — это число объектов в двумерной выборке объема отнесенных по первой случайной компоненте к градации i, а по второй случайной компоненте — к градации ), а в гл. 6 — для обозначения некоторого подмножества области определения исследуемой функции регрессии

Законы распределения вероятностей и их числовые характеристики

-мерный нормальный закон распределения вероятностей с вектором (столбцом) средних значений М и ковариационной матрицей (если контекст не требует уточнения размерности закона, нижний индекс может быть опущен);

— нецентральное -распределение с числами степеней свободы числителя и знаменателя соответственно и и с параметром нецентральности

— обозначение факта: «случайная величина Е, имеет распределение

— квантиль уровня квантиль) стандартного нормального распределения;

-ная точка -распределения с v степенями свободы; -ная точка распределения Стьюдента с v степенями свободы;

-ная точка центрального -распределения с числами степеней свободы числителя и знаменателя соответственно

— элемент последовательности чисел, задающей двумерный (дискретный) закон распределения вероятностей: вероятность, что случайно извлеченный объект будет отнесен по первой компоненте к градации, а по второй — к

- случайная величина , анализируемая при условии, что значение другой случайной величины зафиксировано и равно X;

— теоретическое среднее (математическое ожидание) случайной вели чины

— дисперсия случайной величины ;

— условное среднее значение случайной величины вычисленное при условии, что значение другой случайной величины зафиксировано на уровне X;

— условная дисперсия случайной величины , вычисленная при условии, что значение другой случайной величины зафиксировано на уровне X;

— ковариация случайных величин

Если , то

— ковариационная матрица (размера ) вектора причем она в ряде мест книги разбита на подматрицы по следующей схеме:

где подматрицы имеют соответственно размеры .

Корреляционный анализ

— коэффициент коорреляции между случайными величинами

выборочный коэффициент корреляции между (здесь наблюденные значения случайных величин соответственно

- индекс корреляции, характеризующий тесноту статистической связи между и в общем случае (здесь — -безусловная дисперсия случайной величины , а — усредненная по различным значениям X случайной величины величина условной дисперсии );

— корреляционное отношение, характеризующее тесноту статистической связи между при разбиении диапазона изменения объясняющей (предикторной) переменной на k интервалов группирования (здесь наблюденное значение результирующей переменной в интервале группирования, — средняя величина всех наблюденных значений , оказавшихся в интервале группирования, а — общее среднее значение всех наблюденных значений случайной величины ;

— информационная мера статистической связи между дискретными случайными величинами , где — энтропия случайной величины (здесь ), а суммирование производится по всем возможным значениям случайной величины );

— частный (очищенный) коэффициент корреляции между компонентами вектора (вычислен при условии, что все остальные компоненты вектора X зафиксированы на некотором постоянном уровне);

— частный коэффициент корреляции между и при условии фиксации на постоянных уровнях компонент

— множественный коэффициент корреляции между результирующей переменной и объясняющими переменными

— коэффициент детерминации между ;

— ранговый коэффициент корреляции Спирмэна;

— ранговый коэффициент корреляции Кендалла;

— коэффициент конкордации (согласованности), измеряющий степень согласованности различных ранжировок одних и тех же объектов.

Регрессионный, дисперсионный и ковариационный анализ

- функция регрессии результирующей переменной по объясняющим переменным (параметрическая запись): — функция потерь, измеряющая убытки от неточности восстановления значения с помощью функции где — некоторая аппроксимация неизвестной функции регрессии

— теоретический критерий адекватности модели ;

- выборочный критерий адекватности модели

— класс допустимых решений (класс функций, в рамках которого подыскивается наилучшая аппроксимация для ) — функция -регрессии;

— вектор-столбец неизвестных параметров, от которых зависит уравнение искомой функции регрессии

— статистическая оценка векторного параметра ; — вектор-столбец базисных функций , по которым разложена функция регрессии — функция регрессии, разложенная в системе базисных функций линейная по параметрам;

— ковариационная матрица оценок ;

— общая (неявная) запись модели регрессии по X;

— индикаторные переменные в схеме ковариационного анализа, соответствующие k возможным типам условий эксперимента (нижний индекс д показывает, что эти переменные относятся к «дисперсионной части» модели ковариационного анализа);

— параметры (неизвестные) модели ковариационного анализа, определяющие сравнительный эффект влияния каждого из k типов условий эксперимента на исследуемый результирующий показатель.

<< Предыдущий параграф Следующий параграф >>
Оглавление