Главная > Математика > Прикладная статистика: Исследование зависимостей
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

2.2.2. Ранговый коэффициент корреляции Кендалла.

Другой широко используемой характеристикой тесноты статистической связи между двумя упорядочениями является ранговый коэффициент корреляции Кендалла, определяемый соотношением [67]

где — минимальное число обменов соседних элементов последовательности необходимое для приведения ее к упорядочению Очевидно, величина симметрична относительно своих аргументов, так что с равным правом можно говорить о минимальном числе «соседских обменов» элементов последовательности , необходимом для приведения ее к виду

Из (2.6) сразу следует, что при совпадающих ранжировках (так как , а при противоположных (т. е. при , так что

Нетрудно показать (см., например, ), что во всех остальных случаях

Вычисление связано с необходимостью подсчета величины и, следовательно, является более трудоемким, чем вычисление Однако, во-первых, коэффициент Кендалла обладает некоторыми преимуществами по сравнению с коэффициентом Спирмэна, главные из них: а) относительно большая продвинутость в исследовании его статистических свойств и, в частности, его выборочного распределения (см. ниже, п. 2.2.4); б) возможность его использования и в частной («очищенной») корреляции рангов [67, гл. 8]); в) большие удобства его пересчета при добавлении к статистически обследованным объектам новых, т. е. при удлинении анализируемых ранжировок: для вычисления нового значения рангового коэффициента корреляции приходится переранжировать значительную часть объектов, что в случае означает необходимость пересчета разностей

При вычислении же значения рангов не играют никакой роли, важно лишь число необходимых «соседских обменов», которое при добавлении новых объектов подсчитывается рекуррентным способом (к старому значению ) может быть лишь дополнен некоторый «добавок»).

Во-вторых, можно воспользоваться рекомендациями, упрощающими подсчет числа как при ручном, так и при машинном счете.

Так, при ручном счете полезным оказывается известный факт тождественного совпадения величин , где число инверсий — это просто число расположенных в неодинаковом порядке пар элементов последовательностей являющееся естественной мерой нарушения порядка объектов в одной последовательности относительно другой. Для удобства подсчета перенумеруем объекты в порядке, определяемом рангами последовательности Тогда анализируемые ранжировки соответствующим образом видоизменяются, т. е. преобразуются к виду соответственно , где , а число инверсий а следовательно, и величина определятся по формуле

где

Легко подсчитать, что число инверсий может меняться от 0 (что соответствует случаю совпадающих ранжировок) до (что соответствует случаю противоположных ранжировок).

Формулы (2.6)-(2.7) пригодны для подсчета лишь в случае отсутствия объединенных рангов в обеих исследуемых ранжировках. Соответствующее «подправленное» значение при наличии объединенных рангов в анализируемых упорядочениях будет определяться соотношением

в котором коэффициент твычисляется по формуле (2.6)- (2.7), а «поправочные» величины определяются соотношением

(смысл величин определен в п. 2.2.1, см. (2.4)).

Для цояснения работоспособности формул (2.6)-(2.8) вернемся к примерам 2.1, 2.2.

Анализ степени согласованности ранжировок двумя экспертами десяти проектов реорганизации НПО (пример 2.1), осуществленный с использованием формул (2.6), (2.7), дает:

Таким образом, .

Соответственно

(напомним, что коэффициент Спирмэна в этом примере был равным 0,915).

При вычислении рангового коэффициента корреляции Кендалла в примере 2.2 следует воспользоваться формулой (2.6), так как исследуемые ранжировки содержат объединенные ранги. Используя результаты расчета величин (см. п. 2.2.1), получаем (в соответствии с (2.8)):

Обращаясь теперь к формуле (2.6), имеем:

(напомним, что соответствующий коэффициент Спирмэна был равен 0,917).

<< Предыдущий параграф Следующий параграф >>
Оглавление