Главная > Разное > Статистический анализ угловых наблюдений
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

§ 7.2. Критерии согласия и критерии равномерности

Рассмотрим задачу проверки гипотезы против альтернативы При данном задача может быть приведена к проверке равномерности распределения с помощью преобразования (7.1.10). Кроме того, гипотеза равномерности интересна и сама по себе.

7.2.1. Аналог критерия Колмогорова (критерий Куипера). Как и в случае прямой, определим отклонения

где эмпирическая Обе статистики и зависят от выбора нулевого направления, как это легко видеть из (7.1.8) и (7.1.9): действительно,

и

Чтобы избежать этой зависимости от нулевого направления, Куипер (1960) ввел в рассмотрение статистику

которая согласно (7.2.2) от выбора нулевого направления не зависит. Гипотеза отклоняется при больших значениях Поскольку

то

Аналогично

Подставляя (7.2.4) и (7.2.5) в (7.2.3), получим для статистики выражение

Поскольку, напомним, последовательность сл. углов при справедливости гипотезы есть равномерная порядковая статистика, то имеет распределение, не зависящее от

7.2.1а. Распределение статистики при гипотезе Для получения распределения статистики при справедливости гипотезы Но (или короче — нулевого распределения статистики удобно использовать статистику рассмотренную в работе Бранка (1962). Пусть

где

равномерная порядковая статистика. В отличие от статистики и основаны на разностях между сл. в. и их средними. Пусть

Следуя Стефенсу (1969f), покажем, что

Действительно, пусть сл. углы независимы и равномерно распределены и

И пусть соответствующие порядковые статистики. Как нетрудно убедиться,

где определяется из соотношения и Тогда используя представление (7.2.6), получим

Поскольку составляют равномерную порядковую статистику, как предполагается в определении то равенство (7.2.10) действительно имеет место.

Следуя Бранку (1962), можно далее показать, что

где

есть вероятность нахождения точек между прямыми

Бранк (1962) привел также итеративную процедуру вычисления вероятностей

Используя нулевое распределение (7.2.12) статистики получим нулевое распределение статистики Именно, из и (7.2.12) получаем

где Следуя Стефенсу (1965а), укажем вид для некоторых

1) При имеем

2) При при четном нечетном получим

где есть целая часть и

Стефенс (1965а) вычислил верхние процентные точки статистики с помощью выражения 2) для малых . Для больших было использовано следующее указанное Куипером (1960) приближение:

Таблица верхних процентных точек статистики приведена в приложении 10. Стефенс (1970) показал, что при удобнее пользоваться статистикой

Верхние процентные точки статистики указаны с разрешения


Таблица 7.1 (см. скан) Верхние процентные точки распределения статистики V

автора и редакторов в табл. 7.1. Мааг и Дикей (1971) указали другую аппроксимацию.

Пример 7.1. Проверим гипотезу о равномерной распределенности направлений полета птиц по данным из примера 6.2. Если порядковая статистика, то при гипотезе равномерности, имеем Перепишем (7.2.6) в виде

В табл. 7.2 приведены вспомогательные вычисления. Имеем

Из приложения 10 находим, что -ная точка статистики равна 1,63. Следовательно, можно принять гипотезу равномерности. Заключение то же, что и в примере 6.2.

Таблица 7.2 (см. скан) Вспомогательные вычисления при применении критерия Куипера в примере 7.1

На рис. 7.1 графически изображено вычисление статистики Куипера в примере 7.1.

7.2.2. Аналог критерия Крамера-Мизеса (-критерий Ватсона). Ватсоном (1961) была предложена статистика

где

Известная статистика Крамера — Мизеса несколько отличается от статистики поскольку при ее вычислении не используется центрирование подинтегральной функции величиной

Рис. 7.1.

Напомним, что статистика может быть записана в виде

где равномерная порядковая статистика. Аналогично, используя преобразование (7.1.10), для статистики (7.2.15) можно получить выражение

где Из представления (7.2.17) непосредственно вытекает, что распределение статистики не зависит от

Заметим также, что статистика инвариантна относительно изменения нулевого направления. Действительно, согласно (7.1.8) и (7.1.9) при повороте начала на угол с величина будет равна так что

Отметим мимоходом, что

где .

7.2.2а. Нулевое распределение статистики Используя представление (7.2.22), Стефенс (1963b, 1964а) получил точное нулевое распределение статистики при и обсудил приближение для Для больших Ватсон (1961) показал, что

(Относительно доказательства см. п. 7.2.5с). Он также показал, что предельные распределения статистик совпадают. Поскольку то

Стефенс (1963b) нашел также третий и четвертый моменты статистики и использовал первые четыре момента для уточнения ее процентных точек. Стефенс (1970) показал, что значения процентных точек модифицированной статистики

данные в табл. 7.3, можно использовать уже при Эти величины перепечатаны из J. Roy Stat. Soc. при любезном согласии автора и редактора. Пирсон и Стефенс (1962) и Тику (1965) рассматривали и другие приближения.

Таблица 7.3 Процентные точки статистики

Пример 7.2. Проверить гипотезу равномерности по данным примера 6.2, применяя критерий Ватсона (наблюдения указаны в табл. 7.2). Выражение (7.2.17) можно переписать следующим образом:

Из табл. 7.2 находим, что

Следовательно, -ная точка статистики равна 0,187 (табл. 7.3). Следовательно, мы вновь принимаем гипотезу равномерности.

7.2.3. Критерий Ходжеса — Айне. Пусть суть независимых сл. углов. Проведем диаметр и подсчитаем число сл. углов, принявших значение по каждую сторону от него. Поворачивая диаметр I вокруг центра, найдем наименьшее возможное число выборочных точек по одну сторону диаметра. Пусть это число есть Так как малые значения будут указывать "на отклонение от равномерного распределения, можно взять в качестве статистики критерия. Этот критерий как двувыборочный критерий знаков был предложен Ходжесом (1955). Для окружности он был независимо позже изучен Айне (1968). Взаимосвязь между указанными критериями отметили Бхаттачария и Джонсон (1969).

7.2.3а. Представление величины Приведем формальное представление для Пусть сл. углы получены преобразованием Предположим, что соответствующая порядковая статистика. Пусть

Вектор указывает, какие наблюдения лежат выше или ниже нулевого направления. Поворот диаметра I приведет к получению всех возможных значений Эти значения могут быть получены из начального вектора последовательным применением преобразования

раз. Пусть количество в этих значениях вектора т. е. пусть обозначает общее число — число Определим теперь

При этом имеем

Следовательно,

где

Следовательно, из (7.2.24) и (7.2.25) получим

7.2.3b. Нулевое распределение Как показал Даниелс (1954), нулевое распределение статистики можно задать формулой

где

а

После некоторых преобразований можно получить, что

Подставляя это выражение в (7.2.28), можно записать вероятность и в следующем виде:

где задано в (7-2.29). При разность следовательно, В этом случае (7.2.30) превращается в

Даниелс (1954) рассматривал это распределение в связи с другим критерием. Связь между рассмотренным им и указанным здесь критериями установил Хилл (1960). Иоффе и Клотц (1962) и Клотц (1959) предложили отличное от (7.2.30) выражение. Кроме того, Клотц (1959) табулировал распределение во всей области при и его значения для больших при Формула (7.2.31) была получена Ходжесом (1955),

построившим соответствующие таблицы при Можно показать (см. Даниелс (1954); Айне (1968)), что при больших

где В приложении 11 приведены некоторые процентные точки для Здесь только отметим, что -ная и -ная точки для суть 3,023 и 3,562 соответственно. Гипотеза равномерности, напомним, отвергается при малых значениях

Пример 7.3. Проверить с помощью статистики гипотезу равномерности по данным примера 1.1:

Поскольку все наблюдения принадлежат дуге (270°, 90°), то (см. рис. 1.1 и 1.2), и гипотеза равномерности отклоняется. Заметим, следуя изложенной в п. 7.2.3а схеме, что значения суть

так что . Применяя к преобразование снова получим

Пример 7.4. Проверить гипотезу равномерности по данным примера 6.8. Составляя круговую диаграмму этих данных аналогично изображенной на рис. 1.1, легко находим, что Согласно прйложению -ная точка при есть 2, так что гипотеза отклоняется. Заметим, что при вычислении мы бы столкнулись с совпадением наблюдений, именно

7.2.3с. Группированные данные. Рассмотрим частный, но важный для практики случай группировки, когда наблюдения сгруппированы по класс-интервалам равной длины. Пусть обозначают соответствующие частоты. Тогда естественно использовать статистику к

Пусть, кроме того,

Как нетрудно видеть, так что гипотеза равномерности отклоняется при больших В. Критерий, основанный на

статистике предложили рассматривать Дэвид и Ньюэл (1965).

Пример 7.5. Проверим гипотезу равномерности по данным заболевания белокровием из табл. 6.2. Как нетрудно вычислить, значения суть

так что Далее, (напомним, что Указанные перед примером 7.3 критические уровни сейчас не могут быть использованы — истинные процентные точки статистики теперь другие и равны при тех же уровнях 5% и 1% соответственно 2,53 и 3,09 (см. работу Дэвида и Ньюэла (1965)). Как видим, при уровне 5% гипотезу следует отклонить.

7.2.3d. Свойство оптимальности. Айне (1968) показал, что критерий, основанный на статистике является наиболее мощным инвариантным против альтернатив вида

где в предположении, что близко к 1, т. е. сильно различаются. Оптимальность этого критерия для близких значений будет обсуждена в п. 7.2.5.

7.2.4. Критерии, основанные на выборочных промежутках. Рассмотрим два критерия, основанные на выборочных длинах дуг определенных равенством в п. 7.1.1.

7.2.4а. Критерий размаха. В п. 2.6.2 мы уже определяли круговой размах как длину наименьшей дуги, которая содержит все наблюдения, т. е.

Так как малые значения указывают на скопление наблюдений, то гипотеза равномерности отвергается для малых значений Ясно, что размах инвариантен относительно поворотов.

Определим кругового размаха при гипотезе равномерности. Событие имеет место тогда и только тогда, когда хотя бы одна из превосходит Пусть событие, состоящее в том, что задана в (7.1.5), симметрична по так что по теореме

полной вероятности

где — целая часть Найдем теперь вероятность события Согласно (7.1.5) совместная п. р. в. сл. в. есть

Применяя это выражение в равенстве

получим

Следовательно, (7.2.36) приводит к равенству

где число — наибольшее среди тех, для которых разность положительна. Этот результат уже появлялся в других контекстах (см. Дэвид (1970), § 5.4) и был впервые получен Фишером (1929). В настоящем контексте он был указан Лаубшером и Рудольфом (1968) и Рао (1969). Лаубшер и Рудольф (1968) показали, что

где

В приложении 12 даны процентные точки распределения кругового размаха.

Пример 7.6. Проверить гипотезу равномерности для положений остановок рулетки из примера 7.3. По данным примера 2.12 имеем а согласно приложению -ная точка для равна 88°, 1. Следовательно, гипотеза равномерности отвергается.

7.2.4Ь. Критерий равных промежутков. Согласно гипотезе равномерности математическое ожидание длины постоянно и равно Следовательно, можно использовать критерии

Большие значения указывают на скопление наблюдений. Этот критерий был введен Рао (1969), который отметил, что в линейном случае он был предложен Кендаллом (1946а) и изучен Шерманом (1950). Его нулевое распределение указано в работах Шермана (1950) и Дарлинга (1953), причем в последней приведены первые два момента статистики (7.2.38).

Критические величины для этого критерия даны в приложении 13. Гипотеза равномерности отвергается для больших значений Шерман (1950) показал, что для больших статистика распределена приблизительно нормально

Пример 7.7. Проверим гипотезу равномерности для наблюдений над направлением полета птиц из примера 6.13, используя рассматриваемый критерий. Последовательные значения равны

Так как то Из приложения 13 имеем, что -ная точка равна поэтому гипотеза равномерности не отвергается.

7.2.5. Класс критериев равномерности Берана и An-критерий Айне. Рассмотрим класс критериев равномерности, введенный Бераном (1968, 1968а), который, в частности, содержит критерий Релея (6.2.1Ь), А - критерий Айне и -критерий Ватсона. Пусть непрерывно распределенные сл. углы, а любая п. р. в. на окружности. Статистика

может быть использована для проверки гипотезы равномерности. Нулевая гипотеза отвергается при больших значениях так как если сл. углы равномерно распределены.

7.2.5а. Другое представление статистики Применяя формулу обращения (4.2.7)

и обозначая получим

Подставляя эту формулу в (7.2.39), возводя в квадрат подинтегральное выражение и почленно интегрируя (или применяя формулу Парсеваля (4.2.30)), получаем

Перепишем (7.2.41) в следующем виде:

где

1) Покажем, что статистика критерия Ватсона есть частный случай Рассмотрим п. р. в.

Имеем так что (7.2.43) примет вид

где Подставляя (7.2.44) в (7.2.42) и обозначая находим, что

Упрощая и используя (7.2.17), получим

2) А-критерий Айне. Пусть число наблюдений на полуокружности Айне (1968) ввел статистику

Легко видеть, что — частный случай (7.2.39). Нулевая гипотеза отвергается при больших значениях Используя плотность вида (7.2.34), получаем

Подставляя в (7.2.42), получим следующее выражение:

Ватсоном (1967а) было получено асимптотическое нулевое распределение, а Стефенс (1969b) привел процентные точки распределения статистики аппроксимируя это распределение кривыми Пирсона.

При

из (7.2.39) и (7.2.42) получим, что сводится к

являющейся статистикой критерия Релея. Ватсон (1967b) рассматривал другие интересные случаи статистики когда п. р. в. заменяется ее состоятельной оценкой.

7.2.5Ь. Свойство оптимальности. Рассмотрим альтернативы вида

где параметр неизвестен. Следуя работе Берана (1968), покажем, что критерий, основанный на статистике является по локально наиболее мощным инвариантным относительно поворотов для проверки гипотезы равномерности против альтернативы

В п. 6.2.1с было указано, что РНМ инвариантный критерий задается неравенством (6.2.7).

Переписывая это неравенство для п. р. в. (7.2.50), получим

Разлагая подинтегральное выражение по в окрестности 0, получим

или

Но не зависит от и таким образом, критерий (7.2.51) локально эквивалентен критерию

Теперь можно легко видеть локальную оптимальность в частных случаях: например, критерий Айне оказывается локально оптимальным и при близких (см. (7.2.34)). -критерий Ватсона оказывается локально оптимальным цротив альтернатив вида (7.2.50), когда Для критерия

Релея, как мы уже знаем, справедлив более общий результат (см. п. 6.2.1с) — этот критерий является РНМ инвариантным для проверки равномерности против распределений Мизеса в качестве альтернатив.

7.2.5с. Асимптотическое распределение статистики при гипотезе. Состоятельность теста В п. 4.9.2 (II) мы видели, что сл. в. при больших имеет приблизительно распределение с двумя степенями свободы, а лемма п. 4.9.2 приводит к заключению, что при больших приблизительно независимы, так что х. ф. сл. в. при больших близка к

Доказательство соответствующего утверждения можно найти в статье Берана (1969а). В случае, когда все ненулевые различны, х. ф. можно обратить, и при этом

где Отсюда можно получить асимптотическое выражение распределения статистики для различных частных случаев, например, выражение (7.2.19) асимптотического распределения статистики

Рассмотрим теперь вопрос состоятельности -критерия (Беран (1969а)). Пусть ф. р. сл. углов есть Из представления (7.2.42) на основании закона больших чисел получаем

где коэффициенты соответствуют Таким образом, В-критерий будет состоятельным, если найдется хотя бы одно значение при котором одновременно не равны нулю. В частности, поскольку для отличной от равномерной, найдется как указано в 1), в случае -статистики Ватсона все то -критерий состоятелен при всех альтернативах. С другой стороны, это не верно для критерия Айне, что можно заключить из равенств (7.2.47). Однако критерий Айне состоятелен против всех альтернативных распределений с симметричной и унимодальной плотностью.

Беран (1969а) получил асимптотическое распределение статистик для некоторых общих альтернатив и исследовал эффективность по Бахадуру.

7.2.6. Сравнение мощности критериев. Стефенс (1969b) исследовал с помощью Монте-Карло мощность критерия Куипера, -критерия Ватсона и -критерия Айне и обнаружил, что хотя для альтернатив вида (7.2.51) -критерий наиболее мощный инвариантный, его мощность фактически лишь ненамного больше мощности и -критериев. Стефенс (1969b) продолжил затем исследование мощности для альтернатив вида

где являющихся периодическими функциями с периодом и Оказалось, что (1) для одновершинных распределений все три критерия имеют одинаковую мощность, (2) для двухвершинных распределений -критерии имеют одинаковую мощность, большую, чем мощность -критерия, а (3) для четырехвершинных распределений -критерий более мощный, чем -критерий, который в свою очередь более мощный, чем -критерий. Разница в мощности и -критериев менее значительна при умеренных и малых .

Рао (1969) изучал асимптотическую эффективность по Бахадуру различных критериев при альтернативных распределениях Мизеса с малыми Выяснилось, что критерии Релея, Ватсона и Айне имеют одинаковую асимптотическую эффективность. Одинаковую эффективность имеют также критерии Куипера и -критерий Ходжеса — Айне. Относительная эффективность -критерйя по отношению ко всем этим критериям равна нулю. Относительная эффективность -критерия относительно критерия Релея оказалась равной т. е. около 81%. Заметим, однако, что речь идет о сравнении локальных свойств критериев, что не вполне еще характеризует мощности сравниваемых критериев (Беран (1969а), Рао (1969)). Например, при малых и при больших мощность -критерия оказывается вполне сравнимой мощности критерия Релея Рао (1969).

<< Предыдущий параграф Следующий параграф >>
Оглавление