Главная > Разное > Статистический анализ угловых наблюдений
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

§ 7.4. Двухвыборочные критерии

7.4.1. Свойство инвариантности. Пусть

— Две независимые выборки с соответственно. Обозначим Рассмотрим проверку гипотезы

Можно было бы ожидать, что проверка этих непараметрических гипотез будет основана на линейных рангах первой выборки, однако, как легко видеть, этот вектор рангов не инвариантен относительно поворотов: при повороте на угол а,

ранги преобразуются как

где некоторое целое, зависящее от а. Не инвариантны ранги очевидно, и относительно изменения направления упорядочивания: при повороте и упорядочивании по часовой стрелке получим новые значения рангов

Указанные ниже критерии будут основаны на функциях от инвариантных относительно поворотов и изменения направления упорядочивания.

7.4.2. Критерий равномерных меток.

7.4.2а. Статистика критерия. Представим наблюдение обеих выборок, как обычно, точками на окружности единичного радиуса, и пусть -линейные ранги элементов первой выборки в объединенной выборке.

Рис. 7.2.

Изменим расстояния между последовательными точками так, чтобы все расстояния были равны (см. рис. 7.2), т. е. заменим угловые наблюдения в объединенной выборке точками на окружности так, что первой выборке соответствуют точки

Ранги данных, изображенных на рис. 7.2, равны 6, 7, 8, 9, 10, 12, 13, 14, 15. Для построения статистики критерия рассмотрим длины результирующих точек первой и второй выборок, так, как это было сделано при построении параметрических критериев в случае распределения Мизеса. Пусть — длины результирующих первой и второй выборок соответственно и

результирующая объединенной выборки. Так как

то Следовательно, критерий может зависеть только от где

определены равенством (7.4.4). достигает максимума, если все точки первой выборки отделены от точек второй выборки. Следовательно, отвергается при больших

Как мы видели в каждый подобный критерий для проверки равенства средних направлений двух расцределений Мизеса построен по условному распределению при заданном Используя равномерные метки мы вновь приходим фактически к статистике

Для доказательства инвариантности критерия относительно поворотов перепишем (7.4.5) следующим образом:

Как видим, зависит только от разности рангов по и инвариантность следует из (7.4.2) и (7.4.3).

Этот критерий рассмотрен Вилером и Ватсоном (1964), следуя предложению Дж. Л. Ходжеса. Критерий является частным случаем критерия для сравнения расположения двух выборок, данного Мардиа (1967, 1968). Зависимость между этими критериями была показана Мардиа (1969b).

7.4.2b. Моменты статистики Найдем первые два момента статистики при Пусть если порядковая статистика в объединенной выборке есть элемент первой выборки, и в противном случае. Имеем

Как легко видеть,

Далее, для любого целого

Отсюда Находя затем получаем, что

и — после некоторых выкладок — что

Эти моменты могут быть получены и при помощи выражения для моментов выборочного среднего из конечной совокупности (Сухатме (1953), стр. 188—198).

Величина достигает максимума, когда первые точек принадлежат первой выборке, т. е. Подставляя эти значения в (7.4.5), получаем максимальное значение равное

7.4.2с. Нулевое распределение и мощность критерия В приложении 14 даны некоторые критические значения статистики При можно использовать, что статистика распределена приближенно как с двумя степенями свободы (Мардиа (1967, 1969а)). Этого можно было ожидать, поскольку при из (7.4.8) и (7.4.9) получаем, что

Большей точности при уровнях можно достигнуть,

используя тот факт, что имеет приближенно распределение со степенями свободы (Мардиа (1967)), где

Асимптотическая мощность этого критерия рассматривалась в работах Мардиа (1969b) и Шаха (1969b). Критерий состоятелен против альтернатив где одновершинные ф. р. (Мардиа (1969b)). При альтернативах сдвига относительная эффективность этого критерия для распределения Мизеса стремится к 1 при (Мардиа (1969b) и Шах (1969b)).

Пример 7.9. В эксперименте с почтовыми голубями (пример 6.9), согласно теории солнечно-азимутального компаса, круговое среднее направление экспериментальной группы должно отличаться на 90° против часовой стрелки от кругового среднего направления контрольной группы. Углы исчезновения приведены ниже в градусах (данные Шмидта и Кенига, приведенные в работе Ватсона (1962)):

Контрольная группа

Экспериментальная группа

Проверим сначала гипотезу о том, что соответствующие сл. углы имеют одинаковое распределение. Заменим совпавшие наблюдения 290, 300, 300 в контрольной группе на 285, 295, 295, так что все совпадения между выборками устранены в пользу Но. Так как критерий инвариантен относительно поворотов, то мы можем ранжировать наблюдения в объединенной выборке от угла 50° по часовой стрелке. Ранги контрольной группы даны в табл. 7.4, там же даны углы и их синусы и

Таблица 7.4 (см. скан) Вспомогательные вычисления к примеру 7.9

косинусы. Подставляя из табл. 7.4 в (7.4.5) и (7.4.10), находим, что тогда как -ная точка распределения с двумя степенями свободы равна 9,21. Следовательно, отклоняется.

Заменим теперь углы углами так как сдвиг параметра расположения предполагается равным 90°. Используя рандомизацию для совпадающих значений, находим, что данные подтверждают теорию.

Пример 7.10. Проверим гипотезу равенства распределений для следующих наблюдений над почтовыми голубями из примера 6.9 (см. рис. 7.2):

Выборка 1:

Выборка 2:

Отсчитывая от 75° против часовой стрелки, получим, что ранги наблюдений первой выборки равны Производя те же вычисления, что и в предыдущем примере, получим

Из приложения 14 находим, что -ная точка для равна 21,07. Следовательно, нулевая гипотеза отклоняется.

7.4.3. Двухвыборочный -критерий Ватсона. Ватсон (1962) ввел двухвыборочный аналог одновыборочного теста (см. п. 7.2.2)

где эмпирические ф. р. первой и второй выборок, эмпирическая ф. р. объединенной выборки, равная

Гипотеза отвергается при больших значениях Статистика очевидно аналогична статистике Крамера — Мизеса для случая двух выборок. Как и в случае одной выборки, с помощью равенства (7.1.9) нетрудно усмотреть, что статистика инвариантна относительно поворотов.

Пусть число наблюдений из первой выборки, число наблюдений из второй выборки среди первых членов, порядковой статистики объединенной выборки, т. е. а Из (7.4.11) легко получить выражение

где

Укажем еще выражение статистики через линейные ранги первой выборки (Бурр (1964)). Это выражение будет более удобно для вычислений. Пусть Тогда, как легко видеть, если Подставляя это выражение в (7.4.12), после некоторых вычислений получим

При справедливости имеем

Стефенс (1965b) вычислил первые четыре момента статистики и аппроксимировал ее распределение кривыми Пирсона. Ватсон (1962) показал, что при справедливости гипотезы Но асимптотическое распределение этой статистики то же, что и одновыборочной статистики Ватсона В приложении 15 даны ее критические значения. При не близком к уже можно воспользоваться критическими значениями указанными в приложении 15. Бурр (1964) вычислил точные критические значения при

Беран (1969b) показал, что данный критерий состоятелен против всех альтернатив. Однако все еще неизвестны его свойства в сравнении с другими тестами при малых выборках.

Пример 7.11. Проверим гипотезу равенства распределений в условиях примера 7.9.

Используя ранги из табл. 7.4, согласно (7.4.13) найдем, что Из приложения 15 найдем, что -ная точка для

есть 0,268. Следовательно, вновь отвергается. 7.4.4. Критерий серий. Нанесем на окружность данные двух выборок. Как и в линейном случае, серия — это

последовательность точек, принадлежащих одной из выборок, между двумя точками из другой выборки. Пусть общее число серий в двух выборках на окружности. Гипотеза отвергается, если мало, так как это указывает на разделенность выборок. Число серий на окружности всегда четно. Бартон и Дэвид (1958) и Дэвид и Бартон (1962, стр. 94—95, 132—136) дали метод расчета нулевого распределения числа серий. Азано (1965) табулировал распределения для и в приложении 16 даны некоторые критические точки теста, извлеченные из этих таблиц. При сл. в.

распределена приближенно нормально Выражение (7.4.14) получено из следующих соображений: пусть вероятность наблюдать серий на окружности и на прямой. Появление серий на окружности можно представлять как появление или серий на прямой, в зависимости от выбора начала отсчета. Следовательно,

и поскольку принимает лишь четные значения, то

Но, как известно (см., например, Уилкс (1967), стр. 459), для справедлива нормальная аппроксимация. Это и приводит к (7.4.14).

Пример 7.12. Проверим гипотезу равенства распределений в условиях примера 7.10. Упорядочим элементы объединенной выборки, начиная с 75°. Если «0» означает принадлежность к первой выборке, ко второй, то из объединенной выборки получим следующую последовательность:

(Точка отсчета выбрана так, что она является начальной точкой новой серии.) Отсюда Так как из приложения 16 находим, что -ная точка для равна 6, а -ная точка — 4. Следовательно, нулевая гипотеза вновь отвергается.

7.4.5. Некоторые другие двухвыборочные критерии. Куипер (1960) рассмотрел следующий двухвыборочный аналог критерия

где эмпирические ф. p., и показал, что асимптотическое

нулевое распределение этой статистики совпадает с соответствующим распределением статистики Стек (1969) указал метод оценки распределения сл.в. однако критические точки этого распределения все еще не вычислены. Пример и дальнейшие детали можно найти в работе Бачелета (1965, стр. 35). У Абрагамсона (1967) приведено сравнение асимптотического поведения критериев Колмогорова — Смирнова и Куипера в линейном случае. Беран (1969b) получил двухвыборочный аналог критерия Айне (см. п. 7.4.6), Бачелет (1965, стр. 37) предложил критерий, основанный на наименьшей среди сумм рангов первой выборки, полученных поворотом объединенной выборки. Ротман (1971) дал критерий независимости для двумерных выборок.

7.4.6. Получение двухвыборочных критериев из критериев равномерности. Как мы убедились выше, для каждого критерия равномерности можно построить похожий двухвыборочный ранговый критерий. Например, так получена статистика

Класс двухвыборочных критериев Шаха. Следуя Берану (1969b), построим двухвыборочные ранговые статистики с помощью статистик рассмотренных в п. 7.2.5. Заменяя на из (7.2.42), получим

где определено в (7.2.43). Другое выражение для статистики В можно получить из формулы (7.2.39). Шах (1967) рассматривал статистики В более общего вида, когда функция также может зависеть от

Применяя различные данные в п. 7.2.5а, можно получить соответствующие двухвыборочные критерии: например, аналог статистики Айне

где

Асимптотические распределения при гипотезе статистик в общем случае зависящей от как показал Шах (1967, 1969b), совпадают. В частности, асимптотическое распределение статистики

совпадает, как доказал Беран (1969b) более простым путем, с

распределением статистики при условии, что

Касаясь состоятельности -критериев, нетрудно проверить, что, например, критерий, основанный на статистике состоятелен против всех альтернатив Можно также ожидать, что -критерий будет иметь хорошую мощность против альтернатив п. 7.2.5а, для которых -критерий был локально РНМ инвариантным.

<< Предыдущий параграф Следующий параграф >>
Оглавление