Статистический анализ числовых величин (непараметрическая статистика) — страница 7

  • Просмотров 596
  • Скачиваний 7
  • Размер файла 155
    Кб

модель такова [8]. При нулевой гипотезе H0 результаты наблюдения x1., x2.,…, xn рассматриваются как реализация независимых одинаково распределенных случайных величин числа X1., X2.,…, Xn. с функцией распределения F(x). При альтернативной гипотезе H1 случайные величины X1., X2.,…, Xn. также независимы, X1., X2.,…, Xn-1 имеют распределение F(x), а Xn - распределение G(x), оно "существенно сдвинуто вправо" относительно F(x), например, G(x)=F(x - A), где A достаточно

велико. Если альтернативная гипотеза справедлива, то при вероятность равенства стремится к 1, поэтому естественно применять решающее правило следующего вида: если xmax.> d, то принять H1., если xmax.< d, то принять H0 , (1) где d - параметр решающего правила, который следует определять из вероятностно-статистических соображений. При справедливости нулевой гипотезы Статистический критерий проверки гипотезы H0 , основанный на решающем

правиле вида (1), имеет уровень значимости , если т.е. (2) Из соотношения (2) определяют граничное значение d=d(, n) в решающем правиле (1). При больших n и малых (3) поэтому в качестве хорошего приближения к d(, n) рассматривают (1-/n) - квантиль распределения F(x). Пусть правило отбраковки задано в соответствии с выражениями (1) и (2) с некоторой функцией распределения F, однако выборка берется из функции распределения G, мало отличающейся от F в

смысле расстояния Колмогорова (4) С помощью соотношения (3) получаем, что величина = G(d) для d из уравнения (2) находится между и . Уровень значимости критерия, построенного для F, при применении к наблюдениям из G есть 1- и может принимать любые значения в отрезке [1-; 1-]. В частности, при = 0,01, =0,05, n = 5 возможные значения уровня значимости заполняют отрезок [0; 0,1], т.е. уровень значимости может быть в 2 раза выше номинального, а если n возрастает

до 30, то максимальный уровень значимости есть 0,297, т.е. почти в 6 раз выше номинального. При дальнейшем росте n верхняя граница для уровня значимости, как нетрудно видеть, приближается к 1. Рассмотрим и другой вопрос - насколько правило отбраковки с уровнем значимости для G может отличаться от такового для F при справедливости неравенства (4). С использованием соотношения (3) заключаем, что из (5) следует, что где и выписаны выше. Решение

уравнения (5) может принимать любое значение в отрезке []. В частности, при =0,05 и n = 5 для стандартного нормального распределения F имеем d(, n) = 2,319, при =0,01 решение уравнения (5) может принимать любое значение в отрезке [2,054; + ], при =0,005 - любое значение в [2,170; 2,576]. При использовании любого другого расстояния между функциями распределения выводы о неустойчивости правил отбраковки также справедливы. Отметим, что проведенные рассмотрения