Стохастическое моделирование и прогноз загрязнения атмосферы с использованием нелинейной регрессии — страница 6

  • Просмотров 572
  • Скачиваний 7
  • Размер файла 380
    Кб

использованному для разработок материалу наблюдений. При этом каждое значение предиктора меняется на соответствующее ему среднее значение характеристики загрязнения. Для каждой градации предиктора (их должно быть не менее 5) рассчитать среднее значение CMAX. При недостаточном количестве случаев в одной из градаций, она объединяется с соседних. Таким образом, получаем набор точек с абсциссами M(CMAX) и ординатами,

соответствующими серединам отрезков осреднения. Построить график кусочно-линейной функции, у которой полученные точки являются угловыми. Каждому значению преобразованного предиктора сопоставляется значение кусочно-линейной функции в соответствующей точке. Связь преобразованных таким образом предикторов с предиктантом в значительной степени линеаризуется. Этот прием позволяет учесть реальный вид связи в каждом

конкретном случае. Он близок к так называемому «кусочно-линейному» преобразованию, применяемому при построении моделей для прогноза погоды. При возникновении трудностей, связанных с тем, что данные, подчиняющиеся какому-нибудь несимметричному распределению, должны быть подвергнуты анализу, теория которого разработана в основном для нормального распределения, можно преобразовать эмпирическое распределение в нормальное

(«нормализовать переменные») и затем продолжить анализ на базе известной теории. Для нормализации переменных используется стандартное преобразование выборочной функции распределения в нормальную (гауссову) со средним, равным 0, и стандартным отклонением, равным 1. Это преобразование осуществляется по формуле , (4) где Ф-1(t) – обратная функция к функции распределения нормальной случайной величины со средним значением ноль и

стандартным отклонением единица, а F(x) - выборочная функция распределения рассматриваемой случайной величины X. Задача с преобразованными предикторами решается методом многомерной пошаговой регрессии. На каждой итерации этого метода ищется предиктор, имеющий наибольшую связь с предиктантом. Таким образом определяются наиболее значимые предикторы, которые следует включить в уравнение регрессии. Если значимыми оказались два

предиктора, соответствующие двум срокам измерения одного и того же метеорологического параметра, то в уравнение регрессии включается тот, который больше связан с предиктантом. В итоге должны остаться 4 – 7 наиболее информативных предикторов, связь которых с предиктантом наиболее значима. Данный вид анализа позволяет включать в схему только те факторы, которые имеют значимую корреляцию с показателями загрязнения. Применение