Эконометрический анализ основных числовых характеристик — страница 3

  • Просмотров 246
  • Скачиваний 12
  • Размер файла 45
    Кб

рассеивания. По виду корреляционного поля можно предположить, что зависимость между х и у нелинейная. Попытаемся описать связь между х и у зависимостью: y = a ln x + b. Перейдем к линейной модели. Делаем линеаризующую подстановку: U= ln x; V = y. Для этих данных строим линейную модель: V = b0 + b1U. Для определения линейной связи найдем коэффициент корреляции. r =0,864 Т.к. в данном случае коэффициент корреляции | r | > 0,9, то линейная связь между U и V

сильная. Попытаемся описать связь между U и V зависимостью V = b0 + b1U. Параметры b0 и b1 находим по методу наименьших квадратов. b1 = r U V σ V / σ U = 370.76, b0 = V – b1 U = 3.53. Т.к. b1 > 0, то зависимость между U и V прямая. Т.е. с ростом удельного веса лугов и пастбищ, уровень убыточности продукции животноводства повышается. Проверим значимость коэффициентов bi. Значимость может быть проверена с помощью критерия Стьюдента. Для коэффициента b0: =0,845

Значимость t наблюдаемого: α·tнабл = 0,413221639, т.е. 41%>5%, Значит, коэффициент b0 статистически не значим. Для коэффициента b1: =6,2 Значимость t наблюдаемого: α·tнабл = 3,23039E‑05, т.е. ≈0%<5%, Значит, коэффициент b1 статистически значим. Получим модель зависимости уровня убыточности продукции животноводства от удельного веса лугов и пастбищ. V = 370,76U +3,53. После того, как была построена модель, проверяем её на адекватность. Разброс данных,

объясняемый регрессией: SSP = 972,42 Остатки необъясняемые – разброс: SSЕ = 329,1 Общий разброс данных: SSY = 1301,51 Для анализа общего качества модели найдем коэффициент детерминации. R2 = SSR/ SSY = 0.747 Разброс данных объясняется: линейной моделью на 74,7% и на 25,3% случайными ошибками ((1 – R2)·100%). Качество модели хорошее. Проверим с помощью критерия Фишера. Для проверки найдем величины: MSR = SSR / R1 = 972,42 и MSЕ = SSЕ / R2 = 25,3. Вычисляем k1 = 1 и k2 = 13. Находим

наблюдаемое значение критерия Фишера. Fнабл = MSR / MSE = 38.41. Значимость этого значения: α = 3,23Е‑05, т.е. процент ошибки равен ≈0% < 5%. Следовательно, модель V = 370,76U +3,53. считается адекватной с гарантией более 95%. Т.к. линейная модель адекватна, то и соответствующая нелинейная модель то же адекватна. Находим параметры исходной нелинейной модели a и b. Вид нелинейной функции: y = 370,76/x +3,53. Найдем прогноз на основании линейной регрессии.

Выберем произвольную точку из области прогноза. x [xmin, xmax]; хпр = 17,02, соответственно Uпр= 1/17,02 = 0,06 Рассчитываем прогнозируемые значения по модели для всех точек выборки и для точки прогноза. V(х=17,02) = 370,76U +3,53. = 25,32, у(х=17,02) = 370,76/x +3,53 = 25,32. Т.к. y(x) = V(U), то полуширина доверительного интервала и доверительный интервал будет равен как для y так и для V. Найдем полуширину доверительного интервала в каждой точке и в точке прогноза. ,