1. Математическое описание связи. Модель парной регрессии — страница 10

  • Просмотров 5316
  • Скачиваний 49
  • Размер файла 74
    Кб

факторов, определив при этом влияние каждого из них в отдельности, а также совокупное их воздействие на моделируемый показатель. Построение уравнения множественной регрессии начинается с решения вопроса о спецификации модели (выбор факторов, вида уравнения и др.) Факторы, включаемые в модель множественной регрессии, должны отвечать следующим требованиям: должны быть количественно измеримы; не должны быть интеркоррелированы

или находится в функциональной зависимости; в одну модель нельзя включать совокупный фактор и образующие его частные факторы, что может привести к неоправданному увеличенному их влияние на зависимый показатель, к искажению реальной действительности; количество включаемых в модель факторов не должно превышать одной трети числа наблюдений в выборке. Отбор факторов обычно осуществляется в две стадии: на первой подбираются

факторы, исходя из сущности проблемы; на второй – на основе матрицы показателей корреляции определяют t - статистики для параметров регрессии. Коэффициенты интеркорреляции (т.е. корреляции между объясняющими переменными) позволяют исключать из модели дублирующие факторы. Считается, что две переменные явно коллинеарны, т.е. находятся между собой в линейной зависимости, если . Из двух явно коллинеарных факторов, уравнения

регрессии - рекомендуется исключить один. Предпочтение при этом отдается тому фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами. Рассмотрим пример. Для зависимости y = f(x1,x2,x3) задана матрица парных коэффициентов корреляции:  У x1 x2 x3 У 1 x1 0,8 1 x2 0,7 0,8 1 x3 0,6 0,5 0,2 1 Из таблицы, очевидно, что факторы x1 и x2 коррелированны друг с другом. В уравнение целесообразно включить фактор x2, а

не x1, так как корреляция x2 с y - слабее, чем корреляция фактора x1 с y,но зато rx1x3 >rx2x3. Поэтому в уравнение множественной регрессии включаются факторы x2 и x3. При отборе влияющих факторов используются статистические методы отбора. Так, существенного сокращения числа влияющих факторов можно достичь с помощью пошаговых процедур отбора переменных. Ни одна их этих процедур не гарантирует получения оптимального набора переменных.

Однако при практическом применении они позволяют получить достаточно хорошие наборы существенно влияющих факторов. Наиболее широкое применение получили следующие методы отбора факторов: метод исключения, метод включения, шаговый регрессионный анализ. Метод исключения предполагает построение уравнения, включающего всю совокупность переменных, с последующим последовательным (пошаговым) сокращением числа переменных в