Работа “Моделирование кинетики роста в условиях химиотерапии" Дисциплина: “Моделирование в медицине" Работу — страница 3

  • Просмотров 165
  • Скачиваний 5
  • Размер файла 161
    Кб

данных. 2.4. Метод наименьших квадратов Рассмотрим задачу оценки коэффициентов парной линейной регрессии. Предположим, что связь между х и у линейна: у = +х. Здесь имеется в виду связь между всеми возможными значениями величин х и у, то есть для генеральной совокупности. Наличие случайных отклонений, вызванных воздействием на переменную у множества других, неучтенных в нашем уравнении факторов и ошибок измерения, приведет к

тому, что связь наблюдаемых величин xi и yi приобретет вид уi=+хi+єi,. Здесь єi. - случайные ошибки (отклонения, возмущения). Задача состоит в следующем: по имеющимся данным наблюдений {xi}, {уi} оценить значения параметров  и , обеспечивающие минимум величины . Если бы были известны точные значения отклонений єi, то можно было бы (в случае правильности предполагаемой линейной формулы) рассчитать значения параметров  и . Однако

значения случайных отклонений в выборке неизвестны, и по наблюдениям xi и уi можно получить оценки параметров a и b, которые сами являются случайными величинами, поскольку соответствуют случайной выборке. Пусть а - оценка параметра , b - оценка параметра . Тогда оцененное уравнение регрессии будет иметь вид: yi=а+bxi+еi, (2.8) где еi - наблюдаемые значения ошибок єi. Для оценки параметров  и  воспользуемся МНК, который минимизирует СКО

фактических значений уi от расчетных. Минимум ищется по переменным а и b. Для того, чтобы полученные МНК оценки а и b обладали желательными свойствами, сделаем следующие предпосылки об отклонениях єi: величина єi является случайной переменной; математическое ожидание єi равно нулю: М (єi) = 0; дисперсия є постоянна: D(єi) = D(єi) = 2 для всех i, j; значения єi независимы между собой. Откуда вытекает, в частности, что (2.9) Известно, что, если

условия (1 - 4) выполняются, то оценки, сделанные с помощью МНК, обладают следующими свойствами: Оценки являются несмещенными, т.е. математическое ожидание оценки каждого параметра равно его истинному значению: М(а) =; М(b)=. Это вытекает из того, что М(єi) = 0, и говорит об отсутствии систематической ошибки в определении положения линии регрессии. Оценки состоятельны, так как дисперсия оценок параметров при возрастании числа

наблюдений стремится к нулю:; . Иначе говоря, если п достаточно велико, то практически наверняка а близко к , а b близко к : надежность оценки при увеличении выборки растет. Оценки эффективны, они имеют наименьшую дисперсию по сравнению с любыми другими оценками данного параметра, линейными относительно величин уi . [1] Перечисленные свойства не зависят от конкретного вида распределения величин єi, тем не менее обычно