Главная arrow книги arrow Копия Глава 17. Принятие сложных решений arrow Сходимость итерации по значениям
Сходимость итерации по значениям

При использовании этого определения "расстояние" между двумя векторами, , представляет собой максимальную разность между двумя соответствующими элементами. Основным математическим результатом данного раздела является такое утверждение: допустим, что— два вектора полезностей. В таком случае получим следующее:

(17.7)

Это означает, что обновление Беллмана представляет собой функцию сжатия на коэффициент у, применяемую к пространству векторов полезностей. Таким образом, процедура итерации по значениям всегда сходится к уникальному решению уравнений Беллмана.

В частности, можно заменить значениев уравнении 17.7 истинными полезностя-ми U, для которых BU=U. В таком случае будет получено следующее неравенство:

Поэтому, еслирассматривается как ошибка в оценке, то можно видеть, что эта ошибка уменьшается при каждой итерации на коэффициент, по меньшей мере равный γ. Это означает, что процедура итерации по значениям сходится экспоненциально быстро. Можно легко рассчитать количество итераций, требуемых для достижения заданной предельной ошибки ε, как описано ниже. Вначале напомним, что, как показывает уравнение 17.1, полезности всех состояний ограничены значением. Из этого следует, что максимальная начальная ошибка определяется соотношением. Предположим, что для достижения ошибки, не превышающей ε, выполнено N итераций. В таком случае потребуетсяитераций, поскольку ошибка уменьшается каждый раз по меньшей мере на величину γ. Взяв логарифмы от этого выражения, можно определить, что достаточно применить следующее количество итераций: