Главная arrow книги arrow Копия Глава 12. arrow Условное планирование в частично наблюдаемых вариантах среды
Условное планирование в частично наблюдаемых вариантах среды

Теперь необходимо решить, как должны действовать средства сбора информации с помощью датчиков. В данном случае имеются два варианта. Можно применить автоматический сбор информации с помощью датчиков, который означает, что на каждом временном этапе агент получает все доступные данные восприятия. В примере, приведенном на рис. 12.8, предполагается, что с помощью датчиков происходит автоматический сбор информации о местонахождении агента и наличии мусора в локальном квадрате. Еще один вариант состоит в том, что можно настаивать на использовании средств активного сбора информации с помощью датчиков, а это означает, что данные восприятия приобретаются только в результате выполнения конкретных действий по сбору информации с помощью датчиков, таких как CheckDirt и CheckLocation. Мы будем по очереди рассматривать каждый метод сбора информации с помощью датчиков.

Теперь сформулируем одно из описаний действия с использованием высказываний о знаниях. Предположим, что агент в мире "альтернативного двойного закона Мэрфи" перемещается с помощью действия Left, применяя автоматические средства сбора информации о наличии мусора в локальном квадрате; согласно правилам для этого мира, агент может оставить или не оставить за собой мусор, если квадрат был чистым. Этот результат, рассматриваемый как изменение физического состояния, должен быть дизъюнктивным, но если он рассматривается как результат изменения знаний, то просто сводится к тому, что у агента удаляются знания об истинности терма CleanR. Агент должен также знать, является ли истинным терм CleanL, получив эти знания тем или иным способом, поскольку для сбора информации о наличии мусора в локальном квадрате предусмотрены датчики; кроме того, агент знает, что он находится в квадрате AtL. Вся эта информация записывается следующим образом:

(12.2)