Главная arrow книги arrow Копия Глава 12. arrow Условное планирование в полностью наблюдаемых вариантах среды
Условное планирование в полностью наблюдаемых вариантах среды

Условные результаты не вносят недетерминированность, но позволяют ее моделировать. Например, предположим, что в нашем распоряжении имеется не совсем исправный пылесос, который иногда оставляет мусор в квадрате назначения в процессе своего передвижения, но только если этот квадрат чист. Такую ситуацию можно промоделировать с помощью следующего описания, которое одновременно является и дизъюнктивным, и условным:

Для создания условных планов требуются условные этапы. Мы будем записывать их с использованием синтаксиса, где <test> — булева функция переменных состояния. Например, условным этапом для мира пылесоса может быть следующий: Right else Suck". Выполнение такого этапа осуществляется очевидным способом. В результате вложения условных этапов линейные планы превращаются в древовидные.

Нам требуются условные планы, которые работают невзирая на то, какие результаты действий фактически будут получены. Такая проблема уже встречалась раньше в данной книге, но немного в другом виде. В играх с двумя игроками (см. главу 6) была поставлена задача найти ходы, которые приводят к выигрышу независимо от того, какие ходы делает противник. По этой причине задачи недетерминированного планирования часто называют играми против природы.

Рассмотрим конкретный пример из мира пылесоса. В начальном состоянии робот-агент находится в правом квадрате мира, в котором нет мусора; поскольку среда полностью наблюдаема, агент знает полное описание состояния, AtR . В целевом состоянии робот должен находиться в левом квадрате мира, в котором нет мусора. Такая задача была бы совершенно тривиальной, если бы пылесос не подчинялся "двойному закону Мэрфи" и не оставлял иногда мусор при его перемещении в чистый квадрат назначения, а иногда— при выполнении действия Suck в чистом квадрате.