Страница 4 из 4 Возникновение аналогичной проблемы можно обнаружить и в мире пылесоса Предположим, что в простом рефлексном агенте-пылесосе испортился датчик местонахождения и работает только датчик мусора. Такой агент получает только два возможных восприятия: [Dirty] и [Clean]. Он может выполнить действие Suck в ответ на восприятие [Dirty], а что он должен делать в ответ на восприятие [Clean]? Выполнение движения Left завершится отказом (на неопределенно долгое время), если окажется, что он начинает это движение с квадрата А, а если он начинает движение с квадрата в, то завершится отказом на неопределенно долгое время движение Right. Для простых рефлексных агентов, действующих в частично наблюдаемых вариантах среды, часто бывают неизбежными бесконечные циклы. Выход из бесконечных циклов становится возможным, если агент обладает способностью рандомизировать свои действия (вводить в них элемент случайности). Например, если агент-пылесос получает результат восприятия [Clean], то может подбросить монету, чтобы выбрать между движениями Left и Right. Легко показать, что агент достигнет другого квадрата в среднем за два этапа. Затем, если в этом квадрате имеется мусор, то пылесос его уберет и задача очистки будет выполнена. Поэтому рандомизированный простой рефлексный агент может превзойти по своей производительности детерминированного простого рефлексного агента. В разделе 2.3 уже упоминалось, что в некоторых мультиагентных вариантах среды может оказаться рациональным рандомизированное поведение правильного типа. А в одноагентных вариантах среды рандомизация обычно не является рациональной. Это лишь полезный трюк, который помогает простому рефлексному агенту в некоторых ситуациях, но в большинстве случаев можно добиться гораздо большего с помощью более сложных детерминированных агентов.
<< В начало < Предыдущая 1 2 3 4 Следующая > В конец >> |