Главная arrow книги arrow Копия Глава 13. Неопределенность arrow Логический вывод с использованием полных совместных распределений
Логический вывод с использованием полных совместных распределений

На основании приведенного выше примера можно составить общую процедуру вероятностного вывода. Мы будем придерживаться того случая, в котором запрос касается только одной переменной. Кроме того, потребуются некоторые обозначения: допустим, что X— переменная запроса (в данном примере Cavity); Ε — множество переменных свидетельства (в данном примере к нему относится только Toothache); е— наблюдаемые значения этих переменных; Y— оставшиеся ненаблюдаемые переменные (в данном примере таковой является только Catch). Запросом является Ρ (Х|е), и ответ на него может быть вычислен следующим образом:

(13.6)

где суммирование осуществляется по всем возможным значениям у (т.е. по всем возможным комбинациям значений ненаблюдаемых переменных Y). Обратите внимание на то, что переменные Χ, Ε и Υ, вместе взятые, составляют полное множество переменных для данной проблемной области, поэтому p (Χ, е,у) представляет собой подмножество вероятностей из полного совместного распределения. Алгоритм вычисления ответа на запрос приведен в листинге 13.2. В этом алгоритме проверяются в циклах значения Х и значения Υ для перебора всех возможных атомарных событий с фиксированными значениями е, складываются их вероятности из таблицы совместного распределения, после чего результаты нормализуются.

Листинг 13.2. Алгоритм вероятностного вывода путем перебора всех элементов в таблице полного совместного распределения

При наличии полного совместного распределения, с которым можно было бы работать, алгоритм Enumerate-Joint-Ask становится полным алгоритмом получения ответов на вероятностные запросы, касающиеся дискретных переменных. Но этот алгоритм недостаточно хорошо масштабируется, поскольку при наличии проблемной области, которая описана η булевыми переменными, он требует входной таблицы с размером, а обработка этой таблицы занимает время. реальных задачах может потребоваться рассмотреть сотни или тысячи случайных переменных, а не только три. Попытка определить огромные количества требуемых вероятностей быстро становится полностью неосуществимой, поскольку может быть даже не накоплено достаточного количества экспериментальных данных, которые требуются для того, чтобы отдельно оценить каждую из записей этой таблицы.

По этим причинам полное совместное распределение вероятностей в табличной форме нельзя считать практически применимым инструментальным средством для создания систем формирования рассуждений (хотя в исторических заметках в конце данной главы упоминается одно реальное приложение, основанное на этом методе).

Вместо этого данный подход следует рассматривать как теоретическую основу, на которой могут быть созданы более эффективные подходы. В оставшейся части данной главы представлены некоторые основные идеи, которые потребуются для подготовки к разработке реально осуществимых систем, описанных в главе 14.