Страница 4 из 5 В противном случае текст анкера не соответствует запросу, поскольку в нем именуется категория, не соответствующая данному описанию, такая как "mainframe computers" (мэйнфреймы) или "lawn & garden" (газон и сад). Поэтому, чтобы обладать способностью следовать по искомым ссылкам, необходимо иметь широкие знания об иерархии категорий товаров. Верхняя часть этой иерархии может выглядеть, как показано в табл. 10.1, а. Задача перечисления всех возможных товарных категорий неосуществима, поскольку у покупателя всегда могут возникнуть какие-то новые пожелания, а производители всегда готовы предложить новые товары для их удовлетворения (возможно, скоро будут даже продаваться обогреватели для коленных чашечек?). Тем не менее онтология, состоящая примерно из тысячи категорий, должна оказаться очень полезным инструментом для большинства покупателей. Кроме самой иерархии товаров, необходимо иметь богатый словарь имен для категорий. Жизнь была бы гораздо проще, если бы существовало взаимно однозначное соответствие между категориями и символьными строками, которые их именуют. Мы уже сталкивались с проблемой синонимов — двух имен для одной и той же категории, таких как "laptop computers" and "laptops". Кроме того, существует также проблема омонимов — обозначения одним именем двух или нескольких разных категорий. Например, если в базу знаний, приведенную в табл. 10.1,б, будет добавлено следующее вполне допустимое высказывание, что словом "CDs" обозначаются депозитные сертификаты: то имя "CDs" будет относиться к двум различным категориям.
|