Страница 2 из 6 Было предпринято много попыток написания формальных грамматик естественных языков, как в "чистой" лингвистике, так и в вычислительной лингвистике. К машинно-ориентированным грамматикам такого типа относятся системы, разработанные в рамках проекта Linguistic String Project в Университете штата Нью-Йорк [1343] и проекта XTAG в Университете штата Пенсильвания [403]. Хорошим примером современной системы DCG может служить Core Language Engine [22]. Существует также несколько исчерпывающих, но неформальных грамматик английского языка [701], [735], [1015], [1261]. К хорошим учебникам по лингвистике относятся введение в синтаксис [1342] и учебники по семантике [249], [643]; [1016] в основном посвящена описанию логики и рассчитана на лингвистов. С середины 1980-х годов наметилась тенденция к тому, что больше информации стали вводить в лексикон и меньше в грамматику. Первой крупной грамматической формальной системой, которая характеризовалась высокой степенью лексикализа-ции, была лексически-функциональная грамматика, или сокращенно LFG (Lexical-Functional Grammar) [183]. Доведение процесса лексикализации до предела приводит к созданию категориальной грамматики, в которой количество грамматических правил может стать крайне малым, например равным двум, или грамматики зависимостей [1033], в которой не существует словосочетаний, а есть только слова. В [1431] описан широко применяемый синтаксический анализатор, в котором используется грамматика зависимостей. Грамматика соединения деревьев, или сокращенно TAG (Tree-Adjoining Grammar) [749], строго говоря, не является лексической, но получила широкое распространение в своей лексикализованной форме [1356]. Интерес представляет общедоступный словарь Wordnet [462], состоящий примерно из 100 000 слов и словосочетаний, классифицированных по частям речи и связанных с помощью семантических отношений, таких как "синоним", "антоним" и "часть—целое". Первые компьютеризированные алгоритмы синтаксического анализа были продемонстрированы в [1632]. Эффективные алгоритмы были разработаны в конце 1960-х годов, и с тех пор в них было введено лишь немного дополнений [587], [773], [1636]. Рассматриваемый в настоящей главе диаграммный синтаксический анализатор в большей степени соответствует описанному в [427]. Хороший общий обзор по этой теме приведен в книге Ахо и Ульмана [9], посвященной синтаксическому анализу и компиляции. В [1001] показано, как в обычной ситуации можно добиться высокой эффективности алгоритма диаграммного синтаксического анализа с дополнениями. В [256] рассматривается проблема устранения синтаксической неоднозначности.
|