E-Book Overview
В учебном пособии определяется предмет компьютерной лингвистики, даются его основные понятия. Рассматриваются как традиционные в лингвистике подходы к описанию естественного языка и его моделирования средствами вычислительной техники, так и результаты исследований, проведенных в последнее время. Пособие предназначено для студентов и слушателей факультетов повышения квалификации, обучающихся по специальности «Информатика и вычислительная техника», не имеющих специальной лингвистической подготовки.
E-Book Content
Ю.И.Шемакин НАЧАЛА КОМПЬЮТЕРНОЙ ЛИНГВИСТИКИ МОСКВА Издательство МГОУ А/О "Росвузнаука" 1992
ББК «1.1 Ш 21 ' УДК 519.76:007 Шемякин Ю.И. Начала компьютерной лингвистики: Учеб. пособие. М.: Иэдво МГОУ, А/О "Росвузнаука", 1992. ISBN 5-7045-0132-Х В учебном пособии определяется предмет компьютерной лингвистики, даются его основные понятия. Рассматриваются как традиционные в лингвистике подходы к описанию естественного языка и его моделирования средствами вычислительной техники, так и результаты исследований, проведенных в последнее время. Пособие предназначено для студентов и слушателей факультетов повышения квалификации, обучающихся по специальности "Информатика и вычислительная техника", не имеющих специальной лингвистической подготовки. Рекомендовано Редакционным советом издательства • Научный редактор д.т.н..проф.В.И.Дракин Рецензент д.т.н.,проф.А.И.Китов Ш 460201000/096(02)-92 Без объявления ББК 81.1 ISBN 1992
5-7045-0132-Х
(с)
Ю.И.Шемакин,
ВВЕДЕНИЕ Широко распространено мнение, что компьютеры - это математические машины, предназначенные для выполнения численных расчетов. В действительности компьютеры представляют собой языковые машины. Их сильной стороной является способность манипулировать лингвистическими знаками, которым приписан некоторый смысл. Естественный язык занимает центральное место в информатике. Ранние работы в этой области были связаны с автоматизацией раскрытия военных шифров. В 50-е годы усилия были направлены на разработку автоматических переводчиков о одного естественного языка на другой. И хотя первоначальная цель так и не была достигнута, эти работы серьезно продвинули решение проблемы естественно-языкового общения с ЭВМ. В настоящее время разрабатываются грандиозные проекты по использованию естественного языка в качестве средства "общения" с компьютерами. Некоторые программы ук§ успешно функционируют. Масса компьютеров хотя бы частично используется для текстовой обработки. В то же время попытки научить компьютер "разговаривать" столкнулись с большими трудностями. Лучшие из систем демонстрируют лишь жалкое подобие лингвистических способностей среднего ребенка. Новый прилив энтузиазма в применении естественного языка вызвали работы по искусственному интеллекту и ЭВМ пятого поколения. Интеллектные системы оперируют знаниями. Знания образуют когнитивную сторону компьютерных систем. Существует строгая последовательность зависимостей: компьютер программа - знания - язык, в которой на одном конце находится компьютер, на другом - язык. С момента появления ЭВМ между ней и человеком возник семантический барьер, который на воем протяжении развития средств вычислительной техники подвергается атакам специалистов. Уменьшение разрыва идет, с одной стороны, по пути от машино-ориентированных кодов через алгоритмические языки, языки логических преобразований в направлении к логико-семантическим и семантическим языкам. Последние два базируются на идеях искусственного интеллекта и таким образом включаются в модели познавательного процесса. С другой стороны, уменьшение разрыва идет по пути поиска новых методов обработки естественного языка. В настоящем пособии указанная проблема рассматривается с точки зрения второго подхода. Одной из главных задач, стоящих перед создателями интеллектных систем, является извлечение из естественного языка его концептуального содержания и прид