Анатолий Анисимов.
Компьютерная лингвистика для всех: Мифы. Алгоритмы. Язык
- Киев: Наук. думка, 1991. -
На основе алгоритмического анализа исследуются
литературное творчество, структуры естественного языка и
мышление человека. Системный подход применяется для анализа
мифов, лингвистических схем, снов, предложений и Систем
искусственного интеллекта. Особое внимание уделяется рекурсии
как специальному алгоритмическому способу организации сложных
систем. Рассматриваются примеры рекурсии в литературе, языке,
в формировании психической деятельности человека.
Для широкого круга читателей, интересующихся современными
достижениями информатики, лингвистики и искусственного
интеллекта.
ОГЛАВЛЕНИЕ
От автора
1. Алгоритмы и мир.
Начало 5
Алгоритмы 7
Компьютерная лингвистика 10
2. Мифы
Миф как система 13
Охотник и его жертва.
Комментарии к историям Борхеса 18
Царь Эдип 38
3. Аксиоматический разум
Одни глаголы 45
0 богах, душе, указателях и абстракции 52
Царевна-лягушка и закон устойчивости 61
Логика сказки 67
4. Парадоксы языка
Лжец 75
За пределом 83
Мифы и роботы 86
5. Зеркало мира
Магия слов 98
Ассоциативный разум 104
Маленькие пьесы для электрической машины 109
6. Вариации на тему снов
Жизнь - сон 118
Зеркала Андрея Тарковского 128
Компьютерные сны 134
Последний сон китайского императора.
Домашнее упражнение на предыдущуи тему 145
Внезапная смерть новорожденных во сне.
Алгоритмический подход 150
7. Язык
Рекурсия в сюжете 156
Модель мира 160
Диалоги 165
В этих грустных краях...
Психолингвистика рекурсии 171
Древние, древние времена 178
Структуры языка 182
Река времени 198
Эта книга - независимое продолжение предыдущего рассказа
об алгоритмах и творчестве. На этот раз речь пойдет о языке и
его алгоритмах.
В начале было слово... Почему так? Когда-то язык был
слабым отражением вещей в сознании человека, прозрачной зыбкой
гранью, отделяющей человека от мира неживой материи. Сейчас
язык развился настолько, что сам проявляет тенденцию к
независимому движению и управляет развитием разума. Он
сконцентрировал в себе все тайны Вселенной, в нем скрыты ответы
на извечные вопросы бытия. Проникновение в эти тайны - такая
же трудная, но увлека - тельная задача, как познание тайн
микромира и кос - моса.
Язык - самое древнее и самое загадочное приобретение
человека, а лингвистика, наука о языке, - древнейшая из наук.
Первые философы были поэтами, а проницательные философы всегда
призывали к изучению языка. Лучшие средневековые трактаты по
логике написаны грамматистами, и нет сомнений в том, что а ХХI
в. лучшие трактаты по лингвистике на - пишут программисты.
Развиваясь, язык раскрывает методы собственного познания. Об
этом будет идти речь в книге. Возможно, когда-нибудь
обнаружится, что исследования происхождения мифов предвосхити-
ли изучение тайн гравитации и элементарных частиц. Мифы до
конца еще не расшифрованы.
Компьютерная лингвистика занимается проблемой
компьютерного понимания естественного языка. Язык и мышление
человека неразрывно связаны. Поэтому, разгадывая алгоритмы
языка, человек тем самым пытается расшифровать алгоритмы
разума. Эти многочисленные и настойчивые попытки привели к
новому пониманию проблемы. Язык рассматривается как сложная
алгоритмическая система. В ней обнаружены свои алгоритмы
функционирования и законы развития. Человек - интерпрет'пор
языка, поэтому с-у отводится главенствующее положение в этой
системе. Такой системный подход требует обобщенчого
междисциплинарного изучения языка, затрагивающего все пласты
его проявлений. Психолингвистика, семиотика, мифология,
религия, древняя и современная литература, теория алгоритмов,
программирование, оптимальное управление и многие другие
направления сконцентрированы в языковой системе.
Перед автором стояла задача ввести неподготовленного, но
думающего читателя в сложный, загадочный мир. Да и мир этот
возник только недавно и отражает представления автора. Поэтому
здесь не будет застывших догм и нравоучений, громоздких
барьеров грамматики и сложных технических схем. А будет
(возможно, оно покажется кому-то рискованным) небольшое
путешествие во времени по стране языка. Будут первобытные
ночи, притаившиеся охотники и их многоликие жертвы, старинные
зеркала, загадочные лабиринты, страшные сны, тексты Борхеса,
летящие слова и, конечно, компьютеры, повторяющие путешествие.
======================================================
' Анисимов А. В. Информатика. Творчество. Рекурсия. -
Киев:
Наук. думка, 1988. - 223 с.
===================
1. АЛГОРИТМЫ И МИР
Мы - дети хаоса, и глу-
боко в основе каждого
изменения скрыт распад.
Изначально существует
только процесс рассея-
ния, деградации; все за-
хлестывают волны хаоса,
не имеющего причин и
объяснений. В этом про-
цессе отсутствует какая-
либо изначальная цель,
в нем есть только непре-
рывное движение. Одна-
ко, как мы убедились, и в
этом движении возможны
различные направления,
выбор которых диктуется
случаем.
П. Эткинс. Порядок
и беспорядок в природе
НАЧАЛО
Существует Вселенная, существует человек, объяс-
няющий мир, выражающий эти объяснения
колеба-
ниями авука, жестами или письменными
знаками.
В вечном движении мира действуют свои закономер-
ности, отражающиеся в языке. Поэтому,
исследуя
структуры языка, человек познает законы мира. Кро-
ме числовых количественных соотношений, изучаемых
математикой, в природе существуют универсальные
правила, относящиеся к динамической
структур-
изменений и превращении матерйи. ни невы
азимы
количественными соотношениями описываемыми
ма-
тематическими орм лами. Это законы - развития
и
взаи модействия, ни демонстрируются
в языках
йскусства, в литературе, музыке, живописи. Поиск
строгих формальных выразительных средств для вы-
ражения и изучения законов развития и взаимод-й-
ствия начался в давние времена. Об этом думали и
Пифагор, потрясенный несоизмеримостью диагонали
и сторон квадрата, и Платон, построивший теорию
диалогического взаимодействия для поиска истинных
суждений, и молодой Галуа, в ночь накануне смер-
тельной дуэли доказавший невозможность решения
общих полиномиальных уравнений в радикалах,
и Эйнштейн, искавший законы взаимодействия гра-
витации и вещества.
философы и математики, заметив одинаковые
законы развития разнообразных объектов, предложи-
ли общее понятие - сложная система. Система -
это структурно организованныи объект, в котором
выделяются состояния, переходы, подструктуры и
взаимодействия частей. Системный подход дает воз-
можность анализировать многие сложные объекты с
позиций единой общей методологии.
Наконец, в 30-е годы нашего столетия
логики
изобрели математическую теорию алгоритмов. Алго-
ритм - это сложная информационная система вместе
с заданными правилами функционирования. В каж-
дый момент, зная текущее состояние системы, ее пра-
вила и доступную ей информацию, можно предска-
зать множество ее возможных последующих измене-
ний. Одно из важнейших понятий теории алгорит-
мов - рекусия. Под рекурсией в общем смысле
понимают такой способ организации системы, при ко-
тором она в отдельные моменты своего развития,
определяемые ее правилами, может создавать (вызы-
вать) собственные измененные копии взаимодейство-
вать с ними и включать их в свою структуру. Законы
изменения копий при вызове также включаются в
правила системы и могут зависеть от многих пара-
метров: от состояния системы и других подсистем в
момент вызова копии, от информационного наполне-
ния заданных параметров, от правил самой системы.
Возможно отсутствие изменения при вызове копии -
чистая рекусия (это частный случай). Существует
многообразие вариантов поведения копий; они могут
существовать и развиваться параллельно с главной
системой, исчезать после окончания своего этапа
функционирования, по-разному взаимодействовать
между собой. Все определяется правилами системы.
Рекурсия - важнейшее фундаментальное понятие
теории алгоритмов. В этой теории было доказано, что,
используя рекурсию, можно из ограниченного коли-
чества функциональных единиц получить все много-
образие вычислимых функций.
Но не математики на самом деле открыли общий
принцип рекурсии. Еще в древнейших религиях нахо-
дим рекурсивные определения богов, а рекурсивные
приемы для описания развития встречались во мно-
гих древних текстах. Объективный закон рекурсивно-
го развития мира сначала выражался в текстах и
только затем, много веков спустя, проявился а тео-
рему алгоритмов. С появлением в конце 40-х годов
компьютеров и становлением программирования инте-
рес к рекурсии только усилился. Рекурсивные про-
цедуры и декларативные определения введены в боль-
щинство современных языков программирования. Это
понятие хорошо известно программистам.
Обогатившись в теории алгоритмов
и программи-
ровании, став привычным методом анализа и синтеза
сложных алгоритмических систем, рекурсия возвра-
щается в мир, где она впервые была замечена и
всегда существовала, даже неузнанная. Но теперь в
ее багаже - мощные развитые алгоритмические мето-
ды, теперь она на виду. Оказалось, что язык рекур-
сивен. Из базового ограниченного набора схем, ми-
фов и сказаний рекурсивным способом получаются
все сложные сюжетные построения современных
авторов. Анализ предложений показывает, что здесь
рекурсия проявляется еще более убедительным спо-
собом. Она определяет вложенность комментирующих
частей к различным частям предложения. Педложе-
ние, остававшееся до сих пор филологической загад-
кой, получает алгоритмическое определение, и сразу
становятся ясными многие проблемные факты тради-
ционного синтаксиса. Рекурсивные машины начинают
учиться говорить и понимать язык.
Так закон рекурсивного развития
мира сначала
отразился в древних текстах, затем в литературе и
только после этого получил математическое воплоще-
ние в теории алгоритмов и программировании. Потом
снова произошло обратное отражение. Рекурсия опре-
деляет развитие литературы, дает возможность целе-
направленно создавать сложные психологические
тексты. Начинается игра усиливающихся отраже-
ний - любимая игра Вселенной. Когда-то и разум
возник из такой игры.
АЛГОРИТМЫ
Любое целенаправленное действие сложной системы
связано с понятием алгоритма. Он определяет после-
довательность действий объекта для достижения
цели. Так первобытные охотники
придумывали алго-
ритмы охоты на зверей и на соседние племена,
а их
жены изобретали первые кулинарные рецепты
- тоже
алгоритмы. Алгоритмы повседневной
жизни человека
отличаются неоднозначностью выбора
ходов, рас-
плывчатостыо принятия решений,
неоптимальностью
исполнения. Это действие системы в ситуации
с не-
полной информацией. Когда все ясно, человек
целе-
направленно действует наиболее рациональным
обра-
зом - по кратчайшей прямой
стремится пересечь
местность, выбирает лучшее из возможного.
Познание всегда искало
способы описания алго-
ритмов. Сохранились древние
магические рецепты,
математические тексты, книги боевого искусства,
Где
описывались приемы действий в тех или
иных ситуа-
циях. В математической теории алгоритмов
существу-
ет большое разнообразие определений
алгоритма,
ориентированных на различные способы
вычисли-
тельной реализации: арифметическое исчисление
пре-
дикатов (К. Гедель, 1931), Ь-определимые
(А. Черч,
1936) и частично-рекурсивные (С. Клини, 1936)
функ-
ции, машины Поста и Тьюринга
(Э. Пост, 1936,
А. Тьюринг, 1937), алгоритмы Маркова
(А. А. Мар-
ков, 1951). Все эти определения
выражали формаль-
но интуитивное понятие вычислимости.
Как сразу
было доказано, различные
определения алгоритма
оказались эквивалентными в смысле возможности
мо-
делирования друг друга. Математические
определе-
ния алгоритма ориентированы на строгие
доказатель-
ства возможности тех или иных вычислений.
В силу
этого в их определениях используют
специфические