Полный текст книгиФормулы пропущены, вoзмoжны oшибки, сверяйте с оригиналом
СОДЕРЖАНИЕ
От переводчика 3
1. Введение 5
А. Дискретная математика и психология 8
2 Современная алгебра 8
2.1. Современная прикладная алгебра 10
3. Символическая логика 11
4. Машины Тьюринга 16
5. Электронные вычислительные машины 19
6. Искусственный разум 22
6.1. Универсальные программы 23
6.2. Специализированные программы 24
6.3. Игры 24
6.4. Шашки и шахматы 24
6.5. Доказательство теорем 25
7. Языки программирования 27
8. Математическая лингвистика 30
8.1. Грамматика 30
8.2. Человеческие языки 31
8.3. Механический перевод 33
8.4. Резюме 34
Б. Континуальная математика и психология 35
9. Введение 35
9.1. Аппроксимация 36
9.2. Оптические иллюзии 37
9.3. Машинная графика 37
9.4. Научно-технические расчеты 38
10. Континуум 38
10.1. Маскирующие точки 39
10.2. Анализ 40
11. Психометрика 42
11.1. Факты о группах 43
11.2. Колориметрия 44
12. Слух 45
12.1. Слуховые ощущения 46
12.2. Моделирование речи 47
13. Зрение 49
13.1. Чувственное квантование 52
14. Мозг как переходная вычислительная машина 54
14.1. Машинное распознавание речи 57
В. Психология математики 59
15. Арифметическое познание 59
16. Алгебра и геометрия 62
16.1. Геометрическое познание 63
16.2. Психологические вопросы 64
17. Обучающие машины? 65
18. Математическое открытие 69
19. Конструирование посредством машины 73
20. Зрительное воображение 77
20.1. Классический анализ 79
21. Логическая строгость в анализе 80
21.1. Канторов рай 82
21.2. Парадокс Ришара 82
21.3. Континуум-гипотеза 84
22. Прикладная математика 86
22.1. Симбиоз человека и машины 89
Список литературы 90
1. Введение
Математика, как самая умственная отрасль наук, имеет естественное сродство с психологией — наукой об уме. То, что они не соприкасались ближе, обусловлено отчасти нашим незнанием их обеих, но еще больше тем обстоятельством, что психологи и математики мыслят различными понятиями. Сегодня я хочу рассмотреть некоторые связи между этими двумя областями, с особым учетом их значения для математики.
Я отвлекусь от важных приложений статистики к психологии отчасти потому, что недостаточно знаком с ними, а еще больше потому, что статистика не вписывается в схему дедуктивного доказательства теорем, характерную для других отраслей математики, которые я буду обсуждать.
Мой доклад будет разделен на три главные части:
A. Дискретная математика и психология.
Б. Континуальная математика и психология.
B. Психология математиков (и, следовательно, математики).
Различие между дискретной и континуальной математикой восходит к доисторическим временам. Первым методом дискретной математики был счет (например, овец в стаде), континуальная же математика — математика непрерывного — занималась измерением разных величин, как расстояние, площадь, время, вес и объем.
Ныне обе они представляют собой громадные области. Дискретная математика обнимает, в частности, символическую логику, комбинаторный анализ, математическую лингвистику, теорию чисел, так называемую современную алгебру и нечисловые применения вычислительных машин. Континуальная математика включает теорию функций, дифференциальные уравнения, интегральные уравнения, большую часть математической физики и многие разделы классической алгебры.
После революционного открытия математического анализа главнейшие новые приложения математики в годы 1700 — 1940 состояли в использовании континуального аппарата для решения физических и технических задач. В результате выражение «прикладная математика» означало по традиции прикладную континуальную математику на службе физических наук. Однако, благодаря появлению цифровых вычислительных машин большой мощности и высокого быстродействия, влияние прикладной дискретной математики за последние два десятилетия резко возросло и она обещает вскоре даже превзойти по важности прикладную континуальную.
Вычислительные машины уже выполняют многие математические и информационные операции, требовавшие ранее человеческого мышления. Машинное выполнение таких операций дает бихевиористскую модель хотя бы некоторых функций мозга, что представляет очевидный интерес для психологов. Более того, анализ способа, каким машины производят эти операции, вместе с данными экспериментальной нейрофизиологии подкрепляет старую догадку, что существенные стороны человеческого мышления имеют структуру дискретных математических систем, близких к булевой алгебре и ориентированным графам (сетям).
Представление о таких структурах мысли стало складываться весьма давно. Математики по крайней мере три столетия мечтали о создании «машин», способных выполнять некоторые процессы человеческого мышления. Уже в 1640 г. Декарт показал, что наглядные геометрические рассуждения Эвклида во многих случаях можно заменить относительно механическими алгебраическими манипуляциями. По-видимому под влиянием успеха Декарта, Лейбниц разработал фрагменты логического исчисления, которое должно было облегчить занятия теоретической математикой в той же степени, в какой десятичная нумерация облегчила занятия арифметикой. Он характеризовал это исчисление как «инструмент нового рода, увеличивающий силу разума намного больше, чем какой-либо оптический инструмент когда-либо увеличивал силу зрения». (Было ли простым совпадением, что Лейбниц построил также в 1671 г. первую известную машину умножения?)
Таким образом, замечательные достижения вычислительной техники нашего времени частично осуществили старую мечту. Достижения эти побудили некоторых заключить, что машины завтрашнего дня будут даже «умнее» людей, особенно по способностям к математическому рассуждению.
Ниже я приведу вам доводы, из которых следует, что этого не произойдет, даже в собственной сфере чистой математики. Цифровые вычислительные машины, программируемые весьма специфическим, последовательностным способом, не моделируют человеческого воображения. Я попытаюсь показать, что воображение необходимо для формулировки наиболее глубоких идей даже в чистой математике, особенно в анализе, и для всякой значительной работы в математике прикладной. Человеческое воображение существенно зависит от человеческих ощущений, и прежде всего от наших чувств слуха и зрения, которые помогают нам воспринимать непрерывное. Цифровые машины таких ощущений не имеют.
Хотя можно пытаться создать гибридные устройства для моделирования человеческих континуальных способностей, я не вижу оснований считать, что это самое плодотворное направление развития вычислительной техники.
А. ДИСКРЕТНАЯ МАТЕМАТИКА И ПСИХОЛОГИЯ
2. Современная алгебра
Сначала я рассмотрю в § 2 — 6 те разделы математики, которые, по-видимому, имеют наиболее близкое отношение к цифровым вычислительным машинам — и к человеческой логике. Цифровые вычислительные машины, разумеется, теснее связаны с дискретной, чем с континуальной математикой, а их математическая теория представляет много общего с так называемой «современной алгеброй». Выражение «современная алгебра» обычно означает подход к алгебре, который, хотя и был знаком Дедекинду и Уайтхеду* до 1900 г., возбудил общее внимание среди неалгебраистов впервые около 1930 г., после выхода в свет знаменитой одноименной книги ван-дер-Вардена.
Характерной чертой этого подхода является систематическое применение аксиоматического метода. В то время как большинство профессиональных математиков до 1900 г. занималось почти исключительно действительными и комплексными числами и функциями, современная алгебра изучает все системы, удовлетворяющие данному множеству аксиом (или «постулатов»). Например, она стремится выводить теоремы, справедливые во всех группах, всех модулях или всех полях. Вследствие такого упора на семейства систем современная алгебра систематически выносит частные случаи в упражнения, маскируя тем самым путь, каким действительно совершаются математические открытия. Это обусловило падение интереса к действительному полю, как и к вычислительным алгорифмам вообще и числовой математике в частности.
Трудно переоценить то влияние, которое концепция ван-дер-Вардена, популяризированная позднейшими авторами, имела на математику. Большинство американских учебников по современной алгебре все еще следует его подходу в принципах и построении, разве только предваряя схему «группы, кольца, поля» более полным обсуждением «множеств и функций». Более того, многое из нынешней «новой математики» есть не что иное, как попытка познакомить школьников с этим подходом к математике.
Как мы увидим в § 20, тот же «абстрактный» подход проник глубоко и в современную геометрию. Бурбаки распространил его на анализ. Наконец, в последние годы аксиоматический метод был широко использован для построения моделей в математической психологии; см., например, [33] и [34]. Однако я затрону здесь лишь вскользь эту интересную связь между математикой и психологией.
2. 1. Современная прикладная алгебра. Несмотря на свое фундаментальное значение, книга ван-дер-Вардена (как и большинство ее продолжений) пропускает именно те разделы алгебры, которые представляются наиболее важными для психологии. Многие наблюдения заставляют предполагать, что существенные аспекты человеческой психологии и поведения имеют структуру дискретных математических систем, стоящих ближе всего к булевой алгебре, системам отношений и сетям (графам). В частности, экспериментальная нейрофизиология утверждает, что значительная часть человеческого мышления протекает в сложной сети нитеобразных нейронов, многие из которых передают нервные импульсы по двоичному принципу «все или ничего», напоминающему булеву алгебру (см. ниже § 3 — 5). Странно, что ван-дер-Варден и его последователи совершенно игнорировали булеву алгебру, алгебру отношений и теорию графов.
Эти разделы важны и для вычислительной техники. Действительно, интерес к цифровым вычислительным машинам стимулировал развитие быстро растущей новой ветви прикладной математики, включающей не только элементы (чистой) современной алгебры, как та определена выше, но и символическую логику, математическую лингвистику и теорию машин Тьюринга и конечных автоматов (или «конечных машин»). Центральной проблемой здесь является (цифровая) вычислимость. Думаю, что эту ветвь можно было бы назвать «современной прикладной алгеброй».
Подобно всякой истинно прикладной математике, современная прикладная алгебра отбрасывает
модели, не имеющие важных соответствий в реальном мире вокруг нас, и настойчиво заботится о смысле своих слов и символов. Таким образом, она использует обратную связь с внешним миром как критерий правильности и источник новых идей; она не довольствуется одной интроспекцией и внутренней логической непротиворечивостью. Кроме того, если «чистая» математика прежде всего занимается дедукциями, естественно вытекающими из двух основных понятий: множества
и функции, то современная прикладная алгебра опирается на три основных понятия: множества, функции и вычислимости.
Связи современной прикладной алгебры с психологией и будут главным предметом моего обзора в части А.
3. Символическая логика. Современная прикладная алгебра имеет корни в (чистой) современной алгебре и в символической логике. Последняя, в свою очередь, возникла из интроспективной психологии. Например, Буль через 150 лет после Лейбница начал свой классический трактат «Исследование законов мысли» таким объяснением «характера и цели этого сочинения»:
Цель предлагаемого трактата — исследовать важнейшие законы тех действий ума, посредством которых совершается рассуждение; дать им выражение в символическом языке исчисления и на этом основании утвердить науку логики и развить ее метод; сделать затем этот метод основою общего метода для приложения математического учения о вероятностях; и, наконец, собрать из разных элементов истины, обнаруженных в ходе этих изысканий, некоторые вероятные указания относительно природы и устройства человеческого ума.
Эта цитата отчетливо говорит о том, что Буль относил свой труд к прикладной математике и специально к математической психологии.
Действительно, Буль разработал алгебру логики (и вероятности), описывающую эффект комбини-
рования свойств и высказываний относительно связок «и», «или», «не» и «влечет» (т. е. «если .. .то»). Эта булева алгебра подчиняется точно тем же законам, что и «алгебра множеств» с операциями пересечения, объединения и дополнения.
Например, пусть PAQ обозначает „Р и Q“, a PVQ обозначает „Р или Q“. Буль показал, что операции Д и обладают многими алгебраическими свойствами, подобными свойствам обыкновенного алгебраического умножения и сложения. Сюда входят следующие идемпотентные, коммутативные и ассоциативные законы «алгебры логики»: ...
Применяя методы символической алгебры к дедуктивной логике, Буль получил наглядное свидетельство ее силы. Так, он показал, что из п данных
высказываний повторным употреблением связок «и», «или» и «не» можно построить ровно 22*
логически неэквивалентных высказываний. Представим себе, как трудно было бы доказать это при помощи аристотелевых силлогизмов.
Математики при доказательстве теорем давно оперировали высказываниями по законам булевой алгебры, подобно тому как вавилоняне оперировали словесными описаниями неизвестных величинах задолго до изобретения арабами символической алгебры. Главной заслугой Буля была формализация этих законов. По моему мнению, формализация Булем «законов мысли» составила выдающееся завоевание математической психологии, и я удивлен, что его труды, по-видимому, столь мало изучаются психологами.
Аксиоматические исследования булевой алгебры логики позднейшими математическими логиками оказали сильное влияние на развитие современной алгебры (другое значительное влияние шло из алгебраической теории чисел). Для психолога булева алгебра логики еще важнее как первый крупный шаг в развитии символической логики, т. е. на пути к механизации математического мышления, о которой мечтали Лейбниц и Декарт.
Второй крупный шаг в этом направлении был сделан Джузеппе Пеано около 1889 г. [23, с. 83 — 97]. Заслуга Пеано состояла в открытии того, что «вся теория натуральных чисел выводима из трех первичных понятий и пяти первичных предложений, помимо тех, которые принадлежат чистой логике» [44, с. 5]. Пеано показал, как сделать это при помощи простого символического исчисления, требующего лишь каких-нибудь 15 неопределимых символов и воплощающего принцип математической индукции. В вольной перефразировке можно сказать, что «основной словарь логики и арифметики состоит всего из 15 слов».
Идеи Пеано были быстро популяризированы и заострены Бертрандом Расселом, который в 1903 г. писал с энтузиазмом [44, с. 5]:
Тот факт, что вся математика есть символическая логика, является одним из величайших открытий нашего времени, и коль скоро этот факт установлен, дальнейшее исследование принципов математики состоит в анализе самой символической логики.
(Для установления этого факта надо лишь допустить, что «вся традиционная чистая математика выводима из натуральных чисел» [44, с.4] — широко распространенное допущение, о котором я еще буду говорить в § 21.)
Хотя работы Пеано произвели большое впечатление, ему не удалось формализировать математическое доказательство: он никогда не описал явно, какие именно операции над символическими выражениями могут рассматриваться как законные шаги в математических доказательствах; его правила вывода (законы доказательства) были смутны. Решающий шаг был сделан в десятилетии, предшествующем I мировой войне, Расселом и Уайтхедом. В своем монументальном трактате [55] они дали полное и строгое построение системы действительных чисел, используя только хорошо определенные правила действий над символами. После этого Рассел писал, торжествуя [44, с. 194]:
Если найдутся такие, кто еще не допускает тождества логики и математики, то их можно попросить указать, в каком звене последовательных определений и дедукций из «Principia Mathematica» кончается логика и начинается математика.
Громадное значение этого труда для психологии заключается в его основном тезисе: всякое математическое мышление, в принципе, может быть механически истолковано как манипуляция символами согласно предписанным правилам, некое подобие шахматной игры. Это утверждение я буду называть ниже тезисом Рассела.
Великий математик Гильберт также думал, что (говоря словами фон-Неймана [9, с. 50 — 51]):
... классическая математика предполагает замкнутый в себе, идущий по неизменным, известным всем математикам правилам процесс, который состоит в последовательном построении из основных символов определенных комбинаций, именуемых «правильными» или «доказанными» ... Ее (классическую математику) следует рассматривать как комбинаторную игру с основными символами, и нам надлежит установить комбинаторно-финитным путем, к каким комбинациям основных символов ведут ее методы построения, называемые «доказательствами».
Хотя Гильберт был очень большим математиком, его суждение отнюдь не обладало непогрешимостью. Фундаментальные теоремы Геделя о неполноте (1930 г.) делают ясным, что внутри формальной системы Уайтхеда и Рассела нельзя ни «доказать все предложения, которые мы считаем истинными», ни показать непротиворечивость системы [23, с. 595]*. Коротко, Гедель обнаружил, что основные цели Уайтхеда и Рассела, изложенные ими в [55, т. 1, с. 12 — 13], недостижимы с их же собственных позиций. Тезис Рассела, что символическая логика свела чистую математику к своего рода шахматной игре, был технически неверен.
Конечно, не исключено, что удастся изобрести другую формальную систему, свободную от таких недостатков, и тем самым оправдать это воззрение, но, судя по всему, большинство математических логиков сегодня настроено па этот счет не очень оптимистически.
В § 21 — 22 я буду критиковать с психологической точки зрения идею о том, что можно или должно формализировать всю математику.
4. Машины Тьюринга. Глубокие отрицательные результаты Геделя, какими бы обескураживающими они ни были для математических логиков, отнюдь не убили идеи создания «машин, которые думают». Более того, в 1950 г. идея эта казалась многим математикам более правдоподобной, чем когда-либо, благодаря четырем взаимосвязанным открытиям, сделанным за предыдущие 15 лет и касавшимся логики и булевой алгебры и их физических и биологических реализаций.
Первым из них было описание в 1936 г. Тьюрингом [53] «машины» весьма простого рода, способной напечатать двоичное или десятичное разложение любого «определимого» (или, иначе, «вычислимого», см. § 21) действительного числа, такого, как е, л или k-й нуль jnk бесселевой функции Jn(x) [53, с. 256]. Тьюринг пояснил, каким образом такая машина могла бы вывести и все доказуемые формулы узкого функционального исчисления Гильберта*. Именно, она доказывала бы все истинные теоремы и ни одной ложной.
Машина Тьюринга характеризуется тремя основными чертами: ...
Ее поведение контролируется лентой, состоящей из бесконечного числа клеток и передвигаемой шагами мимо определенного места — считывающей головки.
Появление данного символа aj перед считывающей головкой влечет за собой три события: ...
остальные клетки можно полагать пустыми или, что то же, занятыми знаком ао=0 — символом пустого множества.
Если дано начальное состояние $*(0) и программа (4), то любая машина Тьюринга выполнит конечную или бесконечную последовательность шагов, преобразуя программу в выходную ленту. Например, выходная лента могла бы содержать последовательные десятичные разряды числа У2 или я или доказательство гипотезы Ферма (если только она доказуема в гильбертовом узком функциональном исчислении).
Тьюринг даже показал [53, с. 241 — 263], что существует одна конечная «универсальная» машина Тьюринга, способная делать все, что может делать любая машина Тьюринга. Ныне можно построить универсальную машину Тьюринга, которая имеет только семь состояний и четыре буквы [39, с. 277, рус. пер. с. 328], и она, по-видимому, способна при надлежащем программировании воспроизвести значительную часть (чистой) математики. Относительно дальнейших деталей см. Minsky [39, гл. 5, 7].
Трудно представить себе, что столь простая машина может моделировать человеческий мозг. И однако многое указывает на то, что значительная часть нашего математического мышления действительно допускает такое моделирование*. Эта психологическая тайна бросает серьезный вызов как математикам, так и психологам.
Тезис Тьюринга гораздо скромнее: утверждается, что любое «определимое» (см. § 10) действительное число может быть построено некоторой машиной Тьюринга. Так как слово «определимое» само неопределимо, то тезис Тьюринга невозможно дедуктивно ни доказать, ни опровергнуть. Как давно заметили Уайтхед и Рассел [55, с. v], «любая теория принципов математики должна быть индуктивной».
Однако кажется вероятным, что тезис Тьюринга доказуем математически во многих формальных системах символической логики, например в системах Уайтхеда и Рассела [65] или Гильберта. Тьюринг сам «набросал» одно доказательство в [53, с. 263 — 265]. Кажется также вероятным, что все теоремы из «Principia Mathematica» могут быть доказаны машиной Тьюринга.
5. Электронные вычислительные машины. Оптимизм 1950 года относительно перспектив создания думающих машин был основан не только на математике. Вторым аргументом в его пользу явилось доказательство Шенноном [49] в 1938 г. того факта, что булева алгебра имеет естественную физическую реализацию в классе релейных цепей постоянного тока, именуемых клапанными (или вентильными) схемами*. Это означало, что по крайней мере операции булевой алгебры могут эффективно выполняться устройствами, состоящими из клапанов (вентилей) И, ИЛИ и НЕ [10]. Действительно, некоторые из ранних универсальных цифровых вычислительных машин состояли главным образом из таких релейных цепей. Даже в настоящее время проектирование схем всех вычислительных машин основано на булевой алгебре; последовательностные машины можно строить при помощи тех же клапанных схем и элементов задержки, называемых триггерами.
Оптимизм получил новую поддержку в 1943 г., когда Мак-Каллох и Питтс [36, с. 19 — 39]** описали неврологические аналоги подобных переключательных цепей, так называемые «нервные сети», состоящие из аксонов и нейронов. Экспериментально установлено, что многие нейроны при возбуждении дают последовательность единообразных импульсов типа «все или ничего», напоминающую булеву алгебру (алгебру нуля и единицы). Это позволяет думать, что связь булевой алгебры с законами мысли, открытая Булем, может иметь нейрофизиологическое, а не только интроспективное психологическое толкование. Более глубокое обсуждение и развитие этой идеи см. у Клини [2, с. 3 — 41, рус. пер. с. 15 — 67], Винера [56, гл. 5], Минского [39, гл. 3]. Под впечатлением подобных фактов фон-Нейман [40, с. 39, рус. пер. с. 35] заметил, что дискретность человеческой мысли естественным путем приводит к представлению о дискретной нервной системе человека, состоящей из большого собрания относительно простых «атомных» компонентов, весьма похожих на нейроны. Фон-Нейман также поднял интереснейший вопрос о том, как эти нейроны координируют свое выполнение логических операций.
Но самым важным фактором, пробудившим оптимизм по поводу конструирования «электронных мозгов», было создание в 1940 — 1950 гг. универсальных электронных цифровых вычислителей, способных выполнять итеративные арифметические операции гораздо быстрее людей. Первые такие машины были, по нынешним стандартам, весьма примитивны. Так, их память не превышала 102слов (103 бит). Для сравнения заметим, что печатная страница содержит около 2000 алфавитных знаков и, следовательно, приблизительно 104 бит информации. Библиотека Конгресса содержит около 107 томов, в среднем по 102 страниц каждый; следовательно, она хранит приблизительно 1013 бит информации.
В настоящее время лучшие вычислительные машины выполняют арифметические операции примерно в 105 раз дешевле и по меньшей мере в 107 раз быстрее, нежели люди, а их память может хранить по меньшей мере 1010 бит информации. Это приблизительно равно числу нейронов в центральной нервной системе: «центральная нервная система имеет 10 миллиардов переключательных органов» [40, с. 49, рус. пер. с. 41].
К тому же цифровые вычислительные машины весьма напоминают машины Тьюринга. Точнее, реальные вычислительные машины суть «конечные автоматы» (или «конечные машины»), отличающиеся от машин Тьюринга в двух главных отношениях: а) программа и выход записываются на разных лентах; б) выход уже не может считываться машиной. Машина Тьюринга приобрела бы несколько аналогичные черты, если бы функция б принимала только значения 0 и 1, так что лента двигалась бы только в одном направлении. Кроме того, хотя бы ради ограничения стоимости вычислений число шагов zt на практике ограничивается некоторым конечным пределом Т (скажем, 1010 — 1015)*.
Это сходство и колоссальная мощь электронных вычислительных машин (предвиденная экспертами даже в 1950 г.) придали значительную убедительность идее, что такие машины при надлежащем программировании смогут действовать как заменители человеческого мозга вообще и его математических способностей в частности.
6. Искусственный разум. Таким образом, события, описанные в §4 — 5, уже в 1950 г. настроили многих экспертов оптимистически относительно возможности действительного конструирования «думающих машин». Подобно Мак-Карти и Шеннону, они говорили: «Среди наиболее дерзких вопросов науки нашего времени имеются две соответствующие друг другу проблемы — аналитическая и синтетическая. Как функционирует мозг? Можно ли сконструировать машину, заменяющую мозг?» [2, с. v, рус. пер. с. 7].
Тьюринг дал смелое бихевиористское определение «думающих машин», сформулированное затем Эттингером в следующей четкой форме [3, с. 121]:
Вообразим экспериментатора, связанного телетайпом с двумя комнатами, в одной из которых находится человек, а в другой — машина Если после обмена депешами . . экспериментатор не в состоянии решить, какая депеша от кого, то можно сказать, что машина думает*.
Попытки моделирования человеческого разума на вычислительных машинах составляют область «искусственного разума». В § 6 — 8 я изложу некоторые выводы, вытекающие из двадцатилетней истории таких попыток. То, что эти исследования так и не подошли сколько-нибудь близко к первоначальным целям, внушило большинству экспертов весьма пессимистическое настроение в отношении искусственного разума. Независимо от того, насколько такой пессимизм оправдан, кажется ясным, что организация человеческого мозга намного превосходит по сложности организацию любой известной нам машины. Говорить о сходстве обеих значит предаваться фантазии [см. 42а].
Прежде всего «думает» отнюдь не вычислительная машина; для того чтобы моделировать Человеческий разум, она всегда нуждается в программе. В самом деле, ясно, что «универсальная машина Тьюринга», наделенная лишь семью состояниями и способностью различать лишь четыре буквы, по одной за раз (§ 4), сама по себе орудие убогое — даже если у нее неограниченная память. Следовательно, понятие «искусственного разума» в действительности относится к «разумным» программам.
6.1. Универсальные программы. Свыше десяти лет тому назад Ньюэлл, Саймон и Шоу [33, т. 1, с. 361 — 428 и 47, гл. 4]* составили весьма изобретательные программы для моделирования двух аспектов человеческого разума. Эти программы получили названия «Логик-теоретик» (Logic Theorist — LT) и «Общий решатель задач» (General Problem Solver — GPS); они содержали общие процедуры поиска стратегий (или доказательства теорем и ведения игр) и имели впечатляющий, хотя и ограниченный успех. Общие процедуры программы GPS легко решали задачи о миссионерах и людоедах, о ханойской башне и т. п., однако GPS была неспособна доказать неразрешимость задачи о кенигсбергских мостах или научиться хорошо играть в шахматы. Программа LT доказала 38 из 52 теорем булевой алгебры, взятых из трактата «Principia Mathematical, но не могла справиться с остальными [3, с. 139].
6.2. Специализированные программы. Для психолога, интересующегося моделированием разума, такие универсальные программы, как LT и GPS, вероятно, представляют наибольший интерес. Однако для математика, интересующегося результатом, их ценность не столь велика. Как в самой математике специалисты обычно могут проникнуть глубже в данную техническую область, чем гене-ралисты*, так и специализированные программы, составленные экспертами, обычно оказываются сильнее, чем общие программы типа GPS или типа LT.
6.3. Игры. Кажется вероятным, что уже в 1700 г. Лейбниц мог бы построить (программируемый) автомат для безошибочной игры в (двумерные) крестики-нулики. И, вероятно, большинство нынешних учеников средней школы сумело бы запрограммировать вычислительную машину играть в эту игру гораздо быстрее, чем люди. (В свете Тьюрин-гова определения «думающих машин» это наводит на мысль, что проницательный экспериментатор часто мог бы опознать машину по ее большей скорости в некоторых областях — и ее неуклюжести в других.)
6.4. Шашки и шахматы. Для шашек, имеющих только два вида фигур (простые шашки и дамки) и повторяющуюся доску, требуется гораздо меньше изобретательности, чем для доказательства теорем. Тем не менее весьма интересно, что А. Л. Самуэлю удалось разработать машинную программу, способную на основе метода «минимаксного поиска дерева игры» выиграть или получить ничью у всех, кроме самых сильнейших, шашистов*.
Что самое поразительное, недавно была разработана шахматная программа «Мак Хак VI» (Мае Hack Six), которая имеет национальный турнирный коэффициент свыше 1600. Цитирую авторов [20, с. 802]: «Подход, на котором мы остановились ..., был сугубо прагматическим. Мы не претендовали на построение общей системы решения задач, а прямо обратились к шахматным проблемам». Программа также «организована вокруг минимаксного поиска дерева игры» с «рядом жестких ограничений ... на поиск» [20, с. 803]. Она включает «книгу» более чем с 5000 ходов для стандартных дебютов, составленную шахматным мастером и шахматным теоретиком [20, с. 807]. Благодаря многим специальным приемам программа эта неизмеримо эффективнее более ранней программы Ньюэлла, Шоу и Саймона**, хотя она систематически использует тот же обший алгорифм «альфа-бета».
6.5. Доказательство теорем. Превосходство специализированных программ над универсальными не менее ярко проявляется и в области доказательства теорем. Прекрасный пример тому — успех Хао Вана, составившего в 1958 г. специальную программу, которая за минуты выдала «доказательства» для всех более чем 350 теорем в исчислении предикатов с равенством, фигурирующих в «Principia Mathematica»*. С технической точки зрения, она далеко превосходит по силе «Логика-теоретика» Ньюэлла — Саймона — Шоу относительно поставленной цели.
В [47, с. 110] Ван рассматривал также составление программ, которые формализировали бы все доказательства в такой математической классике, как Ландау (основы анализа), Харди (анализ), Харди и Райт (теория чисел), Веблен и Юнг (проективная геометрия) и даже Бурбаки. Время, однако, сделало Вана меньшим оптимистом в том, что касается замены живых математиков машинными программами; см. [37, с. 31 — 40] по поводу его взглядов 1962 года.
Со своей стороны, я не считаю случайным, что простыми логическими методами легче всего доказываются как раз теоремы самой логики. (Бет предполагал также, что машины смогут легко обобщать уже известные доказательства; соответствующий метод, хорошо знакомый математикам, состоит в том, чтобы, просматривая существующие доказательства, установить действительно использованные посылки.) Однако способность хорошего математика чувствовать существенное и избегать ненужного повторения, по-видимому, плохо поддается механизации, а без нее машине придется перебирать миллионы бесплодных путей, избегаемых опытным математическим умом**.
Быть может, именно по этой причине попытки автоматизировать доказательство теорем в эвклидовой планиметрии не были до сих пор особенно успешными, хотя этому искусству учат в средних школах детей. Лучшие результаты пока получили Гелернтер и Рочестер*; однако сомневаюсь, что их программа позволит машине выдержать выпускные экзамены в колледже. Подозреваю, что гораздо лучших результатов можно было бы добиться при программировании аналитической геометрии Декарта; ее алгебраические, незрительные методы доказательства всегда рассматривались математиками как более механические (и более мощные).
Приведенные примеры свидетельствуют также о необходимости симбиоза между человеком и машиной, если машины действительно должны помогать нам при доказательстве сложных теорем — или даже при систематизации доказательств известных теорем. Ободренный первоначальным успехом, Ван (цит. соч.) писал: «формализация, по-ви-димому, обещает, что машины будут делать значительную часть работы, занимающей сейчас время у математиков-исследователей». Для того чтобы осуществить даже такое полумашинное (computer-assisted) доказательство теорем, потребуется по моему мнению: i)преданное сотрудничество ведущих математиков в разработке программ и ii) включение в эти программы многих глубоких известных теорем, явно выделяющихся по своему значению.
Я рассмотрю эти вопросы далее в части В (§ 18 и 22).
7. Языки программирования. Машины Тьюринга и другие «автоматы» (последовательностные цифровые машины) способны «читать» лишь очень простой «машинный язык», состоящий из длинных цепочек нескольких букв. В большинстве машин это просто цепочки нулей и единиц (используется двоичный «алфавит»), иногда группируемые в 4-символьные «слова» или 64-значные «строки». Перевод на машинный язык даже простейших математических понятий очень труден и требует глубокого знания структуры (психологии) машины.
Стремясь облегчить подготовку машинных программ для сложных задач, специалисты разработали ряд искусственных языков программирования, в том числе ФОРТРАН и АЛГОЛ. На первый взгляд, эти языки кажутся достаточными для выражения математических высказываний, которые могут быть выражены естественно на «жаргоне» Пеано и Буля (но без кванторов). В частности, были построены неоценимые компиляторы, автоматизирующие перевод этих квазичеловеческих языков программирования в чистые машинные языки. Делались даже попытки автоматизировать построение компиляторов [17а]. В случае АЛГОЛа была сделана сознательная попытка построить явную грамматику, исключающую всякие двусмысленности; см. Rutishauser [46].
Однако даже эти относительно простые языки программирования значительно превосходят по сложности другие системы, успешно изучавшиеся методами современной алгебры. Например, для них, вероятно, весьма трудно решить проблему слов, найдя конечный алгорифм, который устанавливал бы, когда две цепочки символов синонимичны*.
* Эта попытка весьма близка к успеху; о некоторых второстепенных исключениях см. D. Knuth and R. Н. Bigelow. J. Assoc. Comput. Mach., 14 (1967), p. 615 — 635.
Для того чтобы изобретать и использовать такие языки, нужен человеческий мозг.
Схема, приведенная на рис. 1, должна показать, какую малую роль играют машины в моделировании человеческого мышления: последние две стрелки автоматизированы, но формулировка языков программирования, построение компиляторов и на-
Рис. 1. Человеческий и искусственный разум.
писание программ, по всей видимости, еще много лет будут требовать человеческого вмешательства.
Достойно восхищения, что Тьюринг [53] предвидел в общих чертах основные понятия, описанные выше; его названия для них также указаны на рис. 1. Однако он отнюдь не предвидел сложности современных вычислительных автоматов; «универсальные машины Тьюринга», определенные в лите-
ратуре, все крайне неэффективны. По мнению многих экспертов, для полного использования вычислительной техники необходима разработка изощренных макро- и системных программ, что опять-таки потребует максимума человеческой изобретательности.
8. Математическая лингвистика. Изучение искусственных языков является важным разделом увлекательной дисциплины, которая называется математической лингвистикой и которую можно определить как математический анализ «языков». Математически язык проще всего определить как множество цепочек символов (букв, цифр, пробелов, знаков препинания и т. д.). Соответственно, математическая лингвистика рассматривает слова и цепочки слов (предложения), оторванные от их смысла: это изучение бессмысленных слов и предложений. Она представляет собой отрасль совре* менной прикладной алгебры, комбинаторную по своей природе и ставшую уже источником многих интересных, чисто математических задач.
8.1. Грамматика. Следуя Хомскому [14] и другим, можно определить «грамматику» в любом языке как конечное множество правил, устанавливающих, какие цепочки слов образуют правильные предложения. В языках программирования такие правила построить относительно легко, так как каждое осмысленное предположение имеет ясную объективную цель — произвести известное изменение во внутреннем состоянии машины или заставить ее отпечатать содержание некоторой ячейки памяти или накопителя. Правила эти полезны при отладке программ.
Такие грамматики классифицируются по допустимым правилам для порождения предложений. Проще всего грамматики с конечным числом со-
стояний*, соответствующие конечным автоматам (языки программирования для вычислительных машин) . Следующая ступень — контекстно-свободные грамматики, соответствующие автоматам с магазинной памятью. Наконец, появляются контекстносвязанные грамматики, реализуемые на машинах Тьюринга и потому, можно думать, характерные для процессов символической логики. Заметим в этой связи, что тезис Уайтхеда — Рассела [55], по которому доказательство теоремы состоит в порождении ее формулы согласно определенным правилам вывода из конечного множества аксиом, есть с абстрактной точки зрения частное выражение идеи грамматики**.
8.2. Человеческие языки. Математики иногда утверждают, что все можно выразить математически («Apud me, omnia in mathematicas fiunt»)***. Так как кажется ясным, что значительную часть математики можно записать на квазиалгебраическом языке символической логики и затем механизировать, то возникает естественный вопрос, нельзя ли механизировать человеческие (естественные) языки и применить к ним методы математической лингвистики (оказавшейся столь эффективной при анализе языков программирования). Думается, что ответ на этот вопрос затрагивает психологию.
Психологи и математики подходят к языку с противоположных позиций. Для психолога основными функциями являются слух и речь; зачаточными способностями к ним обладают даже животные и птицы. Так, Пенфилд и Робертс [41а, с. 250] замечают: «Человек способен находить .. четыре группы нейронных структур: звуковые единицы слов, используемые при слушании речи; артикуляционные единицы, воспроизводимые при разговоре; зрительные — при чтении и тактильные — при письме». Иными словами, средний человек координирует слушание слов, произнесение слов, чтение слов и писание слов — не говоря уже о чтении с губ или о том, что могла делать Елена Келлер.* Математики, с другой стороны, склонны полагать сущность языка в чтении и письме и редко рассматривают слова как артикулируемые гортанью, слушаемые ухом или узнаваемые глазом; точно так же они не спрашивают, каким образом слова и предложения передаются или сохраняются в мозгу.
Я буду рассматривать язык с психологических позиций в части Б, а здесь ограничусь несколькими простыми замечаниями. Во-первых, человеческие языки, без сомнения, гораздо тоньше и сложнее языков программирования. С давнего времени известно, что предложения вне контекста бывают обманчивыми и что правила грамматики, хотя и очень полезные при изучении иностранных языков, неполны, противоречивы и мало помогают при овладении родным. По недавнему заявлению Лам-бека [3, с. 187], он не смог «найти никакого согласия среди современных лингвистов по поводу того, что считать правильным предложением». Подобная неопределенность преобладает и в отношении синтаксиса и морфологии человеческих языков и даже классификации частей речи*. Так, Хомский дал примеры фраз, которые имеют одинаковую грамматическую структуру, но одна из которых наделена значением, а другая — нет. Далее, в английском словаре, синтаксисе и грамматике имеются сотни забавных двусмысленностей, которые было бы невозможно запрограммировать**. Сверх того, существуют намеки, как в популярном вест-индском припеве: Yo’ daddy ain’t уо’ daddy but yo’ daddy don’t know («ваш папа не ваш папа, но ваш папа не знает»); их значение очевидно людям с жизненным опытом, но их семантические правила необъяснимы.
Хомский произвел также структурный анализ вопросы: Why has John always been such an easy man to please? («почему Джону всегда было легко доставить удовольствие?») — и показал, что его нельзя сформулировать ни в одной контекстно-свободной грамматике непосредственных составляющих. Следовательно, он не может быть воспринят конечными автоматами.
8.3. Механический перевод. Важной практической целью математической лингвистики была автоматизация перевода с одного человеческого языка на другой. Предполагалось дополнить буквальную передачу каждого слова (при помощи хранимого «словаря») синтаксическими правилами для изменения порядка слов. Ранние оптимисты [32, с. 134, рус. пер. с. 183] описывали «непосредственный достоверный перевод с одного языка (русского) на другой (английский) на основе небольшого закодированного словаря и ряда поддающихся программированию синтаксических операций, ограниченных по числу, но достаточно широких по охвату материала»*.
Ныне, однако, большинство экспертов соглашается с тем, что механический перевод человеческого языка не сможет в обозримом будущем соперничать с человеческим переводом**. Хотя многие простые фразы, допускают рутинную обработку, упомянутые выше двусмысленности английского синтаксиса и грамматики смешиваются с другими двусмысленностями, когда мы пытаемся соотнести английский язык, скажем, с французским, немецким или русским; см. Г12]. Даже «перевод с последующим редактированием», когда выданный машиной текст трактуется как грубый черновик, будет иметь, по всей видимости, практическое значение лишь при отсутствии квалифицированных переводчиков.
8.4. Резюме. В целом представляется, что затронутые в части А задачи ближе всего подходят к методам, введенным Булем и Пеано. Так, многие из них можно решать без глубокого применения алгебры кванторов («для некоторых», «для всех»), которой не знали Буль и Пеано и которая оставлена без внимания в большинстве языков программирования*. Хотя решение оказалось труднее, чем ожидали иные ранние энтузиасты, это задачи именно такого рода (цифровые), для которых цифровые вычислительные машины кажутся наиболее пригодными.
В частях Б и В я рассмотрю аспекты математики и психологии, которые, по-видимому, поддаются механизации в меньшей степени, но которые также должны найти отражение в любой реалистической модели математического мышления.
Б. КОНТИНУАЛЬНАЯ МАТЕМАТИКА И ПСИХОЛОГИЯ
9. Введение
В части А я пытался очертить объем, в котором цифровые (последовательностные) вычислительные машины были дj сих пор успешно программируемы для «математического мышления». Конечно, было бы чрезвычайно интересно узнать, в каких границах цифровые вычислительные машины и человеческий мозг решают математические задачи «изоморфно»**. Однако в настоящее время наши знания о нейрофизиологии недостаточны для ответа на этот вопрос. В лучшем случае психологи могут найти, что рассмотрение того, какие аспекты «мышления» успешно моделируются какими моделями «искусственного разума», помогает им формулировать остроумные догадки для последующей экспериментальной проверки. Обратно, знакомство с психологией может помочь специалистам по вычислительной технике разработать лучшие программы для механизации человеческой изобретательности.
Во всяком случае доводы, изложенные в части А, убеждают меня, что в принципе цифровые вычислительные машины можно программировать для большинства математических задач, допускающих эффективное описание на искусственном языке Буля и Пеано. Однако, по моему мнению, язык этот плохо приспособлен для описания континуальной математики (например, классического анализа), и то же, думается, относится к цифровым машинам.
Представлю теперь доводы в защиту этого взгляда. Моей первой целью будет убедить вас, что дискретная и континуальная математика различны в самой основе.
Различие между ними отчетливо признано в теории вычислительных машин. Машины, которые обладают непрерывно изменяющимися «состояниями», называются аналоговыми; машины, которые обладают как цифровыми, так и аналоговыми устройствами, называются гибридными.
Я попытаюсь убедить вас, что человек имеет превосходные аналоговые устройства, а также аналого-цифровые и цифро-аналоговые «преобразователи». Иными словами, я утверждаю, что человек есть по меньшей мере гибридная машина.
9.1 Аппроксимация. Фундаментальное логическое различие между дискретным и непрерывным затемняется важной идеей аппроксимации, т. е. приближения. Например, любое действительное число можно с любой желательной точностью представить рациональным числом. Так, знакомые школьные приближения ... более чем достаточны для большинства практических задач. (Древние обычно находили 3 достаточным приближением к я.)
9.2. Оптические иллюзии. Наши физические чувства также могут быть обмануты тесной аппроксимацией к непрерывности. Этот принцип хорошо иллюстрируется кинематографом. Последовательность 120 кадров в секунду при наблюдении человеком производит впечатление непрерывного движения в пространстве и времени; психологически оно достаточно хорошо приближает непрерывное пространство-время. Подобным образом, всякий, кто смотрел на карандашную линию под микроскопом, легко допустит, что физическое различие между дискретным и непрерывным иллюзорно.
9.3. Машинная графика. Указанный факт используется в дискретной «машинной графике», где многие непрерывные кривые успешно представляются для зрительного восприятия зажиганием подходящей области на индикаторном экране, содержащем квадратную решетку из 1024x1024 точек. Такие индикаторные экраны могут заменить многие более рутинные и однообразные работы чертежников. Пульты, подключенные к таким экранам и вычислительным машинам с разделением времени, позволяют значительно ускорить выбор людьми технических конструкций, планирование операций на металлорежущих станках, демонстрацию пояснительных схем в учебных процессах и пр. Эти возможности обсуждаются в [18, с. 131 — 142] и [58, с. 77 — 84]; другой вопрос, как мы увидим в § 19, касается автоматизации эстетического суждения.
9.4. Научно-технические расчеты. Подобным образом, как я уже отмечал в § 1, цифровые вычислительные машины заменяют математический анализ как важнейший инструмент прикладной математики. Они необходимы при решении многих фундаментальных задач технического проектирования, и в частности при оптимизации конструкции ядерных реакторов и размещения скважин в нефтяных пластах. Точно так же в физической химии нет более мощного средства для соотнесения структуры молекул с их спектрами; и пр.
Непосвященным естественно предположить, что этот успех обусловлен столь же точным применением численной математики к решению научно-технических проблем, как применение математической логики — к доказательству теорем. Но это предположение далеко от истины. Успехи вычислительных машин в физике и технике зависят в большой мере от искусного выбора приближений, детали чего понятны только квалифицированным численным аналитикам.
10. Континуум. Громадный логический разрыв, отделяющий дискретное от непрерывного, был ясно увиден Пифагором еще в 600 г. до н. э. Геометрическим рассуждением Пифагор показал, что есть вполне реальное число; оно изображает отношение диагонали квадрата к длине стороны. Затем он показал, что У 2 нельзя точно представить отношением целых чисел (дробью); тем самым было открыто существование иррациональных величин (действительных чисел).
Это сделало ясным, что понятие количества (величины) не может быть основано на тогдашней символике арифметики, и побудило греческих математиков определить действительный континуум геометрически. А именно, они определили действи-
тельные числа как отношения однородных геометрических величин*. Их математические доказательства включали прямые ссылки на чертежи, делавшие непрерывность зримой. Таким образом, блестящие достижения греческой математики зависели от сочетания логики со зрительным воображением, без предпочтения той или другой составляющей.
На этом пути было также найдено логическое основание для искусства аппроксимации рациональными числами. Эвдокс в 400 г. до н. э. обнаружил, что любые две действительные величины а и Ь можно разделить некоторым рациональным числом q, так что aqb; рациональные числа расположены плотно по всему действительному континууму. В силу этого каждое действительное число («величину», «количество») г можно задать сечением (разбиением), которое оно производит в множестве Q всех рациональных чисел; око разбивает Q на множества чисел
10.1. Маскирующие точки. Позиционная десятичная система счисления, изобретенная индусами, часто маскирует различие между дискретным и непрерывным. Так, можно записать в квазицифровой форме 1/^2=1,41424 ...; ошибка маскируется точками. Вообще, каждое действительное число можно однозначно представить в квазиарифметической записи как бесконечную десятичную дробь
если потребовать, чтобы ... для бесконечно многих k. Это можно* сделать и при любом другом основании системы счисления, например при основании 2 (двоичные числа). Позиционная же двоичная система находится в естественной связи с геометрической идеей линейки, на которой нанесены линии, обозначающие дюймы, полудюй-мы, четверти дюймов и т. д.
Затемнение логического различия между дискретным и непрерывным продолжалось до XIX столетия. Таким образом, после изобретения арабами символической алгебры и особенно после того, как Декарт показал, что алгебра может быть использована для описания многих кривых и доказательства многих теорем эвклидовой геометрии без вычерчивания фигур, символический подход вновь обрел господство в математике. По-видимому, этому способствовало также изобретение книгопечатания.
10.2. Анализ. Скрытая сила декартовой, или «аналитической», геометрии проявилась ослепительно ярко с развитием математического анализа, давшего вскоре после своего возникновения массу простых формул для наклонов, длин, площадей и других геометрических величин, связанных с кривыми и поверхностями. В то же время анализ выработал свою собственную символику под давлением (хочу подчеркнуть) идей из геометрии и механики.
Развитие анализа чрезвычайно усилило употребление маскирующих точек, когда в XVIII в. обнаружилось, что многие функции разлагаются в бесконечные ряды. Так, было получено много разложений вида ...
и т. д., весьма напоминающих (5).
Хотя прием маскировки точками (означающими: «продолжай неограниченно») не встречал возражений вплоть до XIX в., в основе его лежит очевидное смешение значений. Точки не суть осмысленные арифметические или логические символы, и все авторитетные математики и логики согласны с тем, что между рациональными и иррациональными числами существует резкое и глубокое различие. Так, когда мы пишем 1/2=1,4142 то отнюдь не утверждаем этим справедливости какого-либо равенства; речь идет лишь о двойном неравенстве 1,4142 ]/2 1,4143. Подобным образом специалисты по вычислительной технике признают принципиальное различие между действительной и целой арифметикой и требуют от клиентов указания, какая из них имеется в виду (действительная арифметика является существенно приближенной)*.
Можно привести много других свидетельств фундаментальной недостаточности дискретного для описания непрерывного. Наиболее известные из них математикам и наиболее прямые вытекают из теоремы неполноты математической логики и будут рассмотрены в § 21. Но существуют столь же впечатляющне психологические данные, показывающие, что, подобно гибридным вычислительным машинам*, мы, люди, обладаем двумя качественно различными формами математического мышления, коренящимися в наших методах счета и измерения и обусловленными нашей физиологической организацией. В частности, в нервных сетях человека происходит немало непрерывных процессов, рода химического торможения, гораздо более разнообразных и тонких, чем то, что имеет место в простых двоичных (комбинаторных или последовательностных) сетях, описанных в § 5.
Далее в части Б я рассмотрю некоторые из этих психологических результатов, выделяя особо процессы, относящиеся к чтению, письму, говорению и слушанию, как ближайшие к «мышлению». Надеюсь, мы увидим, что описание этих процессов основано прежде всего на интуитивной континуальной математике. Подобным образом, моделирование их (и, следовательно, моделирование «мышления») на цифровых вычислительных машинах неизбежно должно опираться на методы аппроксимации.
11. Психометрика. Психометрика занимается больше измерением, чем счетом, больше континуальной, чем дискретной математикой, быть может потому, что касается более глубокого предмета. Это очень ясно излагается в работах С. С. Стивенса [52, с. 1 — 49, рус. пер. т. 1, с 19 — 89] и П. Суп-песа и Дж. Л. Зиннеса [33, т. 1, с. 1 — 76]. (О новейших исследованиях см. [60]).
В частности, Стивенс ясно связывает три различных понятия непрерывной шкалы (шкалы порядка, интервалов и отношений) с соответствую* щими группами преобразований: сохраняющих порядок непрерывных в обе стороны преобразований x=f(x)y аффинных преобразований х=ах+Ь и линейных преобразований х=ах\ см [52, с. 25, рус. пер. т. 1, с. 52].
Двухпараметрическая аффинная группа тесно связана также со степенной группой всех преобразований вида
где а — действительное число и &0. При у= =\ogx она переходит в группу всех аффинных преобразований
где а и p=logfe — подходящие действительные константы. Как отмечено Стивенсом*, формулы (8), (9) устанавливают связь между законом Фехнера (что равные приращения величины у соответствуют равным субъективным изменениям интенсивности ощущения) и эмпирическим законом, что формула у1У=(х/*)" при некотором а0 описывает субъективную оценку ощущений как имеющих «равную силу», когда два различных органа чувств подвергаются действию переменных энергий х и у воспринимаемых ими физических явлений (свет, звук, давление, электрический ток и пр.).
11.1. Факты о группах. Связь между измерением и группами представляет особый интерес ввиду той фундаментальной роли, которая принадлежит понятию группы в современной алгебре, как и в основаниях геометрии. Возможно, некоторым психологам будет интересно узнать, что группы, перечисленные в [52, с. 25], — это единственные конечно-параметрические группы, действующие на величины. Точнее, норвежский математик Софус Ли доказал в одном глубоком мемуаре, что любая конечно-параметрическая непрерывная группа, определенная на действительной прямой, локально эквивалентна либо группе сдвига у=у + а (а значит, и преобра-зованиям х= еу’ = еу+а = еах=ах), либо аффинной группе x=ax + fiy либо «проективной группе» х=(ах+Ь) I (cx + d), айфЬс, выступающей в теории перспективы. Последняя группа исключается физически, в большом, если потребовать, чтобы физические величины были конечны.
11.2. Колориметрия. Один из увлекательных разделов психометрики посвящен изучению цвета. Большинство людей обладает цветовым зрением, присваивающим видимым областям три компонента интенсивности, как показано Томасом Юнгом и подтверждено Гельмгольцем [25, т. 2, с. 20]*. Следуя Грассману и Дж. К. Максвеллу, можно принять, что сетчатая оболочка глаза несет вектор-функцию I=F(p, 0, /), с I=(/i, /2, /3), проецирующую физическое распределение энергии над континуумом длин волн X: Р(ф, 0, t, X), 0,
в (положительный) цветовой конус. Затем можно попытаться разложить цвет на компоненты цветового тона, чистоты и яркости (или светлоты), выбирая нейтральную (черно-серо-белую) ось «бесцветных» смесей, и ввести сферические координаты, где цветовой тон будет служить долготой, яркость — радиусом, а чистота — широтой. Хотя эта процедура включает ряд важных аномалий [50а, особенно гл. VII], а нейрофизиологическая переработка зрительных данных сложна (ср. § 13), предыдущее решение сегодня является признанной основой практической колориметрии.
12. Слух. Было сказано, что «мышление есть разговор с самим собой». Точнее [38, гл. 11], для многих (в том числе и для меня) значительная часть мыслительной деятельности состоит в замене и перестройке словесных цепочек, хранимых в памяти. По-видимому, это дискретный процесс. Хотя современные языки программирования для вычислительных машин уступают людям по своим ассоциативным возможностям*, тезис Тьюринга гласит, что цифровые машины в конце концов будут способны эффективно осуществлять такого рода «мышление».
Как я попытаюсь показать в части В, это неверно даже для математического мышления. В сфере же нематематического словесного мышления данные психологических исследований свидетельствуют о том, что ум человеческий действует совершенно иначе, чем последовательностный цифровой автомат.
Переработка слов в человеческих умах, несомненно, включает слушание, а это заставляет вспомнить, что наше чувство слуха существенно непрерывно. Действительно, для объяснения зрения или слуха необходимо гораздо более глубокое обращение к континуальной математике, чем то, которое предлагается психометрикой. Для того чтобы их сколько-нибудь понять, нужна математическая теория волнового движения. Это было впервые убедительно показано Гельмгольцем, чей многогранный гений до сих пор не перестает вызывать наше восхищение.
Один из величайших психологов, Гельмгольц принадлежал также к ведущим прикладным математикам своего поколения. Он положил начало математической метеорологии* и внес фундаментальный вклад в теории вихрей, волнового движения и струй. Его интерес к последним вытекал из стремления раскрыть природу зрения [25] и слуха [24] (включая музыку). Будучи по образованию военным хирургом, он соединял подробное знание физиологии с глубоким пониманием тогдашней физики и континуальной математики, которую он также обогатил (своим анализом уравнения Гельмгольца V2u + k2u=0).
12.1. Слуховые ощущения. Гельмгольц [24] приписывал наше ощущение звука психофизическому разложению Фурье непрерывно изменяющейся функции давления p(t) от времени, действующей на барабанную перепонку. Это разложение должно давать чистые тоны различной амплитуды и (при соизмеримых частотах) различной относительной фазы. Идея была высказана ранее Омом (1843); Гельмгольц предположил, что каждая из приблизительно 3000 кортиевых палочек** настроена (резонирует) на свою характеристическую частоту
* См. Philip Thompson. Numerical Weather Analysis and Prediction. New York, Macmillan, 1961, p. 13.
** Другое название — кортиевы столбики (по имени итальянского физиолога Корти). — Прим. пер,
[24, с. 33 и 143 — 147, рус. пер. с. 48 и 203 — 207]*,
Опыты показывают, что дело обстоит не столь просто. В настоящее время [54а, с. 35, 332] хорошо подготовленные музыканты могут различать частоты, отстоящие друг от друга всего на 1 Гц, тогда как неподготовленные лица и наполовину не так чувствительны. Следовательно, люди, имеющие то же количество кортиевых палочек, могут отличаться по крайней мере в два раза по своей чувствительности к высоте звука, в зависимости от подготовки и других факторов.
В течение почти столетия после Гельмгольца** физики и психологи продолжали на интуитивной основе применять интеграл Фурье, отождествляя каждую фонему с ее энергетическим спектром. В частности, они предполагали, что люди узнают каждую фонему (гласный или согласный) таким же путем, как и тембр музыкальной ноты, — по относительной силе (и фазам) их верхних и нижних гармоник.
12.2. Моделирование речи. Развивая идеи Фурье, Гельмгольц даже получал распознаваемые синтетические звуки механически***. Более близким к нам по времени синтезатором речи был «Вокодер», экспонированный на Всемирной выставке 1939 г. Он синтезировал как гласные, так и согласные (глухие) звуки приблизительно из 10 модулированных гудений и свистов подходящих амплитуд.
Однако идеи Гельмгольца не давали объяснения тому, как наш человеческий разум преобразует непрерывное входное давление p(t) в дискретные последовательности фонем и строит из них осмысленные слова и предложения. Ныне кажется ясным, что слушание есть гораздо более сложный процесс, нежели представляли себе эти исследователи.
Даже фундаментальная физика передачи звуковых волн в улитке сегодня еще не поддается количественному анализу. Отчасти вследствие сложности геометрии и материалов, мы не знаем, какие формы волн давления ударяются о нервные окончания, и не умеем предсказать результирующую последовательность нервных импульсов, возбужденных данной функцией p(t). Наше восприятие колебаний выше 5 кГц, вероятно, зависит от других концевых аппаратов, чем восприятие колебаний ниже 5 кГц; необъясненные спонтанные сигналы непрерывно передаются по нашим 50 ООО нервных волокон, а эти волокна бывают разных видов (например, радиальные и спиральные). О дальнейших подробностях см. [29]; напрашивается вывод, что в слухе постоянно участвуют церебральные (мозговые) процессы. Церебральная переработка звука будет рассмотрена в § 14.
Физиологически также не ясно, как мы получаем нашу способность к бинауральному восприятию направления (для стереофонической музыки), когда сравниваются две функции давления p\(t) и р2(0, по одной на каждое ухо; см. [18а,с. 109 — 114, рус. пер. с. 147 — 154] и [54а, гл. 17]. Этот эффект, вероятно, включает синхронизацию и центральную интеграцию между полушариями головного мозга.
13. Зрение. Мысля, мы вызываем из памяти не только словесные (звуковые), но и зрительные образы. Математика обнаруживает много аналогий и ряд различий между нашим употреблением этих двух способностей.
Так, если монауральный слух фиксирует функцию p(t) одной переменной (и выделяет ее изображение Фурье), то монокулярное зрение фиксирует прежде всего действительную функцию яркости или интенсивности света /(ф, 0, t)y зависящую от двух переменных направления и от времени. Разрешающая способность по времени t здесь гораздо хуже, чем в случае уха, — около 1/5 с [25, т. 2, с. 213]. Однако это возмещается с избытком необыкновенной остротой нашего черно-белого зрения: каждый нормальный человеческий глаз имеет свыше 125 млн. рецепторов и 800 000 нервов, посредством которых он сообщает то, что видит, мозгу (одной из поверхностей которого является сетчатка каждого глаза). Последние связаны между собой специальными ориентирующими нервными слоями и отрицательными рефлексами, усиливающими периферию [42].
Монокулярное зрение позволяет людям быстро читать печатные и рукописные тексты, преобразуя картинки букв в звуки необычайным аналого-циф-ро-аналоговым процессом. Мы можем читать печатную страницу в 300 слов (2000 букв) за 30 — 60 с., принимая в ходе этого процесса примерно 104 бит цифровой информации*. Как указал Дж. Р. Пирс [18, с. 101], для воспроизведения такой страницы при помощи фототелеграфа с растром 210Х210 потребуется 106 бит информации; для передачи образа последовательно на телевизионном экране Ю10 бит; пропускная же способнсть коаксиального телефонного канала составляет лишь около ЗХЮ8 бит/с.
Эти цифры говорят о трудности механизации восприятия даже статических, двумерных зрительных образов, т. е. решения проблемы распознавания образов. Среди ранних попыток решения этой проблемы на универсальных вычислительных машинах особо выделяется программа «Перцептрон», хотя ее изобретатель подчеркивал ее неполноту как модели мозга*. Строгое доказательство этой неполноты было недавно дано Минским, показавшим, что «Перцептрон» не может «воспринимать» связность.
Было изобретено немало других, менее честолюбивых схем для распознавания частных классов образов, например букв или формул, графов, парных хромосом**. Однако ни одна из этих попыток не увенчалась ярким успехом. Таким образом, даже в простом случае статических образов в двумерном геометрическом континууме, наблюдаемом каждым глазом, до сих пор еще не оказалось возможным механизировать эффективное распознавание***.
Даже ограниченное черно-белыми образами, человеческое зрение способно делать гораздо больше, чем идентификация подмножеств возбужденных нейронов. Оно может обнаружить симметрию с первого взгляда. (Облегчается ли этот процесс наличием у нас двух частично независимых полушарий головного мозга, левого и правого?) Кроме того, оно может поворачивать, сдвигать, увеличивать и уменьшать зрительные образы. Оно может также представлять их в новой перспективе, испытывая их тем самым на «эквивалентность относительно проективной группы»...
Человеческое бинокулярное зрение обладает многими другими способностями, включая параллакс и фокусирование для создания глубины. Большинство людей имеет также цветовое зрение, которое я обсуждал в § 11. Так, тренированный глаз может различать около 100 различных цветовых тонов, вероятно около 103 — 104 разных оттенков цвета и 104 — 105 разных цветовых структур. Он может также следить за движущимися образами и коррелировать их.
Возникает вопрос, как дорого обошлось бы планирование, разработка и эксплуатация машинной программы (и машины), наделенной подобными способностями, — и не безнадежная ли это задача. Со своей стороны, я склонен считать, что задача содержит по крайней мере три весьма серьезные трудности.
Во-первых, человеческое распознавание образов основано на континуальных навыках (или инстинктах), таких, как прослеживание линий или границ (для определения связности) или просматривание (например, в поисках пятен или углов). Эти континуальные навыки нелегко воспроизвести на цифровом автомате. Во-вторых, в отличие от слуха, зрение работает не последовательно, а параллельно — факт, делающий возможным периферийное усиление и двойную дифференциацию яркости (см. [426]). Значит, моделирование человеческого зрения требует также программирования параллельной работы машины*. Это создает для последовательностной вычислительной машины еще одно препятствие в подражании тренированному человеческому глазу. И, в-третьих, люди обладают поразительной способностью к «свободной ассоциации» (например, дрожащего почерка — со старостью).
Итак, я подозреваю, что для успешной механизации распознавания образов в него придется включить континуальные операции, искусную параллельную переработку данных и ассоциативный доступ к памяти.
До этого пока вычислительным машинам очень далеко: существующие программы едва-едва позволяют им справляться с распознаванием даже простых букв и формул, с индентификацией графов или со сличением хромосом. Первым шагом к механическому распознаванию образоз было бы, по-видимому, научное объяснение психологами того, как работает человеческий мозг. Понять психологический и физиологический механизм церебральной переработки чувственной информации, поступающей от глаза и уха, и моделировать его на машине — вот задача, достойная современного Гельмгольца.
13.1. Чувственное квантование. Хотя я настаивал на том, что слух и зрение — это прежде всего непрерывные, плавные чувства, некоторые психологи трактовали их как квантовые, а значит, в конечном счете дискретные, разрывные. Так, Гельмгольц полагал [24, с. 33, рус. пер. с. 48], что ухо имеет по одному резонирующему рецептору (дуга улитки) для каждого различимого тона на нашей музыкальной шкале*. Это кажется маловероятным, поскольку ухо имеет 25 — 30 тыс. нервных волокон [45, с. 385], а мы можем различать менее 10 000 ступеней по высоте тона [54а] и определять абсолютно только около тысячи. Подобным образом, фон-Бекеши [7, с. 238 — 239] находил, что наше ощущение силы звука дискретно, изменяясь квантовыми скачками едва заметной величины. Добавим, что нейроны сетчатки могут быть возбуждаемы всего шестью фотонами**. По поводу объективного рассмотрения экспериментальных данных, относящихся к этому спорному вопросу, см. [16, с. 424 — 445]; по поводу возможных «кодирований» воспринимаемых образов сигналов см. [42а]***
Однако ни одна из этих квантовых моделей ощущений не была действительно удачной. Даже наиболее положительный двоичный, булев закон возбуждения «все или ничего» справедлив только для проводников (аксонов) в нашей нервной системе. Он не выполняется для передатчика — синапса — или для приемника в мозгу*. Вероятно, по этой причине серии двоичных нервных импульсов могут иметь существенно небулевы автокорреляционные связи. Я надеюсь, что эти факты из нейрофизиологии помогут объяснить, почему мы, люди, воспринимаем как непрерывные величины не только высоту и силу звука, но и тепло, свет, мышечное напряжение и движение, статическое кожное давление, вкус и запах.
Действительно, мы как будто думаем лучше всего двумя способами: чисто дискретно и чисто непрерывно. Мы часто пытаемся поляризовать свои ощущения на дискретные и непрерывные. Кинокартины с частотой 10 кадров в секунду производят неприятное ощущение мелькания, которого мы стремимся избежать. Напротив, восприятие плавно изменяющихся величин доставляет нам удовольствие.
14. Мозг как переходная вычислительная машина. Надеюсь, предыдущее обсуждение убедило вас, что мозг представляет собой по меньшей мере гибридную вычислительную машину, зависящую существенным образом от наших непрерывных чувств: слуха, зрения, мышечного движения и пр.; если же принять во внимание все способности, успешно координируемые большинством разумных людей, то кажется точнее назвать их переходными машинами (mongrel computers).
В самом деле, чтобы хотя бы сколько-нибудь понять мозг, необходимо осознать, что он работает в теснейшем содружестве с нашим телом — не только благодаря нашим органам чувств, но и благодаря нашей двигательной и ручной активности. Как следствие, морфология и биохимия центральной нервной системы отличаются крайней сложностью. Так, «одним из великих достижений в ... неврологии является открытие необыкновенного разнообразия средств, при помощи которых нервные клетки сообщаются друг с другом» (Д. Бодиан [42а, с. 6]). Подобным образом, подлинные «нервные сети ... имеют .. . довольно диффузную структуру, в отличие от простой блочной структуры существующих вычислительных машин» [1, т. 4, с. 10]. Эта диффузная структура, вероятно, находится в связи с нашими способностями к свободной ассоциации.
Это содружество между духом и телом развивалось долгими веками в борьбе за существование; одной из мелких сторон его было взаимное торможение нервных импульсов к антагонистическим мышцам. Гораздо важнее гемеостаз, или (предки-бернетический.) механизм саморегулирования, уже давно знакомый биологам и нейрофизиологам. Это то, что держит нас в равновесии — физическом, химическом и психическом. Физиологи неизменно основывают модели гемеостаза на континуальной математике*, и я весьма сомневаюсь, что атомистические «нервные сети» (даже дополненные статистическими расчетами) дадут подлинное объяснение происходящего.
Для того чтобы координировать свои многочисленные способности, большинство из нас проводит в детстве много часов над совершенствованием различных преобразователей: аналого-аналоговых (например, обучение свисту) и цифро-цифровых, как и аналого-цифровых и цифро-аналоговых. Например, как я уже замечал, мы можем распознавать цепочки букв, написанных различными почерками, и переводить их мгновенно в произнесенные слова. Подобным образом мы можем соотносить многие непрерывные зрительные образы (кривые, площади, тела и пр.) с дискретными последовательностями слов, состоящих из устных фонем или письменных букв.
Обратно, ум наш может переводить (написанное или произнесенное) имя или другое словесное обозначение человека или вещи в мысленный образ. Способность такого воссоздания образов называется воображением. Ее-то и недостает нашим тупым ЭВМ ценою в 5 миллионов долларов.
Думаю, что именно эта способность позволяет человеческому уму избегать ловушек словесных двусмысленностей, которые в таком количестве строились изобретательными математическими лингвистами. Это выражения типа they are flying planes («они летят самолетами, они летящие самолеты»). Чтобы быть допустимым, зрительный образ, вызванный предложением, должен «иметь смысл»: человек отбрасывает невероятные альтернативные значения. Рассмотрение в контексте дает ему возможность выбирать правильную интерпретацию из различных машинных анализов фразы the are flying planes, которые описал Куно в [48, с. 57]*.
14.1. Машинное распознавание речи. Например, психическая деятельность человека включает способность расшифровывать 2500 алфавитно-цифровых знаков в минуту в произнесенные слова, каждое из которых есть последовательность из более чем 40 фонем, образуемых координированными движениями лицевых, горловых и легочных мышц, и способность переводить функцию давления p(t) в такие последовательности. До сего времени даже эта вторая рутинная задача была слишком тяжела для машинных программ.
Однако за истекшие 20 лет в механизации распознавания речи произошел известный прогресс. Наилучшие результаты были получены с двоичными критериями различения фонем, весьма отличными от тех приемов гармонического анализа, которыми пользовались Гельмгольц и его последователи. Эти критерии были предложены Якобсоном (см. Locke [32, с. 104 — 118, рус. пер., с. 147 — 165]) и применялись также Питерсоном и Харари [28, с. 139 — 165]. Независимо от того, насколько здесь повлияла идея двухпозиционности нейронов (см. § 12), эти двоичные модели кажутся мне более близкими к истине, нежели модели, основанные на разложении Фурье. Более того, они наводят на мысль, что в восприятии речи человеком церебральная переработка играет очень важную роль*.
Во всяком случае, до сих пор ни одна машинная программа не была способна распознавать фонемы так же или почти так же хорошо, как люди. О ранних попытках распознавания речи см. Licklider and Miller [52, c. 1040 — 1074, рус. пер. т. 2, с. 643 — 681] и R. Fatehchand [1, т. 1, с. 193 — 231]; с голосом одного и того же лица были достигнуты значительные успехи*.
Между тем разумные человеческие существа воспринимают гораздо больше, чем цепочки фонем: они могут организовать фонемы в осмысленные слова и предложения. Более того, люди часто узнают оратора, его родной край, его (подлинное или притворное) эмоциональное состояние и замечают звукоподражание**. Подобные возможности существуют и для зрения (каким путем мы узнаем карикатуру на де Голля?).
Приведенные выше факты показывают, что Тьюрингово определение «думающих машин», перефразированное в § 6, дает весьма искусственное толкование человеческого общения, когда настаивает на связи по телетайпу. Для моделирования человеческого разума искусственный разум должен располагать также многими другими способами общения.
Могут возразить, что тем не менее вся математика допускает эффективную передачу по телетайпу (или, столь же хорошо, на языке символической логики). В следующей части В я попытаюсь убедить вас, что это не так. Хотя я уверен, что искусно программируемые вычислительные машины призваны сыграть важную роль в будущих математических исследованиях, я полагаю также, что проблема механизации математики намного глубже, чем казалось иным теоретикам вычислительных машин.
В. ПСИХОЛОГИЯ МАТЕМАТИКИ
15. Арифметическое познание. Перехожу теперь к своим последним вопросам. Как мыслят математики? Могут ли вычислительные машины моделировать только более простые и более рутинные мыслительные процессы математиков? Или (ср. конец § 6) их можно программировать для выполнения основной части математической деятельности людей? Мой тезис гласит, что для того, чтобы выполнять нерутинные математические задачи экономнее или эффективнее людей, вычислительные машины должны управляться вышестоящими математиками, обладающими глубоким пониманием их ограничений.
Начну с первого вопроса: как мыслят математики (о математике).
Математическое мышление начинается в раннем детстве и сначала имеет дело с арифметикой. Прежде чем научиться арифметике, необходимо научиться считать. Это делается очень легко повторением слышимых звуков (механическое подражание). На третьем году жизни большинство детей может воспроизводить последовательности фонем достаточно хорошо, чтобы сказать «раз, два, три, четыре, пять» так же легко, как «абракадабра». Играя же в прятки, многие из нас учатся в восьмилетием возрасте считать до 100 за каких-то 20 секунд, без всякого понукания со стороны взрослых.
Сосчитать множество предметов £/, сопоставляя его члены с последовательными ординальными числами, без повторений или пропусков, требует большего умения. Ребенок должен помнить, говоря каждое число к, каково множество S(k)czU уже сосчитанных вещей; подозреваю, что эта способность зависит от зрительных или осязательных восприятий конкретных предметов. Проверка того, что мощность п множества U не зависит от порядка, в каком перечисляются его элементы, требует индуктивного рассуждения и еще большей зрелости. Только после проведения такого опыта и уяснения его принципа ребенок действительно понимает значение кардинальных чисел. По наблюдениям Пиаже [3, с. 406 — 414]*, это происходит нормально к семи годам. Подозреваю, что примерно в том же возрасте дети приобретают и способность с первого взгляда определять мощность множеств, имеющих менее чем п элементов, где п в большинстве случаев равно «семи плюс или минус два», как отмечено Дж. А. Миллером [34, т. 1, с. 135 — 151]**.
Усвоив способ счета в десятичной системе и его значение, дети готовы к изучению арифметических действий, также в десятичной системе. Опять-таки легче всего путем механического повторения они запечатлевают в памяти таблицы сложения и умножения для 10 десятичных цифр (45 правил на таблицу) и правила сложения, умножения, вычитания и деления положительных целых чисел в десятичной нумерации***.
* См. также Ж. Пиаже и А. Шеминская. Генезис числа у ребенка. — В кн.: Ж. Пиаже. Избранные психологические труды. М., «Просвещение», 1969, с. 233 — 567. — Прим. пер.
** Рус. пер.: Дж. А. Миллер. Магическое число семь плюс или минус два. — В кн.: Инженерная психология. Сб. статей. М., «Прогресс», 1964, с. 192 — 225. — Прим. пер.
*** Автор поражен, насколько благотворно влияет на нелюбопытных детей раннее знакомство с недесятичной (например, двоичной) арифметикой.
Теперь дети готовы к изучению обыкновенных и десятичных дробей и отрицательных чисел. Традиционным мерилом усвоения арифметики была способность учащегося быстро и точно выполнять с ними сложные символические вычисления (например, деление столбцом) — то, что вычислительные машины могут, очевидно, делать поточным способом гораздо лучше и дешевле нас. Недаром профессиональные арифметики применяли механические сумматоры и множители с XVIII столетия.
В так называемой новой математике происходит здоровое перемещение внимания с вычислительных упражнений на понятия и логику арифметики. Думаю, однако, что новый упор был опять односторонним: на первый план выдвинули оперирование лишенными смысла символами согласно искусственным правилам и пренебрегли более глубокой (и более важной) идеей величины.
Как указывал Гельмгцльц [26, с. 85 и сл.], эта идея коренится в физическом опыте и рабочих приемах измерения (Messen). Аксиомы упорядоченной группы могут рассматриваться как эмпирические свойства величины. К 13 годам учащиеся обычно имеют хорошие представления о приближении и порядках величины, от крайне малой до крайне большой. Важна также способность переводить словесные задачи и реальные жизненные ситуации в символическую математическую форму и, обратно, чувствовать значение таких арифметических утверждений, как «он зарабатывает 3 доллара в час» или «процентная ставка равна 6%»-Эта способность, конечно, составляет существо прикладной арифметики.
Подозреваю, что дети резко различаются по своему арифметическому мышлению, и не только быстротой, но и тем, какое относительное значение
они придают трем сторонам арифметики: умению оперировать с числами, логическому рассуждению и практической полезности. Итак, мне кажется, что между математиками уже в детстве существуют значительные различия.
16. Алгебра и геометрия. В юношестве, во время ознакомления с алгеброй и геометрией, дифференциация между людьми по их математическому мышлению, несомненно, резко возрастает. Так, потенциальные чистые математики склонны думать об алгебре как о некоторой игре, подчиненной определенным правдоподобным правилам, где цель состоит в том, чтобы перенести х на одну сторону уравнения, оставив на другой только символы известных величин. Для потенциальных прикладных математиков алгебра представляет собой громоздкий инструмент, позволяющий находить ответы на интересные вопросы неочевидными методами.
Указанное различие интересов поднимает много трудных педагогических вопросов, в отношении которых я не имею твердых убеждений. Но мне хотелось бы сопоставить весьма расходящиеся между собой взгляды Эйлера, Гельмгольца и Пеано на основания алгебры; эти взгляды иллюстрируют существование разных типов математиков.
Для Эйлера* после усвоения арифметики увидеть истину алгебраических манипуляций так легко, что достаточно указать необходимые приемы; алгебра была для него прямым разысканием правильных ответов. Гельмгольц [26, с. 70 — 97]**, с другой стороны, отводил основное положение постулатам для действительных чисел (Grofien), но рассматривал их истинность как нечто непосредственно открываемое физическим опытом. Наконец, для Пеано важно было вывести законы алгебры из минимального числа формальных допущений с помощью чистой логики (словесных или символических манипуляций).
16.1. Геометрическое познание. Геометрия — старейшая (и простейшая) отрасль математической физики. Прежде чем приступить к ее систематическому изучению, дети должны координировать, вербализировать и рационализировать огромное богатство зрительного и осязательного опыта, относящегося к пространству и пространству-времени (.) в обыденной жизни. Например, они должны научиться распознавать прямую линию, чего они в первые годы жизни, вероятно, не умеют* делать.
Подозреваю, что nd этой причине реакции учащихся на формальную школьную геометрию особенно разнообразны: они рационализировали свой опыт разными способами. Действительно, даже для зрелых математиков существуют весьма различные пути рационализации геометрических фактов, которые все являются правильными.
Наиболее известны из них графический подход Эвклида и координатный подход Декарта. Промежуточный подход, предложенный моим отцом, проще их обоих, после усвоения арифметики, и широко используется в современной американской средней школе. Этот промежуточный подход основан на
* См., J. R. Platt. Scientific American, 202 (1960), No 6, p. 121 — 129 и F. Roberts and P. Suppes. Synthese, 17 (1967), p. 173 — 201.
простых аксиомах о расстояниях и углах, измеряемых линейкой и транспортиром*.
16.2. Психологические вопросы. Было бы интересно сравнить названные подходы с психологической точки зрения. Единственное известное мне психологическое исследование оснований геометрии принадлежит Гельмгольцу [26]**.
Гельмгольц показал, что значительная часть геометрии выводится из следующих двух легко про* веряемых физических фактов: 1) пространство 2 трехмерно и 2) всякое твердое тело S может свободно перемещаться в пространстве, с сохранением неизменных расстояний между парами точек (жесткое движение). Иными словами, можно переместить любую точку р тела 5 в любое положение, затем вращать 5 непрерывно вокруг этого положения, перемещая любую точку q в любое положение qf на том же расстоянии от р, что и q, и_затем, наконец, вращать 5 свободно вокруг оси pq\
Гельмгольц привел эти законы как аксиомы, в духе Эвклида. Разумеется, такая психофизическая интерпретация аксиоматических оснований геометрии весьма далека от взгляда на геометрические аксиомы как на простые правила игры в доказательство теорем. К сожалению, требуется очень изощренная аргументация***, чтобы показать, что аксиомы Гельмгольца (дополненные аксиомой подобия) действительно содержат в себе все о геометрии. Поэтому его аксиомы не составляют такого хорошего исходного пункта для изучения геометрии, как аксиомы Эвклида.
Мне кажется, что сложность геометрии типична для высшей континуальной математики и что усвоение и проверка ее истин включают трудную задачу координации нескольких весьма различных человеческих способностей. Психологически она отнюдь не представляет собой (логической) игры по предписанным правилам.
17. Обучающие машины? Неумирающий миф о роботах имеет много вариантов; последний из них рисует нам обучающую машину с вычислительным устройством вместо мозга. Этот миф пропагандируется следующим широко разрекламированным заявлением [18, с. 157]: «Через несколько лет миллионы школьников будут пользоваться ... личным попечением наставника, столь же знающего и чуткого, как Аристотель». Хотя в сфере вычислительной техники опасно заниматься пророчеством, я думаю, что мы можем смело убавить красок в этой радужной картине.
В действительности речь идет не об обучающей машине как таковой, а лишь о (программированном) полумашинном обучении, об обучении с участием машины (computer aided instruction). Далее, для того чтобы «персонализировать» такое обучение, необходимо дополнить хитроумно запрограммированную машину дистанционными внешними устройствами и графическими пультами, которые сейчас стоят очень дорого. Иными словами, нужна система разделения времени, в которой [18, с. vi] «центральный процессор отвечает последовательно на запросы пользователей, но так быстро, что каждому из них машина кажется находящейся в его полном распоряжении». Утверждение [18, с. vi],
что такое «разделение времени» стало теперь действительностью, просто неверно; мы не имеем пока ни малейшего представления о том, во что обошлось бы «публичная информационная система, взаимодействующая с пультами дома, в школе и в конторе».
Если пренебречь стоимостью оборудования (которая может значительно снизиться), то кажется очевидным, что упражнения по арифметике в начальной школе и по геометрии в средней допускают эффективную механизацию. Более того, для коррективной работы с детьми, имеющими психологические трудности, безличность индивидуализированного общения человека и машины может представлять существенную положительную ценность. Наконец, ценным побочным продуктом механизированных уроков является объективная статистическая информация об отдельных учащихся. Было бы гораздо быстрее, надежнее и удобнее собирать и обрабатывать такую информацию через вычислительные машины, чем через учителей*. Разумно обработанная, эта информация могла бы помочь воспитателям в выделении типов учащихся и в повышении эффективности программированного обучения. Это было бы, вероятно, особенно легко в математике — сравнительно устоявшемся предмете.
Конечно, программированное обучение не требует многопрограммной работы машины в «режиме беседы». Как указал Скиннер [51, с. 17], самой большой проблемой при обучении арифметике является выбор и «программирование» серии вопросов, которая позволит учащимся выработать эффективные математические реакции при встрече с любой из 25 — 40 тысяч возможных арифметических задач разных уровней сложности. Эти вопросы можно изложить в специальных книгах или на контрольных карточках; их не надо хранить в машинной памяти или проецировать на экран. Ответы можно также заранее записать; их не надо вводить в машину через входное устройство.
Если оставить в стороне вопросы стоимости, то важнейшими ограничениями обучающих машин будут поэтому ограничения самого программированного обучения, механизировано оно или нет. Теперь я опишу некоторые из них.
Прежде всего, на коррективном уровне машина (подобно книге или магнитофонной записи лекции) может повторно предлагать ученику стандартное объяснение и находить индивидуальные ошибки, но она не способна дать диагноз его умственных и эмоциональных проблем. Ошибки часто вызываются мечтами и наблюдением за ужимками соседних учеников.
Далее, как программированное обучение может создать мотивацию? Даже дети должны инстинктивно понимать, что все, чему может научить машина, она может и лучше сделать. Тогда зачем тратить на это силы? Вычислительные машины никогда не смогут подготовить людей к занятию важных мест в автоматизированном обществе.
Наконец, что важнее всего, как можно программировать усвоение понятий, т. е. значений слов? Я попытался убедить вас, что центральное понятие арифметики есть величина. Это понятие относится как к описаниям «10 миль», «50 тонн», «один акр», «один час», «два миллиона долларов», так и к разнице между годичными процентными ставками в 3 и 10%. Как может научить машина смыслу величины?
Я также привлек ваше внимание ко многим различным возможным логическим подходам к геометрии и упомянул о скромном успехе лучшей существующей машинной программы для решения оригинальных задач в эвклидовой планиметрии. Было бы наверное намного труднее программировать обучение, которое эффективно и систематически сообщало бы учащимся, как решать широкий класс таких задач.
Вопрос разнообразия, к которому я еще вернусь, имеет много аспектов. Надо ли унифицировать преподавание математики и науки посредством одной «оптимальной» программы, применяемой в национальном или во всемирном масштабе? Сомневаюсь; думаю, что разнообразие оправдано и благоприятствует математическому творчеству*. Если желать разнообразия, то кажется весьма маловероятным, что какая-то одна программа окажется наилучшей для всех типов учащихся; следовательно, необходимо разработать и рекомендовать целый набор программ для машинного обучения.
По изложенным выше причинам я полагаю, что полезность обучающих машин в математическом образовании будет в предстоящие годы ограничиваться в значительной мере заданием, исправлением и оценкой индивидуальных механизированных упражнений на элементарном уровне. Кроме того, даже для этого пульты с разделением времени должны экономически конкурировать со стандартными карточками и бланками, которые могут очень дешево исправляться и анализироваться поточным способом но существу одинаковыми машинными программами* или свободно исправляться учащимися по таблицам ключей.
Признавая ясно эти ограничения, я думаю вместе с тем, что вычислительные машины могут сделать ценный и возрастающий вклад в математическое образование.
18. Математическое открытие. Один из увлекательных и спорных вопросов касается степени, в какой искусно программированные машины могут участвовать в математическом творчестве. Мне кажется очевидным, что это превосходный пример потребности в высокоразвитом «симбиозе человека и машины, при котором каждый партнер делает то, что он может делать лучше» [1, т. 8, с. 41]; см. также § 7.
Не надо быть творческим математиком, чтобы понять, о чем идет речь. Ибо, как заметил Адамар [21, с. 104, рус. пер. с. 98], «между работой ученика, решающего задачу по алгебре или геометрии, и изобретательской работой разница лишь в уровне». Подобным образом Пойя [41Ь] начинает свое предисловие заявлением: «Крупное научное открытие дает решение крупной проблемы, но и в решении любой задачи присутствует крупица открытия».
Очевидно, доказательство математических теорем зависит очень сильно (если не исключительно) от дедуктивной логики, и математики обладают острой и необычайно точной способностью отличать правильный дедуктивный шаг от неправильного. Эта способность тысячи раз пускается в ход в цепочках силлогизмов, где одна логическая ошибка может быть роковой. Думаю, что эта способность состоит по существу в распознавании определенных допустимых схем предложений; ее можно было бы назвать чувством дедуктивной логики. Конечно, это не одно из наших четырех или пяти внешних чувств; это одно из наших внутренних чувств, подобно чувству душевного равновесия или возбуждения, которое, вероятно, также связано с церебральными процессами. Подобно им и нашему музыкальному чувству тона (высоты и тембра), оно может быть весьма обострено упражнением.
Так как цифровые вычислительные машины — конечные автоматы с двоичными элементами, то, по моему мнению, они могут нам помочь прежде всего при доказательстве теорем дискретной математики. В частности, думаю, что симбиоз человека и машины будет наиболее эффективным при доказательстве теорем по логике, арифметике (теории чисел) и родственным областям алгебры* и комбинаторики. Однако даже в этих областях наше восхищение логикой не должно приводить нас к недооценке математики других чувств.
И правда, хотя можно думать о людях как о гибридных вычислительных машинах, в действительности они представляют собой нечто гораздо большее. По сравнению с людьми даже гибридные (последовательностные) вычислительные машины оказываются весьма ограниченными, если их рассматривать как личности. Они имеют рутинный ум: они догматичны, лишены воображения и привязаны к шаблону. Они не способны воспринимать даже очевиднейшие количественные факты об окружающем континууме, если только они не снабжены специальным арифметическим устройством (и не консультируются с численным аналитиком). Это устройство позволяет им заменять человеческих «феноменальных вычислителей», которые, однако, и сами обычно не обладают математическим восприятием.
Думается, математикам следовало бы попытаться рассеять популярное представление, что они такие же невосприимчивые автоматы. Им следовало бы опровергнуть идею, что между ними и играющими или доказывающими теоремы машинами различие лишь в степени; различие это качественное. Им следовало бы восстать против обвинения, что их единственное важное умственное качество есть искусство оперирования символами и числами согласно данным правилам. Разве менее важна их способность оперировать понятиями, в смысле теории гештальтов?
Так, даже элементарная теория чисел была безмерно обогащена понятиями (диофантова) приближения и кристаллической решетки (геометрия чисел)*, а наши знания о распределении простых чисел основаны прежде всего на понятиях асимптотической оценки и комплексного анализа (наглядное представление нулей функции £(/) на комплексной плоскости). Было бы, по-видимому, весьма нелегко запрограммировать вычислительную машину для такой же хорошей координации этих понятий, как у тонкого математика.
Ограниченная роль, которую играет двоичная логика в процессе математического открытия, резко подчеркивается в единственных известных мне психологических исследованиях творчества в математике: Адамара [21] и Пойя [4lb, 42]. Так, Пойя отмечает [41b, с. 120, рус. пер. с. 182]: «Стараясь решить задачу, мы поочередно рассматриваем различные ее аспекты, так как в нашей работе очень существенно видоизменение задачи». Подобным образом Адамар [21, гл. VII] детально описывает ряд весьма различных психологических подходов к математическому творчеству. Логикоигровой подход он связывает с поверхностностью: «Совершенно естественно говорить об уме более интуитивном, когда зона комбинирования идей находится глубоко, и об уме логическом, если эта зона расположена достаточно поверхностно». На следующей странице он указывает на важность математических восприятий раннего детства для зрелого творчества [21, с. 114 — 115, рус. пер. с. 107 — 108]: «Очевиднейшим фактом наблюдения
является то, что в нашем раннем детстве происходят чрезвычайно совершенная организация и синтез обычных ощущений, протекающие в самых глубоких слоях нашего бессознательного и, значит, с очень большой скоростью»* — и говорит о том, «как сильно различаются ученые по способу использования умственных образов или других конкретных представлений».
Поверхностность идеи, что математическое открытие есть игра, вполне доступная для вычислительных машин, высмеивалась многими другими выдающимися математиками. Так, по мнению Э. В. Бета [59, с. 210], одна из немногих вещей, с которыми вычислительные машины могут хорошо справиться, — это более или менее тривиальные обобщения теорем (т. е. проверка гипотез). Л. Куф-финьяль замечает довольно едко, что «Бурбаки создан для игры в Бурбаки» [59, с. 125]. Как указывал Вейль [23, с. 483], теоремы математики суть содержательные истины; их словесное выражение относится к математической истине примерно так же, как набальзамированное человеческое тело в похоронном заведении — к живому человеку.
19. Конструирование посредством машины. С психологической точки зрения, математика имеет много общего с музыкой и изобразительными искусствами. В обоих случаях важная роль принадлежит тонкому эстетическому чувству. Как заметил фон-Нейман [41, с. 4, рус. пер. с. 23]: «...Рождение математических идей из опыта, хотя генеалогия этого подчас длинна и запутанна, достаточно хорошо приближает истину... Но как только эти идеи сформулировались, математика начинает жить своей собственной жизнью, и ее лучше уподоблять какой-нибудь творческой дисциплине, движимой почти исключительно эстетическими мотивами...» О том же писал и Г. Г. Харди: «Математик, подобно живописцу или поэту, — создатель форм... Первое испытание — красота».*
Поэтому возможность механизации доказательства теорем представляет лишь один аспект более широкой проблемы механизации художественного конструирования. Я хочу высказать несколько кратких замечаний по поводу этой восхитительной (для некоторых специалистов по машинам), хотя и ужасающей (для большинства людей искусства) перспективы, прежде чем вернуться к математике. Мне особенно хочется сделать это потому, что мой отец, Джордж Д. Биркгофф, свыше сорока лет тому назад глубоко размышлял о возможности автоматического конструирования.
Излагая свои идеи математикам в прекрасном Палаццо Веккио во Флоренции, мой отец начал с того, что напомнил определение эстетического качества, предложенное в XVTII в. Гемстергейсом*. По этому определению, оно состоит в «сообщении возможно большего числа представлений в возможно меньшее время». Как это близко к духу нынешнего нашего симпозиума по оптимизации**.
В книге «Эстетическая мера» [11] мой отец разработал количественный подход к эстетическому качеству М на основе формулы М=0/С, в которой числитель О толковался как мера «порядка», а знаменатель С — как мера «сложности», или усилий понимания. Этот анализ был сделан во многом в том же духе интроспективной психологии, в каком Буль исследовал законы логики.
Мой отец даже конструировал по формуле пробные вазы, мелодии и поэмы (хотя и без помощи вычислительной машины) .Однако он предупреждал [11, с. 13], что «полное количестенное применение основной формулы осуществимо только тогда, когда элементы порядка преимущественно формальны». Хотя он руководствовался при конструировании формулами, он видел в этом не более чем трюк, tour de force, и ни на минуту не допускал, что искусство может выиграть от таких опытов.
* Atti Congresso Internat. dei Matematici. Vol. 1. Bologna, 1928, p. 315 — 333. См. также сокращенное изложение в «Мире математики» Джемса Р. Ньюмена (James R. Newman The World of Mathematics. Vol. 4, New York, Simon and Schuster, 1956).
** Cm. SIAM J. Control (1969), где публиковались статьи, представленные на то же собрание ОППМ, что и настоящий доклад.
Во всякой эстетической деятельности, будь то художественное конструирование или творческая чистая математика, труднее всего выбирать между бесчисленными альтернативами. Так, в творческой математике, согласно Пуанкаре и Адамару [21, с. 30, рус. пер. с. 32], «бессознательное порождает и сравнивает многочисленные сочетания, из которых сознание исследует лишь небольшое меньшинство». Затем Адамар подчеркивает аналогию с художественным творчеством и приводит следующие слова Поля Валери: «Для того чтобы изобретать, надо быть в двух лицах. Один образует комбинации, другой выбирает... То, что называют гением, является не столько заслугой того, кто комбинирует, сколько характеризует способность второго оценивать только что произведенную продукцию и использовать ее». Правила, управляющие этим выбором (в искусстве или математике), «предельно деликатны и тонки, их почти невозможно выразить точными словами; они легче чувствуются, чем формулируются; можно ли при таких условиях представить себе аппарат, который их применяет автоматически?» (Пуанкаре).
Думаю поэтому, что «теоретики» вычислительных машин, которые дерзко предлагают автоматизировать изобретение, должны тщательно взвешивать свои слова. Как показал мой отец, самая трудная задача при механизации конструирования состоит в открытии формулы эстетической ценности, которая позволила бы надежно отбирать лучшее среди механически порожденных конструкций. Для художественного конструирования главнейшее требование — хороший вкус, а он, по общему мнению, не поддается определению. Необходимо также предупредить порождение нехудожественных конструкций, чтобы не тратить времени на оценку не-
годного. До тех пор, пока хороший вкус и нехудожественное не будут определены в математических терминах, вычислительные машины могут программироваться для моделирования чертежников и пианистов, но не художников или композиторов.
Итак, я очень сомневаюсь, что «цифровая вычислительная машина будет писать музыку, которая будет признаваться критиками имеющей значительную эстетическую ценность», даже если оставить в стороне предсказанный 1967 год*. Самое лучшее, некоторые специалисты по вычислительным машинам и некоторые критики могут найти эти машины полезными для анализа, модификации и рекомбинации отрывков их произведений**. И правда, вычислительные машины уже доказали свою полезность конструкторам в изобразительных искусствах при таком символическом взаимодействии.
Точно так же не вызывает сомнения возможность написать программу, которая доказывала бы любое число истинных теорем — выражающих, например, булевы тождества. Но как научить машину отбирать важные теоремы? Или вести порождение в такой последовательности, чтобы леммы были налицо, когда в них нужда? Или избегать бесконечного повторения мелких вариаций на ту же тему? До сего времени не было предложено никакого метода выполнения этих задач, ни на каком уровне.
Наконец, почти во всех опубликованных математических доказательствах опускается изрядная часть второстепенных подробностей; этот факт и его значение обсуждались в § 21. Как запрограммировать машину, чтобы при печатании ответа она опускала «тривиальные» детали (сокращая общий объем)? Не может ли случиться, что при оптимальном симбиозе человека и машины в доказательстве теорем (см. § 18) на долю машины придется в первую очередь именно проверка таких деталей?
Все вышеизложенное укрепляет меня в мысли, что будет весьма нелегко механизировать художественные творения математики — не говоря уже об изящных искусствах*.
20. Зрительное воображение. Математики широко различаются между собой по степени, в какой они обращаются к зрительному воображению при открытии и доказательстве теорем**. Однако тот факт, что оно играет важную роль, кажется мне очевидным в силу нашего постоянного употребления слова «показать» (demonstrate, show) вместо «доказать» (prove). Даже в абстрактной дискретной математике зрение помогает действиям с символами. Возьмем, например, нынешнюю популярность «погони за диаграммами» в алгебре (особенно в теории гомологий и категорий)***.
Как могли Декарт и Гильберт думать иначе? Возможно, на Декарта повлиял его блестящий успех в замене чертежей в эвклидовой геометрии алгеброй многочленов. Гильберт также находился под чарами декартовой геометрии; в своих работах по логике он не раз ссылается на то, что непротиворечивость аксиом Эвклида можно доказать аналитически, определяя абстрактно точки как пары или тройки чисел (х, у), (х, у, z). (Как это далеко от идей Гельмгольца об «основаниях» геометрии.) На Гильберта мог повлиять еще и его собственный успех в применении аксиомы выбора для неконструктивного доказательства алгебраических теорем. Во всяком случае, мнения Гильберта и Декарта односторонни. Это было ясно Адамару, заметившему [21, с. 87, пер. с. 83 — 84]:
Но Декарт не доверяет этому вмешательству воображения и желает полностью исключить его из науки ... Недавно знаменитым математиком Гильбертом на совершенно другой основе была дана более строгая трактовка принципов геометрии, которые ... были освобождены от всякого обращения к интуиции. Логически всякое вмешательство геометрического смысла исключено. Так ли обстоит дело с психологической точки зрения? Конечно, нет ... Фигуры появляются на каждой странице (книги Гильберта).
В предисловии к другой книге* Гильберт сам подчеркивает, что «наглядное понимание играет первенствующую роль в геометрии». То же справедливо и для классического аксиоматического изложения проективной геометрии, несмотря на введение произвольных полей координат**.
Многие современные алгебраические и дифференциальные геометры, с другой стороны, целиком примкнули к Гильберту. Они считают, что геометрия переросла реальное, трехмерное пространство /?3, в котором нам доводится жить, или даже наш пространственно-временной континуум №. Вместо того они хотят изучать общие свойства, справедливые для всех множеств (m-мерных многообразий) комплексных векторов решений х=(х\, ..., хп) произвольной системы п — т независимых полиномиальных уравнений. Ясным признаком их равнодушия к геометрии в каком-либо физическом смысле является отсутствие в их книгах рисунков реальных кривых или поверхностей.
Было бы бесплодно спорить о достоинствах этих разных подходов к геометрии; я упоминаю их прежде всего для иллюстрации различий между математиками. Кажется интереснее вернуться к основному вопросу: в какой мере можно основать анализ на одной только логике?
20.1. Классический анализ. Вскоре после того как Декарт открыл применение координатной геометрии («geometrie analytique») для представления кривых и поверхностей алгебраическими формулами, был изобретен математический анализ («analyse infinitesimale», сокращенный позже в «analyse») для определения их наклонов, площадей, касательных, углов пересечения и других видимых свойств. На протяжении последующих 150 лет анализ продолжал существенно опираться в своем развитии на зрительную и физическую интуицию.
Действительно, на Эйлер, ни Коши никогда не характеризовали системы действительных чисел формально (как единственное полное упорядоченное поле); не знали они и того, что она несчетна. Эйлер наверное представлял себе действительное число наглядно, то как бесконечную десятичную
дробь, то как точку на начерченной прямой с нанесенной на нее шкалой.
Не давал он и общего определения слова «функция». Он просто наглядно представлял себе различные задания функций: формулами, графиками, таблицами приближенных численных значений, и последовательностью коэффициентов степенного ряда, и особыми геометрическими или физическими условиями, которым можно дать лишь бледные парафазы в символической логике. Для него (как и для меня.) существует замечательный факт, что эти различные представления могут заменять друг друга в столь многих приложениях, — факт, допускающий бесчисленные проверки.
Далее, связывая интуитивно континуальные свойства функций с последовательностями коэффициентов (обыкновенно рациональных чисел, в интересных случаях) их степенных рядов, Эйлер пришел [42] к использованию производящих функций для решения задач по комбинаторному анализу и теории чисел. Эта плодотворная идея, возможно, и не возникла бы у него в век, когда различие между аналитическими и бесконечно дифференцируемыми функциями было неясно, если бы он настаивал на подробном формальном доказательстве каждого утверждения.
21. Логическая строгость в анализе. Потребность в большей логической строгости в анализе впервые обнаружилась после 1755 г., когда Даниил Бернулли, отправляясь от математической теории колебания струны, высказал догадку, что «любая» (разумная) периодическая функция может быть разложена в то, что сегодня называют ее рядом Фурье. Эта догадка была оспорена д’Аламбером, Эйлером и Лагранжем, но время показало, что их возражения были неосновательны.
Эта неосновательность стала очевидной около 1815 г., когда Фурье дал поразительные примеры, показывающие, что сходящиеся ряды гладких (даже аналитических.) функций могут иметь негладкие пределы. Используя Эйлерово понятие ортогональности, Фурье также дал и правдоподобные интуитивные аргументы в пользу того, что «всякая» функция ...
Этот результат (интегральная теорема Фурье) способствовал возникновению теории слуховых ощущений Гельмгольца, о которой мы говорили выше в § 12.
Спор о разложимости в ряды Фурье вынудил математиков дать ясные определения понятий функций, непрерывности и сходимости. Однако, как часто бывает в математической физике (см. § 22), строгость пришла в последнюю очередь. Только в 1829 г. Дирихле дал достаточно строгое дедуктивное доказательство догадки Бернулли, основанное на ясных определениях «непрерывной функции» и «сходимости». Это привело, наконец, около 1850 г. к общей теории «интегрируемости» Римана.
Поиски большей теоретической строгости и общности в основаниях анализа продолжались вплоть до I мировой войны. Они привели к современной характеристике действительного континуума как единственного полного упорядоченного поля и, наконец, к теории интегрирования Лебега. В этой теории, значительно более общей, нежели теория
Римана, существенную роль играет классическая теорема Кантора о том, что действительный континуум несчетен: множество R всех действительных чисел невозможно расположить в последовательность. Иными словами, мощность с действительного континуума бесконечно превосходит мощность бесконечной последовательности, равную к0.
21.1. Канторов рай*. Блестящий результат Кантора был лишь одним из применений его фундаментальной общей теории бесконечных множеств, которая, казалось, была чисто дедуктивной и освобождала дискуссии о действительном континууме от нужды в зрительной интуиции и от мистицизма. Как другое применение своей общей теории, Кантор также нашел, что c=nN’° для любого целого я1, и показал, что с=с" для любого положительного целого числа: пространства любых размерностей можно поставить во взаимно однозначное соответствие.
Следует, однако, сказать, что идеи и методы Кантора завоевали признание не сразу. Кронекер был настолько подозрительным к Канторовым методам, что задержал их публикацию, и Кантор сам был в них не совсем уверен**.
21.2. Парадокс Ришара. Действительно, теория множеств Кантора привела к ряду парадоксов и глубоких вопросов, нерешенных и по сей день. Рассмотрим, например, задачу определения всех действительных чисел. Очевидно, что если дан любой конечный «алфавит» знаков, содержащий буквы, цифры, знаки препинания и пробелы, то можно перечислить в бесконечной последовательности все мыслимые словесные определения: существует только конечное множество определений длины п. С другой стороны, как мы уже говорили, Кантор показал, что действительные числа нельзя расположить в последовательность. Следовательно, лишь небольшая часть действительных чисел допускает определение словами: язык, пригодный для печатания на пишущей машинке, недостаточен для того, чтобы охарактеризовать каждое число (каждую точку континуума) индивидуально. Этот весьма неприятный факт именуется парадоксом Ришара.
Логики посвятили немало усилий описанию (счетного) множества WczR всех действительных чисел, (рекурсивно) определимых через конечные выражения. Так как существует биекция b:R — *2Р действительных чисел х на подмножества SczP множества Р всех положительных целых чисел*, то существует и соответствующее множество b(W) определимых множеств положительных целых чисел. Аналогичным способом задаются «определимые» подмножества любого счетного множества (например, Z или Q). Можно определить также множество всех определимых функций f: U — V из любого счетного множества в любое другое счетное множество, потому что существует биекция р: R — +РР.
На фоне этих определений легко формулируется вывод Тьюринга (называемый часто тезисом Черча): каждое определимое действительное число вычислимо на машине Тьюринга и обратно. Определимость и вычислимость тем самым эквивалентны.
21.3. Континуум-гипотеза. Наконец, Кантор попал в тупик. Хотя он полагал, что между н0 и с нет ни одного бесконечного кардинального числа, — иначе говоря, что с есть второе наименьшее бесконечное кардинальное число — он никогда не
мог это доказать. Вейерштрасс и Гильберт, хотя и очень глубокие и строгие аналитики, верили оба, что доказали эту догадку*, так называемую континуум-гипотезу. Недавно Поль Коэн [15] доказал чисто интуитивными математическими методами, что континуум-гипотезу нельзя ни доказать, ни опровергнуть в рамках существующей формальной логики.
Как могли Вейерштрасс и Гильберт так сильно обмануться? Подобно этому, как мог великий логик Фреге работать годами над основаниями логики лишь для того, чтобы, наконец, узнать от Рассела о противоречивости своих методов (см. [23, с. 127], где описан парадокс Рассела)? По моему мнению, эти примеры просто иллюстрируют опасность опоры исключительно на чистую дедуктивную логику.
Все это, конечно, не уменьшает важности строгого построения анализа. Безусловно, надо стараться проверять интуицию логикой; Адамар соглашается [21, с. 102, рус. пер. с. 96 — 97], что зрительная интуиция и здравый смысл подвержены ошибкам. Я лишь подчеркиваю опасность делать анализ исключительно логическим. В этом духе Вейль [23, с. 483] заметил, что, быть может, «только жалкая часть» классического анализа допускает строгое доказательство с осмысленным содержанием (sinnerfullte Inhalt). Подобным образом Уайтхед и Рассел [55, с. vi] признаются, что даже в их шедевре «доказательства более ранних предложений даются без пропуска какого-либо шага, но по мере продвижения работы доказательства постепенно сокращаются». При этом для построения R им понадобилось три толстых тома, написанных в весьма сжатой символике.
Рассмотрение этих фактов убедило меня, что одна лишь формальная логика недостаточна для математического анализа и хотя некоторые его формальные аспекты поддаются механизации ([1, т. 8, с. 64 — 66] и [17, с. 191 — 203, рус. пер., с. 204 — 219]), многие его существеннейшие понятия являются зрительными. Как писал фон-Нейман [41, с. 27, рус. пер. с. 47]:
... Анализ обладает наиболее развитым математическим аппаратом и является наиболее разработанной областью математики. Таким образом, формальная логика в силу самого существа своего подхода отрезана от наиболее разработанных частей математики ...
Как дальнейший косвенный довод в мою пользу, я хочу обратить ваше внимание на существование двух неклассических (еретических?) современных версий анализа, по меньшей мере столь же логических и непротиворечивых каждая, как классический анализ Римана, Вейерштрасса и Пуанкаре. Это, соответственно, конструктивный анализ и нестандартный анализ. Первый ведет свое начало от логического интуиционизма Л. Э. И. Броуэра (отважного противника Гильбертова формализма); он крайне сдержан, даже жеманен в том, что разрешает. Второй следует либеральной традиции Лейбница и Кантора и крайне снисходителен по отношению ко внутреннее непротиворечивым моделями реальности. В полное нарушение Вейерштрассова пуризма,
он свободно говорит о «бесконечно малом» и «бесконечно большом», без всяких е и 6.
Чтобы посмотреть, как может дробиться анализ, руководимый только дедуктивной логикой, рекомендую вам две превосходные классические книги, описывающие эти версии*.
22. Прикладная математика. Хотя вычислительные машины сделали пока немного для художественного конструирования или чистой математики, они уже свыше десяти лет служат необходимыми орудиями прикладной математики. Дело, по-видимому, в том, что критерии оптимизации промышленного конструирования носят объективный характер: получить максимальное количество обыкновенно значит добиться и минимальной стоимости. Это обстоятельство сделало вычислительные машины (искусно программируемые численными аналитиками) незаменимыми при оптимальном конструировании ядерных реакторов, размещении нефтяных скважин и выводе спутников на орбиту.
Я не вижу в этом ничего удивительного. Что меня удивляет, так это позиция некоторых специалистов по вычислительной технике, которые, имея чрезмерно упрощенное понятие о человеческом мозге, пытаются умалить эти достижения. Такие чистые «специалисты» подобны тем чистым математикам, которые, будучи всего лишь прикладными логиками, настойчиво умаляют значение прикладной математики и с радостью уморили бы ее до смерти. Лично я в области вычислительной техники считаю более неотложной задачей попытаться улучшить условия человеческой жизни, чем пытаться моделировать человеческий мозг. Как бы увлекательны ни были такие попытки моделирования с точки зрения чистой психологии, с реалистической точки зрения они еще очень слабы.
Даже математический мозг человека* как я старался убедить вас, далеко не сводится к логической машине. В согласии с замечанием фон-Неймана. о «рождении математических идей из опыта» я сказал бы, что математика обретает глубину, когда люди пытаются применить дискретные методы счета и логики к геометрии. Это привело к открытию Пифагором существования иррациональных чисел и позже к фундаментальному понятию дедекиндовых сечений.
Это также обогатило теорию чисел, придав более глубокое содержание понятию «диофантова уравнения». Теория чисел была революционизирована еще раз, когда Гаусс и его современники нашли наглядное представление алгебраических чисел на комплексной плоскости.
Теория функций Римана также была обязана своим происхождением геометрической и даже физической интуиции*. Этот пример иллюстрирует зависимость анализа не только от нашего зрительного воображения, но и от нашей физической интуиции относительно явлений тепла, света, электричества и магнетизма. Как сказал Фурье: «Глубокое изучение природы — вот самый обильный источник математических открытий». В прошлом физическая интуиция оказывалась гораздо надежнее, чем формальная математика, когда требовалось узнать, какие задачи о дифференциальных уравнениях в частных производных хорошо поставлены*. Кроме того, физическая интуиция была источником таких фундаментальных математических понятий, как устойчивость, векторное поле, функция Грина, ортогональное разложение, собственные функции, характеристика и зона зависимости.
Наконец, если физическая интуиция была источником многих глубочайших идей чистой математики, насколько важнее она для прикладной, постоянно сталкивающейся с новыми проблемами жизни, безмерной глубины и сложности. Как хочешь пробуй укротить их логикой — что-то всегда ускользнет. В механике жидкостей, например, хорошо известно, что убедительные логические аргументы часто бывали обманчивыми и вели к парадоксам**, решение которых подвергло бы суровому испытанию искусство не одного софиста.
Может случиться, что со временем физическая интуиция станет играть меньшую роль как в чистой, так и в прикладной математике. Но это будет лишь потому, что мы живем в век, когда приложения математики выходят за границы физики и техники и начинают проникать в химию, биологию, экономику и административные науки. Я предсказываю, что исследование этих предметов, стимулируемое показаниями всех наших чувств, внешних и внутренних, а не только нашим чувством логики, приведет к новым и важным математическим понятиям.
22.1. Симбиоз человека и машины. Рассмотренные выше данные кажутся несовместимыми с идеей, что роботообразные «думающие машины» заменят со временем людей, даже в чистой математике. Вместо этого мы можем предвидеть все более растущий симбиоз человека и машины, в котором каждый партнер выполняет задачи, наиболее для него подходящие. Определить, какие это задачи, будет нелегко. Быть может, здесь пригодится данный Пойя совет [42], что математическое «изобретение и обучение следовало бы изучить ... методами экспериментальной психологии». Только руководствуясь глубоким и благожелательным пониманием психологии человеческих математиков, так же как и особенностей цифровых вычислительных машин, мы достигнем эффективного взаимодействия человека и машины в решении проблем завтрашней чистой и прикладной математики.
Итак, я полагаю, что вычислительные машины станут ценным орудием исследования и что они окажут помощь в понимании психологических процессов человеческого обучения, доказательства теорем, игры и перевода с одного языка на другой. Но думаю также, что усилия заменить человеческое мышление статически или динамически программируемыми вычислениями будут ограничены областями, где имеется ясная экономическая и социальная отдача.
Это может свести роль чистых специалистов по вычислительным машинам к роли техников, оптимизирующих взнос машин в общую работу. Чтобы сделать симбиоз человека и машины подлинно эффективным, наше общество будет нуждаться в прикладных математиках, которые как численные аналитики следили бы за приближениями, производимыми при моделировании континуумов, и, что еще важнее, соотносили бы выход вычислительных машин с решаемыми на них научными и техническими задачами.
Думаю, что эта потребность открывает перед ОППМ одну из величайших его возможностей — поддержать и стимулировать профессиональное развитие таких прикладных математиков, способных к глубокому общению с другими учеными и инженерами и знакомыми с мощью и ограничениями цифровых машин. Люди, обладающие этими способностями, призваны стать вождями завтрашнего математического мира, но их будет крайне трудно найти и развить.
|