На главную Тексты книг БК Аудиокниги БК Полит-инфо Советские учебники За страницами учебника Фото-Питер Техническая книга Радиоспектакли Детская библиотека

Автоматический перевод (история машинного перевода). Панов Д. Ю. — 1958 г

Дмитрий Юрьевич Панов

Автоматический перевод

*** 1958 ***



DjVu


От нас: 500 радиоспектаклей (и учебники)
на SD‑карте 64(128)GB —
 ГДЕ?..

Baшa помощь проекту:
занести копеечку —
 КУДА?..



      СОДЕРЖАНИЕ

Предисловие 3
1. Введение 5
2. Техника обычного перевода 12
3. Автоматизация перевода научно-технического текста 19
4. Электронные счетные машины и их использование для автоматического перевода 21
5. Автоматический словарь 25
6. Цифровые эквиваленты слов 32
7. Программа автоматического перевода 36
8. Опыты автоматического перевода с английского языка на русский на электронной счетной машине БЭСМ Академии наук СССР 40
9. Новые исследования в области автоматического перевода 46
10. Некоторые научные вопросы, связанные с проблемой автоматического перевода 49
11. Заключение 62
Литература 62
Приложение. Пример анализа английской фразы при автоматическом переводе 63


      ПРЕДИСЛОВИЕ
      В этой книге рассказывается о проблеме автоматического перевода с одного языка на другой и о некоторых результатах работы, ведущейся в этом направлении в Институте точной механики и вычислительной техники и Институте научной информации Академии наук СССР.
      Эта работа начата в январе 1955 г.; в конце 1955 г. были проведены первые опыты перевода научно-технического текста с английского языка на русский при помощи электронной счетной машины БЭСМ Академии наук СССР.
      Филологическая часть проблемы разрабатывалась И. К. Вельской, а вопросы программирования и кодирования — И. С. Мухиным, Л. Н. Королевым, С. Н. Разумовским, Н. П. Трифоновым, Г. П. Зеленкевич.
      [Первое издание этой книги вышло в начале 1956 г. За прошедшее время в области автоматического перевода проведена большая работа в Институте точной механики и вычислительной техники Академии наук СССР, а также в других учреждениях. Настоящее издание дополнено сведениями о некоторых новых результатах. За истекшее время выявились различные точки зрения на принципы, которые должны быть положены в основу автоматизации перевода, и связанные с этим научные проблемы. В книге говорится и об этих дискуссионных вопросах.
      Д. Ю. Панов
     
      Идея автоматического перевода не нова. Уже давно существуют пособия, для пользования которыми не требуется никакого знания иностранного языка. Это различные «разговорники» и специальные словари, предназначенные для путешественников, попадающих в чужую страну и не имеющих возможности объясняться иным способом. В таких словарях даются переводы на другой язык некоторого количества слов и обиходных выражений, причем существенно, что перевод всегда однозначен. Это избавляет человека, пользующегося словарем, от какой бы то ни было мыслительной работы и позволяет ему отыскать необходимое слово или выражение автоматически, если он только может его прочесть.
      При помощи таких «разговорников» можно легко узнать, что русская фраза «до свиданья» будет переводиться по-французски «аи revoir», по-немецки — «auf Wiedersehen», по-фински — «Nakemaan asti» и т. д.
      Однако очевидно, что такого рода перевод не может удовлетворить нас во многих, даже очень простых случаях. Так, например, если мы захотим указать английский эквивалент русского выражения «до свиданья», то придется дать уже два выражения — «good-bye» и«Ьуе-Ьуе», которые употребляются англичанами в зависимости от обстоятельств, трудно объяснимых в словаре. Между тем живому языку в высокой степени свойственно использование различных слов для определения одного и того же понятия, равно как и приписывание одному и тому же слову нескольких различных значений. Этим и объясняется практическая бесполезность такого рода простейших «автоматических переводчиков», как «разговорники» и им подобные издания.
      Но можно задать вопрос: а нельзя ли создать какую-либо более совершенную систему перевода, которая охватывала бы такие случаи, которые встречаются при практическом переводе иностранного текста, пусть на первых порах не слишком сложного? Нельзя ли разработать такие словари и такие правила перевода, которые учитывали бы все особенности построения данного предложения и позволяли бы однозначно установить смысл входящих в него слов и их взаимоотношение в тексте? Нельзя ли, короче говоря, разработать правила автоматического перевода, которые позволяли бы при пунктуальном их соблюдении выполнять перевод с помощью человека, не знающего языка и только умеющего читать буквы? Оказывается, это можно сделать. А если это возможно, то, очевидно, появляется надежда и на выполнение перевода совершенно автоматическим путем, без всякого участия человека, при помощи машине программным управлением, подобных, например, тем, которые автоматически выполняют сложнейшие вычисления.
      На первый взгляд, утверждение о том, что можно разработать правила автоматического перевода, кажется неправдоподобным. Но если немного вдуматься в поставленную задачу, то легко понять, что ничего невозможного в этом нет. В самом деле, ведь язык представляет собой определенную систему, в которой идеи и понятия обязательно находят свое материальное выражение. Различные значения слов, а также любые изменения значения слова отражаются в языке материально средствами лексики и грамматики. В языке нет ничего не значащих слов (если только они не придуманы специально) и не может быть такого содержания, которое не нашло бы своего отражения в порядке слов и в связи их между собой.
      Если бы дело обстояло иначе, то язык не мог бы выполнять свою основную функцию — быть средством общения между людьми; при его помощи нельзя было бы передать другому человеку свои мысли. Атак как каждый по собственному опыту знает, что это делается постоянно и мы улавливаем при разговоре и при чтении чрезвычайно тонкие оттенки мыслей, выраженных словами, — очевидно, должны существовать какие-то материальные средства, позволяющие различать их определенным, объективным образом.
      По-видимому, первая по времени попытка в некоторой степени механизировать перевод была сделана в 1933 г. П. П. Троянским. Он предложил построить «машины для подбора и печатания слов при переводе с одного языка на другой или на несколько других одновременно». На это изобретение П. П. Троянскому было выдано авторское свидетельство (рис. 1), реализовать которое в то время, однако, не удалось.Это и понятно, так как автоматических устройств, подходящих для этой цели, тогда еще не было создано.
      В последние годы, в связи с огромными успехами, достигнутыми в разработке автоматических электронных счетных машин с программным управлением, идея автоматического перевода стала особенно интересовать ученых. В 1948 — 1949 гг. английские и американские ученые обсуждали вопрос о возможности автоматического перевода с одного языка на другой при помощи электронных счетных машин 11, стр. 2 — 3]. В различных научных учреждениях Англии и США с 1950 — 1951 гг. начались работы в этом направлении. 7 января 1954 г. в конторе фирмы «Интернейшнл Бизнес Мэшииз» в Нью-Йорке была произведена первая публичная демонстрация перевода с рус-
      ского языка на английский при помощи выпускаемой этой фирмой электронной счетной машины ИБМ-701 [2]. Для испытания был специально подготовлен словарь из 250 русских слов, записанных латинскими буквами. Слова были подобраны так, чтобы каждое из них имело одно или, в крайнем случае, два английских значения. В словарь были включены, помимо слов, также некоторые падежные окончания. Для некоторых слов были включены только корни, некоторые слова даны полностью, даже с личными окончаниями в случае глаголов или во множественном числе. В табл. 1 приводится извлечение из этого словаря.
      Помимо английских значений, в словаре указаны для каждого слова также три специальных кодовых числа, используемых для управления работой машины. Для перевода были выбраны простейшие русские фразы, состоящие из тех слов, которые включены в словарь. Были разработаны также шесть синтаксических правил, обеспечивавших при помощи кодовых чисел правильный перевод. Пользуясь этими правилами и словарем, можно было переводить фразы такого, например, типа, как «величина угла определяется отношением длины дуги к радиусу». В табл. 2 приведены выбранные из словаря слова и части их, соответствующие этой фразе, с указанием их английских эквивалентов, управляющих кодов и применяемых правил.
      Формальное применение правил позволяет автоматически получить перевод : «magnitude of angle is determined by the relation of length of arc to radius».
      Для автоматического перевода словарь был сначала записан на перфокартах такого же типа, как применяемые в счетно-аналитических устройствах, а затем введен в машину и записан на магнитный барабан по тому же принципу, по которому производится запись на магнитную ленту в магнитофоне. Для управления машиной была разработана специальная программа, содержащая около 2400 команд. Программа также была введена в машину, после чего предложения, подлежащие переводу, пробивались на перфокартах и вводились в машину. Через некоторое время машина автоматически печатала на выводном устройстве перевод.
      Опыт фирмы «Интернейшнл Бизнес Мэшинз» вызвал огромный интерес во всем мире. Многочисленные отклики, опубликованные в общих и специальных журналах, говорили, однако, о том, что опыт, по-видимому, больше преследовал рекламные, чем научные цели и что рассчитывать на практические результаты в ближайшее время затруднительно. Большинство ученых сходилось на мнении, что в первую очередь необходимо разрабатывать вопросы, связанные с переводом научного и технического текста, и, в частности, составить специализированные словари для каждой отрасли техники.
      В статьях отмечались большие трудности, связанные с проблемой автоматического перевода. Указывалось, что программа, управляющая работой машины, чрезвычайно сложна: даже для перевода простейших фраз требуется программа, содержащая значительно больше команд, чем программа, необходимая для решения сложных математических задач. Многие ученые обращали внимание на объем словаря для автоматического перевода; указывали, например, что в современном немецком языке имеется около 400 ООО слов и что это предъявляет к объему словаря невыполнимые требования. С другой стороны, отмечалось, однако, что в 90% случаев из этого количества используются всего 5000 слов [3]. Объем словарей по специальной тематике оценивался для английского языка в 1000 слов общего назначения и в 1000 специальных терминов
      Таблица 3 Заданная для перевода русская фраза Перевод, выполненный машиной
      Качество угля определяется калорийностью Крахмал вырабатывается механическим путем из картофеля Обработка повышает качество нефти Динамит приготовляется химическим процессом из нитроглицерина с применением инертных соединений Международное понимание является важным фактором в решении политических вопросов The quality of coal is determined by calory content. Starch is produced by mechanical methods from potatoes. Processing improves the quality of crude oil. Dynamite is prepared by chemical process from nitroglycerine with admixture of inert compounds. International understanding constitutes an import factor in decision of political questions.
      [4]. Но, по мнению большинства ученых, словарь такого объема в настоящее время использовать еще невозможно, и поэтому пока нельзя приступить к переводу даже специальных научных книг, не говоря уже о литературных произведениях.
      Совершенно ясно, что перевод разговорной речи или художественного произведения представляет значительно большую трудность, чем перевод научного текста. Дело тут не только в словаре и даже не в специальных выражениях (так называемых идиомах), которые не могут быть переведены по обычным грамматическим правилам, а должны быть заменены эквивалентным по смыслу выражением на другом языке (например, английское приветствие «How do you do» и т. п.). Из дальнейшего изложения будет понятно, что такие идиомы без затруднения могут быть включены в словарь наравне с отдельными словами. Трудности возникают в связи с тем, что предложения из произведений художественной литературы иногда бывают очень тесно связаны с самой природой данного языка и уходят глубокими корнями в жизнь и быт народа. При переводе, сделанном с учетом этих обстоятельств, у читателя возникают мысли и ассоциации, более или менее адэкватные тем, которые имел в виду автор переводимого текста.
      Гоголь кончает повесть «Нос» таким образом: «...А однако же, при всем том, хотя, конечно, можно допустить и то, и другое, и третье, может даже... ну да и где ж не бывает несообразностей? — А все однако же, как поразмыслишь, во всем этом, право, есть что-то. Кто что ни говори, а подобные происшествия бывают на свете; редко, ; но бывают». В этих фразах нет ни одного слова, которое не имело бы эквивалента в английском языке. И можно без особых затруднений составить сочетания английских слов, каждое из которых будет соответствовать нужному русскому слову и которые будут находиться в соответствующих грамматических отношениях. Однако можно быть уверенным, что эти фразы при таком формальном переводе будут совершенно непонятны английскому читателю, и для того, чтобы передать содержание цитированного отрывка на английском языке, несомненно, придется сделать нечто совсем иное, — по существу, за ново написать английский текст, который передавал бы с большей или меньшей степенью приближения содержание слов Гоголя. Конечно, перевод такого рода при помощи машины является проблемой чрезвычайной сложности.
      По-видимому, использовать машины для автоматического перевода художественных произведений удастся] еще не скоро. Однако, кроме перевода художественной литературы, имеются и другие вопросы, требующие разрешения. Перед учеными всех стран стоит огромная задача ознакомления с научной литературой, написанной на других языках, и вот эту задачу, безусловно, можно надеяться разрешить при помощи автоматического перевода. Первые шаги в этом направлении сделаны, и можно ожидать серьезного прогресса в данной области уже в ближайшие годы.
     
      2. ТЕХНИКА ОБЫЧНОГО ПЕРЕВОДА
      Чтобы легче разобраться в том, как должен происходить автоматический перевод, рассмотрим подробнее, что делает переводчик при переводе обыкновенного научно-технического текста, текста средней трудности, не претендующего на художественность. При этом мы постараемся фиксировать очень мелкие детали процесса перевода, которые обычно проходят незамеченными.
      Предположим, что переводчик знаком в какой-то степени с языком, с которого переводит, — например, английским. Допустим, что он знает правила грамматики и помнит ряд «опорных» слов, т. е. таких, которые являются как бы вехами в предложении, позволяя быстро оценить его строение и определить, какие синтаксические функции несут в нем те или иныеслова. Такими «опорными» словами обычно служат местоимения, предлоги, глаголы и некоторые другие слова; переводчик должен помнить достаточное их количество для того, чтобы процесс перевода не шел слишком медленно.
      Перед тем как приступить к переводу, переводчик читает фразу и, пользуясь словами, которые он помнит, и некоторыми грамматическими правилами, определяет строение прочитанной фразы.
      Возьмем в качестве примера какой-либо научно-технический текст (рис. 2).
      Рассмотрим процесс перевода фразы.
      All these operations can be done almost automatically by punch-card machines. (2,1)
      Читая эту фразу, переводчик легко установит, что слова сап и be являются глаголами и входят в состав сказуемого. Переводя эти слова как «могут быть», переводчик
      далее легко определит подлежащее, которое, очевидно, состоит из слов All these operations.
      Предположим, что переводчику, который является инженером, уже немного забывшим английский язык, известны такие слова, как all, operations, automatically, machines (слово all ему известно из выражения «ол-райт», остальные слова понятны по аналогиям в русском языке). Тогда он может составить следующую схему переводимого предложения
      «Все these операции могут быть done almost автоматически by punch-card машины». (2,2)
      Используя еще слово by, переводчик преобразует именительный падеж «машины» в творительный — «машинами», опуская при этом само слово by. После этого начинаются поиски в словаре, так как мысленный «словарь», состоящий из слов, которые переводчик помнит, уже недостаточен. Слово almost очень простое; оно имеет только одно значение — «почти». Слово these также не представляет особых затруднений, так как в словаре после отсылки к this сразу находится нужное значение. У done значений очень много (рис. 3), в данном случае наиболее подходит значение глагола do. Если переводчик не силен в английском языке, то здесь ему придется плохо, потому что различные варианты перевода слова do занимают в словаре два полных столбца (рис. 4). Пользуясь уже определенной ранее структурой фразы, переводчик, по всей вероятности, выберет первое, правильное значение; но при этом очень много шансов, что он возьмет глагол «делать», а не «выполнять».
      Слов punch-card переводчик, как правило, в словаре не найдет и, если он не является специалистом по вычислительным машинам, будет мучительно думать о связи слов «дырявить», «карта» и «машина». После некоторого количества бесплодных раздумий он запишет перевод в таком виде:
      «Все эти операции могут быть сделаны почти автоматически punch-card машинами». (2, 3)
      Подумав еще немного и учитывая предыдущий текст, переводчик, наверное, сделает еще одно исправление и перепишет фразу так:
      «Все эти операции могут быть выполнены почти автоматически punch-card машинами», (2, 4)
      заменив значение глагола do и взяв то значение, которое по характеру текста больше соответствует русскому языку.
      KOHEЦ ФPAГMEHTA КНИГИ

 

 

 

От нас: 500 радиоспектаклей (и учебники)
на SD‑карте 64(128)GB —
 ГДЕ?..

Baшa помощь проекту:
занести копеечку —
 КУДА?..

 

На главную Тексты книг БК Аудиокниги БК Полит-инфо Советские учебники За страницами учебника Фото-Питер Техническая книга Радиоспектакли Детская библиотека


Борис Карлов 2001—3001 гг.