Электронный "мозг" - страница 6
Помимо английских значений, в словаре указывались для каждого слова и три специальных кода — числа. Их использовали для управления машиной. Были разработаны также шесть синтаксических правил, обеспечивавших грамотный перевод.
Машина переводила так, как это сделал бы человек, не знающий языка, когда он переводит с помощью словаря. Человек просто отыскивает равнозначимые слова, а потом правила их расстановки. Естественно, что такой перевод очень несовершенен, но в машине и он вызвал огромные трудности.
Первая состоит в том, что специальная программа для управления переводом содержала около 2500 кодов. Это намного больше, чем программа для решения самых сложных математических задач.
Другая трудность заключалась в большом словарном объеме современных языков. Так, в немецком языке имеется около 400 тысяч слов, из которых чаще всего используется всего 5000 слов. В английском языке можно ограничиться лишь тысячей слов общего назначения и тысячей специальных терминов.
Но даже и таким небольшим количеством слов, учитывая их грамматические формы, машине оперировать трудно. Поэтому советские ученые, проанализировав работы американских и английских коллег, отвергли путь чрезмерной связи программы перевода со словарем, так как это создавало искусственные ограничения для перевода.
Была разработана система анализа предложения, позволившая устанавливать значение входящих в него слов и определять их грамматические формы.
Система анализа английской фразы и синтеза русской оказалась практически независимой от словаря и дала возможность в конце 1955 года осуществить машинный перевод.
«Как же так? — спросит каждый, кто знаком с переводом. — Ведь английский язык очень далек от русского, у них совершенно разный грамматический строй. Может быть, переводили сугубо специальный текст?»
Допустим. Но и в специальном тексте иногда встречаются чрезвычайно сложные для перевода фразы.
Например, foolproof («защищенный от нежелательного воздействия») дословно переводится как «защищенный от дурака», а charlleyhorse («судорога в икре ноги») — как «лошадь, по имени Чарли».
Не только в английском языке наблюдаются подобные явления. Один инженер получил странный дословный перевод французской фразы Absorption comfortable des vibrations («комфортабельное поглощение колебаний»), а в действительности в технике фраза означает — «гашение колебаний, обеспечивающее комфортабельность езды». Dos des anes («возвышенные дорожные неровности») буквально переводится еще смешнее — «ослиные спины».
Как видите, трудности велики. А я еще не касался переводов художественной литературы и разговорной речи, обладающих неисчерпаемым многообразием оттенков и музыкальностью слова. Вспомните, для примера, окончание повести Н. В. Гоголя «Нос»:
«…А однако же, при всем том, хотя, конечно, можно допустить и то, и другое, и третье, может, даже… ну да и где же не бывает несообразностей? А все, однако же, как поразмыслишь, во всем этом, право, есть что-то. Кто что ни говори, а подобные происшествия бывают на свете, — редко, но бывают».
Под каждым словом этого отрывка можно подписать английские слова или их сочетания, но они не передадут англичанину всего своеобразия текста повести.
И все же машина переводит.
Идея машинного перевода существует давно. Еще в 30-х годах у нас в стране велась работа в этом направлении. Изобретатель П. П. Троянский в 1933 году создал механизированный словарь.
В 1950 году была предложена машина для перевода, которой помогали два человека: переводчик-подготовитель текста, и переводчик — редактор. Роль машины в таком переводе была незначительной, поэтому ее отвергли.
…Но вот мы в зале, где установлена быстродействующая электронная счетная машина. Научный сотрудник, принимавший участие в опытах машинного перевода, показывает мне по этапам, как с момента ввода английской фразы в машину весь процесс перевода происходит автоматически, без какого-либо вмешательства человека.
Сотрудник ставит в вводное устройство машины большую бобину.
— Здесь записан английский текст, — говорит он, выдергивая из бобины небольшой кусок узкой бумажной ленты, похожей на телеграфную. — Только вместо знаков на ней мелкие отверстия. На ленте отверстиями обозначены буквы, составляющие слова. Это код переводимого текста.