
Пару лет назад я заключил пари с приятелем на бутылку хорошего коньяка. Мы поспорили, что в ближайшие пять лет компьютеры не научатся переводить, как переводят люди. Я предложил простой критерий: взять несложный художественный текст и дать его перевести двум профессиональным переводчикам и машине. А потом дать трем людям определить, какой перевод делал компьютер.
С моей точки зрения, все трое легко его угадают.Остается еще три года, но я уверен, что выиграю пари. Что придает мне уверенности? Оппонент мне говорил: компьютерный перевод уже стал частью нашей реальности, мы пользуемся его плодами постоянно, зачастую смеемся над неуклюжими ошибками: к примеру, в меню в каком-нибудь восточном ресторане или в этикетке на китайском ширпотребе. Но это ведь первые, неуклюжие шаги, а скоро подключится сетевой интеллект. Компьютеры давно обыгрывают чемпиона-человека не только в шахматы, но и в игру го, в которой вариантов позиций, как говорят, больше, чем атомов во Вселенной. Неужели они не смогут перевести простенький рассказ или стишок?
Подобные ожидания - скоро машина заменит переводчика-человека - звучат с шестидесятых годов прошлого века. Но пока не заменила. Убедитесь сами, например, с помощью гугл-переводчика - пожалуй, самого распространенного и успешного в мире. Достаточно взять художественный текст и перевести его сначала на какой-нибудь далекий язык (не украинский и даже не английский), а потом получившийся результат перевести обратно. Будут ли смысловые потери?
Будут, да еще какие! Первую строфу "Бородина" Лермонтова я вбил в гугл-переводчик без разбивки на строки, чтобы они не считались отдельными предложениями.
После перевода на японский и обратно вышло: "Дядя, разве не бессмысленно, что сожженная Москва отдана французам? Ведь драка была, но, более того, России нечего вспоминать о Бородинском дне!" Прямо скажем, общий смысл изменился на прямо противоположный. С китайским вышло не лучше: "Дядя, скажите, пожалуйста, отдана ли Франция, уничтоженная пожаром, французам? Ведь драки бывают, да, мол, еще! Недаром вся Россия помнит дни Бородина!" И даже французский отчасти промахивается: "Скажите, дядя, не зря ли сожженная огнем Москва была отдана французам? Ведь были бои, да, мол, чего еще можно желать! Недаром вся Россия помнит время Бородина!".Любой русский читатель понимает, что "даром" в данном случае совсем не то же, что "бессмысленно" или "зря": речь идет об огромных жертвах, мол, не даром Москва французам досталась, не просто так ее уступили. И, конечно же, отсылка тут не ко времени жизни композитора Бородина, а к дате Бородинского сражения, которое считается славной страницей истории. Как это нечего о нем вспоминать?
Но чемпион по несуразности, пожалуй, понятная любому носителю русского языка скороговорка "косил косой косой косой". Что тут долго думать? Некий человек, страдающий косоглазием, а может быть, даже заяц из сказки, косил траву, притом коса у него оказалась не прямой, а скошенной. Зайцам, поди, так удобнее. Иначе понять это невозможно. Что выдаст Гугл на английском? "Mowed with oblique oblique" – он правильно распознал только глагол, а все три слова "косой" перевел совершенно одинаково, как прилагательное. Ну, а из путешествия в Китай эта скороговорка возвращается в виде единственного слова "наклонный".
Почему теперь так плохо? Да очень просто. Для начала, рабочий язык гугл-переводчика - английский. По сути дела, все остальные пары языков переводятся через его посредничество. Поэтому, кстати, переводы с этого языка или на него получаются лучше прочих. Переводя с русского на китайский и обратно, программа два раза прогоняет текст через английский и по дороге легко утрачивает, к примеру, различия между "ты" и "вы".
Но главное препятствие в том, что машина принципиально не понимает смысла. На данный момент она сравнивает огромные объемы текстов, переведенных людьми, и устанавливает стандартные соответствия. На первом этапе она, упрощенно говоря, определяет, что самый частый эквивалент для русского прилагательного "косой" – английское "oblique". Ну и еще в программу вкладывают информацию, что сочетание букв "косой" может быть формой от существительного "коса", а у него, посмотрит программа в своем массиве данных, есть разные значения.
Далее программа учится эти значения различать. Если рядом со словом "коса" стоят слова "сено, деревня, мужики", то значение одно. Если слова "девушка, прическа, гребень" - другое. А если "река, песок, отмель" - третье. И в большинстве случаев этой информации достаточно, чтобы выбрать правильное значение. Но только не в том, который я привел выше!
А впрочем, не только в нем. Любое человеческое высказывание опирается не только на непосредственный контекст (слова и предложения, которые стоят рядом), но и на контекст культурно-исторический, на наши общие представления об окружающем мире. Компьютер их лишен начисто, формализовать их, по крайней мере, с имеющимися технологиями практически невозможно.
Что будет происходить дальше? Скорее всего, компьютеры окончательно вытеснят людей в том, что касается перевода технических или медицинских инструкций. В конечном счете, все они сводятся к ограниченному количеству вариантов, как в шахматах, например: принимать лекарство по две таблетки один раз в день или по одной три раза, до или после еды, запивать водой или рассасывать.
Но вот уже с юридическими текстами возникнет проблема, потому что они описывают отношения между людьми, которые едва ли могут быть исчерпывающим образом описаны с помощью ряда стандартных формул. Как сможет компьютер находить лазейки в законе или добавлять на двадцатой странице договора примечание мелким шрифтом, которое меняет весь смысл документа? А юристам деньги платят именно за это. И уж совсем трудно ожидать, что он распознает сарказм в речи адвоката, сумеет правильно перевести риторический вопрос, отличив его от реального.
Что же касается художественного перевода… не будем обманываться: часть того, что называют сегодня худлитом (но только, умоляю вас, не "художественной литературой", это совсем иное), и переводится сегодня через машину, а потом слегка причесывается человеком-редактором. И может быть, это даже сгодится для чтения в вагоне метро или в очереди к зубному врачу. Но те компьютеры, с которыми мы имеем дело сегодня, никогда не создадут ничего сравнимого с "Гамлетом" в переводе Пастернака или с "Алисой в стране чудес" в переводе Заходера.
Вы, может быть, скажете, что на самом деле это не совсем переводы, а скорее оригинальные литературные произведения, которые были созданы на тот же сюжет и с использованием сходных образов и выражений на другом языке. И может быть, вы будете даже по-своему правы, но я на это возражу, что таким и должен быть хороший перевод.
Но об этом мы поговорим в другой раз - когда я допью свой честно выигранный коньяк!
Свежие комментарии