Интернет: кое-что в помощь переводчику
Вообще же мысль о создании автоматических переводчиков зародилась у лю дей давно. И не только у фантастов. Выдающийся математик XIX века Чарльз Бэббидж пытался убедить британское правительство в необходимости финансировать его исследования по разработке “вычислительной машины”. В числе прочих благ он обещал, что когда-нибудь эта машина сможет автоматически переводить разговорную речь. Следует заметить, что хотя Бэббидж так и не построил свою машину и не выполнил обещания по поводу машинного перевода, он и сегодня считается признанным автором множества идей, лежащих в основе работы компьютера.
На практике работы по созданию компьютерных переводчиков начались в 50-х годах ХХ века, почти одновременно с появлением первых работоспособных электронных вычислительных машин. Тогда же возник и термин – “машинный перевод”. Кажущаяся простота задачи породила некоторую лингвистическую эйфорию. Было начато несколько глобальных проектов по созданию систем перевода для разных языков.
Что же требуется для построения системы машинного перевода?
Во-первых, совершенно очевидно, словарь. Чем он больше, тем лучше перевод. Значит, прежде всего необходимо решить задачу создания и хранения больших словарей для систем.
Во-вторых, система должна уметь правильно переводить устойчивые сочетания слов и идиоматические выражения. Следовательно, вторая проблема – научить систему распознавать устойчивые обороты.
В-третьих, предложение для перевода составляется по определенным правилам. По определенным же правилам оно и переводится. Значит, третья задача, стоящая перед разработчиками систем перевода, состоит в описании этих правил в виде программы.
Проблемы вполне понятны и являются основными при разработке систем машинного перевода, а вот методы их решения далеко не очевидны и отнюдь не так просты, как может показаться. Дело в том, что перевод текстов с одних естественных языков на другие – сложный творческий процесс. Он требует от переводчика не только лингвистической подготовки, но и хороших знаний тех предметных областей, к которым переводимые тексты относятся. С точки зрения психологии, грамотный перевод осуществляется человеком на основе восприятия и понимания исходного текста и последующей передачи его содержания средствами другого языка. При этом переводятся не столько слова и их последовательности, сколько понятия и мыслительные образы, порождаемые в сознании переводчика при чтении исходного текста.
Трудности в разработке новых систем и неудачи при реализации уже начатых проектов стали причиной того, что в 1967 году специально созданная комиссия Национальной академии наук США объявила машинный перевод неперспективным и не заслуживающим финансирования… От этого вердикта лингвисты оправились лишь в начале 80-х годов. Во многом оживление исследований было связано с развитием вычислительной техники вообще и с интересом к проблемам “искусственного интеллекта” как области применения компьютеров, в частности.
В 1990 году Ларри Чайлдс (Larry Childs), специалист по машинному переводу, предложил следующую классификацию систем машинного перевода по степени их “самостоятельности”:
FAMT (Fully-automated machine translation) – полностью автоматизированный машинный перевод;
HAMT (Human-assisted machine translation) – машинный перевод при участии человека;
MAHT (Machine-assisted human translation) – перевод, осуществляемый человеком с использованием компьютера.
В настоящее время наиболее распространен третий вариант построения машинного перевода. Это обычные электронные словари, которые обеспечивают перевод требуемого слова, возлагая на человека ответственность за выбор нужного варианта и смысл переведенного текста. Такие словари значительно облегчают процесс перевода, но требуют от пользователя определенного знания языка и затрат времени на его осуществление. И все же сам процесс перевода значительно ускоряется и облегчается.
В Интернете существует множество сайтов, предлагающих воспользоваться преимуществами электронных словарей. Сразу несколько таких словарей можно найти на сервере InfoArt. Тут, по адресу http://www.infoart.ru/misc/dict/index.htm, находятся три англо-русских и три русско-английских словаря компании ABBYY (http://www.bitsoft.ru/ ): словарь общей тематики (англо-русский словарь из 100 000 статей, русско-английский – из 70 000 статей), словарь по вычислительной технике
(50 000/35 000 статей) и словарь по экономике (50 000/35 000 статей). Работа с любым из них не требует абсолютно никаких усилий и специальных навыков. Достаточно ввести требуемое для перевода слово или часть слова в поле запроса и запустить процесс перевода. Программа автоматически выберет направление перевода (в зависимости от языка запроса) и выдаст ответ, который, помимо собственно переведенного слова, содержит несколько наиболее часто употребляемых словосочетаний и устойчивых выражений с переводимым словом. Экономический и компьютерный словари являются не только переводными, но и в определенной степени толковыми: ряд статей снабжены комментариями, для некоторых терминов приводятся синонимические ряды.
Можно также воспользоваться имеющейся тут же, на сайте InfoArt, сетевой версией электронного словаря “МультиЛекс 1.0” (http://www.infoart.ru/misc/dict/multilex/index.htm) компании “МедиаЛингва” (адрес домашней страницы компании –http://www.infoart.ru/misc/dict/multilex/index.htm). Он, как следует из описания, “включает знаменитый трехтомный словарь НБАРС под редакцией проф. Э. М. Медниковой и акад. Ю. Д. Апресяна (250 000 словарных входов, 2 300 000 английских и русских слов)”. Работа со словарем также не отличается особой сложностью. Достаточно ввести требуемое слово или словосочетание, чтобы получить перечень из нескольких десятков слов, по смыслу отвечающих введенному для перевода. Результаты представляются в виде столбца слов, расположенного в левой части экрана. При нажатии на соответствующий вариант перевода в правой части экрана дается пояснение термина. Так, например, при попытке перевести слово “перевод” среди прочих вариантов был выдан и такой – “Africanization”. Оказалось, что этот термин обозначает “перевод обучения и официальной переписки на местный африканский язык (вместо языка бывшей колониальной державы)”.
Тут хочется сделать отступление и заметить, что грамотно составить словарь и верно построить синонимический ряд – тоже большое искусство. Так, со специалистами всем известной компании Microsoft приключился казус при переводе словарей для редактора MS Word на испанский язык. Например, в словаре в качестве синонимов для прилагательного женского рода ansiosa, что означает “пылкая, жаждущая” были приведены испанские эквиваленты слов “нимфоманка, развратная, сексуально озабоченная”. Зато для того же слова мужского рода, ansioso, были подобраны другие синонимы: “страстно желающий, целеустремленный, усердный”. Эти и другие аналогии вызвали возмущение многих женщин.
Дело кончилось тем, что испанское правительство выступило с обвинениями американской компании в “женофобии” и “женоненавистничестве”. В результате специалисты Microsoft были вынуждены переработать словари и бесплатно снабдить ими всех желающих пользователей (или пользовательниц?)…
Но вернемся к электронным словарям. На том же сайте InfoArt есть англо-русский словарь медицинских аббревиатур (http://www.infoart.ru/misc/dict/med/index.htm ). Поскольку здесь отсутствует механизм поиска, то, строго говоря, это не электронный словарь, а просто страница, на которой собраны и отсортированы в алфавитном порядке англоязычные медицинские аббревиатуры. Но при переводе английских текстов по медицинской тематике такой словарь может стать неплохим подспорьем. Кстати, если приходится переводить английские тексты с кулинарным уклоном (рецепты заморских блюд, например), то неоценимую помощь окажет “Англо-русский кулинарный словарь” (http://isabase.philol.msu.ru/~jirik/cook.html). В нем собраны и расположены в алфавитном порядке 1217 слов и терминов, так или иначе связанных с приготовлением пищи. Системы запроса и поиска нет. Слова и их толкование на русском оформлены в виде таблицы.
По адресу http://isabase.philol.msu.ru/mu-online/ расположился еще один on-line англо-русский словарь, содержащий 56 тысяч словарных статей. Словарь как словарь, за исключением того, что желающие могут его скачать в локальной “офф-лайн” версии под UNIX.
Очень симпатичный и удобный англо-русский и русско-английский словарь представлен на сайте “Мегаэнциклопедия “Кирилл и Мефодий” (http://mega.km.ru/ALPHABYTE/index.asp). В результате перевода формируется ответ из нескольких слов, наиболее близких по значению к переводимому слову. Кроме того, на экран выводится целый ряд слов, связанных с заданным для перевода или имеющих близкое к нему написание (например, на запрос перевести слово “перевод” был сформирован список из “похожих” слов – “переводить”, “переводной”, “переводчик” и т. д.). То есть программа имитирует страницу обычного “бумажного” словаря.
Кроме того, в случае отсутствия у пользователя на клавиатуре русской раскладки, текст на русском можно вводить прямо при помощи мыши на виртуальной клавиатуре, появляющейся на экране по отдельному запросу. Система также помнит последние несколько заданных для перевода слов, что тоже удобно.
Ну а что же делать, если всего этого мало? Я думаю, что поиска по более чем 1500 словарям одновременно будет достаточно…
Сайт COMPLEXSYSTEMS (http://www.complexsystems.net:8101/forms/index.htm) предоставляет пользователям именно такую возможность. По крайней мере, так утверждают создатели сайта.
Подводя итог сказанному, можно сделать вывод о том, что электронные компьютерные словари по сути представляют собой своеобразные “модули расширения памяти”. Используя такой словарь, человек расширяет свой словарный запас (как, впрочем, и при использовании обычного словаря), но процесс перевода выполняет самостоятельно, полагаясь на собственное знание языка и понимание предметной области. Таким образом, электронный словарь значительно облегчает и ускоряет процесс перевода, освобождая от необходимости листать в поисках неизвестного слова толстенный том обычного “бумажного” словаря.
Обратимся теперь к системам машинного перевода, отвечающим, по вышеприведенной классификации, понятию HAMT-систем или систем машинного перевода при участии человека. Такие системы предусматривают возможность полнотекстового перевода с одного языка на другой при условии подготовки исходного текста и редактирования результата перевода человеком.
Наиболее известной в русскоязычной части Интернета программой такого типа является система “он-лайн” перевода петербургской компании “ПРОМТ” (http://www.promt. ru/ ).
Компания “ПРОМТ” выпустила свою первую систему машинного перевода еще в 1991 году. Она переводила с английского на русский специализированные тексты по программному обеспечению и использовала словарь объемом около 17 тысяч слов и выражений. Работала система в среде DOS и не имела средств настройки для пользователя.
Кстати сказать, разработка первых систем автоматического перевода началась в мире еще в 50-е. Так за 1956-65 годы правительство США истратило на разработку систем машинного перевода около $13 млн. Но особых результатов ученые тогда не добились. С тех пор многое изменилось…
Воспользоваться услугами современной системы-переводчика “ПРОМТ” в режиме “он-лайн” можно, зайдя на страницу по адресу .http://www.translate.ru/rus/ Здесь находятся системы перевода с русского на английский, немецкий и французский языки и обратно.
А также появился переводчик с итальянского на русский. На английской версии сайта (http://www.translate.ru/eng/) находятся англо-французский, французско-английский, англо-испанский, немецко-английский, немецко-французский и французско-немецкий “он-лайн” переводчики. Кстати, пакет программ-переводчиков для работы в Интернете “PROMT Internet” получил высокую оценку “PC Magazine/Russian Edition Editor’s Choice” и был признан “лучшим изделием 1999 года на российском рынке” в номинации “Прикладное ПО”.
Система очень проста в использовании и наглядна. Чтобы осуществить перевод, нужно ввести в поле запроса требуемый для перевода текст (вручную или вставить из буфера обмена командой “Вставить”), выбрать направление перевода и указать тип используемого словаря. В последнем случае предлагаются следующие темы: “Общая лексика”, “Автомобили”, ”Деловая корреспонденция”, “Компьютеры и Интернет”, “Разговорник”, “Путешествия”. Перевод, скажу по своему опыту, получается достаточно приличным. Например, попробовал я перевести на английский такую сентенцию (тема “Общая лексика”): “Система машинного перевода должна быть простой и наглядной в использовании. Наличие большого словаря является преимуществом”. Результатом стал такой вот перевод на английский: “The machine translation system should be simple and evident in use. Presence of the big dictionary is advantage.” Смысл, в общем-то, передается верно, и получившийся текст редактировать почти не надо. Обратный перевод той же фразы на русский язык был следующий: “Система машинного перевода должна быть проста и очевидна в использовании. Присутствие большого словаря – преимущество.” Почти что близко к тексту. К исходному. Хотя нюансы, конечно, теряются…
Приверженцы системы перевода “Сократ” компании “Арсеналъ” могут воспользоваться демо-версией этой программы-переводчика по адресу http://www.socrat.ru/online/online.asp . Так как система работает в режиме “демо”, то на нее наложены ограничения: длина текста, предназначенного к переводу, не должна превышать 100 символов, осуществляется перевод только на английский и с английского языка и только по одному предложению. Вообще же, профессиональная версия системы может работать с английским, немецким или французским языками.
Испытание системы двунаправленным переводом одной и той же фразы дало следующие результаты. Исходная фраза: “Система машинного перевода должна быть простой и наглядной в использовании. Наличие большого словаря является преимуществом.” Результат на английском: “System a machine translation must be an idle time and demonstrative in use. Presence of big dictionary is an advantage.” Обратный перевод на русский: “Система машинный перевод, должен быть простой и наглядным в использование. Присутствие большой словарь является преимуществом.” М-да, с русским что-то не то.
Смысл фразы, конечно, понять можно, но над согласованием окончаний стоит поработать. Да и английский несколько грубоват. Все-таки “should be” звучит по-английски несколько мягче и естественнее, нежели грубое приказное “must be”… Одним словом, трудозатраты на редактирование полученного текста в этом случае будут больше.
Наконец, третья, наиболее известная в России система машинного перевода – это программа “Stylus”. Ее можно найти в Интернете по адресу http://www.chat.ru/~stylus_plus/index1.html. Простой, даже аскетический интерфейс, отсутствие выбора темы словаря и… отсутствие работоспособности. По крайней мере, у меня ничего не получилось. Компьютер просто “подвис”.
Таким образом, реально можно говорить о двух системах он-лайн перевода, действующих в русскоязычной части Сети, –”ПРОМТ” и “Сократ”.
Западный мир тоже не стоит на месте.
В конце 60-х годов американские ученые пришли к выводу о бесперспективности продолжения работ по созданию систем машинного перевода. Многие крупные проекты были свернуты. Однако развитие вычислительной техники и разработка новых лингвистических и кибернетических алгоритмов построения программ-переводчиков позволили вновь вернуться к теме создания систем машинного перевода. По сообщениям прессы, в период с конца 70-х годов до середины 90-х годов в США на исследования в области машинного перевода истрачено более $20 млн, в Европе – свыше $70 млн, в Японии – $200 млн. Подстегивает интерес публики к таким программам и бурное развитие Интернета, который “перешагивает” границы государств, объединяя пользователей в единое информационное сообщество. Требуются программы-переводчики, способные самостоятельно, без участия человека грамотно переводить как тексты, так и целые сайты с одного языка на другой. Иными словами, возникает реальный спрос на FAMT–системы машинного перевода (в соответствии с вышеприведенной классификацией).
Попытка реализовать подобную систему предпринята разработчиками поисковой машины AltaVista. По адресу http://world.altavista.com/ расположена система он-лайн перевода, которая помимо перевода собственно текстов в состоянии осуществлять перевод Web-страниц, выводя результат с сохранением дизайна исходной страницы. Для этой цели используется работающее на 10-процессорном сервере Sun программное обеспечение фирмы Systran. Аппаратура расположена в Сан-Матео (штат Калифорния). Система работает с целым рядом европейских языков. Что же касается русского, то ситуация такая: перевод с русского есть, хотя и не совсем корректный, а вот на русский система не переводит. Вообще же следует заметить, что Systran – основная система, использующаяся в госструктурах США. Ядро ее входит в различные приложения, функционирующие во многих государственных организациях.
Собственный сайт компании Systran расположен по адресу http://www.systransoft.com . Тут можно воспользоваться системой “он-лайн” перевода с/на несколько европейских языков. Правда, исходным или выходным языком может быть только английский. Но если текст на английском все же можно, с горем пополам, перевести, то людей, читающих, скажем, на португальском, гораздо меньше. Так что, может, кому и пригодится такой перевод. Кстати, тут же можно бесплатно стать зарегистрированным пользователем системы (http://www.systranet.com/translate.html ) и получать переводы через электронную почту. Эта услуга удобна при необходимости перевода больших файлов или текстов.
Но вернемся все же к русскому языку. Зачастую удобнее перевод осуществлять прямо у себя на компьютере, не подключаясь к Интернету. В этом случае можно бесплатно обзавестись в Сети целым рядом программ-переводчиков и электронных словарей.
Прежде всего, на сайте компании “ПРОМТ” (http://www.promt.ru/rus1/index1.htm) есть возможность “скачать” пробную версию программы PROMT Internet. Она включает в себя модуль перевода в Microsoft Internet Explorer – WebTranSite 98 – удобный переводчик как в броузере, так и в большинстве приложений Windows; WebView – браузер с синхронным переводом Web-страниц. Это испытательная версия на 30 дней со дня инсталляции. От коммерческой версии ее отличает только ограниченное число запусков.
На сайте GY.com ( http://www.gy.com/www/ww1/ww2/trid1.htm) выложена программа Language Master 5.0. Данный продукт, как следует из описания, в состоянии работать с русским, украинским и английским языками. Одна из версий, доступных для “скачивания”, является демо-версией (три языка, но есть ограничения по составу словарей), другая – shareware-версией (работает только с русским и английским языками).
И, наконец, можно обзавестись англо-русским словарем на сайте ListSoft
(http://listsoft.ru/programs/pr2078.htm). Объем файла – 1640 K. Словарный запас – около 60 тыс. слов. Вот и все на этот раз. А нам с вами остается либо надеяться на то, что когда-нибудь системы машинного перевода достигнут такого уровня, что речь будет идти не о “качественном черновом машинном переводе” (термин, на сегодняшний день широко распространенный в США), а именно о “качественно выполненном переводе”, либо совершенствовать собственные познания в иностранных языках. Хотя, наверное, и в этом случае найдется работа для систем машинного перевода, ведь знать все языки не в состоянии никто.
Ильдар Кутыев