Все тонкости локализации сайта на иностранный язык

В этой статье мы хотели бы рассказать вам о тонкостях профессиональной локализации веб-сайтов на иностранный язык, с помощью каких сервисов вы можете построить данный процесс, что из себя представляют услуги MT и PEMT, обсудить плюсы и минусы различных движков машинного перевода, а также поделиться чек-листом, который позволит вам самостоятельно справиться с локализацией вашего проекта.
Чем локализация отличается от перевода
Начнем с того, в чем же заключается суть локализации веб-материалов, где целевой язык — иностранный. Стоит сразу оговориться: локализация — это не просто перевод с одного языка на другой. Это комплексная работа по адаптации контента под реалии, языковые нормы и традиции страны, чью аудиторию вы хотите привлечь. Для веб-сайта также важно корректно перевести все элементы интерфейса, чтобы пользователю было удобно ориентироваться на страницах.
Есть два пути выполнения локализации:
- Традиционный перевод, выполняемый командой исполнителей — профессиональных переводчиков, т. е., скажем так, «человеческий» перевод, когда носители языка обеспечивают соответствие языковым нормам и культурным особенностям;
- Машинный перевод (часто обозначаемый как MT — machine translation), который делается автоматически с применением искусственного интеллекта (AI), т. е. движков МТ. Это позволяет выполнять перевод быстро и в больших объемах, но может значительно терять в смысловой части, т. к. AI не способен учитывать контекст и реалии живого языка. При этом даже если вы выберете традиционный перевод людьми, машинный перевод может служить помощником переводчику, предоставляя перевод для базовых и распространенных формулировок.
Современные тенденции в локализации продуктов: PEMT
Чтобы повысить качество машинного перевода, компании прибегают к услуге PEMT (англ. Post-editing of machine translation — постредактирование машинного перевода). Не стоит путать эту задачу с редактированием, т.е. постредактирование — это и не перевод, и не редактирование, а работа с уже готовым результатом перевода, созданного движком МТ. Перевод уже выполнен машиной, но он еще не прошел проверку человеком, его следует довести до требуемого уровня качества.
Оригинал | Машинный перевод | Пост — редакция |
Providing World-Class Patient Care from Any Device, Anywhere | Обеспечение ухода за пациентами мирового класса с любого устройства и в любом месте | Обеспечение высочайшего качества ухода за пациентами |
Рис. (сокращение от слова рисунок) | Rice | Fig. |
Обычно в работу постредактора входит проверка терминологии (например, чтобы в тексте о майнинге биткойнов не появилось истории о горнодобывающем комплексе), «очеловечивание» текста (чтобы материал не был как будто написан роботом, хотя по сути так оно и есть), при этом постредактор не должен переписывать перевод полностью, а только довести его до грамотного и читабельного уровня.
К движкам МТ выдвигают довольно масштабные требования, чтобы такой тип перевода не был слишком дословным, механическим, построенным не по нормам языка перевода, поэтому критически важно постоянно обучать движки МТ распознавать и корректно интерпретировать даже сложный контент. Многие компании интегрировали PEMT в процесс локализации, однако проверка человеком остается актуальной для обеспечения желаемого качества перевода.
В компании AWATERA мы наиболее часто сталкиваемся с локализацией на такие языки, как английский, китайский, испанский, немецкий, французский, японский. Это те языки, которые локализуются в первую очередь, т.к. на них разговаривает большинство пользователей в мире. Конечно, английский язык можно считать языком № 1, и именно для него созданы большинство движков МТ и именно с ним AI справляется лучше всего.
Современные тенденции в локализации продуктов: CAT-инструменты и API-интерфейсы
Обычно инструменты автоматизации перевода именуются CAT-tools или CAT-инструменты (от англ. Computer-assisted translation — автоматизированный перевод). Наиболее популярными решениями для автоматизации перевода являются:
- Trados;
- Smartcat;
- MemoQ;
- Crowdin.
Если вы хотите локализовать свой веб-сайт самостоятельно, то благодаря различным CAT-tools вы сможете это сделать, но потребуется немного вникнуть в тонкости их работы: всех их объединяет возможность работы без установки дополнительного ПО, опция подключения различных движков МТ и технологии для организации потоковой работы над переводами на платформе, где заказчик предоставляет доступ к своему контенту, а переводческая компания выполняет перевод и сдает результат все в той же системе, что позволяет исключить пересылку материалов между сторонами и устранить излишние шаги в процессе работы.

Иногда компании выбирают несколько инструментов, и заказчику можно выбрать, с чем продолжать работу на постоянной основе.
Процесс локализации веб-сайта зачастую строится через API-интерфейсы — технологию автоматизации, благодаря которой этап перевода интегрируется с системами управления контентом, позволяя запускать переводческие проекты в один клик из системы клиента, получая перевод обратно в этой же системе. Это позволяет исключить времязатраты на пересылку материалов и их обновление, а также практически устраняет вероятность сбоев при размещении переведенного материала в структуру сайта. В 2017 году компания AWATERA разработала собственную Translation API, которая успешно показала себя в работе с клиентами и может гарантировать вам оперативность и высокое качество перевода веб-контента. Перевод по API оптимально подходит для многостраничных и многоязычных сайтов и приложений.
Тенденции в сфере автоматизации переводов
- Стремление к оптимизации затрат времени и ресурсов — машинный перевод в разы быстрее и в разы дешевле;
- Обеспечение обработки большого массива данных, желательно на постоянной основе — при непрерывной локализации (о ней расскажем в следующей статье) перевод можно выстроить с минимальным контролем, и поступающий контент будет проходить через MT и PEMT почти самостоятельно;
- Желание достичь такого уровня перевода, чтобы материал был максимально адаптирован под живой язык и чтобы простой читатель не заметил «искусственного» происхождения текста — движки МТ должны совершенствоваться и становиться все более узкоспециализированными, чтобы удовлетворять требованиям потребителей.

Движки машинного перевода
Движки МТ — это настраиваемая и пополняемая база переводов, на основе которой AI строит возможный перевод для нового переводимого материала. Можно сравнить это с памятью переводов, собранной со всего Интернета и обработанной искусственным интеллектом. Поэтому первыми реализовывать движки МТ стали поисковые системы: все мы знаем Google Translate и Яндекс Переводчик, которые, вопреки старым шуткам, сейчас стали гораздо умнее и перестали быть косноязычными. Затем подобные движки стали создавать уже целенаправленно для выполнения отраслевых переводов, поэтому туда попадали довольно качественно сформированные переводы. В последнее время на слуху стал такой движок как Deepl, который отлично справляется с локализацией контента на английский и немецкий языки (но, к сожалению, пока что далек от совершенства для китайского языка). Упомянем также и движки, популярные в других странах — Amazon Translate, Microsoft Translator, Baidu Translate API (особенно подходит для локализации на китайский язык). Также важно понимать, что не все движки МТ одинаково подходят для разных тематик: для технической документации, рекламных проектов или компьютерных игр нужно использовать разные решения. Конечно, нельзя не отметить, что использование машинного перевода сейчас набирает обороты, и хотя эра автоматизации лингвистических услуг уже наступила, мы все еще далеки от качественного общедоступного «гуглоперевода», поэтому наиболее оптимальным сценарием остаются профессиональные услуги лингвистических компаний.
Типы веб-сайтов и процесс локализации
В зависимости от того, какую цель вы ставите перед своим веб-сайтом, существует два сценария предоставления контента:
- Одностраничный веб-сайт, где вся необходимая информация представлена на одной странице в виде блоков и не требует от посетителя перехода в разделы и на новые страницы).
Многостраничный сайт — наиболее распространенный вариант, где на веб-сайте существуют кликабельные подразделы, например, «О нас», «Новости» или различная информация о товарах и услугах).
И если одностраничный веб-сайт достаточно разово локализовать, предоставив на единой странице всю ключевую информацию, то многостраничный сайт зачастую требует более тщательного подхода и постоянного обновления контента. В этом случае, естественно, хочется минимизировать трудо- и времязатраты на поддержание актуальности содержимого веб-портала и максимально автоматизировать и оптимизировать подобную работу.

Советы по построению процесса локализации
Мы рекомендуем обратить внимание на непрерывную локализацию как эффективный инструмент перевода многостраничных веб-сайтов.
Что же из себя представляет процесс непрерывной локализации? По сути, это работа в общем пространстве, на платформе, к которой подключены клиент (предоставляет контент), менеджеры (сотрудники, контролирующие поступление и передачу исходных и переведенных материалов между сторонами), переводчики (как непосредственно люди, так и подключенный МТ, чье качество может дополнительно проверяться постредакторами и отделом контроля качества), а также другие члены команды (копирайтеры, дизайнеры, тестировщики и т. д.). Таким образом обеспечивается оперативность, прозрачность и единообразие локализации с параллельным построением всех этапов работы.
Естественно, что перевод многостраничного веб-сайта с большим количеством контента — процесс трудоемкий. И здесь вы можете или обратиться в лингвистическую компанию, с чьей помощью вы сможете организовать непрерывную локализацию, или же выполнить это самостоятельно с помощью ряда сервисов. Для обеспечения непрерывной локализации компания AWATERA предоставляет комплексное ERP-решение для управления многоязычным корпоративным контентом. Данное решение автоматизирует процесс перевода, обеспечивает существенное повышение производительности труда и гарантирует высокое качество проделанной работы.
Если же вы выбираете сценарий выполнения локализации своими силами, то рекомендуем рассмотреть работу на вышеупомянутых платформах Trados, Smartcat и т. п., где вы можете выбрать подходящий вам движок МТ и где вам будет удобно работать.
Чек-лист для самостоятельного выполнения локализации веб-сайта
- Техническое задание на перевод
Чем подробнее, тем лучше! В ТЗ вы должны прописать все, что потребуется для перевода — сведения о целевой аудитории, требования для исполнителей (переводчиков, дизайнеров, разработчиков), а также информацию об ожидаемом контенте с учетом страны распространения материала. - Референсы
Это могут быть любые опорные материалы, которым вы доверяете, с которых следует брать пример или из которых можно почерпнуть что-то для вашего контента. Это и внутренние материалы о продукте вашей компании (так сказать, начинка для будущего веб-сайта), примеры других порталов, работающих в схожей с вами сфере, это инструкции для оформления сайта. - Обязательная проверка переведенного контента
Прежде чем выпускать веб-сайт для аудитории, вы должны проверить, соответствует ли переведенный текст вашим ожиданиям и все ли работает как надо. Для этого можно выполнить лингвистическое тестирование. Такую услугу предоставляет компания AWATERA. В рамках этого процесса тестировщик проверяет качество сборки сайта (нет ли «битых» ссылок и все ли кнопки сайта работают корректно) и его адаптированность для восприятия целевой аудитории.
После того как вы все проверили и остались довольны результатом, веб-сайт можно открывать для пользователей. Дальнейший сбор аналитики поможет вам получить информацию от посетителей и при необходимости обновить и скорректировать ваш контент.
Вы можете выполнить локализацию сайта самостоятельно по нашей инструкции, однако напоминаем, что машинный перевод требует обязательной проверки носителем языка. Вы можете обратиться в нашу компанию AWATERA для быстрого перевода вашего сайта, приложения или программы, и под ваш проект мы соберем опытную команду редакторов и переводчиков, которые быстро переведут ваш продукт с использованием новейших технологий, и проверят каждую букву и каждое предложение на соответствие культурным и речевым особенностям языка перевода.
За информацией по срокам и стоимости локализации вашего сайта вы можете обратиться в любой из наших офисов в Москве, либо в наш филиалы в США, ОАЭ, Казахстане или на Кипре любым удобным способом: по телефону, заполнив форму ниже, написав на почту, в WhatsApp или Telegram.