13 февраля 2023
580

Все тонкости локализации сайта на иностранный язык

В этой статье мы хотели бы рассказать вам о тонкостях профессиональной локализации веб-сайтов на иностранный язык, с помощью каких сервисов вы можете построить данный процесс, что из себя представляют услуги MT и PEMT, обсудить плюсы и минусы различных движков машинного перевода, а также поделиться чек-листом, который позволит вам самостоятельно справиться с локализацией вашего проекта. 

Чем локализация отличается от перевода 

Начнем с того, в чем же заключается суть локализации веб-материалов, где целевой язык — иностранный. Стоит сразу оговориться: локализация — это не просто перевод с одного языка на другой. Это комплексная работа по адаптации контента под реалии, языковые нормы и традиции страны, чью аудиторию вы хотите привлечь. Для веб-сайта также важно корректно перевести все элементы интерфейса, чтобы пользователю было удобно ориентироваться на страницах. 

Есть два пути выполнения локализации: 

  1. Традиционный перевод, выполняемый командой исполнителей — профессиональных переводчиков, т. е., скажем так, «человеческий» перевод, когда носители языка обеспечивают соответствие языковым нормам и культурным особенностям; 
  2. Машинный перевод (часто обозначаемый как MT — machine translation), который делается автоматически с применением искусственного интеллекта (AI), т. е. движков МТ. Это позволяет выполнять перевод быстро и в больших объемах, но может значительно терять в смысловой части, т. к. AI не способен учитывать контекст и реалии живого языка. При этом даже если вы выберете традиционный перевод людьми, машинный перевод может служить помощником переводчику, предоставляя перевод для базовых и распространенных формулировок.

Современные тенденции в локализации продуктов: PEMT 

Чтобы повысить качество машинного перевода, компании прибегают к услуге PEMT (англ. Post-editing of machine translation — постредактирование машинного перевода). Не стоит путать эту задачу с редактированием, т.е. постредактирование — это и не перевод, и не редактирование, а работа с уже готовым результатом перевода, созданного движком МТ. Перевод уже выполнен машиной, но он еще не прошел проверку человеком, его следует довести до требуемого уровня качества. 

ОригиналМашинный переводПост — редакция
Providing World-Class Patient Care from Any Device, AnywhereОбеспечение ухода за пациентами мирового класса с любого устройства и в любом месте Обеспечение высочайшего качества ухода за пациентами мирового класса с любого устройства и в любом месте
Рис. (сокращение от слова рисунок) Rice Fig. 

Обычно в работу постредактора входит проверка терминологии (например, чтобы в тексте о майнинге биткойнов не появилось истории о горнодобывающем комплексе), «очеловечивание» текста (чтобы материал не был как будто написан роботом, хотя по сути так оно и есть), при этом постредактор не должен переписывать перевод полностью, а только довести его до грамотного и читабельного уровня. 

К движкам МТ выдвигают довольно масштабные требования, чтобы такой тип перевода не был слишком дословным, механическим, построенным не по нормам языка перевода, поэтому критически важно постоянно обучать движки МТ распознавать и корректно интерпретировать даже сложный контент. Многие компании интегрировали PEMT в процесс локализации, однако проверка человеком остается актуальной для обеспечения желаемого качества перевода. 

В компании AWATERA мы наиболее часто сталкиваемся с локализацией на такие языки, как английский, китайский, испанский, немецкий, французский, японский. Это те языки, которые локализуются в первую очередь, т.к. на них разговаривает большинство пользователей в мире. Конечно, английский язык можно считать языком № 1, и именно для него созданы большинство движков МТ и именно с ним AI справляется лучше всего. 

Современные тенденции в локализации продуктов: CAT-инструменты и API-интерфейсы 

Обычно инструменты автоматизации перевода именуются CAT-tools или CAT-инструменты (от англ. Computer-assisted translation — автоматизированный перевод). Наиболее популярными решениями для автоматизации перевода являются: 

Если вы хотите локализовать свой веб-сайт самостоятельно, то благодаря различным CAT-tools вы сможете это сделать, но потребуется немного вникнуть в тонкости их работы: всех их объединяет возможность работы без установки дополнительного ПО, опция подключения различных движков МТ и технологии для организации потоковой работы над переводами на платформе, где заказчик предоставляет доступ к своему контенту, а переводческая компания выполняет перевод и сдает результат все в той же системе, что позволяет исключить пересылку материалов между сторонами и устранить излишние шаги в процессе работы.

Иногда компании выбирают несколько инструментов, и заказчику можно выбрать, с чем продолжать работу на постоянной основе. 

Процесс локализации веб-сайта зачастую строится через API-интерфейсы — технологию автоматизации, благодаря которой этап перевода интегрируется с системами управления контентом, позволяя запускать переводческие проекты в один клик из системы клиента, получая перевод обратно в этой же системе. Это позволяет исключить времязатраты на пересылку материалов и их обновление, а также практически устраняет вероятность сбоев при размещении переведенного материала в структуру сайта. В 2017 году компания AWATERA разработала собственную Translation API, которая успешно показала себя в работе с клиентами и может гарантировать вам оперативность и высокое качество перевода веб-контента. Перевод по API оптимально подходит для многостраничных и многоязычных сайтов и приложений. 

Тенденции в сфере автоматизации переводов 

Движки машинного перевода 

Движки МТ — это настраиваемая и пополняемая база переводов, на основе которой AI строит возможный перевод для нового переводимого материала. Можно сравнить это с памятью переводов, собранной со всего Интернета и обработанной искусственным интеллектом. Поэтому первыми реализовывать движки МТ стали поисковые системы: все мы знаем Google Translate и Яндекс Переводчик, которые, вопреки старым шуткам, сейчас стали гораздо умнее и перестали быть косноязычными. Затем подобные движки стали создавать уже целенаправленно для выполнения отраслевых переводов, поэтому туда попадали довольно качественно сформированные переводы. В последнее время на слуху стал такой движок как Deepl, который отлично справляется с локализацией контента на английский и немецкий языки (но, к сожалению, пока что далек от совершенства для китайского языка). Упомянем также и движки, популярные в других странах — Amazon Translate, Microsoft Translator, Baidu Translate API (особенно подходит для локализации на китайский язык). Также важно понимать, что не все движки МТ одинаково подходят для разных тематик: для технической документации, рекламных проектов или компьютерных игр нужно использовать разные решения. Конечно, нельзя не отметить, что использование машинного перевода сейчас набирает обороты, и хотя эра автоматизации лингвистических услуг уже наступила, мы все еще далеки от качественного общедоступного «гуглоперевода», поэтому наиболее оптимальным сценарием остаются профессиональные услуги лингвистических компаний. 

Типы веб-сайтов и процесс локализации 

В зависимости от того, какую цель вы ставите перед своим веб-сайтом, существует два сценария предоставления контента: 

  1. Одностраничный веб-сайт, где вся необходимая информация представлена на одной странице в виде блоков и не требует от посетителя перехода в разделы и на новые страницы). 

Многостраничный сайт — наиболее распространенный вариант, где на веб-сайте существуют кликабельные подразделы, например, «О нас», «Новости» или различная информация о товарах и услугах). 

И если одностраничный веб-сайт достаточно разово локализовать, предоставив на единой странице всю ключевую информацию, то многостраничный сайт зачастую требует более тщательного подхода и постоянного обновления контента. В этом случае, естественно, хочется минимизировать трудо- и времязатраты на поддержание актуальности содержимого веб-портала и максимально автоматизировать и оптимизировать подобную работу. 

Советы по построению процесса локализации 

Мы рекомендуем обратить внимание на непрерывную локализацию как эффективный инструмент перевода многостраничных веб-сайтов. 

Что же из себя представляет процесс непрерывной локализации? По сути, это работа в общем пространстве, на платформе, к которой подключены клиент (предоставляет контент), менеджеры (сотрудники, контролирующие поступление и передачу исходных и переведенных материалов между сторонами), переводчики (как непосредственно люди, так и подключенный МТ, чье качество может дополнительно проверяться постредакторами и отделом контроля качества), а также другие члены команды (копирайтеры, дизайнеры, тестировщики и т. д.). Таким образом обеспечивается оперативность, прозрачность и единообразие локализации с параллельным построением всех этапов работы. 

Естественно, что перевод многостраничного веб-сайта с большим количеством контента — процесс трудоемкий. И здесь вы можете или обратиться в лингвистическую компанию, с чьей помощью вы сможете организовать непрерывную локализацию, или же выполнить это самостоятельно с помощью ряда сервисов. Для обеспечения непрерывной локализации компания AWATERA предоставляет комплексное ERP-решение для управления многоязычным корпоративным контентом. Данное решение автоматизирует процесс перевода, обеспечивает существенное повышение производительности труда и гарантирует высокое качество проделанной работы. 

Если же вы выбираете сценарий выполнения локализации своими силами, то рекомендуем рассмотреть работу на вышеупомянутых платформах Trados, Smartcat и т. п., где вы можете выбрать подходящий вам движок МТ и где вам будет удобно работать. 

Чек-лист для самостоятельного выполнения локализации веб-сайта 

  1. Техническое задание на перевод
    Чем подробнее, тем лучше! В ТЗ вы должны прописать все, что потребуется для перевода — сведения о целевой аудитории, требования для исполнителей (переводчиков, дизайнеров, разработчиков), а также информацию об ожидаемом контенте с учетом страны распространения материала. 
  2. Референсы
    Это могут быть любые опорные материалы, которым вы доверяете, с которых следует брать пример или из которых можно почерпнуть что-то для вашего контента. Это и внутренние материалы о продукте вашей компании (так сказать, начинка для будущего веб-сайта), примеры других порталов, работающих в схожей с вами сфере, это инструкции для оформления сайта. 
  3. Обязательная проверка переведенного контента 

Прежде чем выпускать веб-сайт для аудитории, вы должны проверить, соответствует ли переведенный текст вашим ожиданиям и все ли работает как надо. Для этого можно выполнить лингвистическое тестирование. Такую услугу предоставляет компания AWATERA. В рамках этого процесса тестировщик проверяет качество сборки сайта (нет ли «битых» ссылок и все ли кнопки сайта работают корректно) и его адаптированность для восприятия целевой аудитории. 

После того как вы все проверили и остались довольны результатом, веб-сайт можно открывать для пользователей. Дальнейший сбор аналитики поможет вам получить информацию от посетителей и при необходимости обновить и скорректировать ваш контент. 

Вы можете выполнить локализацию сайта самостоятельно по нашей инструкции, однако напоминаем, что машинный перевод требует обязательной проверки носителем языка. Вы можете обратиться в нашу компанию AWATERA для быстрого перевода вашего сайта, приложения или программы, и под ваш проект мы соберем опытную команду редакторов и переводчиков, которые быстро переведут ваш продукт с использованием новейших технологий, и проверят каждую букву и каждое предложение на соответствие культурным и речевым особенностям языка перевода.

За информацией по срокам и стоимости локализации вашего сайта вы можете обратиться в любой из наших офисов в Москве, либо в наш филиалы в США, ОАЭ, Казахстане или на Кипре любым удобным способом: по телефону, заполнив форму ниже, написав на почту, в WhatsApp или Telegram.

Поделиться