Машинный перевод с постредактированием (MTPE) для промышленной технической документации: когда применять и как контролировать качество
Когда MTPE экономит бюджет, а когда подводит. Разбор стандарта ISO 18587, метрик качества и сценариев применения для нефтегаза, горнодобычи и EPC-проектов Казахстана.

Технический директор крупного казахстанского нефтесервисного оператора получил от китайского поставщика 1 800 страниц эксплуатационной документации к новой буровой установке. Сроки сжатые: установка уже на пути в Атырау, без переведённого пакета её не примут в эксплуатацию. Бюджет на классический полный перевод — несколько миллионов тенге, срок — минимум шесть недель. Решение нашлось в гибридной модели: машинный перевод с последующим полным постредактированием специалистом-нефтяником. Итог — четыре недели, минус 35% к бюджету, документация принята тендерным комитетом без замечаний.
Эта история повторяется в Казахстане всё чаще. Машинный перевод с постредактированием (MTPE, Machine Translation Post-Editing) перестал быть экспериментом и вошёл в рабочий арсенал промышленных компаний. Но MTPE — не универсальный инструмент: для одних типов документов он даёт реальную экономию, для других становится источником рисков, которые проявятся в самый неподходящий момент. Ниже разбираем, как бюро технических переводов iText в Павлодаре подходит к MTPE на проектах для нефтегаза, горнодобычи и EPC-подрядчиков, а также какие критерии помогают заказчику отличить разумную автоматизацию от опасной экономии.
Что такое MTPE и чем он отличается от обычного перевода
MTPE — это процесс, в котором текст сначала обрабатывается системой машинного перевода (DeepL, движки на базе LLM, специализированные нейронные движки), а затем редактируется квалифицированным переводчиком-отраслевиком. Международный стандарт ISO 18587:2017 формализует эту процедуру и описывает требования к процессу, компетенциям постредактора и системе контроля качества.
Стандарт различает два уровня постредактирования:
Light post-editing (лёгкое постредактирование) — задача минимальная: сделать текст понятным, исправить смысловые ошибки, опечатки, грубые искажения. Стилистика, единообразие терминологии, читаемость для русскоязычного инженера остаются на втором плане. Подходит для внутренних рабочих документов, переписки, чернового ознакомления с зарубежной нормативкой.
Full post-editing (полное постредактирование) — результат должен быть неотличим от перевода, выполненного с нуля профессиональным переводчиком. Применяется к документации, которая выходит за пределы компании: тендерные пакеты, эксплуатационные инструкции, контракты, материалы для регуляторов и аудиторов.
Промышленный заказчик в Казахстане в подавляющем большинстве случаев работает именно по модели full post-editing. Полное руководство по работе с корпоративными переводческими проектами мы разбираем в пилларной статье о корпоративном переводе для промышленного холдинга.
Когда MTPE действительно работает: пять типов документации
Машинные движки последнего поколения хорошо справляются с текстами, где есть стандартизованная терминология, повторяющиеся структуры и минимум культурного контекста. По нашему опыту, на промышленных проектах в Казахстане MTPE даёт ощутимую отдачу на следующих категориях:
Эксплуатационные руководства серийного оборудования. Насосы, компрессоры, КИПиА, частотные преобразователи, конвейерные системы. Каждая глава таких документов содержит обширные блоки повторяющегося синтаксиса. Если глоссарий настроен правильно, движок выдаёт черновик с точностью 80–85% уже на первом прогоне.
Каталоги запасных частей и спецификации. Огромный объём, низкая лингвистическая сложность, высокая повторяемость. Здесь MTPE экономит до половины бюджета по сравнению с классическим переводом.
Внутренняя проектная переписка и письма-уведомления. Внутри EPC-проектов между подрядчиком, заказчиком и субподрядчиками. Обычно эти тексты пишутся неносителями языка, в них нет идиом или культурных аллюзий, на которых движки спотыкаются.
Регламенты ТО и инструкции по обслуживанию. При наличии накопленной TM (translation memory) и отраслевой терминологической базы. Подробнее о роли TM в снижении стоимости мы рассказывали в материале о CAT-инструментах.
Многоязычные обновления к ранее переведённой документации. Когда поставщик присылает revision новой версии руководства, основная часть текста уже есть в TM. Машинный движок обрабатывает только новые сегменты, постредактор сверяет их с уже одобренным корпусом.
В наших проектах с ERG MTPE регулярно используется на каталогах запчастей для горно-шахтного оборудования и регламентах планового ТО — это позволяет команде ERG получать материалы быстрее без потери качества. Подробности — в кейсе многолетнего сотрудничества с Eurasian Resources Group.
Когда MTPE применять нельзя: красная зона
Есть документы, на которых машинный перевод с постредактированием не сэкономит, а добавит проблем. По нашему правилу в бюро технических переводов iText, в красную зону попадают:
Контракты и юридические соглашения. PSA, EPC, рамочные договоры, лицензионные соглашения, контракты на сервисное обслуживание скважин. Здесь каждое слово несёт юридическую нагрузку, движок не понимает приоритет терминов и часто переводит юридические клише дословно. Подробно про специфику контрактных переводов в нефтегазе мы писали в статье о переводе контрактов PSA для Тенгиза и Кашагана.
Документация HAZOP, OSRP, оценка рисков и любые HSE-материалы, связанные с безопасностью персонала. Цена ошибки в постредактуре — потенциальный инцидент. Об этом подробно — в материале о переводе процедур HSE для нефтедобывающих компаний.
Сертификационная документация для регуляторов. Технические регламенты ТР ТС, ISO 9001/14001/45001, паспорта безопасности SDS, обоснования безопасности — материалы, по которым принимаются решения о допуске продукции на рынок ЕАЭС. Аудитор не примет текст, в котором машинная стилистика просвечивает между строк.
Маркетинговые и презентационные материалы. Брошюры, презентации, годовые отчёты, материалы для инвестиционных комитетов. Машинный перевод не справляется с регистром, тоном и культурными нюансами — заказчику важна не только точность, но и убедительность.
Документы с китайского на русский (и наоборот) в нефтегазе и горнодобыче. Технические тексты на упрощённом китайском требуют от движка понимания контекста, которого он лишён. Терминология КНР отличается от международной, а количество ложных эквивалентов превышает все разумные пределы. Здесь только полный перевод с китайского специалистом-отраслевиком. Подробнее — в нашем разборе перевода контрактов с китайского для горнодобывающих проектов.
Метрики качества: как заказчику проверить результат MTPE
Промышленному заказчику в Казахстане редко достаточно отчёта «всё проверено, всё в порядке». На крупных проектах для оператора уровня КМГ, КАЗМИНЕРАЛС, КазМунайГаза или Самрук-Казыны требуется измеримое подтверждение качества. Бюро технических переводов iText опирается на три практические метрики.
Edit distance — доля сегментов, в которые постредактор внёс правки. Если показатель ниже 15%, значит, движок выдал хороший черновик и реальной работы было мало (нужно проверить, что постредактор действительно вычитал текст, а не пробежал глазами). Если выше 50% — гибридная модель не оправдала себя на этом тексте, дешевле было переводить с нуля.
LQA-балл по модели MQM (Multidimensional Quality Metrics). После выборки 10–15% объёма опытный лингвист-аудитор проставляет ошибки по категориям: терминология, грамматика, стилистика, accuracy. Целевой уровень для full post-editing — не более 5 баллов на 1000 слов по шкале MQM Premium.
Терминологическая консистентность. Проверка по корпоративной TB (term base) — каждый ключевой термин должен передаваться единообразно во всём документе. Для нефтегаза, например, это около 800–1500 единиц на средний проект. Расхождения отлавливаются автоматически QA-модулями SDL Trados, memoQ или Verifika.
Эти три метрики мы включаем в SLA с корпоративными клиентами. О том, как структурировать SLA для переводческих услуг, есть отдельная статья.
Как мы внедряем MTPE на проектах для промышленных клиентов
Алгоритм типового проекта в бюро технических переводов iText выглядит так.
Первый шаг — оценка пригодности материала. Менеджер проекта анализирует исходник: тип документа, объём, целевая аудитория, требования к стилю, наличие повторяющегося контента. Если в исходнике юридическая часть, HSE-секция или материал для регулятора, мы предлагаем заказчику исключить эти блоки из MTPE-пайплайна и переводить их классически.
Второй шаг — настройка движка и подготовка корпуса. Подключаем глоссарий клиента, накопленную TM, отраслевой словарь. Для нефтегаза у нас есть готовые TM объёмом более миллиона сегментов, для горнодобычи — порядка 800 тысяч сегментов. На этом этапе тонкая настройка определяет 60–70% итогового качества.
Третий шаг — машинный перевод с предварительной токенизацией. Движок выдаёт черновик, который автоматически проходит первичный QA: проверка чисел, единиц измерения, тегов разметки, незавершённых предложений.
Четвёртый шаг — full post-editing силами переводчика-отраслевика. Это профильный специалист с инженерным или химико-технологическим бэкграундом, имеющий опыт работы с документацией данной категории. Минимум — пять лет в технической переводческой среде, обязательное знание стандарта ISO 18587 и инструментов CAT.
Пятый шаг — двухуровневая проверка качества. Второй переводчик (reviewer) делает выборочную сверку 20% сегментов; QA-инженер прогоняет финальный файл через автоматизированные проверки. О нашей системе многоуровневой проверки мы подробно писали ранее.
Шестой шаг — отчёт о качестве. Заказчик получает не только переведённый файл, но и краткий отчёт: LQA-балл, edit distance, статистика ошибок по категориям, обновлённая TM. Это особенно важно для холдингов и EPC-подрядчиков, которые отчитываются перед головной компанией.
Языковые пары: где MTPE даёт максимум и где упирается в потолок
Качество машинного перевода в промышленных проектах напрямую зависит от языковой пары и от того, насколько богат корпус, на котором обучался движок.
Английский — русский. Самая отработанная пара. Любой коммерческий движок (DeepL, OpenAI-движки, специализированные нейронные модели) выдаёт черновик приемлемого уровня. Постредактор сосредотачивается на терминологии и стилистике, грубых ошибок мало. Для большинства промышленных заказчиков в Казахстане именно эта пара даёт максимальную экономию через MTPE.
Английский — казахский. Здесь корпуса заметно меньше, и качество базового вывода падает. На общетехнических текстах движки справляются, но узкоспециальная терминология (нефтегаз, металлургия) требует от постредактора заметно больше времени. Экономия меньше — обычно 15–20% против 30–35% на паре EN-RU.
Китайский — русский. Сложная пара даже для последних поколений движков. Проблема не только в самих языках, но и в том, что китайские технические документы пишутся в стилистике, далёкой от русской инженерной традиции: меняется логика построения абзаца, иначе расставляются акценты. MTPE применим только на простых эксплуатационных текстах, и то с оговорками. Подробнее о специфике мы разбираем в материале о переводе с китайского на казахский.
Турецкий — русский. Для EPC-подрядчиков из Турции (ENKA, Renaissance, Limak) пара рабочая, но требует постредактора с опытом строительной документации. Машинные движки часто путают термины по железобетону и сталеконструкциям. Базовый черновик пригоден, full post-editing обязателен. Связанный материал — перевод с турецкого языка для строительных компаний.
Европейские пары (немецкий, итальянский, французский) для нефтегазового и горнодобывающего оборудования — рабочие, но узкие. Объёмов мало, потому собственные TM ограничены, а отраслевые специалисты по этим парам в Казахстане редки. Экономика MTPE на таких заказах нестандартна и считается индивидуально.
Распространённые ошибки заказчика и как их избежать
По нашим наблюдениям, промышленные компании в Казахстане совершают на MTPE-проектах несколько типичных просчётов.
Отказ от глоссария. Самая частая ошибка. Заказчик передаёт исходник без терминологической базы и ожидает, что движок «сам разберётся». Результат — постредактору приходится вручную унифицировать терминологию по всему документу, и экономия от MTPE сводится к нулю.
Применение MTPE к смешанным документам. EPC-контракт с приложениями, где половина текста — техническое описание, половина — юридические условия. Машинный движок не различает эти секции и обрабатывает их одинаково. Правильное решение — разделить документ на части и применить разные модели обработки к разным секциям.
Ставка на бесплатные движки. DeepL Free, Google Translate без API-ключа, бесплатные веб-чаты с LLM. Для серьёзной промышленной документации это путь в никуда: нет конфиденциальности, нет интеграции с TM, нет настройки терминологии. Корпоративный заказчик в Казахстане обязан учитывать требования по защите коммерческой тайны и работать только с лицензионными корпоративными решениями. Подробнее об этой стороне вопроса — в материале про конфиденциальность и NDA при переводе.
Скрытое использование MTPE без согласования с заказчиком. Некоторые бюро берут заказ по ставке полного перевода, прогоняют его через бесплатный движок и сдают с минимальной правкой. Защита — прямо прописывать в договоре, какой именно процесс используется, и требовать отчёт по edit distance.
Игнорирование процесса обучения движка. После каждого крупного проекта корпоративная TM пополняется новыми сегментами, а движок дообучается на этом корпусе. Если этого не делать, качество MTPE через год-два падает: накапливаются неточности в новой терминологии, появляются разрывы между корпусом и реальными текстами.
Экономика MTPE: где реальная экономия
Заказчики часто слышат о «экономии до 60%» и ждут такого результата на любых проектах. На практике картина сложнее. По нашей статистике 2024–2025 годов на промышленных проектах в Казахстане:
на эксплуатационных руководствах серийного оборудования MTPE даёт реальную экономию 30–35% к бюджету полного перевода;
на каталогах запчастей и спецификациях с высокой повторяемостью — до 40–45%;
на технических регламентах и нормативных документах среднего объёма — около 20%;
на HSE, контрактах, сертификационных пакетах — нулевая или отрицательная экономия, проект быстрее и дешевле сделать классически.
Если поставщик переводческих услуг обещает 60% экономии на любой документации, это повод задать вопросы о методологии и контроле качества. Реальная экономия зависит от типа документа, языковой пары и качества корпоративной TM.
Что сделать заказчику перед запуском первого MTPE-проекта
Минимальный чек-лист подготовки выглядит так:
собрать глоссарий ключевых терминов (даже на 100–200 единиц — уже существенно лучше, чем без него);
выгрузить существующие переводы за последние два года для построения TM;
определить, какие категории документов в принципе нельзя пропускать через MTPE (см. красную зону выше);
согласовать с поставщиком метрики приёмки (edit distance, LQA-балл, терминологическая консистентность);
прописать в договоре уровень постредактирования (light vs full) и формат отчётов по качеству;
запросить у поставщика NDA с явным запретом на использование публичных бесплатных движков.
Этот чек-лист — основа разговора с любым бюро, которое предлагает MTPE-услуги. Если поставщик не готов обсуждать перечисленные пункты, есть смысл задуматься о выборе другого подрядчика.
Итог
Машинный перевод с постредактированием — не панацея и не угроза, а рабочий инструмент, у которого есть чёткая область применения. На стандартных эксплуатационных руководствах, каталогах запчастей и регламентах ТО гибридная модель экономит заказчику бюджет и сроки без потери качества. На контрактах, HSE-документации и сертификационных материалах она недопустима — здесь только полный перевод силами отраслевого специалиста.
Бюро технических переводов iText в Павлодаре работает с MTPE по стандарту ISO 18587 с 2022 года. У нас собственные движки для основных языковых пар (русский — английский, русский — китайский, русский — казахский), накопленные корпоративные TM по нефтегазу, горнодобыче, металлургии и EPC-проектам, а также команда переводчиков-отраслевиков с инженерным образованием. Команда iText поможет рассчитать ожидаемую экономию по вашему конкретному проекту, разработать пилотный пайплайн на ограниченном объёме (500–1000 страниц) и предоставит прозрачный отчёт по качеству. Свяжитесь с нами через страницу контактов для обсуждения. Подробнее об услугах для нефтегазового и горнодобывающего секторов — на страницах /services/oil-gas и /services/mining.