Терминологические базы для промышленных клиентов: создание и управление
Как создать и поддерживать корпоративную термбазу для технического перевода в нефтегазе, горнодобыче и энергетике — структура, инструменты, процессы и практика работы с промышленными заказчиками в Казахстане.

Руководитель отдела технической документации крупного горно-металлургического предприятия получает новый том проектной документации по расширению обогатительной фабрики. Том приходит от европейского поставщика на английском, к нему прикладываются спецификации на китайском и комментарии турецкого подрядчика. Внутри текста десятки раз встречаются термины вроде "ore dressing", "beneficiation", "middlings", "tailings pond" — и у каждого специалиста в компании своя версия перевода. В одном документе "хвостохранилище" превращается в "пруд хвостов", в другом "tailings" остаётся без перевода, в третьем появляется калька "тейлинговая система". Когда документ доходит до экспертизы в промышленной безопасности, расхождения приходится согласовывать вручную — это три недели переписки и риск срыва сроков ввода оборудования.
Корень проблемы — отсутствие централизованного управления терминологией. Именно здесь терминологическая база перестаёт быть кабинетным инструментом лингвистов и превращается в инфраструктуру, без которой промышленный холдинг с многоязычным документооборотом работать не может. В этой статье разберём, как устроена термбаза для промышленного клиента, какие данные в неё должны попадать, кто и как её поддерживает, и во что превращается перевод документации после того, как такая база начинает работать. Материал адресован руководителям отделов документации, менеджерам проектов в EPC-компаниях и закупщикам, которые отвечают за выбор долгосрочного поставщика переводческих услуг.
Что такое термбаза и чем она отличается от глоссария
Глоссарий — плоский список "термин на одном языке — термин на другом". Он обычно живёт в виде Excel-таблицы, которую кто-то когда-то составил для конкретного проекта, а потом она расходится по почте в десятках версий. Термбаза — структурированная база данных, где каждый термин описан по концепту, а не по слову. У концепта есть описание, контекст, источник, статус, категория, предпочтительный и недопустимый варианты, привязка к отрасли и подсистеме. Если в термбазе есть концепт "колонна фракционирования", к нему привязаны варианты на русском, английском, казахском, возможно китайском, указаны стандарты, где термин нормирован (API 571, ГОСТ, ISO), и примеры использования.
Разница становится критичной, когда объём растёт. Десятитысячная Excel-таблица превращается в хаос: строки дублируются, версии расходятся, никто не может сказать, какое написание актуально. База на платформе SDL MultiTerm, memoQ QTerm или Phrase TMS обрабатывает тот же объём без деградации, поддерживает роли редактора и рецензента, пишет историю изменений и интегрируется с CAT-инструментом так, что переводчик видит термин прямо в интерфейсе во время работы.
Международный стандарт ISO 17100:2015, который регулирует требования к процессу оказания переводческих услуг, прямо упоминает управление терминологией как часть ресурсного обеспечения поставщика. В Казахстане этот стандарт применяется переводческими компаниями, которые работают с промышленным B2B и проходят соответствующую сертификацию (Институт стандартизации по ISO 17100). Бюро технических переводов iText находится в процессе подготовки к сертификации ISO 17100, и термбазы по клиентам — одна из составляющих этой подготовки.
Почему термбаза нужна именно промышленным компаниям
В B2C-переводе цена ошибки в терминологии ограничена качеством документа: неудачное слово в рекламной брошюре — это потерянный клик, но не авария. В промышленном контексте всё иначе. Если в операционной процедуре НПЗ термин "emergency shutdown" в одной главе переводится как "аварийный останов", а в другой — как "экстренное выключение", оператор на смене может не найти нужный раздел в инструкции в критическую минуту. Если в технических условиях на поставку оборудования "pressure vessel" превращается то в "сосуд под давлением", то в "напорный сосуд" — это повод к претензии со стороны экспертизы промышленной безопасности по линии Комитета промышленной безопасности МЧС РК.
Промышленный клиент в Казахстане почти всегда работает с многоязычной документацией. Разработчик технологии приходит из Европы или Кореи, оборудование — из Китая, сервисная компания — из Турции, отчёты в регулятор идут на русском и казахском. Для проектов, которые реализуются по соглашениям о разделе продукции на Тенгизе и Кашагане, часть документации дублируется на английском, потому что в проектных командах работают подрядчики со всего мира. У горнодобывающих компаний уровня ERG — а по данным Eurasian Resources Group, в группе занято около 67 000 сотрудников, и её продукция поставляется более чем в 40 стран (ERG About) — документооборот между дивизионами в Казахстане, Африке и Европе ведётся параллельно в нескольких языковых парах. Без единой термбазы каждое направление выстраивает свой терминологический аппарат, и потом их сложно свести.
Есть и экономический аргумент. Практика показывает, что термбаза в связке с Translation Memory снижает повторяющиеся затраты на перевод: фрагменты, где термины уже согласованы и закреплены, проходят быстрее и требуют меньше времени на корректуру. Подробнее эту математику мы разбирали в материале о работе Translation Memory для повторяющейся документации.
Как мы строим термбазу для нового промышленного клиента
Работа начинается не с таблицы, а с разговора. На старте команда iText встречается с заказчиком и выясняет несколько вещей: какая отрасль, какие языковые пары, какие документы проходят через отдел документации, какие стандарты применяются, есть ли уже какие-то глоссарии в ходу, кто в компании считается внутренним экспертом по терминологии. Без этой беседы любая термбаза получится оторванной от реального документооборота.
После этого мы идём к самим документам. В первые две-три недели проекта анализируются уже переведённые материалы клиента — типовые контракты, операционные процедуры, спецификации оборудования, отчёты в регулятор. Из них извлекаются кандидаты в термины: слова и словосочетания, которые встречаются чаще определённого порога и относятся к отраслевой лексике. На этом этапе работает не только автоматика — хотя такие инструменты, как SDL MultiTerm Extract или встроенные экстракторы memoQ, существенно ускоряют процесс. Работает отраслевой переводчик, который отделяет общеязыковую лексику от технической.
Дальше идёт валидация. Найденные термины проходят через двух рецензентов: один — лингвистический редактор, второй — предметный эксперт со стороны клиента. Именно предметный эксперт принимает решение, как компания будет называть конкретную единицу оборудования или процесс. Без этого шага термбаза превращается в набор "как мне кажется правильно" от переводчика, а не в корпоративный стандарт.
Итог первого этапа — ядро термбазы на 1500–3000 концептов для типичной промышленной компании среднего размера. Это не финальная база — она будет расти вместе с документооборотом. Но этого ядра хватает, чтобы покрыть большую часть повторяющейся лексики в операционных документах.
Структура записи в термбазе: что должно быть у каждого концепта
Минимально необходимые поля для промышленного контекста:
- Концепт (идентификатор, не привязанный к конкретному языку)
- Термин на исходном языке (EN, CN, DE, FR, KR и т.д.)
- Термин на целевом языке (RU и/или KZ)
- Определение или описание
- Контекст применения (в каком типе документов термин встречается)
- Статус (одобрен, на согласовании, устарел, запрещён)
- Источник (ГОСТ, ISO, ST RK, внутренний стандарт компании)
- Отрасль и подсистема (нефтепереработка → ректификационная колонна)
- Запрещённые варианты (как НЕ надо переводить)
- Дата последней верификации и имя редактора
Поле "запрещённые варианты" часто оказывается самым полезным. Например, для одного нефтегазового клиента мы зафиксировали, что "well completion" переводится как "заканчивание скважины", а не "завершение скважины" — и внесли второй вариант в список запрещённых с пометкой о типичной ошибке. Это избавило команду от бесконечных корректур в каждом новом переводе.
Для казахского языка стоит отдельно отметить привязку к нормативной базе. Комитет технического регулирования и метрологии РК публикует терминологические стандарты ГОСТ Р и ST RK, и термины из них должны попадать в базу с прямой ссылкой на номер стандарта. Это особенно важно для документации, которая идёт в государственные органы или на сертификацию по техническим регламентам Таможенного союза (подробнее о таких переводах — в нашем материале о переводе технических регламентов ТР ТС).
Инструменты: на чём работать
Сегодня рынок предлагает несколько зрелых платформ для управления термбазами. Выбор зависит от того, какой CAT-инструмент уже стоит у переводческого поставщика и у самого клиента.
SDL MultiTerm — классика для команд, работающих в Trados Studio. Позволяет хранить многоязычные базы со сложной структурой концептов, поддерживает совместную работу через MultiTerm Server, экспортирует данные в XML и TBX. Основной недостаток — высокая цена лицензии и сложность интерфейса, особенно для предметных экспертов клиента, которые не хотят разбираться в специализированном ПО.
memoQ server с модулем QTerm — альтернатива для тех, кто работает в memoQ. Веб-интерфейс QTerm удобнее для экспертов клиента: редактор может зайти через браузер, посмотреть термин, утвердить вариант без установки локального клиента.
Phrase TMS (бывший Memsource) — облачная платформа, которая подходит компаниям, не желающим разворачивать серверную инфраструктуру у себя. Термбазы в Phrase интегрированы с переводческой средой и доступны через API, что удобно для клиентов с собственной системой управления документами.
Для небольших проектов до сих пор жизнеспособен Excel с чётко заданной структурой колонок — особенно если термбаза ведётся под импорт в один из CAT-инструментов. Но для серьёзного промышленного документооборота Excel перестаёт работать где-то после 2000–3000 концептов.
Процессы поддержки: кто и как добавляет новые термины
Термбаза — живой организм. Если её создали один раз и бросили, через полгода она устареет. Рабочий цикл поддержки обычно выглядит так.
При появлении нового документа для перевода менеджер проекта со стороны бюро проверяет, встречаются ли в нём термины, отсутствующие в базе. Такие кандидаты собираются в отдельный список в ходе перевода. В конце проекта лингвистический редактор обрабатывает список: удаляет ложные срабатывания, формулирует предварительный вариант перевода, фиксирует контекст и источник. Затем список уходит на согласование предметному эксперту клиента. После согласования термин получает статус "одобрен" и попадает в основную базу.
У долгосрочных клиентов этот процесс встроен в рамочное соглашение — регулярная встреча раз в месяц или квартал, где вместе проходят по накопившимся кандидатам. Подробнее о том, как устроены такие соглашения, мы писали в статье про рамочные соглашения на перевод для промышленных компаний.
Критический момент — версионирование. Когда термин в базе меняется (например, клиент решил перейти с одного варианта на другой), нужно пересмотреть Translation Memory и обновить переводы ключевых документов. Без этого база и реальные переводы расходятся, и тогда возникает парадокс: термин в справочнике утверждён, а в документах он другой. Именно поэтому в долгосрочных контрактах мы отдельно оговариваем процедуру массового обновления после изменений в термбазе.
Типичные ошибки при построении термбазы
За несколько лет работы с корпоративными термбазами накопился список повторяющихся промахов.
Первый — пытаться сразу охватить всё. Промышленный холдинг хочет термбазу на 15 000 концептов за месяц. Такая база, собранная в авральном режиме, окажется наполовину некорректной: никто не успеет её проверить. Правильнее начать с ядра на 1500–2500 концептов и расширять постепенно.
Второй — игнорировать предметных экспертов клиента. Термбаза, собранная только переводчиками, неизбежно будет расходиться с тем, как реально говорят в компании. Инженер с двадцатилетним стажем на ТЭЦ скажет "байпасная задвижка", а не "обходная задвижка", и лингвист об этом не догадается без его участия.
Третий — не фиксировать источник. Через год никто не помнит, откуда взялся конкретный вариант. Если рядом с термином нет ссылки на ГОСТ, ISO или внутренний стандарт, при спорах с экспертизой защищать его становится нечем.
Четвёртый — разделять базы по отраслям без общего ядра. У холдинга, где есть и нефтегаз, и горнодобыча, возникает соблазн вести две отдельные базы. Но значительная часть терминологии пересекается (HSE-процедуры, корпоративные политики, финансовые отчёты), и дублирование концептов в двух местах приводит к расхождениям. Удобнее строить базу с отраслевыми тегами внутри единой структуры.
Термбаза и сдача на сертификацию
Отдельный сюжет — использование термбазы при подготовке документов для сертификации. Когда компания готовит досье для EAC, ISO или проходит аудит на соответствие ТР ТС, терминологическая консистентность проверяется аудиторами буквально по ключевым определениям. Расхождение в переводе одного и того же термина в разных разделах досье приводит к запросам на доработку и к срыву сроков аудита. Выстроенная заранее термбаза с привязкой к нормативным документам снимает эту проблему: аудитор видит, что у компании есть централизованный источник терминологии, и вопросов к внутренней согласованности не возникает.
Это касается и документации для СТ-KZ — казахстанского сертификата происхождения, и документации для аудита по международным стандартам отчётности о минеральных ресурсах вроде JORC или NI 43-101, которую мы разбирали в материале про перевод отчётности по запасам.
Практический пример: эффект от внедрения термбазы
Среди наших долгосрочных клиентов — крупный промышленный холдинг, для которого мы за несколько лет создали термбазу на более чем 8000 концептов в трёх языковых парах (EN–RU, RU–KZ, CN–RU). Начинали с 1200 базовых терминов, постепенно наращивая охват за счёт ежемесячного цикла сбора новых кандидатов. Эффект, который клиент фиксирует у себя, — сокращение времени внутреннего согласования переводов и заметное уменьшение количества корректировок от внутренних рецензентов, потому что спорные терминологические решения теперь принимаются один раз, а не переоткрываются в каждом новом документе. Общая история нашей работы с крупным горно-металлургическим клиентом собрана в кейсе о партнёрстве с ERG.
С чего начать, если термбазы ещё нет
Если вы руководите отделом документации или отвечаете за перевод в промышленной компании, базовый план выглядит так:
Первое: собрать все существующие глоссарии, которые уже используются в разных подразделениях, даже если они в виде Excel-файлов на 200 строк.
Второе: выделить одного внутреннего эксперта по терминологии — обычно это инженер или руководитель технического отдела, который согласится выделять по 2–3 часа в месяц на проверку кандидатов.
Третье: обратиться к поставщику переводческих услуг, который работает с вашей отраслью и умеет строить термбазы — не в формате "раз в год прислали файл", а в формате живого процесса.
Четвёртое: зафиксировать в рамочном соглашении цикл поддержки базы — кто добавляет термины, кто согласует, с какой периодичностью.
Бюро технических переводов iText специализируется исключительно на промышленном B2B-переводе для нефтегаза, горнодобычи, энергетики и строительства в Казахстане. Мы строим и поддерживаем терминологические базы для долгосрочных корпоративных клиентов, интегрируя их с Translation Memory и процессами многоуровневой проверки качества. Если ваша компания выходит на масштаб, при котором хаос в терминологии начинает стоить реальных денег и сроков, напишите нам через страницу контактов или посмотрите подробнее про корпоративные решения в нашем руководстве по организации перевода для промышленного холдинга и на странице услуг iText.