Tencent открыла код двух высокопроизводительных моделей перевода

AppTractor

11 месяцев назад

Китайский технологический гигант Tencent открыл исходный код двух специализированных моделей перевода, заявив, что они превосходят известные инструменты, такие как Google Translate, в международных бенчмарках.

На WMT2025, крупном семинаре, где исследовательские группы сравнивают системы перевода, новые модели Tencent Hunyuan MT 7B и Hunyuan MT Chimera 7B заняли первые места в 30 из 31 протестированных языковых пар. Семинар по машинному переводу (WMT) — одно из ведущих мероприятий по оценке моделей перевода.

Обе модели поддерживают двусторонний перевод на 33 языка, включая такие широко распространённые, как китайский, английский и японский, а также менее распространённые в цифровом формате языки, как чешский, маратхи, эстонский и исландский. Tencent заявляет, что основное внимание уделяется переводу между мандаринским диалектом китайского языка и языками национальных меньшинств в Китае. Модели могут переводить в обоих направлениях между китайским и казахским, уйгурским, монгольским и тибетским языками.

Технический отчёт Tencent показывает, что модели Hunyuan превосходят существующие системы в прямых сравнениях. По сравнению с Google Translate результаты улучшились на 15–65% в зависимости от направления перевода и критериев оценки. Фирменные системы искусственного интеллекта, такие как GPT-4.1, Claude 4 Sonnet и Gemini 2.5 Pro, также не оправдали ожиданий в большинстве тестов.

Обладая 7 миллиардами параметров, эти модели значительно компактнее многих базовых моделей в своём классе, поэтому требуют меньше вычислительной мощности и могут работать на более слабом оборудовании. Тесты показывают, что они по-прежнему не уступают или даже превосходят более крупные системы по производительности. В частности, они превосходят серию Tower Plus (до 72 миллиардов параметров) на 10–58%.

В прямых сравнительных тестах с ключевыми языковыми парами обе модели Hunyuan показали явный прирост. По сравнению с Gemini 2.5 Pro они показали примерно на 4,7% более высокий результат. При тестировании со специализированными моделями перевода улучшения составили от 55 до 110%.

Модели доступны с открытым исходным кодом на Hugging Face, кроме того Tencent опубликовала исходный код на GitHub.