Новости
Google показал Translatotron для сквозного перевода речи
В Google поделились информацией о новой системе Translatotron, которая будет переводить голос с одного языка на другой с сохранением его звучания.
Традиционно в речевом переводе используется автоматическое распознавание голоса для преобразования речи в текст, к тексту применяется машинный перевод, а затем обратно используется перевод текста в речь для озвучивания перевода.
Translatotron представляет собой end-to-end модель. Исследователи считают, что Translatotron может выполнять переводы быстрее и с меньшими сложностями, чем традиционные каскадные модели.
«Насколько нам известно, Translatotron — это первая сквозная модель, которая может напрямую переводить речь с одного языка на другой. Он также может сохранять голос спикера в переведенной речи», — говорится в блоге.
Оценка BLEU для измерения качества машинного перевода показала, что экспериментальный Translatotron имеет более низкое качество, чем обычные каскадные системы, но Translatotron добился аккуратного перевода, чем базовые каскадные переводы.
Принципы работы Translatotron более подробно изложены в опубликованной статье «Прямой перевод речь-в-речь с последовательной моделью».
Когда Translatotron появится в приложениях пока не особщается.
-
Видео и подкасты для разработчиков1 месяц назад
Lua – идеальный встраиваемый язык
-
Новости1 месяц назад
Poolside, занимающийся ИИ-программированием, привлек $500 млн
-
Новости1 месяц назад
Видео и подкасты о мобильной разработке 2024.40
-
Новости1 месяц назад
Видео и подкасты о мобильной разработке 2024.41