Новости
Google показал Translatotron для сквозного перевода речи
В Google поделились информацией о новой системе Translatotron, которая будет переводить голос с одного языка на другой с сохранением его звучания.
Традиционно в речевом переводе используется автоматическое распознавание голоса для преобразования речи в текст, к тексту применяется машинный перевод, а затем обратно используется перевод текста в речь для озвучивания перевода.
Translatotron представляет собой end-to-end модель. Исследователи считают, что Translatotron может выполнять переводы быстрее и с меньшими сложностями, чем традиционные каскадные модели.
«Насколько нам известно, Translatotron — это первая сквозная модель, которая может напрямую переводить речь с одного языка на другой. Он также может сохранять голос спикера в переведенной речи», — говорится в блоге.
Оценка BLEU для измерения качества машинного перевода показала, что экспериментальный Translatotron имеет более низкое качество, чем обычные каскадные системы, но Translatotron добился аккуратного перевода, чем базовые каскадные переводы.
Принципы работы Translatotron более подробно изложены в опубликованной статье «Прямой перевод речь-в-речь с последовательной моделью».
Когда Translatotron появится в приложениях пока не особщается.
-
Аналитика магазинов4 недели назад
Мобильный рынок Ближнего Востока: исследование Bidease и Sensor Tower выявляет драйверы роста
-
Видео и подкасты для разработчиков3 недели назад
Разбор кода: iOS-приложение для управления личными финансами на Swift. Часть 1
-
Новости3 недели назад
Видео и подкасты о мобильной разработке 2025.47
-
Разработка4 недели назад
100 уроков о том, как я довёл своё приложение до продажи за семизначную сумму

