Новости
Google показал Translatotron для сквозного перевода речи
В Google поделились информацией о новой системе Translatotron, которая будет переводить голос с одного языка на другой с сохранением его звучания.
Традиционно в речевом переводе используется автоматическое распознавание голоса для преобразования речи в текст, к тексту применяется машинный перевод, а затем обратно используется перевод текста в речь для озвучивания перевода.
Translatotron представляет собой end-to-end модель. Исследователи считают, что Translatotron может выполнять переводы быстрее и с меньшими сложностями, чем традиционные каскадные модели.
«Насколько нам известно, Translatotron — это первая сквозная модель, которая может напрямую переводить речь с одного языка на другой. Он также может сохранять голос спикера в переведенной речи», — говорится в блоге.
Оценка BLEU для измерения качества машинного перевода показала, что экспериментальный Translatotron имеет более низкое качество, чем обычные каскадные системы, но Translatotron добился аккуратного перевода, чем базовые каскадные переводы.
Принципы работы Translatotron более подробно изложены в опубликованной статье «Прямой перевод речь-в-речь с последовательной моделью».
Когда Translatotron появится в приложениях пока не особщается.
-
Автоматическое тестирование приложений1 месяц назад
Краш-курс по автоматизации тестирования
-
Разработка4 недели назад
Почему Ollie перешел от SwiftUI к UIKit
-
Медиа3 недели назад
Hilt в многомодульный проект — пособие по внедрению зависимостей для новичков
-
Приложения1 месяц назад
Fantasy Hike — фитнес-трекер по мотивам «Властелина колец»