Site icon AppTractor

Новый Text-To-Speech движок в Wear OS

Сегодня Google выпустил новый движок Text-To-Speech (TTS), который отличается производительностью и надежностью. Функция преобразования текста в естественную речь на более чем 50 языках работает на основе технологии машинного обучения (ML) Google. Новый механизм преобразования текста в речь в Wear OS использует уменьшенные ML-модели, чтобы обеспечить более быстрый синтез прямо на устройствах Wear OS.

Варианты использования механизма преобразования текста в речь в Wear OS могут быть самыми разнообразными: сервисы доступности, подсказки для приложений для тренировок, навигационные подсказки, а также чтение вслух входящих оповещений через динамик часов или наушники, подключенные по Bluetooth. Механизм предназначен для коротких взаимодействий, поэтому его не стоит использовать для чтения вслух длинной статьи или содержания подкаста.

Как использовать TTS в Wear OS

Функция преобразования текста в речь уже давно поддерживается в Android. Новый TTS в Wear OS был настроен на производительность и надежность на устройствах с малым объемом памяти. Все API-интерфейсы Android остались прежними, поэтому разработчики используют тот же процесс для интеграции в приложения Wear OS. Например, TextToSpeech#speak можно использовать для произнесения определенного текста. Это доступно на устройствах, работающих под управлением Wear OS 4 и выше.

Когда пользователь впервые взаимодействует с TTS в Wear OS после загрузки устройства, механизм синтеза будет готов примерно через 10 секунд. Для особых случаев, когда разработчики хотят, чтобы часы заговорили сразу после открытия приложения или запуска опыта, можно использовать код для предварительного разогрева TTS-движка перед поступлением запросов на синтез.

Когда вы закончите использовать TTS, вы можете освободить движок, вызвав tts.shutdown() в методе onDestroy() вашей Активити. Эту команду также следует использовать при закрытии приложения, в котором используется TTS.

Языки и локали

По умолчанию Wear OS TTS включает 7 предварительно загруженных языков в образ системы: английский, испанский, французский, итальянский, немецкий, японский и мандаринский китайский. OEM-производители могут выбрать для предварительной загрузки другой набор языков. Проверить, какие языки доступны, можно с помощью TextToSpeech#getAvailableLanguages(). При настройке часов, если пользователь выбирает системный язык, который не входит в число предварительно загруженных голосовых файлов, часы автоматически загружают соответствующий голосовой файл при первом подключении к Wi-Fi во время зарядки часов.

Существуют ограниченные случаи, когда речевой вывод может отличаться от системного языка пользователя. Например, в сценарии, когда приложение для обеспечения безопасности использует TTS для вызова службы спасения, разработчики могут захотеть синтезировать речь на языке местности, в которой находится пользователь, а не на языке, на который настроены его часы. Чтобы синтезировать текст на языке, отличном от системных настроек, используйте TextToSpeech#setLanguage(java.util.Locale).

Заключение

Теперь ваши приложения для Wear OS могут разговаривать либо непосредственно через динамики часов, либо через наушники, подключенные по Bluetooth. Узнайте больше об использовании TTS здесь.

Exit mobile version