GitHub
Live Transcribe Speech Engine: перевод речи в текст
Google открыл движок распознавания речи Live Transcribe — Live Transcribe Speech Engine. Исходный код теперь доступен на GitHub.
Google выпустил Live Transcribe еще в феврале. Приложение использует алгоритмы машинного обучения для превращения речи в текст в реальном времени. В отличие от будущей функции Android Live Caption, Live Transcribe работает в полноэкранном режиме, использует микрофон смартфона (или внешний микрофон) и использует Google Cloud Speech API.
Live Transcribe может записывать произнесенные слова в режиме реального времени на более чем 70 языках и диалектах. Вы также можете использовать его и для проговаривания введенного текста, Live Transcribe является универсальным инструментом коммуникации. Другое основное отличие — Live Transcribe уже может работать на 1.8 миллиарде Android-устройств (Live Caption появится позже в этом году и будет работать только на некоторых устройствах с Android Q).
Live Transcribe Speech Engine упрощает работу с Cloud Speech API — поддерживает бесконечную передачу данных в облако, справляется с потерями данных и паузами, работает с несколькими кодеками, уже содержит библиотеку форматирования текста и расширение для оффлайновой работы.
-
Аналитика магазинов3 недели назад
Мобильный рынок Ближнего Востока: исследование Bidease и Sensor Tower выявляет драйверы роста
-
Видео и подкасты для разработчиков3 недели назад
Разбор кода: iOS-приложение для управления личными финансами на Swift. Часть 1
-
Новости3 недели назад
Видео и подкасты о мобильной разработке 2025.47
-
Разработка4 недели назад
100 уроков о том, как я довёл своё приложение до продажи за семизначную сумму

