Connect with us

Приложения

Gemini 3.5 Live Translate обеспечивает голосовой перевод в реальном времени

В отличие от систем пошаговых переводчиков, которые «ждут, пока говорящий закончит говорить, прежде чем ответить», эта модель генерирует речь непрерывно.

Опубликовано

/

     
     

Сегодня Google анонсировала Gemini 3.5 Live Translate — свою новейшую модель для перевода речи в реальном времени. Эта модель способна распознавать более 70 языков и генерировать «плавный, естественный перевод речи», сохраняя интонацию, темп и высоту тона.

В отличие от систем пошаговых переводчиков, которые «ждут, пока говорящий закончит говорить, прежде чем ответить», эта модель генерирует речь непрерывно. Это обеспечивает «плавное звучание без неловких пауз и отставание от говорящего всего на несколько секунд на протяжении всего сеанса».

Gemini 3.5 Live Translate уже доступен в Google Translate для Android и iOS. Нажмите «Live translate» в левом нижнем углу, надев наушники.

В Android-приложении также появился новый «режим прослушивания» (listening mode), позволяющий слышать перевод через динамик телефона, если у вас нет наушников под рукой. Вы можете «просто поднести телефон к уху, как при обычном звонке».

Gemini 3.5 Live Translate также появится в Google Meet. Ранее функция перевода речи в приложении для видеозвонков поддерживала только пять языков. Поддержка более 70 языков открывает «более 2000 языковых комбинаций в одной встрече, расширяя возможности по сравнению с предыдущим вариантом, когда перевод осуществлялся только с английского на английский и обратно». В веб-версии появилась новая кнопка в ряду элементов управления для немедленного запуска перевода речи.

В этом месяце функция запускается в «закрытом предварительном просмотре для избранных корпоративных клиентов Google Workspace». Более широкое распространение ожидается позже в этом году.

Gemini 3.5 Live Translate также доступен в публичном предварительном просмотре для разработчиков через Gemini Live API и Google AI Studio.

В целях безопасности весь сгенерированный аудиоконтент помечается водяным знаком SynthID.

Если вы нашли опечатку - выделите ее и нажмите Ctrl + Enter! Для связи с нами вы можете использовать info@apptractor.ru.
Telegram

Популярное

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: