У Google было много новостей для разработчиков на GCP Next в Сан-Франциско, но одной из самых интересных оказалось решение создать абсолютно новый API на основании своей технологии распознавания речи.
API называется Google Cloud Speech API (логично, а как же ещё), он позволяет разработчикам встраивать распознавание речи на 80 языках от Google в любое приложение. Доступный в стриминг-режиме реального времени и в фоновом режиме, API может упростить запись текста, голосовые команды и множество других вещей, использующих Google Cloud Platform.
Cloud Speech API – это ещё одна попытка Google донести свою продвинутую технологию машинного обучения до сообщества разработчиков. Открывая свои лучшие инновации, Google надеется переманить разработчиков из конкурирующих компаний, таких как Amazon Web Services или Microsoft Azure. В этом случае анализ изображений, голосовые возможности и оперативный перевод – несомненные преимущества Google.
Напомним, что у Яндекс с 2014 года есть SpeechKit Cloud — облачный сервис распознавания речи. С его помощью разработчики также могут научить свои продукты понимать голос человека.