DeepSpeech – открытая система перевода речи в текст на основе TensorFlow. Есть пакеты для Python и NodeJS. Пока платформа работает только с английским, но новые языки обещают добавить уже в начале следующего года.
Project Common Voice – около 400,000 записей для тренировок моделей распознавания. Это голоса 20,000 человек из разных стран, второй по величине датасет в мире.