Эта функция, которая будет развернута в Google Lens, позволит пользователям либо сфотографировать рецепт, либо загрузить его из библиотеки фотографий.
Цель проекта состоит в том, чтобы улучшить распознавание голоса для людей с ограниченными возможностями и разнообразными речевыми моделями.
Handwritten Digit Recognition — iOS-приложение, которое распознает рукописные цифры. Написано на Swift, использует TensorFlow Lite с натренированной Keras базой. Исходники: https://github.com/sevakon/handwritten-digit-recognition
В данной статье мы научимся сканировать документы и распознавать на них текст с помощью VisionKit в iOS 13.
Google открыл движок распознавания речи Live Transcribe - Live Transcribe Speech Engine. Исходный код теперь доступен на GitHub.
Snapchat тестирует функцию визуального поиска товаров внутри мессенджера.
Google выпустил браузерную игру Emoji Scavenger Hunt, в которой вам надо охотиться на эмодзи. Приложение стало примером использования фирменных технологий машинного обучения и распознавания изображений.
CEO проекта NanoNets рассказал об использовании нейронных сетей на небольших устройствах вроде Raspberry Pi.
Android-разработчик Леонардо Пирро рассказал об инструменте компьютерного зрения от Google и его применении в приложениях.
Facebook AI Research (FAIR) опубликовал исходные коды Detectron – платформы обнаружения объектов.
HQ Trivia ежедневно разыгрывает тысячи долларов, но, как оказалось, она недостаточно защищена от взлома. Стефен Когнетта, бывший продукт менеджер Google, в этой статье описывает способ обхитрить викторину, который...
В новою версию приложения для распознавания и перевода текста ABBYY TextGrabber для Android встроена технология ABBYY Real-Time Recognition (ABBYY RTR SDK). С ее помощью можно мгновенно извлекать информацию...
Avito стал первым российским мультикатегорийным сайтом объявлений, предложившим пользователям функцию «Поиск по фото».
В Google созрел очередной «картонный» проект - AIY Vision Kit. Это простейший набор для создания системы видеонаблюдения и распознавания объектов на основе моделей TensorFlow.
Machine Learning Group в Mozilla опубликовала open source систему распознавания голоса и набор голосов для ее тренировки.
Исследователи Google разработали «электронную защиту экрана», которая может предупредить вас, если кто-то пялится в ваш смартфон.
На следующей неделе в Лас-Вегасе состоится конференция AWS re:Invent, в ходе которой, как ожидается, компания представит новые инструменты и функции своей облачной платформы.
Команда компании Deep Systems собрала свои знания о создании современных систем глубокого обучения в один туториал, который поможет вам создать свою систему компьютерного зрения за считанные...
Аспирант Стэнфордского университета Авни Ханнун написал о том, какие проблемы ещё предстоит решить, чтобы вывести системы автоматического распознавания речи на уровень человека.
Российская компания Smart Engines представила технологию распознавания автомобильных номеров для мобильных платформ Smart PlateReader. С ее помощью в iOS/Android приложениях можно «на лету» распознавать номера, находящихся...