Новости
Новый алгоритм распознавания Google Street View побеждает любую CAPTCHA
Интересную свинью подложил Google сам себе: компания создала превосходный алгоритм распознавания названий улиц и номеров домов для Street View. Но он оказался настолько хорош, что может с 99% вероятностью расшифровать любую CAPTCHA.
Нельзя не сказать, что распознавание номеров домов и улиц на фотографиях та еще задача – подумайте обо всех вариантах шрифтов, освещенности, положения табличек и всего остального, что для машины, кажется, является непреодолимым препятствием. Тем не менее, Google в Street View удалось добиться 90% автоматического распознавания.
Стандартным подходом тут является разбивка всей процедуры на шаги (локализация, сегментация и распознавание), но Google применил тут иной метод – «глубокую свертывающуюся нейронную сеть», которая особенно эффективна для распознавания изображения. С его помощью компания автоматически обработала около 100 миллионов адресов во всем мире.
Для тестирования же алгоритма Google натравил его на проект reCAPTCHA. Результаты ошеломляют – для самых сложных задач распознавание превышает 99%. Сама идея CAPTCHA в том, что никто, кроме живого человека, не может распознать символы, да и то вряд ли кто-нибудь из нас, живых, сможет это сделать с такой точностью. Таким образом, можно сказать, что CAPTCHA практически побеждена алгоритмически. Тем не менее, спаму и ботам еще рано праздновать победу, Google говорит, что его reCAPTCHA сейчас в меньшей степени полагается именно на распознавание символов, «текст лишь один из сигналов для определения ботов».