Статьи
За гранью Siri: AI революция придет из Сети
Давайте осознаем, что величайшая возможность создать AI, который действительно сделает наши жизни проще, заключается в обуздании того, что мы используем каждый день.
От искусственного интеллекта HAL в «Космическая одиссея 2001 года» до Саманты в «Она» Спайка Джонса — мы уже несколько десятилетий одержимы той идеей, что однажды компьютеры с искусственным интеллектом смогут взаимодействовать с людьми, следовать устным инструкциям и принимать решения независимо, как человек.
После появления Siri на наших iPhone 4, Google, Facebook, Amazon, Microsoft и Baidu тоже вступили в игру. Но хотя каждое новое поколение AI приносит новые интересные функции или сценарии использования, они всё еще невероятно далеки от своих образов в фильмах. Пока ещё сложно представить, что кто-то вступит в романтические отношения с Siri, а NASA позволит Alexa контролировать космический корабль.
Фильмы установили довольно высокую планку, и мы всё еще ждем, когда же такие универсальные управляемые голосом помощники придут в реальный мир. Тем не менее, эра умных помощников, которые действительно могут помочь нам в повседневной жизни, гораздо ближе, чем мы думаем.
Пассивные ассистенты, которые полагаются на ввод информации пользователем
Когда говорят о умных персональных помощниках, люди обычно вспоминают Siri, Cortana или Amazon Echo. Более технологически подкованные люди также слышали о Viv от основателей Siri, недавнем вкладе Facebook – M, или других месседжинг AI инструментах, вроде Operator или Magic. Тем не менее, хотя вокруг них много ажиотажа в последнее время, когда дело доходит до сценариев использования, большинство из них застряли в области прославленных Вопросов и Ответов.
За последние пару лет некоторые факты не раз свидетельствовали о том, что технологические лидеры серьезно настроены вывести AI на новый уровень. В 2014 году Google приобрел за полмиллиарда долларов лондонскую группу DeepMind, занимающуюся глубинным обучением. IBM в прошлом году купил AlchemyAPI, а Apple недавно рассказал о двух AI-приобретениях подряд.
Эти покупки следуют за недавними прорывами в техниках глубинного обучения с поддержкой GPU-ускорения, с помощью которых было улучшено распознавание образов, речи и машинное зрение. Согласно Тиму Таттлу, основателю и CEO Expect Labs, за следующие два года машины смогут следовать устным инструкциям даже лучше, чем люди.
И хотя способность взаимодействовать с помощью наших чувств — суть человеческого разума, это единственный ингредиент важнейшего рецепта.
Профессор Стюарт Рассел из Калифорнийского университета в Беркли выделяет 6 основных возможностей, которые нужны компьютеру, чтобы пройти тест Тьюринга: средства обработки естественного языка, представления знаний, автоматизированного формирования рассуждений, машинного обучения, машинного зрения и средства робототехники.
Проще говоря, это составляющие общего искусственного интеллекта, и распознавание речи – просто один из аспектов. Разговор может быть удобной альтернативой нажатиям по клавиатуре, когда ваши руки заняты, но тогда ваш голос – всего лишь средство, а он не всегда самый лучший способ ввода. Сколько раз вы спрашивали Siri о чем-то, и в итоге сами писали запрос в Google?
Контекст – самая трудная часть
Команда Viv верит, что они могут создать лучшего персонального помощника, используя продвинутые техники глубинного обучения, чтобы машины сами научили себя, как решать проблемы. И хотя они по понятным причинам держат свою технологию в строжайшем секрете, судя по раскрытой информации для построения сценариев использования потребуется некоторое человеческое руководство. Таким же образом как человек может научиться разрешить проблему, используя подсказки того, кто уже знает, как её решить, они помогут AI найти свои собственные способы решения проблемы.
Однако, на этом сравнение с людьми заканчивается, поскольку мы, в отличие от машин, обладаем способностью автономно совершенствовать наши знания, контекстуализируя проблемы и находя оригинальные решения. Мы от природы «связываем факты в единое целое», чтобы найти ответы и принимать решения, хотя сегодняшние AI часто не могут ассоциировать проблемы с контекстом, который их окружает.
Контекст это то, что дает AI способность принимать более умные решения, а не полагаться исключительно на четко сформулированные инструкции.
Как таковой, он связывает прошлое, настоящие и будущее для решения сложных проблем. Профессор Патрик Брезиллон из Парижского университета утверждает: «В AI отсутствие явного представление о контексте – одна из причин провала многих систем баз знаний».
Обучение компьютеров контексту в человеческом поведении – колоссальная задача; люди не всегда предсказуемы и разнообразие ситуаций фактически бесконечно. На персональном уровне, использование техник машинного обучения для понимания чьего-либо способа социальных взаимодействий и принятия решений потребует несчётных часов ввода информации человеком. Вероятно, это можно осуществить, если следить за вами 24 часа в день, но, так как чтения мыслей ещё не существует, вам придется объяснять свою логику вслух, чтобы машина смогла научиться думать как вы.
Обуздание силы интернета
Машинному обучению требуется масса информации. Для обработки естественного языка данные обычно собраны в корпус текстов, что представляет собой огромный структурированный набор текстов, которые могут быть использованы для обучения AI. Чтобы представить, насколько огромными могут быть эти наборы информации, вспомните, что чтобы победить человека в интеллектуальной игре Jeopardy, Watson пришлось скормить всю базу данных Wikipedia.
Что интересного в истории IBM Watson так это то, что корпус, который ему подали, не требовал предварительного структурирования, а это означает, что Watson смог использовать данные без человеческой помощи. Что если бы у M было похожее обучение, которое подразумевало дальнейшую возможность общаться и выполнять сложные задания? Какой бы была модель и где бы мы нашли подобные данные?
Интернет содержит миллионы часов разговоров, видео, книг, информации и всего, что позволит нейронным сетям развить интеллект.
Вы хотите рассказать машине о любви? Дайте ей «Ромео и Джульетту» и другие романтические произведения. Научить бизнесу? Встройте новостную ленту The Wall Street Journal. DeepMind недавно дал нам представление о том, чего можно достичь, обучив AI языку с помощью базы данных из более чем 300,000 статей из CNN и Daily Mail.
Данные прямо перед нами, а мы пока только скребем поверхность. Но новая волна прогресса в машинном обучении в скором времени позволит нам извлечь ещё больше пользы из эксабайтов информации, содержащейся в Интернете, и такой успех ознаменует огромный шаг на пути к Искусственному Суперинтеллекту.
Помимо океанов неструктурированных данных, доступных онлайн, более близкое будущее, которое упростит наши жизни, уже под рукой. Каждый день люди принимают сотни решений онлайн, и каждый раз, когда мы кликаем на ссылку, эти клики записываются рекламными и аналитическими компаниями. Представьте, что эта информация использовалась бы AI, предназначенным для анализа ваших веб-действий, наряду с миллионами других пользователей, для выявления паттернов из этих данных.
Он бы не только смог предложить вам более персонализированный и контекстуализированный веб-опыт, а также лучше понимал ваши намерения и смог бы предугадывать ваши нужды прежде, чем вы их выразите! И вуаля, персональный AI ассистент смог бы действительно облегчить жизнь, используя уже существующую технологию.
Исследователи прогнозируют, что нам придется подождать еще как минимум декаду, прежде чем мы сможем по-настоящему ощутить величие универсального человекоподобного интеллекта. Тем временем, Интернет достигает той стадии, когда он соберет в себе все необходимые ингредиенты для огромного прыжка в области AI, и в нём уже есть невероятное количество ботов, аналитики и других API, собирающих наши онлайн-данные, из которых мы можем извлечь преимущества.
Поэтому давайте отделим картинки из фильмов от реального прогресса, который происходит прямо перед нашими глазами, и осознаем, что величайшая возможность создать AI, который действительно сделает наши жизни проще, заключается в обуздании того, что мы используем каждый день.