Connect with us

Разработка

Эффект Саманты: взгляд в будущее ботов

Мы сможем смотреть на отношения и корреляции и искать что-то новое, что поможет нам сделать мир лучше, а машины смогут подсказать нам, как наши предположения соотносятся с данными. Таким образом, самый многообещающий аспект искусственного интеллекта — это не создание ассистента вроде Саманты, а усиление человеческих способностей. Менеджер GrowthBot Джастин Ли рассказал о настоящем и будущем ботов.

Анна Гуляева

Опубликовано

/

     
     

В 2013 году Спайк Джонс выпустил фантастическую инди-драму “Она”. Фильм рассказывает про эволюционное развитие первой в мире системы с искусственным интеллектом с именем “Саманта”. Саманта — это мечта любого разработчика, идеальный пример настоящего искусственного интеллекта. Она понимает контекст, естественный язык, эмоции, и, кажется, может вполне здраво мыслить.

Очевидно, что современные боты пока не могут достичь уровня Саманты. В лучшем случае они способны предлагать конкретные результаты через диалоговый интерфейс. В худшем — раздражают так, что захочется бросить телефон в стену.

Так как технология развивается со скоростью молнии, можем ли мы представить эпоху, в которой будет существовать бот, похожий на Саманту?

Эмоциональные интеллектуальные данные

Современный искусственный интеллект сочетает обработку символьной информации (явные правила и логику) с машинным обучением, усиливая их достоинства и устраняя недостатки. Например, обработка символов позволяет нам конкретизировать знания и поведение, которые нельзя узнать из данных. Машинное обучение помогает системе адаптироваться к неожиданным ситуациям и новым концепциям.

Эта комбинация ускоряет процесс обучения. В будущем она даст нам возможность взаимодействовать с ботами более человечно. Сейчас машинное обучение — это статистический процесс, который отражает качество данных, от которых он зависит. Это благословение и проклятие. Чувствительность машинного обучения к характеристикам входных данных означает, что оно может легко обучиться неправильным вещам, как произошло в случае с Tay, роботом-расистом от Microsoft. Более того, выбранные для обучения данные часто отражают подсознательные предрассудки разработчиков и исследователей.

Чтобы подойти к способности Саманты к самоанализу и рассуждениям, нам нужно создать искусственный эмоциональный интеллект для наших ботов, который позволит им ответить на вопрос: “Почему ты принял такое решение?”. Даже существующие простые системы уже делают шаги навстречу синтезу индивидуальных ответов на вопросы. Пока же мы можем только убедиться, что применяем алгоритмы обучения на качественных данных в тщательно отслеживаемой среде.

Семантический веб

Создатель World Wide Web Тим Бернерс-Ли смотрел в будущее, когда в 2001 предложил идею семантического веба:

системы, которая позволит компьютерам делать выводы из взаимоотношений между ресурсами в вебе.

В итоге машины научатся связывать вместе идеи, концепции и факты, а не документы и страницы. Это позволит подобным Саманте ассистентам считываться информацию о нас и действовать от нашего имени: автономно назначать встречи, организовывать путешествия и бронировать столы в ресторанах.

Видение Бернерса-Ли уже в какой-то степени реализовано в Knowledge Graph от Google, который потребовал от компании нанять тысячи людей, чтобы ввести подробные правила репрезентации общих знаний. Зато он позволяет Google отвечать на вопросы с помощью структурированных данных, а не списком веб-страниц.

Технологии распознавания изображений могут быть предшественниками семантического веба, этот искусственный интеллект может распознавать ключевые слова, демографические данные, цвета и лица на изображениях.

Распознавание естественной речи

Способность распознавать естественный язык является главной для успешного бота – как текстового, так и голосового. В идеале бот должен достигать цели, заполняя пробелы в разговоре автономно.

Siri, Cortana и Alexa пока не достигли стандартов Саманты. Но её способности в распознавании не кажутся отдаленным будущим. Ошибки в распознавании речи уменьшаются на 20% каждый год, а в Google недавно достигли показателя ошибок в 4.1%, который почти соответствует способностям человека.

Эти улучшения могли произойти благодаря нескольким инновациям: мультимикрофонным массивам, направленным лучам, сложной обработке звука и применению биометрических данных для голоса. Анализ звуковой сцены — это ещё одна многообещающая техника, которая предназначена для разделения источников звука.

Распознавание голоса также улучшается при помощи огромного пула данных для обучения статистических моделей при помощи методов машинного обучения: один из них — это глубокие нейронные сети. Они состоят из множества слоев обработки и основаны на нейронной структуре человеческого мозга. Нейронные сети могут классифицировать разные данные: изображения, последовательности слов, локации и высказывания.

Настоящее и будущее машинного обучения на устройствах

Контекст и абстракция

Люди могут понимать контекст и делать выводы. Иногда они следуют из логики, но чаще всего основаны на нашем общем знании мира. В случае искусственного интеллекта виртуальный ассистент должен уметь предлагать альтернативы, рассматривать разные возможности и понимать их ценность:

Я: “Я бы хотел сегодня купить обувь в Melissa.”

Бот: “Извините, Melissa закрыт. Почему бы вам не попробовать Office, который похож на Melissa и находится неподалеку?”

Бот мог бы изучать эти ассоциации через попытки и ошибки, но это заняло бы годы, так как для каждого взаимодействия существует миллион разных вариаций. Некоторые исследователи считают, что компьютеры должны учиться на аналогиях. Именно эта способность позволяет людям делать выводы из разных ситуаций и обобщать на основе контекста, достигая высшего уровня понимания.

Звучащие по человечески боты

Эмоциональный диапазон и интонации голоса Саманты находятся за пределами наших возможностей, но новые модели генерирования речи, например, Google WaveNet, могут создавать убедительные искусственные голоса. Естественный голос улучшает наши впечатления от искусственного интеллекта. Недостатком этого подхода является то, что ожидания пользователя повышаются, что, вероятно, приведет к ошибкам в разговоре и раздражению. И все мы знаем, насколько меньше у нас терпения при общении с машиной, чем с человеком.

Независимо от того, может ли бот соответствовать нашим ожиданиям, мы склонны доверять ботам с человеческим поведением – игрой слов, шутками, цитатами и эмоциями. С этим связан и тест Тьюринга, где человек участвует в разговоре с другим человеком и с машиной. Если человек не может отличить машину от живого собеседника, машина проходит тест.

Инсайты

Может ли искусственный интеллект помочь нам находить инсайты? Это не только что-то новое и ценное, но и факты, которые помогут управлять будущими решениями и действиями, что довольно трудно понять программе. Мы узнаем инсайт, когда видим его, но сложные границы вокруг этого понятия сложно провести, а поиск инсайта требует узнавания шаблонов, отношений и корреляций.

Некоторые проекты машинного обучения уже погружаются в эту область. Например, Deep Mind от Google хорош в распознавании новых моделей на уровне сложности, который в случае игры Го превосходит возможности людей. Но эти методы работают, только если машина знает, в чем ее цель.

Только люди могут идентифицировать интересные модели, не зная первоначальной цели. С другой стороны, люди не могут справляться с большими объемами информации, и здесь преимущество есть у машин. Они могут сотрудничать с нами в областях, в которых мы сталкиваемся с трудностями. На текущий момент большая часть цифровой информации существует в форме текста, то есть, данные не имеют структуры, в отличие от организации традиционных баз данных.

Текстовые данные

Автоматические методы понимания текстов развиваются достаточно быстро, хотя они ещё далеки от идеала.

Вот пример. Пациент входит в офис доктора с редким заболеванием, о котором врач не слышал. Доктор консультируется с цифровым ассистентом, который сканирует все медицинские журналы и всю когда-либо написанную информацию о заболевании в течение нескольких секунд. Затем он обобщает эту информацию и представляет её врачу небольшими частями. Подобную “грамотную машину” пытается разработать стартап Maluuba, который недавно приобрела Microsoft. В итоге компьютеры смогут собирать, курировать и обобщать огромное количество текста такими способами, о которых мы не могли и мечтать.

И нам не придется использовать сложные технические языки программирования или запросы в базы данных, чтобы объяснить, что мы ищем: недавно созданные системы могут использовать естественный язык, чтобы получать вопросы насчет текста. Мы уже в какой-то степени знакомы с этой функцией благодаря запросам в Google. Боты будут естественными преемниками этой традиции.

Финальным фактором является то, что уже существуют приложения, которые учатся на взаимодействии. Например, Replika разрабатывает идиосинкратические модели языка на основе сканирования предыдущих разговоров в чате и узнает о предпочтениях и приоритетах пользователей.

Это делает нас ближе к созданию Саманты.

Усиление человеческого интеллекта

Во время первой индустриальной революции машины начали выполнять задачи, связанные с ручным трудом. Сейчас индустрия 4.0 начинает выполнять и умственные задачи. Почти любое рутинное задание можно автоматизировать. Мы бы могли отдать алгоритмам ручное заполнение данных, поиск тем и идей для статей, сортировку писем. Отдав эти задачи искусственному интеллекту, мы сможем сфокусироваться на областях, в которых мы сильны и которые отличают нас от машин.

Мы сможем смотреть на отношения и корреляции и искать что-то новое, что поможет нам сделать мир лучше, а машины смогут подсказать нам, как наши предположения соотносятся с данными. Таким образом, самый многообещающий аспект искусственного интеллекта — это не создание ассистента вроде Саманты, а усиление человеческих способностей.

 

Комментарии
Если вы нашли опечатку - выделите ее и нажмите Ctrl + Enter! Для связи с нами вы можете использовать info@apptractor.ru.
Advertisement
Click to comment

You must be logged in to post a comment Login

Leave a Reply

Разработка

Дневники разработчиков: Babycare №9

Babycare – приложения для ухода за новорождённым с популярной Android-версией. Теперь Максим Колпаков и компания Wachanga покоряют пользователей iOS и каждую неделю пишут об этом заметки.

Babycare

Опубликовано

/

Автор:

Прошло 11 недель челленджа. На этой неделе окончательно выпустили китайскую локализацию, а также запостили в App Store видеоролик вместо первого скриншота. Оба события принесут (или не принесут) плоды не раньше следующей недели. Тогда и опишу результаты.

Произошёл казус. Договариваясь с блогерами и сообществами о продвижении приложения, получили от некоторых следующий фидбек. Они отказываются работать с нами, так как «изображение бутылочки дискредитирует ценность грудного вскармливания». Мы знали о подобной особенности, но с точки зрения пользователей всё было в порядке в 99% случаев. Блогеры же имеют другое мнение. Думаем, что делать, готовим эксперименты с альтернативными иконками. Если и юзеры выберут другую иконку, то, конечно, сменим.

У нас в компании есть некий код, ДНК, который я сформулировал, и который мы вкладываем теперь в каждый наш новый продукт. Один из первых пунктов этого кода – «Масштабируемость». Сейчас мы делаем только продукты, которые можно легко запустить по всему миру. Обеспечивают такую возможность несколько условий:

  • Минимум контента, а если без него никуда, то UGC – User Generated Content. Это позволит дешевле переводить продукт на другие языки.
  • Минимальная зависимость от национальных особенностей. Например, грудное вскармливание – это намного ближе к физиологии и, значит, интернационально.
  • B2C-продажи. Мы убрали любые B2B-компоненты на период масштабирования, так как это снижает скорость роста. По достижении определенного уровня проникновения, конечно, есть смысл вернуть B2B обратно.
  • Простота клиентской поддержки. Например, для того чтобы это делать на десятках языков, коммуникации с клиентами нужно вести в текстовом виде. В крайнем случае, на первых порах можно на голосе оставить только первую линию, отдав её на аутсорс и обеспечив скриптами, которые нестандартные проблемы всё равно переводят на текстовую коммуникацию.
  • Наличие универсальных каналов привлечения клиентов. Facebook, Instagram, Adwords, App Store, Google Play – эти каналы есть в каждой стране. Если продукт сможет получать достаточно пользователей из них, то он проходит отбор.

Есть и другие особенности «Масштабируемости», но о них я расскажу только в том случае, если вы будете активнее в комментариях. А ещё мне нравятся лайки и репосты  ;)

Комментарии
Продолжить чтение

Новости

Интересные материалы: 21.06

В новом дайджесте когортный анализ, новые инструменты и лучшие библиотеки.

AppTractor

Опубликовано

/

Автор:

Весь день мы собираем лучшие материалы о разработке и маркетинге технологий, стартапов, мобильных приложений и игр для iOS и Android из самых разных источников:

Комментарии
Продолжить чтение

Новости

Интересные материалы: 20.06

Дизайн и прототипирование, PWA и звуки, которые важны.

AppTractor

Опубликовано

/

Автор:

Весь день мы собираем лучшие материалы о разработке и маркетинге технологий, стартапов, мобильных приложений и игр для iOS и Android из самых разных источников:

Комментарии
Продолжить чтение

Разработка

“Крутись и уворачивайся”: история разработки Circle vs Spikes

Немного о себе: 30 лет, программированием начал заниматься относительно поздно, всего 2 года назад. Имелся технический бэкграунд, но в целом от программирования был далек. Знакомых кодеров тоже не было, пришлось самому набивать шишки, пытаясь понять, что и как делать. Привлекла идея делать мобильные приложения, так как хотелось работать на себя. Ну а что может быть интереснее геймдева. Таким образом была поставлена цель – научиться делать мобильные игры.

AppTractor

Опубликовано

/

Автор:

Но сначала нужно было изучить основы. Решил взяться за фундаментальные вещи: теория, алгоритмы, проектирование и т.д. Промучившись месяца два понял, что нужно ставить практические задачи, а теорию изучать уже по мере надобности. Стал изучать Java, которая повсеместно используется для Android. Да и фреймворк LibGDX, о котором я уже тогда начал думать, был на Java.

Освоив на достаточном уровне Java и LibGDX, я захотел пройти весь путь от идеи игры до публикации. Хотелось начать с чего-то простого. Пришла мысль сделать 2D-аркаду, в которой надо уворачиваться от препятствий, двигаясь при этом по сложной траектории.

Итак, у меня была неплохая цель – сделать в короткие сроки простую игру, довести ее до публикации в Google Play и, таким образом, набраться опыта. В итоге “короткие сроки” растянулись более чем на полтора года. Частенько я переделывал все с нуля, тратил много времени на каждый этап, добавлял или убирал функционал. Много времени было вложено и в создание редактора уровней. Если игра будет нравится людям, включу его в игру в одном из обновлений. Вот так он выглядит сейчас.

Это был крайне интересный опыт, но, думаю, все же надо было придерживаться изначального плана – довести до конца максимально простую игру.

Но сейчас, уже опубликовав игру, предстоит новый этап – продвижение. Я уже ощутил, насколько это тяжелый и энергозатратный процесс. Но мне уже не привыкать.

Крутись и уворачивайся

В игре вы управляете кругом, который движется по орбите. При этом орбита вместе с кругом движутся вперед. Таким образом соединяются две траектории: круговая и прямолинейная. Это делает механику интересной, заставляет просчитывать наперед это сочетание. Кругом надо уворачиваться от множества разных препятствий (шипов, маятников, лазеров, блоков…). Управление при этом предельно простое – касанием экрана можно менять направление вращения по орбите.

Игра поделена на небольшие уровни, длительностью по 30-40 секунд. Это при условии, конечно, что проходите их с первого раза. Но такое будет происходить редко. Игру я сознательно сделал сложной, так как насмотрелся супер-легких игр, в которых игрокам буквально указывают, куда нажимать. Если вы любите принимать вызовы, то моя игра вам понравится.

На то, чтобы сменить направление вращения (другими словами – на каждое касание) требуется 1 заряд. Уровень вы начинаете, имея 100 зарядов. Цель – истратить как можно меньше зарядов за уровень. То есть нельзя бездумно тыкать по экрану, нужно просчитывать траекторию и использовать заряды с умом.

Чтобы пройти тяжелые участки, можно использовать замедление.

Имеется поддержка Google Play Игр:

  1. Достижения – за каждое из которых открывается новый скин или цветовая тема.
  2. Лидерборды
  3. Сохранения и синхронизация между устройствами

Музыку мне сделал друг, специально для игры, за что я ему очень благодарен. Кому интересно, вот ссылка на его страничку в Soundcloud: https://soundcloud.com/octonick.

Также я постоянно делаю новые уровни, так что пройдя все – не спешите удалять игру. Я планирую часто выпускать обновления.

Если у вас есть какие-либо вопросы, пишите, постараюсь ответить всем: ibragames.com@gmail.com.

Комментарии
Продолжить чтение

Реклама

Наша рассылка

Нажимая на кнопку "Подписаться" вы даете согласие на обработку персональных данных.

Вакансии

Популярное

X
X

Спасибо!

Теперь редакторы в курсе.