Connect with us

Интервью

TensorFlow: помочь в освоении космоса, установить первый контакт с новыми цивилизациями, победить кеттов

TensorFlow – библиотека машинного обучения, созданная и поддерживаемая компанией Google. В конце 2016 были открыты ее исходные коды, а в феврале вышла версия 1.0. Мы попросили представителей компании рассказать о том, что такое TensorFlow, как с ним работать, какие задачи с его помощью можно решать. Все это в нашем интервью.

Леонид Боголюбов

Опубликовано

/

     
     

TensorFlow – библиотека машинного обучения, созданная и поддерживаемая компанией Google. В конце 2016 были открыты ее исходные коды, а в феврале вышла версия 1.0. Мы попросили представителей компании рассказать о том, что такое TensorFlow, как с ним работать, какие задачи с его помощью можно решать. Все это в нашем интервью.

[highlight]Что такое TensorFlow сейчас?[/highlight]

 

Наталия Ефимцева, Google: Machine Learning (ML) — это про нахождение паттернов в данных. Человек по этому же принципу выполняет множество задач. В том числе, как я понимаю, обучается в детстве. Наш мозг получает информацию, обрабатывает, накапливает, отсеивает ненужное (или, по его мнению, ненужное :)), “повторяет” (в соответствии с созданным паттерном) и привносит что-то новое (в идеале)!.

А TensorFlow — это, по сути, инструмент, который позволяет реализовать или упростить реализацию ML для вашей системы или задачи. Например, чтобы сложить два числа никому же уже не требуется записывать числа в регистр, вызывать операции сложения и считывать результат из другого регистра. Возможно, что пока TF не настолько упрощается задачи ML, но смысл именно в этом — упрощении, масштабировании и применимости практически на любой платформе.

Если несколько более формально, то TF — это Deep Learning (DL), движок с открытым исходным кодом, а DL — это область ML, которая использует концепцию функционирования (или того, как мы это сейчас понимаем) нейронных связей человеческого мозга для решения различных проблем, таких как распознавание образов и речи, т.е. таких задач, которые трудно решить с помощью просто вычислительных мощностей компьютера.

В отличие от обычных привычных нам функций и сервисов, нейронная сеть может не просто на выходе предоставлять результат по заранее определенным правилам, а сама обучается (принцип основан на том, как и наш мозг ведет себя), т.е. сеть сама для себя определяет правила (веса и смещение) и выдает результат.

Интересный пример — распознавание в Великобритании автомобильных номеров на фотографиях — тут как раз применяется TensorFlow. Автор решения и статьи указывает в выводах на интересную особенность: для обучения использовались автоматически генерируемые изображения (с фоном, с цифрами на номерах, шумами и т.п.). Так как для генерации номера применяется один и тот же шрифт, то система испытывала трудности с распознанием буквы R, написанной другим шрифтом. Так что, пока некоторые нейронные сети не такие “умные” как мы с вами :).

К сказанному выше добавлю, что TF — это система машинного обучения, которая может работать как на локальном компьютере, в облаке, так и на смартфоне или даже, например, Rasberry Pi-платах. И в этом, как мне кажется, ее большое преимущество – универсальность и некоторая простота (в определенном смысле). Уверена, что в скором времени на TF будут появляться более высокоуровневые решения, но для тех, кто хочется разобраться именно в TF. Рекомендую следующую статью: “TensorFlow: широкомасштабное машинное обучение на гетерогенных распределенных системах”.

Джош Гордон, ведущий эксперт по TensorFlow в Google: Прошло уже больше года с тех пор, как мы опубликовали TensorFlow в Open Source, и очень приятно видеть принятие платформы сообществом и быстрое ее развитие как здесь, в Google, так и в компаниях по всему свету. TensorFlow — это главный инструмент, который мы используем для машинного обучения во всех наших продуктах. Вот некоторые примеры:

  • Полностью новая система перевода, основанная на глубокой нейронной сети.
  • Инструмент, позволяющий врачам диагностировать заболевания глаз.
  • Приложение, создающее картины и музыку.
  • Австралийские морские биологи используют TensorFlow для поиска морских коров на десятках тысяч фотографий.
  • Японский производитель огурцов натренировал TensorFlow на сортировку  овощей.
  • Радиологи используют TensorFlow для определения признаков болезни Паркинсона на медицинских сканах.
  • Стэнфордские докторанты с помощью TensorFlow обнаруживают рак кожи.
  • Научные сотрудники из Залива используют TensorFlow и Raspberry Pi для отслеживания поездов Caltrain.

С выпуском TensorFlow версии 1.0, платформа стала:

  • Быстрой. TensorFlow 1,0 невероятно быстрая! XLA закладывает основу для еще большего повышения производительности в будущем, а на tensorflow.org уже есть советы и рекомендации по достижению максимальной скорости для ваших моделей .
  • Готовой к использованию. TensorFlow работает почти везде, включая Android, iOS, Raspberry PI, ноутбуки, десктопы и масштабируемые дата-центры Google. Кроме открытия самого TensorFlow, Google также открыл инструменты для обслуживания моделей в продакшене.
  • Очень гибкой. В TensorFlow 1.0 появились высокоуровневые API, с tf.layers, tf.metrics и tf.losses-модулями. Мы также анонсировали включение новых tf.keras-модулей, которые обеспечивают полную совместимость с Keras – еще одной популярной высокоуровневой библиотекой для работы нейронных сетей.

Вы можете узнать больше обо всем этом на наших ресурсах:

[highlight]Какие технологии лежат в основе TensorFlow?[/highlight]

 

Наталия Ефимцева: Наверное, ответ на этот вопрос заслуживает отдельной статьи или даже книги. Поэтому интересующихся  отсылаю к статье в блоге “Понимание нейронных сетей с помощью игровой площадки TensorFlow” (явный плюс в том, что изложение структурировано и с картинками :)).

Мне помогла разобраться в этих вопросах и вспомнить университетский курс по нейронным сетям и искусственному интеллекту статья “Использование нейронных сетей для распознавания рукописных цифр”. Большое спасибо Андрею Юрьевичу Филипповичу — это наш преподаватель в МГТУ им. Баумана, который этот курс разработал и преподавал. После института долгое время просто вспоминалось, что это был один из наиболее интересных курсов, но применять полученные знания на практике не приходилось. Но вот не прошло и 10 лет, и теперь такие знания стали не только актуальными, но и применяемыми достаточно просто, благодаря и TensorFlow в том числе.

Советую посмотреть именно эти статьи, так как они позволят вам понять предметную область более точно и структурировано.

[highlight]Какие проблемы может решить библиотека?[/highlight]

 

Джош Гордон: Используя TensorFlow, разработчики могут воспользоваться теми же инструментами, которые Google использует для большинства своих исследований и задач Deep Learning. Это означает, что разработчики, ученые и компании могут сразу перейти к решению проблем, которые важны для них, а не затрачивать много лет на  создание инструментов для этого.

Наталия Ефимцева: Здесь все просто: можно самостоятельно писать систему, оптимизировать ее; когда все вопросы, связанные с машинным обучением, будут решены,  решать вопросы по масштабированию (в том числе по достижению максимального параллелизма выполнения задач) или — воспользоваться TensorFlow.

На мой взгляд, очень существенным плюсом является то, что TF может быть развернута как локально, так и может быть перенесена в облако (когда потребуются дополнительные мощности и уже будет не пилотная фаза). Кроме того, библиотека может работать на смартфоне или подобных устройствах. Один из наиболее нашумевших примеров — это сортировка огурцов с  помощью TF и Rasberry Pi.

[highlight]Где TF использует Google?[/highlight]

 

Джош Гордон: Кроме исследований в Google Brain, TensorFlow лежит в основе множества работающих сервисов и продуктов, включая и те, которые имеют уже миллионы пользователей. Вот несколько примеров:

  • Google Translate: мы развернули полностью новую систему перевода, основанную на глубоких нейронных сетях.
  • Умные ответы в Gmail. Модель TensorFlow может предсказывать ответ для сообщения, которое вы только что получили.
  • Используется как инструмент, помогающий докторам диагностировать заболевания глаз.

Наталия Ефимцева: TF применяется во многих продуктах Google. Как уже сказал мой коллега, TF используется, например, в Google Cloud Speech, в Google Photos и т.п. Например, есть такой сервис Google Cloud Translation. Недавно была анонсирована Premium-редакция сервиса, качество которого приблизилось к профессиональному переводу.

Этот новый сервис построен на основе TF и Tensor Processing Unit (TPU). Для тех, кого интересуют подробности, все доступно по ссылке выше. А я лишь приведу иллюстрацию, которая демонстрирует достигнутое качество перевода:

Вообще, ML применяется сейчас для многих задач. Например, есть кейс применения ML для сокращения расходов на потребляемую в дата-центре электроэнергию (он интереснее и нагляднее, так как с фотографиями мы все имеем дело, а вот экономией энергии в масштабе дата-центров занимаются не все). Подробнее в статье “DeepMind AI уменьшил стоимость охлаждения Google Data Center на 40%”.

Другой интересный пример — за счет использования алгоритмов машинного обучения прямо на устройстве вы можете улучшить качество изображения — подробно это описано в статье “Google использует машинное обучение для уменьшения данных, необходимых для получения изображений с высоким разрешением”. Это пример нового подхода к работе с изображениями (или с информацией вообще). Важно, что это не алгоритм или кодирование, которое позволяет по четким правилам вернуть биты и байты и получить изображение лучшего качества, а процесс прогнозирования (и восстановления) того, каким изображение могло бы быть в высоком качестве (и работает он очень неплохо).

Еще один любопытный пример применения TF — это синтаксический анализ предложений (вспоминаем уроки русского языка в начальной школе). Подробнее в статье “Анонс SyntaxNet: самый точный синтаксический анализатор в мире переходит в Open Source”. Наглядная демонстрация работы — ниже на картинке (кстати, опять вспоминается курс в университете по семантике языка):

Ну и конечно, TF используется в сервисе Google Cloud Machine Learning.

[highlight]Где еще можно посмотреть работу TF?[/highlight]

 

Наталия Ефимцева: Отличный пример мы уже упоминали — это сортировка огурцов. Кстати говоря, первый пример, с которого я начала изучение ML и TF — “Tensorflow Chessbot – Распознавание шахматных фигур из изображений путем обучения однослойного классификатора”. Для человека, знакомого с шахматами (да и практически не знакомого с ними), задача является простой (как и с распознаванием написания буквы R).Здесь наглядно демонстрируется как раз распознавание и паттерны, применяемые как нашим мозгом, так и нейронной сетью. Про то, как это делает разработанный код, лучше внимательно почитать на GitHub, а здесь замечу, что наш мозг все-таки использует еще и дополнительные знания — правила игры, чтобы “быстрее” понять, что же это за фигура.

Ученые проводили эксперимент — в нем участвовала гроссмейстер Сьюзан Полгар. За несколько секунд она должна была запомнить позицию на доске и восстановить ее потом по памяти. Сьюзан без проблем справлялась с этим в том случае, когда расстановки соответствовали шахматным правилам (усвоенным ее мозгом годами). Если же позиция была произвольной (например, пешки на 1-ой или 8-ой горизонталях или короли рядом друг с другом) и не все соответствовало правилам шахмат, то восстановить позицию без ошибок у нее не получалось.

Как раз здесь ученые и говорят о паттернах, с помощью которых наш мозг сначала распознает позицию, а потом заносит в память, далее анализирует и выдает решение. Ведь запоминание идет не “на A1 такая-то фигура, на A2 такая-то” (как известно, в среднем у человека всего 8 “блоков” кратковременной памяти, а на доске 64 клетки), а более общими позициями (паттернами). Например, здесь у черных рокировка, а у белых здесь домик — вот уже 1/8 доски и запомнили.

Также и с ML — формируются паттерны, коэффициенты важности того или иного параметра (которые потом могут меняться) и выдается результат. Если вернуться к шахматам, то, насколько я знаю, текущие шахматные программы построены по более простым алгоритмам, которые учитывают некоторые правила, а далее выигрывают за счет вычислительных способностей (поэтому люди с такими программами уже не играют, а вот программы сами с собой поиграть могут, кстати, даже есть чемпионаты и программы-чемпионы). Но вот недавний эксперимент от команды Google DeepMind показал, что теперь может быть и другой подход, основанный на ML и обучении — это программа AlphaGo. Здесь как раз смысл не в переборе вариантов (а в Го их очень много), а в “разумном” осмыслении игры и позиции и принятии решения на основе опыта (паттернов) и стиля игрока.

Здесь рекомендую посмотреть просто интересное видео:

Кстати, в связи с этим (формирование паттернов внутри и просто выдача итогового результата) для ML есть еще более интересный вопрос — понять процесс, как же было принято решение и на основании чего. Встречались очень курьезные варианты принятия решения, хотя итоговый результат выдавался правильный.

Вот такой пример описан в статье “Первый клик: Глубокое обучение – это создание компьютерных систем, которые мы не полностью понимаем”. Исследователи провели эксперимент: задали людям и программе вопрос, например: какого цвета обувь на этой фотографии? Предполагалось, что и человек, и машина сразу обратят внимание на нижнюю часть изображения (измерения выполнялись с помощью heat map). Но для программы это предположение оказалось не верным!

Или другой вопрос: что закрывает окно на этой фотографии? Человек сразу смотрит на окно и быстро находит ответ. Программа же сначала выделяла кровать (так как это была фотография спальни). Одно из предложенных в данном случае объяснений заключается в том, что пока программа не способна понять внешний мир (факты) и суть происходящего, а полагается на выявленные паттерны в наборе исходных данных (и ясно, что в фотографии спальни при таком подходе кровать является одним из основных объектов, правда, для заданного вопроса это второстепенно, но пока программа этого не понимает).

Еще один из ярких примеров — “индексирование” видео, то есть понимание того, что происходит в течение всего видеофрагмента. В Google Cloud Platform, кстати, такой сервис тоже появился — это сервис Cloud Video Intelligence (и уже не требуется строить ML или TF-модели и модули — это к тому, о чем говорилось выше).

Таким образом, ML и  TF могут применяться для множества задач, которые нам кажутся простыми, но рутинными (или сложно выполнимыми в силу большого объема данных, которые нужно обработать), но для системы, снабженной ML, они становятся посильными и простыми (если добиться принятия решения, то есть  хорошей производительности. Ведь, например, если ML-программа будет на 99% точно распознавать номер, но затрачивать на это секунды (и здесь речь даже о 1+ секунде), то ее применимость для многих задач уже ставится под вопрос, особенно для работ  с текущим трафиком).

[highlight]Что нужно знать разработчику для работы с TF?[/highlight]

 

Джош Гордон: Поможет знание машинного обучения. Чтобы узнать больше о TensorFlow, вы можете посмотреть руководства на www.tensorflow.org. Если вам нравятся практические работы с кодом, то я рекомендую TensorFlow для Поэтов — это простой способ начать распознавать изображения. Если вам больше нравятся курсы, то рекомендую новый курс от Стэнфорда: CS 20SI: Tensorflow for Deep Learning Research.

Наталия Ефимцева: Желательно знать матчасть =) Или хотя бы вспомнить или получить начальные знания по нейронным сетям, теории вероятности, математическому анализу. Но не все так страшно на практике, так как именно универсальность и быстрота обучения и проверки гипотезы (или пилотирования модели) позволяют построить систему на основе TF без глубоких фундаментальных знаний (но замечу, что понимание общих принципов, конечно, никто не отменял – именно усвоенные ранее правила, понятия и паттерны позволяют пойти дальше и во всем разобраться). Ожидаю, что в скором времени появится множество высокоуровневых и готовых сервисов на основе ML и TF, которые уже можно будет просто использовать и получать от них результаты и пользу в своей программе. Сейчас такие сервисы уже появляются. Как от Google — это Google Cloud Speech API, Google Cloud Vision API и т.п. — так и от других вендоров. Поэтому все частично идет и к упрощению, и универсализации, что в итоге расширит охват и сферу применения TensorFlow, а также качество моделей.

Кроме того, сейчас уже имеется достаточно нейронных сетей, которые можно использовать для решения своих задач, без модификаций или с небольшими модификациями (или другой обучающей выборкой). Возможно, это один из наиболее популярных способов использования ML среди широкого круга разработчиков.

[highlight]Это масштабируемая платформа?[/highlight]

 

Джош Гордон: Да, open source TensorFlow поддерживает работу множества компьютеров и GPU.

Наталия Ефимцева: Да, изначально именно этот аспект был одним из важнейших. TF уже прошел испытание объемом и временем.

[highlight]Готов ли TensorFlow 1.0 к “промышленному” применению?[/highlight]

 

Джош Гордон: Абсолютно. TensorFlow — это главный инструмент, который мы используем для задач машинного обучения во всех наших продуктах. С версией 1.0 он сейчас готов к развертыванию как никогда..

[highlight]Можно ли вносить свой вклад в TensorFlow, как в Open Source проект?[/highlight]

 

Джош Гордон: Да, конечно! Люди сделали уже более 6000 Open Source-репозиториев, а сотни контрибьютят в проект напрямую.

[highlight]Как будет развиваться проект после версии 1.0?[/highlight]

 

Джош Гордон: После выпуска версии 1.0 мы начали работу над высокоуровневыми API, включая новый tf.keras-модуль, который обеспечивает полную совместимость с Keras.

Наталия Ефимцева: Уверена, что у ML и TF большое будущее. Стоит сказать, что TF не только применяется внутри Google и прошел серьезную проверку на множестве данных и выдаваемых результатах, но, например, в дата-центрах Google Cloud Platform применяются специальные модули, которые специально оптимизированы под TF (это значит — еще выше, быстрее, сильнее). Это Tensor Processing Unit (TPU). Как GPU оптимизирован (архитектурно) для работы с графикой, так и TPU специально создан для работы с ML-задачами (кстати, для этого GPU сейчас стали применять иногда активнее, чем CPU, так как их архитектура такова, что можно параллельно выполнять множество независимых вычислений в отличие от CPU, а для ML это как раз и требуется).

TPU использовался для вычислений уже упомянутой ранее программы AlphaGo.

Что еще могут ML и TF, и как они будут развиваться? Наверное, они смогут помочь в освоении космоса, установить первый контакт с новыми цивилизациями, победить кеттов… ой, это, кажется, к ML не имеет пока отношения. Хотя кто знает :) Но в свете недавних новостей от Илона Маска о создании новой компании Neuralink, которая займется разработкой технологий, позволяющих соединить человеческий мозг и компьютер, уже не знаю — где игра (и модуль СЭМ или синергия человека и машины, как в финале Mass Effect 3), а где реальность.

[highlight]Спасибо за интересное интервью и TF![/highlight]

 

Курс по креативному применению TensorFlow

 

Комментарии
Если вы нашли опечатку - выделите ее и нажмите Ctrl + Enter! Для связи с нами вы можете использовать info@apptractor.ru.
Advertisement
Click to comment

You must be logged in to post a comment Login

Leave a Reply

Интервью

Global Mobile Vision 2017: корейский ответ Industry 4.0

Алексей Спирков, руководитель отдела наукоемких технологий в «АстроСофт», посетил Global Mobile Vision — выставку индустрии информационно-коммуникационных технологий (ICT), которая прошла 13-15 сентября в Сеуле (Корея).

Леонид Боголюбов

Опубликовано

/

В этом году выставка была посвящена мобильным технологиям в таких областях, как Интернет вещей, большие данные, мобильные устройства, телекоммуникационные технологии, облачные сервисы и др. Cобралось более 14 000 (!) посетителей и 300 экспонентов.

Получив приглашение поучаствовать в таком глобальном событии от KOTRA (Корейского агентства содействия торговле и инвестициям), мы не долго думали: не все же о своей операционной системе для Интернета вещей говорить — и на других полезно посмотреть.

Когда Алексей вернулся, мы расспросили его об итогах и о самых актуальных трендах выставки.

Алексей, как ты объяснишь такое внимание к мобильным технологиям в Южной Корее?

Корейский рынок информационно-коммуникационных технологий — один из самых быстроразвивающихся в мире. А Global Mobile Vision 2017 — витрина новейших технологий, продуктов и услуг в мобильной индустрии.

Что стало главной темой выставки?

В двух словах — «Mobile meets intelligence» – мобильный интеллект. Вообще главной целью выставки была демонстрация ответа корейского бизнеса и государственного сектора на Четвертую промышленную революцию, более известную как Industry 4.0. Идея в том, что в условиях дефицита собственных природных ресурсов в Республике Корея (импортируется более 98% энергии и 80% продовольствия) основным двигателем экономики и Четвертой промышленной революции являются инновации в высокотехнологичных областях. И такими инновациями могут похвастать не только гиганты: например, на выставке отсутствовали промышленные монстры, типа Samsung или LG, а основное внимание было уделено малому и среднему бизнесу, разнообразным стартапам.

И какие же стартапы удивили лично тебя?

Бросилось в глаза присутствие на стендах множества стартапов на тему электроники для животных: различные устройства для автоматического кормления, совмещенные с играми и коммутаторами.

Забавно. А если говорить серьезно, то какие технологии преобладали на выставке и обсуждались на Global Mobile Vision Conference 2017?

«Рулили» технологии, связанные с мобильными сетями и устройствами, Интернетом вещей, умным производством, smart cars, умными медицинскими устройствами (фитнес-трекеры, умные весы, ростомеры и т. п.), и даже технологии, связанные с интеллектуальным электронным правительством (smart e-government).

Закономерно особое внимание уделили глобальным технологическим трендам: Интернету вещей (Internet of Things), искусственному интеллекту (AI), мобильной связи пятого поколения (5G).

У меня до сих пор на экране смартфона 3G доминирует над LTE, а тут уже 5G на подходе?

Точно! По словам Won Yeol Lee, директора крупнейшей корейской телекоммуникационной компании KT Corporation, только технология 5G может ускорить Четвертую промышленную революцию. Своим видением перспектив мобильной связи пятого поколения также поделились представители Qualcomm, Ericsson-LG, Naver и другие эксперты. Кстати, продемонстрировать всему миру мощь 5G Республика Корея собирается на зимних Олимпийских играх в Пхенчхане.

Еще один повод ждать Олимпиаду :)  А какие выводы ты сделал лично для себя?

Я еще больше убедился, что моя работа и наши продукты, в частности — операционная система МАКС для Интернета вещей — это движение в верном направлении, открывающее новые перспективы перед российскими IT-разработками.

Спасибо большое, успехов!

Всегда рад!

 

Комментарии
Продолжить чтение

TechHype

Внутри Первой Церкви Искусственного Интеллекта

На самом деле это неизбежно. Это гарантировано случится. То, что мы создадим, по сути, и будет богом. Не в том смысле, что он будет метать молнии или вызывать ураганы. Но если есть что-то в миллиард раз умнее самого умного человека, то как еще это назвать?

AppTractor

Опубликовано

/

Автор:

Энтони Левандовский не похож на пророка. Он одевается в стандартные для кремниевой долины джинсы и окружен пиарщиками, а не церковнослужителями. Инженер известен самоуправляемыми автомобилями – и большим скандалом – но его новый стартап связан не с механикой или ПО, а с новой религией. Искусственный интеллект лежит в основе многомиллиардных компаний, больших исследовательских проектов и множества предсказаний о гибели мира или, как минимум, его качественном изменении. Теперь Левандовский на полном серьезе создает его Первую Церковь.

«Если вы спросите любого, может ли компьютер быть умнее человека, то 99,9% скажут вам, что это научная фантастика», – говорит он. «На самом деле это неизбежно. Это гарантировано случится. То, что мы создадим, по сути, и будет богом. Не в том смысле, что он будет метать молнии или вызывать ураганы. Но если есть что-то в миллиард раз умнее самого умного человека, то как еще это назвать?»

Комментарии
Продолжить чтение

Интервью

Алексей Коровянский (Mobilatorium): камера смартфона – оптимальная точка входа в технологии дополненной реальности

18 ноября в Нижнем Новгороде пройдет международная конференция GDG Gorky. Одна из ее тем – виртуальная и дополненная реальность.

Анна Гуляева

Опубликовано

/

18 ноября в Нижнем Новгороде пройдет международная конференция GDG Gorky. Одна из ее тем – виртуальная и дополненная реальность. Мы поговорили с Алексеем Коровянским, Google Developer Expert-ом и основателем лаборатории Mobilatorium, который рассказал нам о том, что происходит в этой области сейчас.

Какие самые интересные проекты появились в области AR за последнее время?

Из приложений советую посмотреть – Ikea Place, SketchAR, Inkhunter, Giphy World, World Brush, Holo, MeasureKit, Google Lens, Snapchat, Facebook Messenger.

Эксперты сходятся во мнении, что камера смартфона это оптимальная точка входа в технологии дополненной реальности для массового пользователя. Между тем корпорации думают и работают над носимыми AR-устройствами и облаком дополненной реальности, поэтому стоит понимать, что те решение, которые мы видим сегодня, это только начало большого пути.

Существуют ли фундаментальные различия между ARKit и ARCore?

Базовые возможности и внешние интерфейсы фреймворков очень близки друг к другу, и это значительно упрощает жизнь для разработчиков, заинтересованных в создании AR приложений работающих на обеих платформах. Тем не менее, на данный момент у ARKit есть пара интересных возможностей, которых нет в ARCore. Это возможность легкой интеграции со SceneKit и SpriteKit, а также инструментарий Face Tracking API, появившийся в новом iPhone X. С другой стороны, в Google (скорее всего) уже работают над аналогичными возможностями для ARCore. Более того, Google работает и над web-стандартом и браузером с поддержкой AR!

Какие приложения уже сделаны на базе ARCore? Какие вы можете рекомендовать в качестве ориентиров?

На данный момент ARCore находится в стадии Dev Preview, поэтому в Google Play еще нет приложений, созданных на базе ARCore. В качестве источника вдохновения и ориентира я советую посмотреть приложения и примеры, опубликованные в канале BuiltWithARCore и на сайте AR Experiments.

Станет ли VR общедоступной технологией?

Да. Я и многие другие эксперты в этом уверены. Ключевой вопрос – когда? Думаю, что в США это может произойти в ближайшие пять лет.

Какая ценность может быть у виртуальной реальности для обычного пользователя?

VR может значительно упростить наше взаимодействие с технологиями и графическими интерфейсами. Поэтому даже пожилые люди легко осваивают возможности VR и с огромным удовольствием путешествуют по миру не выходя из дома. По сути VR дает нам возможность мгновенной телепортации, что значительно расширяет наши возможности в плане общения и обучения. Также VR – это море новых эмоций для любителей игр и развлечений.

Что нужно сделать разработчику, чтобы начать создавать приложения с дополненной реальностью?

Сделать уникальное и популярное приложение с дополненной реальностью сегодня просто, как никогда. Разработчики, знакомые с Unity3D или Unreal Engine, легко справятся с созданием AR-игры на базе ARKit и ARCore после прочтения официальной документации (само подключение и знакомство с AR фреймворками займет около часа). Для iOS разработчиков хорошим вариантом для старта может быть создание простого AR приложения на связке ARKit и SceneKit. При наличии небольшого бюджета на обучение, рекомендую пройти курсы на Udemy по Unity3D и ARKit.

Комментарии
Продолжить чтение

Интервью

Дмитрий Желнин (65apps): Как попасть в Топ-5 мобильных разработчиков России за три года

Если главный вопрос этого интервью «Как попасть в Топ-5 за три года», то мой ответ — «собрать лучшую на рынке команду».

Леонид Боголюбов

Опубликовано

/

Дмитрий Желнин, основатель 65apps, рассказал нам как за три года компания стала одним из лидеров рынка мобильной разработки в России и вошла в Топ-5 рейтинга Тэглайн.

Как начиналась история 65apps?

Как обычно. С шишек и ошибок трудных.

Начали с мобильных игр 6 лет назад. Облажались. Потом еще раз. И еще.

Очень уж хотелось делать игры.

Потом пошли небольшие заказы на создание бизнес-приложений. Потом их стало много. А отдел игровой разработки тихо захирел и умер.

Потом мы стали работать на субподрядах, но на конечного клиента не выходили, рынок нас не знал. Поэтому в Рейтинге Тэглайн мы были примерно… нигде.

Первыми нашими клиентами традиционно были стартапы. Люди с идеями приходили, заказывали приложения (или не заказывали)… и уходили. Проекты не имели развития, не нуждались в поддержке, не обогащали ни наше портфолио, ни бюджет компании. В какой-то момент я пришел к пониманию – невозможно создать устойчивую компанию по аутсорс-разработке, работая на рынке стартапов: ни денег, ни славы. И вот 3 года назад мы впервые взяли крупный заказ как самодостаточная аутсорс-команда, после чего уже работали только с конечным клиентом.

Такой же совет я даю коллегам из молодых студий, когда они обращаются ко мне.

И как изменился ваш подход со временем? Кто идеальный клиент компании 65apps сегодня?

Идеальный клиент для нас – не столько компания, имеющая известное имя (и сейчас у нас в портфеле много таких: Сбербанк, Яндекс, World Class,  Mail.ru, Чайхона №1, Hoff, Burger King и др.), сколько действительно имеющая  потребность в автоматизации с помощью мобильных технологий или в работе с мобильной аудиторией.

То есть это состоявшиеся компании, которым нужно развивать свое мобильное направление – понятно как, понятно для кого и понятно, где в таком решении деньги. Наши мобильные приложения – инструмент, решающий задачи бизнеса. Точка.

Маркетинговые свистелки-тарахтелки нам неинтересны.

Такой подход выгоден клиенту. Такой подход выгоден и нам. Он создает выгодное взаимодействие с заказчиком на долгие годы: всякое приложение нуждается в развитии и поддержке.

Вообще, с рынка приходит всё больше задач, связанных с автоматизацией внутренних нужд бизнеса – приложения для курьеров, для логистических процессов, для торговых представителей, онлайн-касс, личных кабинетов и т.п. То есть повышение внутренней эффективности бизнеса с помощью мобильного инструментария.

А кто ваш клиент по профессии: это маркетолог или айтишник?

Это наша боль.

Работа с маркетингом протекает всегда по одному и тому же грустному сценарию: они ищут, у какого подрядчика покрасивее картинки, развесёлее креатив и, конечно же, поменьше бюджет. Агентство с типовым названием “ХХХ-Медиа” берет с клиента 100 рублей, рисует красивый дизайн, потом просит нас за 1 рубль “сегодня за ночь сделать хоть что-нибудь, завтра нам сдавать проект”.

Мы с такими не работаем. Даже если это не агентство, а внутренний маркетинг клиента. Они такие же. Порченные. Потом прибегают с разорванным анусом: “надо все переделать, только качественно, а бюджет уже кончился, хээээлп”.

Мы так не умеем и уметь не хотим. Мобильная аудитория не прощает небрежности! Приложение – это не лендосик, который можно запилить за ночь из говна и палок.

Работа с айтишниками – совсем другое дело. IT-директор на стороне клиента понимает что нужно, понимает сложность и трудоемкость задач, планирует наперед. Он нуждается в качественной реализации, потому что осознает, что проекты имеют развитие.

Ценность мобильного приложения в компании понятна и измерима. Вообще, автоматизация с помощью мобильного инструментария еще только набирает обороты. Вот сюда я рекомендую смотреть уважаемым конкурентам, ищущим своё место на рынке.

Хорошо, с клиентами понятно. А в чём ваше отличие от конкурентов?

На этом, несомненно, визуально-центрированном рынке все слишком увлеклись красивостями и рюшечками.

Мы же сфокусированы на создании ценности для бизнеса, на утилитарности и техническом совершенстве. Мобильный инструментарий должен решать задачи бизнеса. Это основное и главное.

Может быть поэтому наши клиенты возвращаются к нам во второй, третий, четвертый раз.

После многочисленных проб и ошибок, мы твердо решили, что не держим дизайнеров внутри компании. Дизайнеры — самые сложноуправляемые единицы с полным отсутствием инженерного подхода, а внутренние издержки на их менеджмент зашкаливают.  И конечно нормальный мобильный разработчик заложит все эти риски в смету клиента.

Приходите к нам со своим дизайном и мы сделаем вам продукт безупречного качества! Ну а если вы хотите, чтобы ваше приложение выглядело эксклюзивно, то клиент, как известно, всегда прав, и в этом случае мы возьмем эту услугу с рынка, как берём с рынка внешние услуги по клинингу или любые другие. В этом случае вы все равно выиграете, потому что мы не станем раздувать бюджет за счет дизайна — стоить это будет 200-300 к, а не 2-3 млн, как у большинства наших коллег из топ-10. В общем, если бюджет позволяет — можете смело обращаться в топ-3 Тэглайна, в их коммерческих предложениях с десятью нулями все учтено. Если умеете считать деньги и шапочно понимаете ценообразование в аутсорс-разработке — к нам.

Если говорить про рынок заказной разработки, как он будет развиваться в ближайшей перспективе?

Очевидно, что сегодня рынок мобильной разработки носит характер «пузыря», который продолжает надуваться. Рано или поздно он бабахнет. И тогда девять из десяти компаний, не накопивших качественную клиентскую базу, не нарастивших компетенции внутри, не отстроивших процессы, не научившихся доносить информацию о себе потенциальным заказчикам, просто разорятся и исчезнут. Все так же, как было с тысячами сайтостроительных компаний некоторое время назад. Уже сейчас если вас нет в топ-50 Тэглайна – считайте, что вас нет на рынке.

Мы вкладываем много сил в качественных управленцев, в продвижение, в получение «долгих» клиентов, в технические навыки разработчиков – у нас в компании жесточайший отбор и до тестового задания доходит один из дюжины программистов.

Я сам носитель ценностей, которые культивируются у нас в компании – аккуратность, обязательность, ответственность, энтузиазм, интерес к своему делу. Невозможно качественно делать работу, строить долгосрочные отношения с клиентами и не соответствовать всем этим требованиям – тем более, если речь идет о крупных клиентах. Наша команда – моя гордость, основа нашего роста и успеха. И наше место в рейтинге – это ее заслуга. И если главный вопрос этого интервью «Как попасть в Топ-5 за три года», то мой ответ — «собрать лучшую на рынке команду».

И как развивается команда внутри вашей компании?

Мобильная разработка — это не Rocket Science. Это, в первую очередь, качество каждого этапа: проектирование, программирование, тестирование — и мы, понимая это, развиваем свою компанию именно в этих направлениях. Мы активно обучаем менеджеров и разработчиков, сертифицируемся в разных категориях.

Какие у компании 65apps планы на ближайшее развитие?

Войти в топ-3 уже через год. С нашей командой и набранным темпом у нас есть потенциал не просто подтвердить свое место в следующем году, но и войти в Топ-3 мобильных разработчиков России. Это сложная и комплексная задача, но у нас есть и силы, и компетенции. Мы можем намного больше.

Что будет в нашей компании в ближайшее время:

  • Увеличение  среднего срока разработки проектов и, как следствие, среднего чека. Это уже не 2-3 месяца, а 4-6, что обусловлено сложностью приложений, которые мы берем в производство. Наш фокус направлен на работу с железом, со сложным картографическим ПО. Мы непрерывно развиваемся и в фундаментальных знаниях об архитектуре приложений, чтобы реализовывать проекты любой сложности.
  • Переезд в Москву и открытие фронт-офиса 65apps. Это неминуемый этап развития и масштабирования компании, к которому мы готовы.
  • Смена локации ижевского продакшн-офиса: сейчас мы заняты поиском современного и удобного офисного пространства, где сможет с комфортом разместиться наша растущая команда.
  • Региональное масштабирование: мы рассматриваем возможность открытия дополнительных представительств 65apps в Екатеринбурге и Ульяновске.
  • Продолжение в наращивании компетенций – прохождение значимых на рынке программ сертификации качества, таких, как: Google Certified Associate Android Developer, Android Java SE 8 Programmer и др.
  • Ребрендинг студии — мы зарелизим свой собственный обновленный фирменный стиль и сайт, которые практически не менялись с момента основания компании.

 

Комментарии
Продолжить чтение

Наша рассылка

Каждому подписавшемуся - "1 час на UI аудит": бесплатный ускоренный курс для разработчиков веб и мобильных приложений!

Нажимая на кнопку "Подписаться" вы даете согласие на обработку персональных данных.

Популярное

X

Спасибо!

Теперь редакторы в курсе.