Новости
Niantic использует данные игроков для создания «большой геопространственной модели»
Компания называет свое творение «большой геопространственной моделью» (Large Geospatial Model, LGM), проводя параллели с большими языковыми моделями (LLM).
На прошлой неделе компания Niantic объявила о планах по созданию ИИ-модели для навигации по физическому миру с помощью сканов, собранных у игроков ее мобильных игр, таких как Pokémon Go, и у пользователей приложения Scaniverse.
Все ИИ-модели требуют обучающих данных. До сих пор компании собирали данные с веб-сайтов, видеороликов на YouTube, книг, аудиоисточников и т.д., но это, пожалуй, первый случай, когда данные для обучения ИИ собираются через мобильное игровое приложение.
«За последние пять лет Niantic сосредоточилась на создании системы визуального позиционирования (VPS), которая использует одно изображение с телефона для определения его положения и ориентации с помощью 3D-карты, построенной на основе данных, полученных от людей, сканирующих интересные места в наших играх и Scaniverse», — пишет Niantic в блоге компании.
Компания называет свое творение «большой геопространственной моделью» (Large Geospatial Model, LGM), проводя параллели с большими языковыми моделями (LLM), подобными тем, что используются в ChatGPT. В то время как языковые модели обрабатывают текст, модель Niantic будет обрабатывать физические пространства, используя геолокационные изображения, собранные через ее приложения.
Масштабы сбора данных Niantic свидетельствуют о значительном присутствии компании в AR-пространстве. Модель знает более 10 миллионов отсканированных мест по всему миру, причем пользователи еженедельно собирают около 1 миллиона новых снимков через Pokémon Go и Scaniverse. Эти снимки делаются с точки зрения пешехода, захватывая места, недоступные для автомобилей и камер уличного обзора.
Компания сообщает, что обучила более 50 миллионов нейронных сетей, каждая из которых представляет определенное местоположение или угол обзора. Эти сети сжимают тысячи картографических изображений в цифровые представления физических пространств. Вместе они содержат более 150 триллионов параметров — настраиваемых значений, которые помогают сетям распознавать и понимать местоположение. В составлении карты одного места могут участвовать несколько сетей, и Niantic планирует объединить их знания в единую комплексную модель, способную понять любое место, даже с незнакомых ракурсов.
«Представьте, что вы стоите за церковью», — пишет Niantic. «Ближайшая локальная модель видела только парадный вход в эту церковь, и поэтому она не сможет сказать, где вы находитесь. Но в глобальном масштабе мы видели тысячи церквей, захваченных местными моделями по всему миру. Ни одна церковь не похожа на другую, но многие имеют общие черты. LGM получает доступ к этим распределенным знаниям».
Технология основана на существующей в Niantic системе визуального позиционирования Lightship, которая позволяет игрокам размещать виртуальные предметы в реальных местах с точностью до сантиметра. Недавняя функция Pokémon Go под названием Pokémon Playgrounds демонстрирует эту возможность, позволяя пользователям оставлять покемонов в определенных местах, чтобы другие могли их найти.
Niantic предполагает, что технология может использоваться в продуктах дополненной реальности, робототехнике и автономных системах, а также в пространственном планировании, логистике и совместной удаленной работе.
Догадывались ли миллионы игроков Niantic о том, что их сканы будут переданы в систему искусственного интеллекта? Судя по этой ветке Reddit, посвященной реакции на новость, похоже, что многие не удивлены. «Определенно, это не скрывалось», — написал один из участников Reddit. «Большинство из нас знали, что их бизнес-модель не вращается вокруг поддержки реальных игроков».