Site icon AppTractor

Новый метод обучения ИИ от Apple сохраняет конфиденциальность

Исследователи Apple разработали новый мультимодальный метод быстрого обучения больших языковых моделей (LLM), который может позволить создать более гибкие и мощные системы машинного обучения и «искусственного интеллекта».

В научной статье, опубликованной компанией на исследовательском сайте arxiv.org в начале прошлой недели, говорится о том, что Apple использовала для обучения LLM так называемое «тщательное сочетание» (careful mix) изображений с подписями, чередования изображений с текстом и данных, содержащих только текст. Сочетание визуальных и языковых данных позволило моделям справиться с такими задачами, как интеллектуальное создание подписей к изображениям или генерация текста на естественном языке.

В ходе исследования было установлено, что выбор энкодера изображений и разрешение обрабатываемых им изображений оказывают большее влияние на производительность, чем дизайн коннектора «зрение-язык».

В одном случае, используя модель MM1 с 30 миллиардами параметров, была обнаружена высокая способность к контекстному обучению. Это открытие означает, что система может выполнять многоступенчатые рассуждения над несколькими изображениями с небольшим количеством подсказок.

Судя по всему, Apple продолжает свою традицию быть «быстрым последователем», а не «первопроходцем», когда речь идет о революционных технологиях. Генеральный директор Тим Кук недавно признал, что компания тратит  миллиард долларов в год на внедрение «искусственного интеллекта» в существующие технологии.

Кук сказал, что компания поделится «подробностями текущей работы в области ИИ позднее в этом году». Ожидается, что Apple сделает несколько заявлений о своих достижениях на WWDC в июне этого года.

Компания догоняет конкурентов в использовании технологий, связанных с искусственным интеллектом. Она также разрабатывает методы, которые позволят сохранить конфиденциальность пользователей и при этом расширить существующие возможности машинного обучения.

Интерес Apple к мультимодельному обучению нейронных сетей позволил добиться самых современных результатов, позволяющих проводить многоступенчатые рассуждения. Это говорит о том, что компания нашла путь к быстрому развитию способностей машинного обучения и наделению их расширенными возможностями «интеллекта».

 

Exit mobile version