Разработка

Машинное обучение на устройствах с помощью MLX и Swift

MLX Swift расширяет MLX на язык Swift, облегчая исследователям ML-эксперименты на процессорах Apple.

Опубликовано

1 год назад

27.02.2024

Автор:

AppTractor

Язык программирования Swift обладает большим потенциалом для использования в работе с машинным обучением, поскольку сочетает в себе простоту использования и высокоуровневый синтаксис такого языка, как Python, и скорость компилируемого языка, такого как C++.

MLX — это фреймворк для работы с машинным обучением на Apple Silicon. MLX предназначен для исследований, а не для развертывания моделей в приложениях.

MLX Swift расширяет MLX на язык Swift, облегчая исследователям ML-эксперименты на процессорах Apple.

В этот релизе включены:

Всеобъемлющий Swift API для ядра MLX
Пакеты нейронных сетей и оптимизаторов высокого уровня
Пример генерации текста с помощью Mistral 7B
Пример обучения MNIST
C API для MLX, который служит мостом между Swift и ядром C++

Все вышеперечисленное выпущено под разрешительной лицензией MIT.

Это большой шаг к тому, чтобы ML-исследователи могли экспериментировать с ИИ, используя Swift.

Мотивация

MLX обладает несколькими важными для исследований в области машинного обучения функциями, которые поддерживают лишь немногие из существующих библиотек Swift. К ним относятся:

Нативная поддержка аппаратного ускорения. MLX может выполнять операции с интенсивными вычислениями на CPU или GPU.
Автоматическая дифференциация для обучения нейронных сетей и моделей машинного обучения на основе градиента.

Более подробную информацию о MLX можно найти в документации.

Язык программирования Swift — быстрый, простой в использовании и хорошо работает на Apple Silicon. С помощью MLX Swift вы получаете удобный для исследователей фреймворк машинного обучения с возможностью легко проводить эксперименты на различных платформах и устройствах.

Обзор

Начать работу с MLX Swift можно быстро и легко с помощью Xcode или SwiftPM.

В MLX Swift создание и выполнение операций с N-мерными массивами очень просто. В следующем примере все операции будут выполняться на устройстве по умолчанию, которым является GPU, если не указано иное.

import MLX
import MLXRandom

let r = MLXRandom.normal([2])
print(r)
// array([-0.125875, 0.264235], dtype=float32)

let a = MLXArray(0 ..< 6, [3, 2])
print(a)
// array([[0, 1],
//        [2, 3],
//        [4, 5]], dtype=int32)

// last element of 0th row
print(a[0, -1])
// array(2, dtype=int32)

// slice of the first two rows        
print(a[0 ..< 2])
// array([[0, 1],
//        [2, 3]], dtype=int32)

// add with broadcast
let b = a + r

print(b)
// array([[-0.510713, 1.04633],
//        [1.48929, 3.04633],
//        [3.48929, 5.04633]], dtype=float32)

​x
 
import MLXimport MLXRandom​let r = MLXRandom.normal([2])print(r)// array([-0.125875, 0.264235], dtype=float32)​let a = MLXArray(0 ..< 6, [3, 2])print(a)// array([[0, 1],//        [2, 3],//        [4, 5]], dtype=int32)​// last element of 0th rowprint(a[0, -1])// array(2, dtype=int32)​// slice of the first two rows        print(a[0 ..< 2])// array([[0, 1],//        [2, 3]], dtype=int32)​// add with broadcastlet b = a + r​print(b)// array([[-0.510713, 1.04633],//        [1.48929, 3.04633],//        [3.48929, 5.04633]], dtype=float32)

Вы также можете использовать преобразования функций в MLX Swift. Преобразования функций в MLX полезны для обучения моделей с автоматическим дифференцированием, а также для оптимизации вычислительных графов по скорости или использованию памяти. Ниже приведен пример, который вычисляет градиент функции.

func fn(_ x: MLXArray) -> MLXArray {
    x.square()
}

let gradFn = grad(fn)

let x = MLXArray(1.5)
let dfdx = gradFn(x)

// prints 2 * 1.5 = 3
print(dfdx)

xxxxxxxxxx
 
func fn(_ x: MLXArray) -> MLXArray {    x.square()}​let gradFn = grad(fn)​let x = MLXArray(1.5)let dfdx = gradFn(x)​// prints 2 * 1.5 = 3print(dfdx)

В документации есть несколько более полных примеров, которые помогут вам начать работу с MLX Swift:

Генерация текста с помощью LLM: Полный пример генерации текста LLM с помощью Mistral 7B. Пример генерирует текст, используя любую модель в стиле Mistral или Llama, включая предварительно квантованные модели MLX, многие из которых доступны на Hugging Face.
Обучение MLP на MNIST: Пример обучает простой многослойный перцептрон для классификации цифр MNIST, используя пакеты нейронных сетей и оптимизаторов MLX Swift.

Дополнительные ресурсы

Вот еще несколько ресурсов для начала работы с MLX Swift:

Документация и примеры на Swift
Репозиторий GitHub
Если у вас возникли проблемы или есть предложения по улучшению, рекомендуется создать issue
Если вы хотите внести свой вклад в MLX Swift, ознакомьтесь с руководством по внесению вклада.

Источник

Если вы нашли опечатку - выделите ее и нажмите Ctrl + Enter! Для связи с нами вы можете использовать info@apptractor.ru.