GitHub

FluidAudio — фреймворк диаризации на CoreML

Опубликовано

1 год назад

07.07.2025

Автор:

Diarization (или Speaker Diarization) — это процесс автоматического определения, кто говорит когда в аудиозаписи. Грубо говоря, система делит аудиофайл на сегменты по разным говорящим.

FluidAudio — Swift Speaker Diarization на CoreML. Это высокопроизводительный фреймворк Swift для диаризации на устройстве и обработки звука, разработанный для соответствия самым высоким стандартам. Цель — максимизировать производительность, используя исключительно модели CoreML. Все модели были вручную преобразованы командой разработчиков из вариантов с открытым исходным кодом и доступны на Hugging Face.

FluidAudio на GitHub: https://github.com/FluidInference/FluidAudio
Платформа: iOS
⭐️: 156

Если вы нашли опечатку - выделите ее и нажмите Ctrl + Enter! Для связи с нами вы можете использовать info@apptractor.ru.

Новости4 недели назад

Видео и подкасты о мобильной разработке 2026.25

Разработка4 недели назад

Лучшие практики SwiftUI из агентского навыка Xcode 27

Новости4 недели назад

Android 17 официально вышел

Программирование4 недели назад

Что нового в Swift 6.4 после WWDC26

AppTractor

FluidAudio — фреймворк диаризации на CoreML

GitHub

FluidAudio — фреймворк диаризации на CoreML

Популярное

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам:

Ваш комментарий (необязательно):