GitHub

FluidAudio — фреймворк диаризации на CoreML

Опубликовано

12 месяцев назад

07.07.2025

Автор:

Diarization (или Speaker Diarization) — это процесс автоматического определения, кто говорит когда в аудиозаписи. Грубо говоря, система делит аудиофайл на сегменты по разным говорящим.

FluidAudio — Swift Speaker Diarization на CoreML. Это высокопроизводительный фреймворк Swift для диаризации на устройстве и обработки звука, разработанный для соответствия самым высоким стандартам. Цель — максимизировать производительность, используя исключительно модели CoreML. Все модели были вручную преобразованы командой разработчиков из вариантов с открытым исходным кодом и доступны на Hugging Face.

FluidAudio на GitHub: https://github.com/FluidInference/FluidAudio
Платформа: iOS
⭐️: 156

Если вы нашли опечатку - выделите ее и нажмите Ctrl + Enter! Для связи с нами вы можете использовать info@apptractor.ru.

Разработка4 недели назад

Горячая перезагрузка AGSL-шейдеров без пересборки: пошаговое руководство для Compose

Новости4 недели назад

Видео и подкасты о мобильной разработке 2026.21

Исследования4 недели назад

Как Apple боролась с мошенничеством в App Store в 2025

Видео и подкасты для разработчиков4 недели назад

N техник, которые улучшат работу видеоленты

AppTractor

FluidAudio — фреймворк диаризации на CoreML

GitHub

FluidAudio — фреймворк диаризации на CoreML

Популярное

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам:

Ваш комментарий (необязательно):