В этом выпуске Подлодки разбираемся, что такое векторные базы данных – зачем они понадобились, если есть SQL и текстовый поиск, как устроены под капотом и в чём их ключевое отличие от привычных подходов. Объясняем простыми словами: как данные превращаются в векторы, как по ним происходит быстрый поиск и почему это вообще работает.
В гостях Андрей Васнецов – основатель Qdrant. Вместе обсуждаем, откуда пошёл хайп, что изменилось с приходом LLM, как на практике применяются векторные базы (не только в RAG), какие есть популярные движки и встроенные решения в Postgres и ClickHouse, а также с какими подводными камнями, ограничениями и компромиссами сталкиваются команды при работе.
Содержание:
- 00:00 О чем выпуск
- 03:30 Что такое вектор
- 05:16 Размерность вектора
- 10:16 Почему появился векторный поиск
- 13:32 Архитектура векторных баз
- 18:29 Мультимодальные модели
- 21:10 Преобразование картинок в векторы
- 23:07 Обучение нейросетей
- 26:51 Ограничения текстового поиска
- 32:38 Оптимизация в векторном поиске
- 42:49 Влияние трендов на векторный поиск
- 47:18 Практическое применение векторного поиска
- 49:50 Особенности векторных баз для RAG
- 59:36 Реализация векторных индексов
- 01:02:04 Отличия векторных и графовых баз данных
- 01:17:24 Проблемы интерфейсов для векторного поиска
- 01:21:23 Рекомендации для изучения векторного поиска
- 01:26:17 Заключение

