Один из наиболее эффективных вариантов использования современных моделей искусственного интеллекта — инструменты диктовки. Один из таких инструментов для Mac, Willow, запускает приложение для iOS, позволяющее пользователям печатать голосом во всех приложениях.
Подобно Wispr Flow, клавиатура Willow транскрибирует ваш голос и форматирует сообщение в соответствии с контекстом. Приложение, поддерживающее более 100 языков, позволяет вам определять собственную лексику или создавать различные стили письма для различных категорий приложений, таких как работа, обмен сообщениями, электронная почта и другие.
Одним из ключевых преимуществ приложения Willow является наличие полноценной клавиатуры для набора текста. Это помогает быстро редактировать слова или предложения, не набирая их целиком вручную. Кроме того, вам не нужно переключаться на другую клавиатуру, когда вы хотите набрать слова, а не проговаривать их.
Willow был основан Алланом Го и Лоуренсом Лю, выпускниками Стэнфорда, но бросившими учёбу ради стартапа. Дуэт пришёл в Y Combinator летом 2024 года с другим составом соучредителей (они сейчас покинули компанию). Изначально они хотели работать в сфере здравоохранения, а именно — создать программное обеспечение для управления домами престарелых. Однако эта идея не прижилась, и в течение года компания пыталась заниматься другими проектами.
«Работая над решениями для здравоохранения, мы заметили, что врачи используют голосовые записи, которые расшифровывает ИИ — они записывают разговоры с пациентами и создают документы для последующего наблюдения. У меня было много разговоров с врачами; они говорили, что эти ИИ-приложения очень полезны для них. Это подтолкнуло нас к созданию голосового ИИ-инструментария для работников сферы интеллектуального труда и других пользователей», — рассказал Го в интервью TechCrunch.
Го добавил, что решил не разрабатывать ещё один ИИ-транскрибер, поскольку считал рынок насыщенным. Вместо этого сфера диктовки показалась ему более привлекательной, поскольку большая часть общения происходит вне встреч. Он рассказал, что компания использует ряд моделей и уделяет особое внимание настройке своего text-to-text конвейера для форматирования и персонализации.
Затем стартап перенёс выпуск из YC на весну 2025 года. Компания заявила, что с момента запуска число пользователей растет на 50% каждый месяц. Среди корпоративных клиентов есть Uber, Heidi Health и Zego, которые используют инструмент для диктовки с такими функциями, как кастомный командный словарь.
Willow привлекла 4.5 миллиона долларов от Box Group, Y Combinator, Burst Capital и бизнес-ангелов. Один из них заявил, что, по его мнению, самые удивительные пользовательские интерфейсы будущего будут с голосовым управлением.
«Меня очень впечатлило видение Аллана, заключающееся не только в создании отличного приложения для диктовки, но и в долгосрочной перспективе в создании интерфейса, способного управлять компьютером», — сказал он. «Когда я пишу в Willow, мне нужно вносить меньше правок, чем при использовании встроенной системы диктовки компьютера».
Стартап конкурирует с другими игроками, такими как Wispr Flow, который на сегодняшний день привлек более 56 миллионов долларов финансирования; Monologue, который входит в пакет подписки Every; и стартапами Aqua, Talktastic, Superwhisper и Betterdictation, поддерживаемыми YC.
Го сообщил, что в ближайшие месяцы компания планирует расширить платформу на Windows и Android, а также улучшить персонализацию, чтобы сократить количество ручных правок, которые пользователи вносят после диктовки.

