Приложения
EzDubs стремится стать центром переводом для пользователей
Приложение, доступное на iOS и Android, предлагает перевод звонков в режиме реального времени с поддержкой 30 языков.
По оценкам различных аналитиков, мировой рынок переводческих услуг составляет около 40 миллиардов долларов. Значительную долю этого рынка составляют корпоративные услуги. Для потребителей доминируют такие приложения, как Google Translate и Apple Translate, но они не работают со звонками и голосовыми сообщениями.
Компания EzDubs, профинансированная Y Combinator, хочет решить эту проблему перевода с помощью своего приложения, которое поддерживает перевод звонков, голосовых сообщений и текста на более чем 30 языках.
Стартап был основан в 2023 году Падманабханом Кришнамурти, Амрутаваршем Кинаги и Каримом Нассаром. Кришнамурти и Кинаги познакомились во время учебы в колледже в Гонконге. В то время они создали проект, который читал по губам и переводил речь в текст для людей с нарушениями слуха.
В 2021 году дуэт переехал в Колумбийский университет и начал работать над дубляжом видео. В университете они познакомились с Нассаром, который возглавлял группу речевого ИИ в Cisco, параллельно обучаясь в магистратуре. Нассар работал над продуктами речевого ИИ в режиме реального времени. Позже он создал стартап Voicea, специализирующийся на интеллектуальном обеспечении переговоров, который продал компании Cisco. Трио официально приступило к созданию EzDubs после участия в программе Y Combinator 2023 с моделью дубляжа и ранней версией инструмента перевода.
Сначала компания создала бота для Twitter/X, который переводил ролики, размещенные на платформе, и выпустила его в январе 2023 года. Вы можете упомянуть бота и попросить его перевести видео на другой язык. У бота более 340 000 подписчиков, он получает более 500 запросов на перевод в день, а количество просмотров переведенных видеороликов превышает миллион в день.
В июле 2023 года компания запустила бота в WhatsApp, который позволял пользователям переводить голосовые сообщения и видео. Однако пользователю приходилось пересылать голосовое сообщение боту, получать ответный перевод и отправлять его оригинальному отправителю. Чтобы облегчить эту проблему и создать более надежный канал связи, компания решила создать свое приложение и выпустила раннюю версию в этом году.
«Партнеры из Y Combinator сказали нам, что если вы сможете решить сложную проблему с задержкой перевода разных языков, то коммуникационная платформа будет иметь гораздо больший эффект, чем видео», — отметил Кришнамурти, говоря о том, что он решил создать коммуникационное приложение, а не заниматься дублированием видео.
Приложение, доступное на iOS и Android, предлагает перевод звонков в режиме реального времени с поддержкой 30 языков. Вы можете позвонить человеку, говорящему на другом языке, и получить мгновенный перевод. При этом собеседнику не нужно иметь приложение EzDubs, чтобы разговаривать. Приложение также предлагает перевод текстовых, голосовых и видеосообщений.
Хотя пользователи могут делиться переведенными голосовыми или видеосообщениями за пределами приложения с помощью ссылки, создатели считают, что для людей, которые общаются на нескольких языках, такие платформы, как WhatsApp и iMessage, не подходят.
EzDubs отметил, что многие люди используют это приложение для совершения сотен звонков в день, при этом среднее время разговора составляет 17 минут. По словам представителей стартапа, в числе наиболее популярных пользователей — люди, встречающиеся с представителями других культур, и профессионалы, пытающиеся общаться с местными жителями, находясь за границей.
В основе стартапа лежат две модели: одна для клонирования голоса с сохранением передаваемых эмоций, а другая — для перевода. Модель перевода справляется с прерываниями и не ждет, пока кто-то закончит предложение, чтобы начать внутренний перевод.
Стартап привлек 4.2 миллиона долларов в качестве начального финансирования под руководством Venture Highway, основанной бывшим руководителем отдела по работе с клиентами WhatsApp Нираджем Аророй. В раунде также приняли участие партнер Y Combinator Джаред Фридман, генеральный директор Replit Амджад Масад, президент Replit Мишель Катаста, генеральный директор компании Applied Intuition, занимающейся разработкой программного обеспечения для автономных автомобилей, Касар Юнис и генеральный директор облачного стартапа Replicate, поддерживаемого a16z, Бен Фиршман.
Фридман отметил, что компания находится на пути к тому, чтобы сделать инструменты перевода легкодоступными для пользователей. Кроме того, он верит в продукт, учитывая богатую историю основателей, занимающихся изучением речи и языков.
«Доступ к высококачественным переводчикам был ограничен корпорациями и государственными структурами. EzDubs пытается демократизировать доступ к этой услуге через свое приложение», — говорит Фридман.
Он добавил, что даже внутри компании существуют языковые барьеры, мешающие эффективному общению, и EzDubs может устранить их.
В скором времени компания запустит функцию, которая позволит человеку отсканировать QR-код и инициировать звонок EzDubs мгновенно, не загружая приложение. По словам основателей, хотя в таких приложениях, как Google Translate, есть режим реального времени, для его работы необходимо передавать телефон туда-сюда. В конечном итоге стартап хочет сделать EzDubs приложением для звонков по умолчанию, чтобы оно также могло обрабатывать входящие звонки.
В ближайшие месяцы EzDubs также планирует создать расширение для таких приложений, как Google Meet, Microsoft Teams, Zoom и Slack.
-
Новости4 недели назад
Видео и подкасты о мобильной разработке 2024.51
-
Новости3 недели назад
Видео и подкасты о мобильной разработке 2024.52
-
Видео и подкасты для разработчиков4 недели назад
Как ВКонтакте измеряет перфоманс приложений
-
Видео и подкасты для разработчиков4 недели назад
Compose и SwiftUI: найди 10 отличий