Транскрипция речи в текст с использованием самых мощных моделей искусственного интеллекта, включая: OpenAI Whisper large-v3 LLM. Отличное управление фоновым шумом, множественными акцентами или живой речью.
Будь одним из первых, кто примет эту технологию, и получи дополнительные бесплатные часы транскрипции каждый месяц!
Отсутствие периодических расходов
в месяц
Счета выставляются ежемесячноСчета выставляются ежегодно
$40 в месяц Счета выставляются ежегодно ЕжегодноЕжемесячно Ежегодно |
Предварительно записанные транскрипции | $0.35 в час |
---|---|
Транскрипция в реальном времени | $0.80 в час |
API доступ | |
---|---|
Доступ к базе данных | |
Управляемые услуги | |
Предел скорости транскрипции | макс. 50 одновременных сеансов |
Запуск сервера | warm boot in non-peak times |
Транскрипция аудио из загруженного файла | |
---|---|
Транскрипция аудио из URL | |
Транскрипция аудио из микрофона | |
Экспорт субтитров и файлов | |
Перевести транскрипции | |
Polyglot |
Транскрипция с микрофона | |
---|---|
Транскрипция из прямого потока | |
Транскрипция в режиме реального времени через публичный URL | |
Перевод в режиме реального времени через публичный URL | |
Исторические транскрипции через публичный URL | |
Включить защиту паролем | |
Расписаны транскрипции |
Языковая поддержка | 57 языков плюс диалекты и акценты |
---|---|
Автоматическое определение языка | |
Сегментация пунктов | |
Резюме | |
Метки времени уровня слова | |
Выравнивание на уровне слов | |
Диаризация |
Помощь и поддержка | Электронная почта и чат |
---|---|
SLA |
VocalStack использует большие языковые модели (LLM) для получения наилучшего качества транскрипции, даже в самых сложных аудио средах. Сюда входит Whisper, который служит основной моделью для платформы VocalStack. Большая модель Whisper – это современная модель искусственного интеллекта, которая была тренирована на огромном количестве данных, чтобы точно понимать и транскрибировать речь.
Чтобы лучше понять влияние размера модели ИИ, давайте используем различные модели Whisper для транскрипции вымышленного отрывка:
Нет, вам не будет выставлен счет за весь час. Наши расходы всегда рассчитываются за секунду транскрибированного аудио независимо от того, является ли транскрипция заранее записанным аудио или аудио в реальном времени. Это означает, что вы платите только за то, что вам нужно переписать. Единственным исключением является то, что длительность аудиозаписи должна составлять не менее одной минуты. В противном случае с вас будет взиматься плата за всю минуту.
Чтобы упростить это еще больше, вот что вам будет взиматься в каждом плане за предварительно записанную транскрипцию (при условии, что вы использовали все ваши бесплатные часы транскрипции за месяц):
Нет, скрытых издержек нет. Вы платите только за транскрипцию вашего аудиоконтента. (Иными словами, только для расходов, перечисленных в таблице цен. ) Другие функции, такие как автоматическое обнаружение языка, переводы, резюме, сегментация пункта, обнаружение ключевых слов и временные метки включены бесплатно.
Важно отметить, что количество переводов не влияет на стоимость транскрипции. Например, если вы транскрибируете аудиофайл на английском языке, а затем переводите его на испанский, французский и немецкий языки, вам будет взиматься плата только за транскрибирование английского аудиофайла. Это также относится к транскрипции в режиме реального времени с помощью Polyglot. Вы можете выполнять неограниченное количество переводов в любое время без каких-либо дополнительных затрат.
Предварительно записанная транскрипция относится к процессу транскрипции аудио, которое было ранее записано. Он может быть загружен в качестве аудиофайла и транскрибирован позже, что делает его подходящим для подкастов, интервью, видео и другого записанного контента.
Транскрипция в режиме реального времени относится к процессу транскрипции аудио в режиме реального времени по мере того, как он говорит. Это полезно для прямых трансляций, подкастов, мероприятий, встреч, лекций и других сценариев, где требуется немедленная транскрипция (и, возможно, перевод)