Перетворюйте мову на текст за допомогою найбільших і найпотужніших моделей штучного інтелекту, включаючи: OpenAI Whisper large-v3 LLM. Відмінна обробка фонового шуму, декількох акцентів або живої мови.
Будь першим, хто прийме цей проект і отримуй додаткові безкоштовні години транскрипції кожного місяця!
Без повторних витрат
$40 на місяць Щорічний рахунок ЩорічноЩомісяця Щорічно |
Перезаписані транскрипції | $0.35 на годину |
---|---|
Транскрипція в реальному часі | $0.80 на годину |
Доступ до API | |
---|---|
Доступ до бази даних | |
Керовані служби | |
Обмеження швидкості перекладу | максимум 50 одночасних сеансів |
Запуск сервера | warm boot in non-peak times |
Переписати звук з вивантаженого файла | |
---|---|
Переписати аудіо з URL | |
Переписати звук з мікрофона | |
Експортувати субтитри і файли | |
Перекласти транскрипції | |
Polyglot |
Переписати з мікрофона | |
---|---|
Переписати з потоку | |
Переписування в реальному часі за допомогою публічної адреси URL | |
Переклади в реальному часі за допомогою публічної адреси URL | |
Історичні транскрипції через публічний URL | |
Увімкнути захист паролем | |
Заплановані транскрипції потоків |
Підтримка мови | 57 мов, а також діалекти і акценти |
---|---|
Автоматичне визначення мови | |
Сегментація абзацу | |
Резюме | |
Часові штампи рівня слів | |
Вирівнювання рівня слів | |
Дикторська діалогівка |
Довідка і підтримка | Підтримка електронної пошти і балачки |
---|---|
SLA |
VocalStack використовує великі мовні моделі (LLM), щоб отримати найкращу якість транскрипції, навіть у найскладніших аудіо середовищах. Це включає Whisper, який служить як основна модель для платформи VocalStack. Велика модель Whisper є найсучаснішою моделлю штучного інтелекту, яка була навчена на величезній кількості даних, щоб розуміти і точно транскрибувати мову.
Щоб краще зрозуміти вплив розміру моделі штучного інтелекту, скористаємося різними моделями Whisper, щоб переписати вигаданий уривок:
Нет, вам не будут выставлять счет за всю час. Наші витрати завжди розраховуються за секунду транскрибованого аудіо, незалежно від того, чи є транскрипція попередньо записаним аудіо чи живим аудіо. Це означає, що ви платите тільки за те, що вам потрібно переписати. Єдиним винятком є те, що аудіо має тривати не менше однієї хвилини. В іншому випадку, вам буде нараховано за всю хвилину.
Щоб ще більше спростити цю процедуру, ось вартість передзаписаної транскрипції у кожному з планів (припустимо, що ви використовували всі вільні години транскрипції за місяць):
Ні, прихованих витрат немає. Ви платите тільки за транскрипцію вашого аудіо контенту. (Іншими словами, тільки для витрат, перерахованих в таблиці цін. ) Інші можливості, такі як автоматичне виявлення мови, переклади, підсумки, сегментація абзаців, виявлення ключових слів і часові позначки, доступні безкоштовно.
Важливо, що кількість перекладів не впливає на вартість транскрипції. Наприклад, якщо ви транскрибуєте аудіофайл англійською мовою, а потім перекладаєте його іспанською, французькою і німецькою мовами, вам буде нараховано лише вартість транскрибування англійського аудіофайлу. Це також стосується живих транскрипцій з використанням Polyglot. Ви можете виконати необмежену кількість перекладів у будь- який час без додаткових платежів.
Попередньо записана транскрипція стосується процесу транскрипції аудіо, яке було раніше записано. Його можна завантажити як аудіофайл і переписати пізніше, що робить його придатним для підкастів, інтерв’ ю, відео та іншого записаного вмісту.
Транскрипція в реальному часі стосується процесу транскрипції аудіо в реальному часі під час мовлення. Це корисно для прямих потоків, радіопередач, подій, зустрічей, лекцій та інших ситуацій, коли потрібна негайна транскрипція (і, можливо, переклад)