Преобразувайте речта в текст, като използвате най-големите и най-мощните модели на изкуствен интелект, включително: OpenAI Whisper large-v3 LLM. Отлична работа с фонов шум, множество акценти или жива реч.
Бъдете един от първите, които ще използват услугата и ще получавате допълнителни безплатни часове за транскрипция всеки месец!
Без повтарящи се разходи
$40 на месец Фактурирани ежегодно ГодишноМесечно Годишно |
Предварително записани транскрипции | $0.35 на час |
---|---|
Транскрипция на живо | $0.80 на час |
Достъп до API | |
---|---|
Достъп до база данни | |
Управлявани услуги » | |
Ограничение на скоростта на транскрипция | макс. 50 едновременни сесии |
Стартиране на сървъра | warm boot in non-peak times |
Преписване на аудио от качен файл | |
---|---|
Преписване на аудио от адрес | |
Преписване на аудио от микрофон | |
Експортиране на субтитри и файлове | |
Превод на транскрипции | |
Polyglot |
Препис от микрофон | |
---|---|
Препис от поток на живо | |
Транскрипции в реално време чрез публичен адрес | |
Преводи в реално време чрез публичен адрес | |
Исторически преписи чрез публичен адрес | |
Активиране на защита с парола | |
Планирани транскрипции на живо |
Поддръжка на езици | 57 езика плюс диалекти и акценти |
---|---|
Автоматично разпознаване на езика | |
Сегментация на параграфи | |
Резюме | |
Времеви печати на ниво дума | |
Подравняване на ниво дума | |
Диаризация на говорителя |
Помощ & поддръжка | Поддръжка по имейл и чат на живо |
---|---|
SLA |
VocalStack използва големи езикови модели (LLM), за да получи най-доброто качество на транскрипция, дори и в най-предизвикателните аудио среди. Това включва Whisper, който служи като основен модел за платформата VocalStack. Големият модел е най-съвременният модел на изкуствен интелект, който е обучен върху огромно количество данни, за да разбере и преведе речта точно.
За да разберем по-добре влиянието на размера на модела на изкуствения интелект, нека използваме различните модели за да транскрибираме фиктивен откъс:
Не, няма да бъдете таксувани за целия час. Разходите ни за фактуриране винаги се изчисляват на секунда от транскрибирано аудио, независимо дали транскрипцията е предварително записано аудио или аудио на живо. Това означава, че ще бъдете таксувани само за това, което трябва да бъде транскрибирано. Единственото изключение е, че аудиото трябва да бъде с продължителност поне една минута. В противен случай ще бъдете таксувани за цялата минута.
За да опростим допълнително, ето какво ще бъдете таксувани във всеки план за предварително записана транскрипция (при условие, че сте използвали всичките си безплатни часове за транскрипция за месеца):
Не, няма скрити разходи. Плащате само за транскрипцията на вашето аудио съдържание. (С други думи, само за разходите, изброени в ценовата таблица. ) Други функции като автоматично откриване на езика, преводи, обобщения, параграф сегментация, откриване на ключови думи, и времеви печати са включени безплатно.
Важно е да се отбележи, че броят на преводите не влияе върху цената на транскрипцията. Например, ако транскрибирате аудио файл на английски и след това го преведете на испански, френски и немски, ще бъдете таксувани само за транскрибирането на английския аудио файл. Това се отнася и за транскрипции на живо с помощта на Полиглот. Можете да извършвате неограничен брой преводи по всяко време без допълнителни такси.
Предварително записаната транскрипция се отнася до процеса на транскрибиране на аудио, което е било записано по-рано. Той може да бъде качен като аудио файл и транскрибиран по-късно, което го прави подходящ за подкасти, интервюта, видеоклипове и друго записано съдържание.
Транскрипцията на живо се отнася до процеса на транскрибиране на аудио в реално време, докато се говори. Това е полезно за потоци на живо, подкастове, събития, срещи, лекции и други сценарии, при които се изисква незабавна транскрипция (и евентуално превод)