Претворај говор во текст со користење на најголемите и најмоќните модели на ВИ на располагање, вклучувајќи: OpenAI Whisper large-v3 LLM. Одлично управување со бучава во позадина, повеќе акценти, или говор во живо.
Бидете рано усвоени и добивајте дополнителни бесплатни часови за транскрипција секој месец!
Нема повторувачки трошоци
$40 на месец Годишно наплатување ГодишноМесечно Годишно |
Пред- снимени транскрипции | $0.35 % 1 секунди |
---|---|
Транскрипција во живо | $0.80 % 1 секунди |
Пристап до API | |
---|---|
Пристап до база на податоци | |
Управувани услуги | |
Ограничување на брзината на транскрипција | макс. 50 истовремени сесии |
Старт на серверот | warm boot in non-peak times |
Пренесете аудио од внесената датотека | |
---|---|
Пренесете аудио од URL | |
Пренесе аудио од микрофонот | |
Изнеси субтитрирани датотеки | |
Преведи транскрипции | |
Polyglot |
Препраќање од микрофон | |
---|---|
Препис од поток во живо | |
Транскрипции во реално време преку јавен URL | |
Преводи во реално време преку јавен URL | |
Историски транскрипции преку Публик URL | |
Овозможи заштита со лозинка | |
Закажани транскрипции во живо |
Поддршка за јазици | 57 јазици плус дијалекти и акценти |
---|---|
Автоматско откривање на јазик | |
Сегментација на параграфи | |
Резиме | |
Временски печати на ниво на збор | |
Порамнување на ниво на збор | |
Дијаризација на говорникот |
Помош и поддршка | Поддршка за е- пошта и разговор во живо |
---|---|
SLA |
VocalStack користи големи јазични модели (LLMs) за да се добие најдобар квалитет на транскрипција, дури и во најпредизвикувачките аудио средини. Ова вклучува Whisper, кој служи како основен модел за VocalStack платформата. Големиот Whisper модел е најсовремен модел на вештачката интелигенција кој е трениран на огромна количина на податоци за да го разбере и прецизно да го транскрибира говорот.
За подобро да го разбереме влијанието на големината на моделот на вештачката интелигенција, да ги искористиме различните модели на Whisper за да транскрибираме измислен извадок:
Не, нема да ви се наплати за целиот час. Нашите трошоци за наплата секогаш се пресметуваат по секунда на транскрибирано аудио, без разлика дали транскрипцијата е претходно снимена аудио или аудио во живо. Тоа значи дека ќе добиете фактура само за она што ви треба да го транскрибирате. Единствен исклучок е тоа што аудиото мора да трае најмалку една минута. Во спротивно, ќе ви се наплати за целата минута.
За да го поедноставиме ова уште повеќе, еве што ќе ви биде наплатено во секој план за претходно снимена транскрипција (под претпоставка дека сте ги искористиле сите бесплатни часови за транскрипција за месецот):
Не, нема скриени трошоци. Плаќате само за транскрипција на вашата аудио содржина. (Со други зборови, само за трошоците наведени на табелата за цените. Други карактеристики како што се автоматско детектирање на јазик, преводи, резимеа, сегментација на параграфи, детектирање на клучни зборови и временски печати се вклучени бесплатно.
Важно е да се напомене дека бројот на преводи не влијае на цената на транскрипцијата. На пример, ако транскрибирате аудио датотека на англиски и потоа ја преведете на шпански, француски и германски, ќе ви биде наплатена само транскрипцијата на англискиот аудио. Ова исто така важи и за транскрипции во живо користејќи Полиглот. Можете да извршите неограничен број на преводи во секое време без никакви дополнителни трошоци.
Претходно снимена транскрипција се однесува на процесот на транскрипција на аудио кој претходно бил снимен. Може да се качи како аудио датотека и да се транскрибира подоцна, што го прави погоден за подкасти, интервјуа, видеа и друга снимена содржина.
Транскрипција во живо се однесува на процесот на транскрипција на аудио во реално време како што се зборува. Ова е корисно за преноси во живо, подкасти, настани, состаноци, предавања и други сценарија каде што е потребна итна транскрипција (и евентуално превод)