Транскрипција говора у текст користећи највеће и најмоћније моделе УИ доступне, укључујући: OpenAI Whisper large-v3 LLM. Одлично руковање позадинском буком, вишеструким акцентом, или живим говором.
Поред тога, сваки месец се издаје и додатак за слободне програмере.!
Нема понављајућих трошкова
$40 месечно Годишња наплата ГодишњеМесечно Годишње |
Претходно снимљене транскрипције | $0.35 на сат |
---|---|
Транскрипција | $0.80 на сат |
АПИ приступ | |
---|---|
Приступ бази података | |
Управљани сервиси | |
Ограничење брзине транскрипције | максимум 50 истовремених сесија |
Почетак сервера | warm boot in non-peak times |
Преписивање звука из постављене фајлове | |
---|---|
Преписивање аудио- фајла са URL- а | |
Преписивање звука са микрофона | |
Извози поднаслове и фајлове | |
Преводи | |
Polyglot |
Преписивање са микрофона | |
---|---|
Преписивање из живог тока | |
Транскрипције у реалном времену преко јавног URL-а | |
Преводи у реалном времену преко јавног URL- а | |
Портал Биографија Портал Биографија Портал Србија | |
Ово укључује заштиту лозинком | |
Закажене транскрипције |
Подршка језика | 57 језика плус дијалекти и акценти |
---|---|
Аутоматско откривање језика | |
Сегментација параграфа | |
Резиме | |
Временски печати на нивоу речи | |
Поравнавање на нивоу речи | |
Диаграми дијаграма |
Помоћ и подршка | Подршка за е- пошту и чат |
---|---|
СЛА |
VocalStack користи велике језичке моделе (LLMs) да би добио најбољи могући квалитет транскрипције, чак и у најпредизвиканијим аудио окружењима. Ово укључује Whisper, који служи као језгро модела за VocalStack платформу. Велики Whisper модел је state-of-the-art модел вештачке интелигенције који је обучен на огромној количини података да разуме и прецизно транскрибује говор.
Да бисмо боље разумели утицај величине модела вештачке интелигенције, користимо различите Whisper моделе за транскрипцију фиктивног извадка:
Не, нећете бити нарачунати за цео сат. Наши трошкови нарачуна се увек израчунавају по секунди транскрибованог звука, без обзира да ли је транскрипција претходно снимљена аудио или аудио уживо. То значи да ћете добити само рачун за оно што вам је потребно транскрибовано. Једини изузетак је да аудио мора трајати најмање један минут. У супротном ћете бити награђени за цео минут.
Да би се ово још више поједноставило, ево шта ће вам бити нарачунато у сваком плану за унапред снимљену транскрипцију (под претпоставком да сте искористили све своје бесплатне транскрипционе сата за месец):
Нема скривених трошкова. Плаћате само за транскрипцију свог аудио садржаја. (Другим речима, само за трошкове наведене у табели цена. Друге карактеристике као што су аутоматска детекција језика, преводи, резимеи, сегментација параграфа, детекција кључних речи и временске ознаке су укључени бесплатно.
Важно је да број превода не утиче на трошкове транскрипције. На пример, ако транскрибујете аудио фајл на енглеском и онда га преведете на шпански, француски и немачки, наплатиће вам се само транскрибовање енглеског аудиоа. Ово такође важи за транскрипције уживо користећи Полиглот. Можете извршити неограничен број превода у било које време без додатних трошкова.
Предснимљена транскрипција се односи на процес транскрипције звука који је претходно снимљен. Може се постављати као аудио фајл и касније транскрибовати, што га чини погодним за подкастове, интервјуе, видео-снимке и друге снимљене садржаје.
Транскрипција уживо се односи на процес транскрипције звука у реалном времену док се говори. Ово је корисно за преносе уживо, подкастове, догађаје, састанке, предавања и друге сценарије где је потребна тренутна транскрипција (и можда превод)