Ператварэньне мовы ў тэкст з выкарыстаньнем найбуйнейшых і найбольш магутных мадэляў штучнага інтэлекту, уключаючы: OpenAI Whisper large-v3 LLM. Выдатная праца з фонавым шумам, мноствам акцэнтаў або жывой мовай.
Будзьце першымі, хто прыме гэты падыход, і атрымайце дадатковыя гадзіны транскрыпцыі кожны месяц!
Няма паўторных выдаткаў
$40 у месяц Штогадовы рахунак ШтогодШтомесяц Штогод |
Запісаныя перад запісам транскрыпцыі | $0.35 % 1 хвілін |
---|---|
Транслітарацыя | $0.80 % 1 хвілін |
Даступнасць API | |
---|---|
Даступ да базы дадзеных | |
Кіраваны сервісComment | |
Абмежаванне хуткасці перапісвання | макс. 50 адначасова працуючых сеансаў |
Пачатак сервера | warm boot in non-peak times |
Перазапісаць файл? | |
---|---|
Перазапісаць гук з URL | |
Перапісаць гук з мікрафона | |
Экспартаваць субтытры і файлы | |
Пераклад | |
Polyglot |
Перапісваць з мікрафона | |
---|---|
Перапіска з Live Stream | |
Транскрипция в реальном времени через публичный URL | |
Пераклад у рэальным часе праз публічны URL | |
Шаблон:Праграматары па імені | |
Уключыць абарону паролем | |
Запланаваныя транскрыпцыі |
Моўная падтрымка | 57 моваў, дыялекты і акцэнты |
---|---|
Аўтаматычнае вызначэнне мовы | |
Абзац | |
Зводка | |
Часовыя знакі ўзроўню слова | |
Выраўнаванне па ўзроўні слова | |
Дыялагічны дынамік |
Дапамога і падтрымка | Падтрымка электроннай пошты і жывога чата |
---|---|
SLA |
VocalStack выкарыстоўвае вялікія мовы мадэляў (LLMs) для атрымання лепшага якасці транскрыпцыі, як гэта магчыма, нават у самых складаных аўдыё асяроддзі. Гэта ўключае Whisper, які служыць асновай для платформы VocalStack. Большая мадэль Whisper — гэта сучасная мадэль штучнага інтэлекту, якая была навучана на вялікай колькасці дадзеных, каб зразумець і дакладна перапісаць мову.
Для таго, каб лепш зразумець уплыў памеру мадэлі штучнага інтэлекту, давайце выкарыстаем розныя мадэлі Whisper, каб перапісаць выдуманы фрагмент:
Не, вы не будзеце плаціць за ўвесь гадзіну. Нашы падаткі заўсёды разлічваюцца за секунду транскрыпцыі аўдыё, незалежна ад таго, з'яўляецца транскрыпцыя запісаным аўдыё ці жывым аўдыё. Гэта азначае, што вы плаціце толькі за тое, што вам трэба перапісаць. У адрозненне ад аўдыё, відэа павінна быць не менш за 1 хвіліну. У адваротным выпадку вы будзеце аплачваць за ўсю хвіліну.
Для далейшага спрашчэння, вось што вам будзе аплачана ў кожным плане за папярэдне запісаную транскрыпцыю (пры ўмове, што вы выкарыстоўвалі ўсе свае бясплатныя гадзіны транскрыпцыі за месяц):
Не, ніякіх схаваных выдаткаў няма. Вы плаціце толькі за транскрыпцыю вашага аўдыё-кантэнту. (Пра гэта можна даведацца з тэксту, размешчанага на старонцы праекта). ) Іншыя функцыі, такія як аўтаматычнае выяўленне мовы, пераклады, падрабязнасці, сегментацыя абзацаў, выяўленне ключавых слоў, і часопісы ўключаны бясплатна.
Важна, што колькасць перакладаў не ўплывае на кошт транскрыпцыі. Напрыклад, калі вы транскрыптуеце аўдыё файл на англійскай мове, а затым перакладаеце яго на іспанскую, французскую і нямецкую мовы, вы будзеце плаціць толькі за транскрыпцыю англійскага аўдыё. Гэта таксама датычыцца жывых транскрыпцый, якія выкарыстоўваюць Polyglot. Вы можаце выканаць неабмежаваную колькасць перакладаў у любы час без дадатковых выдаткаў.
Праграмнае забеспячэнне, якое выкарыстоўваецца для запісу аўдыёзапісу, называецца транскрыптарам (transcripter). Ён можа быць загружаны як аўдыё файл і перапісаны пазней, што робіць яго прыдатным для падкастаў, інтэрв'ю, відэа і іншага запісанага кантэнту.
Live transcription азначае працэс транскрыпцыі аўдыёзапісу ў рэальным часе, калі ён гучыць. Гэта карысна для жывых трансляцый, падкастаў, мерапрыемстваў, сустрэч, лекцый і іншых сцэнараў, дзе патрабуецца неадкладная транскрыпцыя (і магчыма пераклад)