VocalStack Logo

Documentation

Získať údaje o prepise

Získať údaje z čakajúcich alebo dokončených prepisov

Prepis z mikrofónu alebo LiveStream

Prepisujte živú reč z mikrofónu alebo živého prenosu

Transkripčné relácie

Monitorovať a spravovať stav prepisu s reláciami

Preložiť prepis

Preložiť prepísaný text do iného jazyka

Prepis zvuku z URL

Prepis reči z vopred nahratého zvuku v URL na obyčajný text

Tokeny overenia na strane klienta

Vytvoriť dočasný token overenia pre požiadavky na strane klienta

Prepis a prezentácia polyglotovej relácie

Vytvorte reláciu, ktorá môže byť použitá na vysielanie živého prepisu prostredníctvom verejného zdieľaného odkazu

Žiadosť o prepis a odpoveď

Prehľadávať dokumentáciu
Spoločné možnosti žiadosti a odpovede pre všetky operácie prepisu. Použite možnosti na konfiguráciu nastavení prepisu.
VocalStack sa pokúsi prepísať váš zvuk pomocou rozumných predvolených možností konfigurácie. Žiadosť o prepis však môžete ďalej nakonfigurovať pomocou nasledujúcich možností:
  • languageKód jazyka podľa normy ISO 639-1 pre reč. Napríklad "en" (angličtina) alebo "ro" (rumunčina). V predvolenom nastavení sa VocalStack pokúsi prepísať vo všetkých jazykoch, ak táto možnosť nie je poskytnutá. To môže byť užitočné pre viacjazyčnú reč. Ak však poznáte jazyk reči, poskytnutie tejto možnosti môže zvýšiť presnosť prepisu. Trvanie zvukového súboru v sekundách.
  • duration_s Táto voľba sa používa ako ochrana, aby sa zabezpečilo, že váš prepis sa uskutoční iba vtedy, ak dĺžka zvukového súboru zodpovedá dĺžke voľby. V predvolenom nastavení je táto voľba ignorovaná a prepisy sa spracujú bez ohľadu na ich dĺžku. Maximálne trvanie, ktoré možno prepísať, v sekundách. Použite túto možnosť, ak chcete obmedziť množstvo prepísanej reči. Nastavte to na
  • max_duration_s Ak chcete spracovať celý prepis, bez ohľadu na jeho dĺžku (⚠️ používajte s opatrnosťou). Predvolene je táto možnosť nastavená na. , pričom sa zabezpečí, že sa prepíšu len prvé dve hodiny prejavu.Odpoveď na transkripciu0Môžete asynchrónne monitorovať prepis údajov, ako sa stane k dispozícii pomocou. 7200 obslužný program udalostí, ktorý poskytuje
Objekt odpovedeonDataThe. response Tento objekt má nasledovné vlastnosti:
: Hodnota medzi 0 a 1 označujúca percentuálny pokrok transkripcieresponse Ak je stav "processing" alebo "done", bude k dispozícii objekt časovej osi, ktorý zobrazuje celý prepis dostupný do tohto bodu. Časová os je pole objektov obsahujúcich tieto vlastnosti:
  • status: čas začiatku segmentu prepisu
  • data.progress: čas ukončenia segmentu prepisu
  • data.timeline: časť textu v segmente prepisu: úložisko kľúčových hodnôt jazykových kódov v ISO 639-1 a prekladov (táto vlastnosť je dostupná len vtedy, ak má prepis aspoň jeden preklad)
    • startPost- spracovanie
    • endPo dokončení transkripcie sa uskutoční postprocesovanie, v ktorom sa vytvorí konečný.
    • text bude zaslané na
    • translations.V konečnej odpovedi bude stav prepisu "done" a tieto nové vlastnosti budú zahrnuté v.
: zhrnutie celého prepisu v jednom odsekuresponse: celý prepis zoskupený do odsekov, rozdelený podľa tém alebo zmysluplným prechodom na novú témuonDataPodpora pre TypescriptdataVocalStack JavaScript SDK má plnú podporu pre TypeScript. Napríklad
  • keywords objekt má
  • summary typ.
  • paragraphsZahteva za prepis
ISO 639-1 je standard za označevanje jezikov.response Na primer "en" (angleščina) ali "ro" (romunščina). Privzeto bo VocalStack poskušal prepisati v vseh jezikih, če ta možnost ni na voljo. To je lahko koristno za večjezični govor. Če pa poznate jezik govora, lahko s to možnostjo povečate natančnost prepisa. UrlTranscriptionResponseTrajanje zvočne datoteke v sekundah.
TSTypeScript
import { UrlTranscription, UrlTranscriptionResponse } from '@vocalstack/js-sdk'; const sdk = new UrlTranscription({ apiKey: 'YOUR-API-KEY' }); const transcription = await sdk.start({ url: 'http://example.com/audio.mp3' }); transcription.onData((response: UrlTranscriptionResponse) => { console.log(response.data); });
Scroll Up