VocalStack Logo

Documentation

Dohvaćanje podataka o transkripciji

Dohvaćanje podataka iz čekanja ili dovršenih transkripcija

Transkripcija s mikrofona ili prijenosa uživo

Prepisivati govor uživo iz mikrofona ili live stream

Seanse transkripcije

Nadziranje i upravljanje stanjem transkripcije sa seansama

Prevedite transkripciju

Prevodio je s hrvatskog na druge jezike

Prepisivati audio s URL- a

Pretvara govor iz unaprijed snimljenog zvuka u URL u obični tekst

Tokeni za provjeru autentičnosti na klijentskoj strani

Napravi privremeni token za provjeru autentičnosti za zahtjeve s klijentske strane

Transkripcija i prezentacija poliglotske sesije

Izradite sesiju koja se može koristiti za emitiranje transkripcije uživo putem javne poveznice za dijeljenje

Zahtjev za transkripciju i odgovor

Pregledaj dokumentaciju
Zajedničke mogućnosti zahtjeva i odgovora za sve operacije transkripcije. Koristite mogućnosti za konfiguriranje postavki transkripcije.
VocalStack će pokušati prepisati vaš audio koristeći razumne zadane opcije konfiguracije. Međutim, možete dodatno konfigurirati zahtjev za transkripciju sa sljedećim mogućnostima:
  • languageISO 639-1 jezici. Na primjer, "en" (engleski) ili "ro" (rumunjski). Prema zadanim postavkama, VocalStack će pokušati transkripciju na svim jezicima ako ta opcija nije ponuđena. To može biti korisno za višejezični govor. Međutim, ako znate jezik govora, pružanje ove mogućnosti može povećati točnost transkripcije. Trajanje, u sekundama, audio datoteke.
  • duration_s Ova opcija se koristi kao zaštita kako bi se osiguralo da se transkripcija dogodi samo ako se duljina audio datoteke podudara s trajanjem opcije. Prema zadanim postavkama, ova opcija se ignorira, i transkripcije će se obrađivati bez obzira na njihovu duljinu. Maksimalno trajanje koje se može prepisati, u sekundama. Upotrijebite ovu opciju ako želite ograničiti količinu transkribiranog govora. Postavite na
  • max_duration_s Ako želite obraditi cijeli transkript, bez obzira na njegovo trajanje (⚠️ koristite s oprezom). Prema zadanim postavkama, ova je opcija postavljena na. , osiguravajući da su samo prva dva sata govora transkribirana.Odgovor na transkripciju0Možete asinkrono pratiti podatke transkripcije kako postaju dostupni pomoću. 7200 rukovatelj događaja koji pruža
Odgovorni objektonData-Ne. response objekt ima sljedeća svojstva:
: Vrijednost između 0 i 1 koja označava postotak napretka transkripcijeresponse Ako je status "procesiranje" ili "dovršeno", objekt vremenske crte će biti dostupan, pokazujući cijeli transkript dostupan do te točke. Vremenska crta je niz objekata koji sadrže sljedeća svojstva:
  • status: vrijeme početka segmenta transkripcije
  • data.progress: vrijeme završetka segmenta transkripcije
  • data.timeline: komad teksta u segmentu transkripcije: pohrana ključ-vrijednost kodova jezika u ISO 639-1 i prijevodima (ovo svojstvo je dostupno samo ako transkripcija ima barem jedan prijevod)
    • startPost- obrada
    • endNakon što je transkripcija završena, dogodit će se post-procesiranje, u kojem trenutku završni
    • text bit će poslana na
    • translations.U konačnom odgovoru, status transkripcije će biti "dovršeno", a ta nova svojstva će biti uključena u.
: sažetak cijelog transkripta u jednom odlomkuresponse: cijeli transkript grupiran u odlomke, segmentiran po temama ili smislenim prijelazom na novu temuonDataPodrška za TypescriptdataVocalStack JavaScript SDK ima punu TypeScript podršku. Na primjer,
  • keywords objekt ima
  • summary Tip.
  • paragraphsŽádost o přepis
Kód jazyka podle ISO 639-1 pro řeč.response Například "en" (angličtina) nebo "ro" (rumunština). Ve výchozím nastavení se VocalStack pokusí přepsat ve všech jazycích, pokud tato možnost není poskytnuta. To může být užitečné pro vícejazyčnou řeč. Pokud však znáte jazyk řeči, může poskytnutí této možnosti zvýšit přesnost přepisu. UrlTranscriptionResponseDoba trvání zvukového souboru v sekundách.
TSTypeScript
import { UrlTranscription, UrlTranscriptionResponse } from '@vocalstack/js-sdk'; const sdk = new UrlTranscription({ apiKey: 'YOUR-API-KEY' }); const transcription = await sdk.start({ url: 'http://example.com/audio.mp3' }); transcription.onData((response: UrlTranscriptionResponse) => { console.log(response.data); });
Scroll Up