Hent data fra ventende eller fullførte transkripsjoner
Transkriber live tale fra en mikrofon eller live stream
Overvåk og administrer transkripsjonsstatus med økter
Oversett transkribert tekst til et annet språk
Transkriber tale fra forhåndsinnspilt lyd i en URL til ren tekst
Opprett et midlertidig autentiseringsmerke for forespørsler fra klientsiden
Opprett en økt som kan brukes til å kringkaste en direktetranskripsjon via en offentlig delbar kobling
language
ISO 639-1-språkkoden for talen. For eksempel "en" (engelsk), eller "ro" (rumensk). Som standard vil VocalStack forsøke å transkribere på alle språk hvis dette alternativet ikke er oppgitt. Dette kan være nyttig for flerspråklig tale. Hvis du imidlertid kjenner språket i talen, kan dette alternativet øke transkripsjonsnøyaktigheten. Varigheten i sekunder av lydfila. duration_s
Dette valget brukes som en vakt for å sikre at transkripsjonen bare skjer hvis lydfillengden samsvarer med varigheten for valget. Som standard ignoreres dette valget, og transkripsjoner vil bli behandlet uavhengig av lengden. Maksimal varighet som kan transkriberes, i sekunder. Bruk dette valget hvis du vil begrense mengden tale som transkriberes. Sett dette til max_duration_s
Hvis du ønsker å behandle hele transkripsjonen, uavhengig av varighet (⚠️ bruk med forsiktighet). Som standard er dette valget satt til. , og sørger for at bare de to første timene av talen blir transkribert.Transkripsjonssvar0
Du kan asynkront overvåke transkripsjonsdataene etter hvert som de blir tilgjengelige ved hjelp av. 7200
hendelsesbehandler som gir onData
The response
objektet har følgende egenskaper:response
Hvis statusen er "behandler" eller "ferdig" vil tidslinjeobjektet være tilgjengelig, og vise hele transkripsjonen som er tilgjengelig opp til dette punktet. Tidslinjen er en matrise av objekter som inneholder disse egenskapene:status
: starttidspunktet for transkripsjonssegmentetdata.progress
: sluttid for transkripsjonssegmentetdata.timeline
: teksten i transkripsjonssegmentet: et nøkkel-verdi-lager av språkkoder i ISO 639-1 og oversettelser (denne egenskapen er bare tilgjengelig hvis transkripsjonen har minst én oversettelse)start
Etterbehandlingend
Når transkripsjonen er fullført, vil etterbehandlingen skje, på hvilket tidspunkt den endelige teksten vil bli skrevet. text
vil bli sendt til translations
.I det endelige svaret vil statusen for transkripsjonen være "ferdig", og disse nye egenskapene vil bli inkludert i. response
: hele transkripsjonen gruppert i avsnitt, segmentert etter temaer, eller ved en meningsfull overgang til et nytt emneonData
Typescript- støttedata
VocalStacks JavaScript SDK har full støtte for TypeScript. For eksempel keywords
objektet har summary
type. paragraphs
Transkrypcjaresponse
Na przykład "en" (angielski) lub "ro" (rumuński). Domyślnie VocalStack będzie próbował transkrybować we wszystkich językach, jeśli ta opcja nie jest podana. Może to być przydatne w przypadku mowy wielojęzycznej. Jeśli jednak znasz język mowy, udostępnienie tej opcji może zwiększyć dokładność transkrypcji. UrlTranscriptionResponse
Czas trwania pliku audio w sekundach. TypeScriptimport { UrlTranscription, UrlTranscriptionResponse } from '@vocalstack/js-sdk'; const sdk = new UrlTranscription({ apiKey: 'YOUR-API-KEY' }); const transcription = await sdk.start({ url: 'http://example.com/audio.mp3' }); transcription.onData((response: UrlTranscriptionResponse) => { console.log(response.data); });