VocalStack Logo

Documentation

Hent transskriptionsdata

Hent data fra ventende eller afsluttede transskriptioner

Transskriber fra en mikrofon eller LiveStream

Transskriber live tale fra en mikrofon eller live stream

Transskriptionssessioner

Overvåg og administrer transskriptionsstatus med sessioner

Oversæt en transskription

Oversæt transskriberet tekst til et andet sprog

Transskriber lyd fra URL

Transskriber tale fra forudindspillet lyd i en URL til almindelig tekst

Tokens til godkendelse på klientsiden

Opret et midlertidigt godkendelsestegn til anmodninger på klientsiden

Transskriber og præsenter en Polyglot-session

Opret en session, der kan bruges til at udsende en live-transskription via et offentligt link, der kan deles

Anmodning om transskription og svar

Gennemse dokumentation
Fælles anmodningsindstillinger og svar for alle transskriptionshandlinger Brug indstillinger til at konfigurere transskriptionsindstillingerne.
For eksempel "en" (engelsk), eller "ro" (rumænsk). Som standard vil VocalStack forsøge at transskribere på alle sprog, hvis denne mulighed ikke er angivet. Dette kan være nyttigt for flersproget tale. Hvis du kender talesproget, kan denne indstilling dog øge transskriptionsnøjagtigheden.
  • languageLydfilens varighed i sekunder. Denne indstilling bruges som en vagt for at sikre, at din transskription kun sker, hvis længden af lydfilen matcher varigheden af indstillingen. Som standard ignoreres denne mulighed, og transskriptioner vil blive behandlet uanset deres længde. Den maksimale varighed, der kan transskriberes, i sekunder.
  • duration_s Brug denne indstilling, hvis du vil begrænse mængden af tale, der transskriberes. Sæt dette til hvis du ønsker at behandle hele transskriptionen, uanset dens varighed (⚠️ brug med forsigtighed). Som standard er denne indstilling sat til. , og sørg for, at kun de første to timer af talen bliver transskriberet.
  • max_duration_sTransskriptionssvarDu kan asynkront overvåge transskriptionsdataene, når de bliver tilgængelige ved hjælp af. hændelseshåndtering, som giver 0 - Nej, tak.7200Svarobjektet
objektet har følgende egenskaber:onData: En af "venter", "behandler", "færdig" eller "fejl"response: En værdi mellem 0 og 1, der angiver transskriptionsfremskridtet i procent
: starttidspunktet for transskriptionssegmentetresponse: sluttidspunktet for transskriptionssegmentet
  • status: den del af teksten i transskriptionssegmentet
  • data.progress: et nøgle-værdi lager af sprogkoder i ISO 639-1 og oversættelser (denne egenskab er kun tilgængelig, hvis transskriptionen har mindst én oversættelse)
  • data.timelineEfterbehandlingNår transskriptionen er færdig, vil efterbehandlingen finde sted, hvorefter den endelige.
    • start vil blive sendt til
    • end.I det endelige svar vil status for transskriptionen være "færdig", og disse nye egenskaber vil blive inkluderet i.
    • text: et par nøgleord, der repræsenterer emner fra transskriptionen
    • translations: et enkelt afsnits sammendrag af hele transskriptionen
Typescript- understøttelseresponseVocalStacks JavaScript SDK har fuld TypeScript-understøttelse. For eksempel. onData objektet har data type.
  • keywords:,:
  • summary:,:
  • paragraphs:,
:, response:,:UrlTranscriptionResponse:,:
TSTypeScript
import { UrlTranscription, UrlTranscriptionResponse } from '@vocalstack/js-sdk'; const sdk = new UrlTranscription({ apiKey: 'YOUR-API-KEY' }); const transcription = await sdk.start({ url: 'http://example.com/audio.mp3' }); transcription.onData((response: UrlTranscriptionResponse) => { console.log(response.data); });
Scroll Up