Documentation

Hent transkripsjonsdata

Hent data fra ventende eller fullførte transkripsjoner

Transkribere fra en mikrofon eller LiveStream

Transkriber live tale fra en mikrofon eller live stream

Transkripsjonsøkter

Overvåk og administrer transkripsjonsstatus med økter

Oversett en transkripsjon

Oversett transkribert tekst til et annet språk

Transkriber lyd fra URL

Transkriber tale fra forhåndsinnspilt lyd i en URL til ren tekst

Autentiseringstegn på klientsiden

Opprett et midlertidig autentiseringsmerke for forespørsler fra klientsiden

Transkribere og presentere en Polyglot-økt

Opprett en økt som kan brukes til å kringkaste en direktetranskripsjon via en offentlig delbar kobling

Forespørsel om transkripsjon og svar

Bla gjennom dokumentasjon
Vanlige forespørselsvalg og svar for alle transkripsjonsoperasjoner. Bruk valg for å konfigurere transkripsjonsinnstillingene.
VocalStack vil forsøke å transkribere lyden din ved hjelp av fornuftige standardkonfigurasjonsalternativer. Du kan imidlertid konfigurere transkripsjonsforespørselen ytterligere med følgende alternativer:
  • languageISO 639-1-språkkoden for talen. For eksempel "en" (engelsk), eller "ro" (rumensk). Som standard vil VocalStack forsøke å transkribere på alle språk hvis dette alternativet ikke er oppgitt. Dette kan være nyttig for flerspråklig tale. Hvis du imidlertid kjenner språket i talen, kan dette alternativet øke transkripsjonsnøyaktigheten. Varigheten i sekunder av lydfila.
  • duration_s Dette valget brukes som en vakt for å sikre at transkripsjonen bare skjer hvis lydfillengden samsvarer med varigheten for valget. Som standard ignoreres dette valget, og transkripsjoner vil bli behandlet uavhengig av lengden. Maksimal varighet som kan transkriberes, i sekunder. Bruk dette valget hvis du vil begrense mengden tale som transkriberes. Sett dette til
  • max_duration_s Hvis du ønsker å behandle hele transkripsjonen, uavhengig av varighet (⚠️ bruk med forsiktighet). Som standard er dette valget satt til. , og sørger for at bare de to første timene av talen blir transkribert.Transkripsjonssvar0Du kan asynkront overvåke transkripsjonsdataene etter hvert som de blir tilgjengelige ved hjelp av. 7200 hendelsesbehandler som gir
SvarobjektetonDataThe response objektet har følgende egenskaper:
: En verdi mellom 0 og 1 som angir transkripsjonsfremdriften i prosentresponse Hvis statusen er "behandler" eller "ferdig" vil tidslinjeobjektet være tilgjengelig, og vise hele transkripsjonen som er tilgjengelig opp til dette punktet. Tidslinjen er en matrise av objekter som inneholder disse egenskapene:
  • status: starttidspunktet for transkripsjonssegmentet
  • data.progress: sluttid for transkripsjonssegmentet
  • data.timeline: teksten i transkripsjonssegmentet: et nøkkel-verdi-lager av språkkoder i ISO 639-1 og oversettelser (denne egenskapen er bare tilgjengelig hvis transkripsjonen har minst én oversettelse)
    • startEtterbehandling
    • endNår transkripsjonen er fullført, vil etterbehandlingen skje, på hvilket tidspunkt den endelige teksten vil bli skrevet.
    • text vil bli sendt til
    • translations.I det endelige svaret vil statusen for transkripsjonen være "ferdig", og disse nye egenskapene vil bli inkludert i.
: et enkelt avsnitt oppsummering av hele transkripsjonenresponse: hele transkripsjonen gruppert i avsnitt, segmentert etter temaer, eller ved en meningsfull overgang til et nytt emneonDataTypescript- støttedataVocalStacks JavaScript SDK har full støtte for TypeScript. For eksempel
  • keywords objektet har
  • summary type.
  • paragraphsTranskrypcja
Kod języka ISO 639-1 dla tej mowy.response Na przykład "en" (angielski) lub "ro" (rumuński). Domyślnie VocalStack będzie próbował transkrybować we wszystkich językach, jeśli ta opcja nie jest podana. Może to być przydatne w przypadku mowy wielojęzycznej. Jeśli jednak znasz język mowy, udostępnienie tej opcji może zwiększyć dokładność transkrypcji. UrlTranscriptionResponseCzas trwania pliku audio w sekundach.
TSTypeScript
import { UrlTranscription, UrlTranscriptionResponse } from '@vocalstack/js-sdk'; const sdk = new UrlTranscription({ apiKey: 'YOUR-API-KEY' }); const transcription = await sdk.start({ url: 'http://example.com/audio.mp3' }); transcription.onData((response: UrlTranscriptionResponse) => { console.log(response.data); });
Scroll Up