VocalStack Logo

Documentation

Transcriptiegegevens ophalen

Haal gegevens op van lopende of voltooide transcripties

Transcriberen van een microfoon of LiveStream

Transcribeer live spraak van een microfoon of live stream

Transcriptiesessies voor studenten

Bewaak en beheer de transcriptiestatus met sessies

Een transcriptie vertalen

Vertaal getranscribeerde tekst naar een andere taal

Audio van URL transcriberen

Transcribeer spraak van vooraf opgenomen audio in een URL naar platte tekst

Tokens voor client-side-verificatie

Maak een tijdelijk authenticatie token voor client-side verzoeken

Een Polyglot-sessie transcriberen en presenteren

Maak een sessie die kan worden gebruikt om een live transcriptie uit te zenden via een openbare link die kan worden gedeeld

Transcriptieaanvraag en antwoord

Blader door de documentatie
Gebruik de opties om de transcriptie-instellingen te configureren en de transcriptie-instellingen te wijzigen.
VocalStack zal proberen om uw audio te transcriberen met behulp van de standaard configuratie opties. U kunt uw transcriptieaanvraag echter verder configureren met de volgende opties:
  • languageDe ISO 639-1 taalcode voor de spraak. Bijvoorbeeld "en" (Engels), of "ro" (Roemeens). Standaard zal VocalStack proberen om in alle talen te transcriberen als deze optie niet wordt aangeboden. Dit kan nuttig zijn voor meertalige spraak. Als u echter de taal van de toespraak kent, kan het bieden van deze optie de nauwkeurigheid van de transcriptie verhogen. De duur, in seconden, van het audiobestand.
  • duration_s Deze optie wordt gebruikt als een bewaker om ervoor te zorgen dat uw transcriptie alleen plaatsvindt als de lengte van het audiobestand overeenkomt met de optieduur. Standaard wordt deze optie genegeerd en worden transcripties verwerkt ongeacht hun lengte. De maximale duur die kan worden getranscribeerd, in seconden. Gebruik deze optie als u de hoeveelheid getranscribeerde spraak wilt beperken. Zet deze op
  • max_duration_s Als u de gehele transcriptie wilt verwerken, ongeacht de duur (⚠️ gebruik met voorzichtigheid). Standaard is deze optie ingesteld op. , waarbij ervoor gezorgd wordt dat alleen de eerste twee uur van de toespraak worden getranscribeerd.Transcriptierespons0U kunt de transcriptiegegevens asynchronisch controleren wanneer deze beschikbaar worden met behulp van. 7200 event handler die de
Het antwoordobjectonDataDe. response object heeft de volgende eigenschappen:
: Een waarde tussen 0 en 1 die het percentage van de transcriptievoortgang aangeeftresponse Als de status "verwerken" of "klaar" is, zal het tijdlijnobject beschikbaar zijn, waarbij de volledige transcriptie tot dat moment beschikbaar is. De tijdlijn is een array van objecten met de volgende eigenschappen:
  • status: de starttijd van het transcriptie segment
  • data.progress: de eindtijd van het transcriptiesegment
  • data.timeline: het stuk tekst in het transcriptie-segment: een sleutel-waarde opslag van taalcodes in ISO 639-1 en vertalingen (deze eigenschap is alleen beschikbaar als de transcriptie ten minste één vertaling heeft)
    • startNabewerking
    • endZodra de transcriptie is voltooid, zal de nabewerking plaatsvinden, op welk punt de uiteindelijke
    • text zal worden verzonden naar
    • translations.In de laatste reactie zal de status van de transcriptie "klaar" zijn, en deze nieuwe eigenschappen zullen worden opgenomen in de.
: een samenvatting van de gehele transcriptie in één alinearesponse: de gehele transcriptie gegroepeerd in alinea's, gesegmenteerd op thema's, of door een zinvolle overgang naar een nieuw onderwerponDataOndersteuning voor TypescriptdataDe JavaScript SDK van VocalStack heeft volledige TypeScript ondersteuning. Bijvoorbeeld de
  • keywords object heeft de
  • summary type.
  • paragraphsTranskriptsiooni taotlus
ISO 639-1 keelekood.response Näiteks "en" (inglise keeles) või "ro" (rumeenia keeles). Vaikimisi üritab VocalStack transkribeerima kõiki keeli, kui seda valikut ei ole antud. See võib olla kasulik mitmekeelse kõne puhul. Kui te aga teate kõne keelt, võib selle suvandi lisamine suurendada transkriptsiooni täpsust. UrlTranscriptionResponseHelifaili kestus sekundites.
TSTypeScript
import { UrlTranscription, UrlTranscriptionResponse } from '@vocalstack/js-sdk'; const sdk = new UrlTranscription({ apiKey: 'YOUR-API-KEY' }); const transcription = await sdk.start({ url: 'http://example.com/audio.mp3' }); transcription.onData((response: UrlTranscriptionResponse) => { console.log(response.data); });
Scroll Up