Documentation

Kry Transkripsie Data

Kry data van in-verwagting of voltooide transkripsies

Transkribeer vanaf 'n Mikrofoon of LiveStream

Transkribeer live spraak vanaf 'n mikrofone of live stroom

Transkripsiesessies

Monitor en bestuur transkripsiestatus met sessies

Vertaal 'n transkripsie

Vertaal getranskribeer teks na 'n ander taal

Transkribeer oudio vanaf URL

Transkribeer spraak van vooraf opgeneemde oudio in 'n URL na gewone teks

Kliënt Kant Geldigheidstoets Tokens

Skep 'n tydelike geldigheidsverklaring token vir kliënt kant versoeke

Transkribeer en voorsit 'n Polyglot sessie

Skep 'n sessie wat gebruik kan word om 'n live transkripsie via 'n openbare deelbare skakel uit te saai

Transkripsie Versoek en Antwoord

Blaai Dokumentasie
Gemeenskaplike versoek opsies en antwoorde vir alle transkripsie operasies. Gebruik opsies na konfigureer die transkripsie instellings.
VocalStack sal probeer om jou oudio te transkribeer met die verstandige konfigurasie-keuses. Jy kan egter verder jou transkripsie versoek met die volgende opsies konfigureer:
  • languageDie ISO 639-1 taalkode vir die spraak. Byvoorbeeld "en" (Engels), of "ro" (Roemeens). Verstek, VocalStack sal probeer om in alle tale te transkribeer as hierdie opsie nie verskaf word nie. Hierdie kan nuttig wees vir meertalige spraak. As jy die taal van die spraak ken, kan hierdie opsie die transkripsie akkuraatheid verhoog. Die duur, in sekondes, van die oudiolêer.
  • duration_s Hierdie opsie word gebruik as 'n wag om seker te maak dat jou transkripsie slegs plaasvind as die oudio lêer lengte ooreenstem met die opsie duur. By verstek, hierdie opsie word geïgnoreer, en transkripsies sal verwerk ongeag hul lengte. Die maksimum duur wat kan wees oorgedra, in sekondes. Gebruik hierdie opsie as jy wil hê na beperk die hoeveelheid spraak getranscribed. Stel hierdie na
  • max_duration_s as jy die hele transkripsie wil verwerk, ongeag die duur daarvan (⚠️ gebruik met voorsigtigheid). Verstek, hierdie opsie is stel na , om seker te maak dat slegs die eerste twee ure van die toespraak getranskribeer word.Transkripsie Antwoord0Jy kan asynkronies die transkripsie data monitor soos dit beskikbaar word met behulp van 7200 gebeurtenis hanteerder wat die
Die Antwoord VoorwerponDataDie response object het die volgende eienskappe:
:'n waarde tussen 0 en 1 beteken die transkripsie vordering persentasieresponse As die status "verwerk" of "klaar" is, sal die tydlyn-object beskikbaar wees, wat die hele transkripsie beskikbaar tot op daardie punt vertoon. Die tydlyn is 'n ry van voorwerpe wat hierdie eienskappe bevat:
  • status: die begin tyd van die transkripsie segment
  • data.progress: die einde tyd van die transkripsie segment
  • data.timeline: die stuk teks in die transkripsie segment: 'n sleutel-waarde stoor van taalkodes in ISO 639-1 en vertalings (die eienskap is slegs beskikbaar as die transkripsie ten minste een vertaling het)
    • startNa-verwerking
    • endSodra die transkripsie voltooi is, sal naverwerking plaasvind, waarna die finale
    • text sal gestuur word na
    • translations. In die finale antwoord, die status van die transkripsie sal wees "done", en hierdie nuwe eienskappe sal wees ingesluit in.
:'n enkel paragraaf opsomming van die hele transkripsieresponse: die hele transkripsie gegroepeer in paragraafe, gesegmenteerd deur temas, of deur 'n betekenisvolle overgang na 'n nuwe onderwerponDataTypescript OndersteuningdataVocalStack se JavaScript SDK het volledige TypeScript ondersteuning. Byvoorbeeld, die
  • keywords object has the
  • summary tipe.
  • paragraphsطلب نسخ
رمز اللغة ISO 639-1 للخطاب.response على سبيل المثال "en" (بالإنجليزية)، أو "ro" (بالرومانية). وبشكل افتراضي، سوف تحاول VocalStack نسخ النص بجميع اللغات إذا لم يكن هذا الخيار متاحا. وهذا يمكن أن يكون مفيداً في الكلام المتعدد اللغات. ومع ذلك، إذا كنت تعرف لغة الخطاب، فإن توفير هذا الخيار يمكن أن يزيد من دقة النسخ. UrlTranscriptionResponseمدة الملف الصوتي بالثواني.
TSTypeScript
import { UrlTranscription, UrlTranscriptionResponse } from '@vocalstack/js-sdk'; const sdk = new UrlTranscription({ apiKey: 'YOUR-API-KEY' }); const transcription = await sdk.start({ url: 'http://example.com/audio.mp3' }); transcription.onData((response: UrlTranscriptionResponse) => { console.log(response.data); });
Scroll Up