VocalStack Logo

Documentation

Iegūt transkripcijas datus

Iegūt datus no gaidošām vai pabeigtām transkripcijām

Transkripts no mikrofona vai LiveStream

Transcribe tiešraides runu no mikrofona vai tiešraides straumi

Transkripcijas sesijas

Uzraudzīt un pārvaldīt transkripcijas statusu ar sesijām

Tulkot transkripciju

Tulkot transkripcijas tekstu citā valodā

Transcribe Audio no URL

Transkribēt runu no iepriekš ierakstīta audio URL vienkāršā tekstā

Klienta puses autentifikācijas žetoni

Izveidot pagaidu autentifikācijas žetonu klienta puses pieprasījumiem

Pārrakstīt un prezentēt Polyglot sesiju

Izveidojiet sesiju, kuru var izmantot, lai pārraidītu tiešraides transkripciju, izmantojot publiski kopīgojamu saiti

Transkripcijas pieprasījums un atbilde

Pārlūkot dokumentāciju
Vispārējās pieprasījumu opcijas un atbildes visām transkripcijas darbībām. Izmantojiet opcijas, lai konfigurētu transkripcijas iestatījumus.
VocalStack mēģinās pārrakstīt savu audio, izmantojot saprātīgu noklusējuma konfigurācijas iespējas. Tomēr varat tālāk konfigurēt savu transkripcijas pieprasījumu ar šādām opcijām:
  • languageISO 639-1 valodas kods, kas attiecas uz runu. Piemēram, "en" (angļu valodā) vai "ro" (rumāņu valodā). Pēc noklusējuma, VocalStack mēģinās transkripciju visās valodās, ja šī iespēja nav nodrošināta. Tas var būt noderīgi daudzvalodu runā. Tomēr, ja jūs zināt runas valodu, šīs opcijas nodrošināšana var palielināt transkripcijas precizitāti. Audio faila ilgums sekundēs.
  • duration_s Šī opcija tiek izmantota kā aizsargs, lai nodrošinātu, ka jūsu transkripcija notiek tikai tad, ja audio faila garums atbilst opcijas ilgumu. Pēc noklusējuma šī opcija tiek ignorēta, un transkripcijas tiks apstrādātas neatkarīgi no to garuma. Maksimālais ilgums, ko var pārrakstīt, sekundēs. Izmantojiet šo opciju, ja vēlaties ierobežot transkripcijas apjomu. Iestatiet šo uz
  • max_duration_s ja vēlaties apstrādāt visu transkripciju, neatkarīgi no tās ilguma (⚠️ lietojiet piesardzīgi). Pēc noklusējuma šī opcija ir iestatīta uz. , nodrošinot, ka tiek transkriptas tikai pirmās divas runas stundas.Transkripcijas atbildes reakcija0Jūs varat asinhroni uzraudzīt transkripcijas datus, kad tie kļūst pieejami, izmantojot. 7200 notikumu apstrādātājs, kas nodrošina
Atbildes objektsonDataThe response objektam ir šādas īpašības:
: Vērtība no 0 līdz 1, kas norāda transkripcijas progresu procentosresponse Ja statuss ir "apstrāde" vai "pabeigts", laika grafika objekts būs pieejams, parādot visu transkripciju, kas pieejama līdz šim brīdim. Laika grafiks ir objektu masīvs, kas satur šādus rekvizītus:
  • status: transkripcijas segmenta sākuma laiks
  • data.progress: transkripcijas segmenta beigu laiks
  • data.timeline: teksta daļa transkripcijas segmentā: atslēgas vērtību krātuve ar valodu kodiem ISO 639-1 un tulkojumiem (šī īpašība ir pieejama tikai tad, ja transkripcijai ir vismaz viens tulkojums)
    • startPēcapstrāde
    • endKad transkripcija ir pabeigta, pēcapstrāde notiks, kurā brīdī galīgā
    • text tiks nosūtīts uz
    • translations. Galīgajā atbildē, transkripcijas statuss būs "izdarīts", un šīs jaunās īpašības tiks iekļautas.
: viena rindkopas kopsavilkums par visu transkripcijuresponse: visa transkripcija, kas sagrupēta rindkopās, segmentēta pēc tēmām vai ar jēgpilnu pāreju uz jaunu tēmuonDataTypescript atbalstsdataVocalStack JavaScript SDK ir pilnīgs TypeScript atbalsts. Piemēram,.
  • keywords objektam ir
  • summary tips.
  • paragraphsTranskripcijos užklausa
ISO 639-1 kalbos kodas.response Pavyzdžiui, "en" (anglų kalba) arba "ro" (rumunų kalba). Pagal numatytuosius nustatymus, VocalStack bandys transliuoti visomis kalbomis, jei ši parinktis nėra pateikta. Tai gali būti naudinga daugiakalbei kalbai. Tačiau, jei žinote kalbos kalbą, suteikiant šią parinktį gali padidėti transkripcijos tikslumas. UrlTranscriptionResponseGarso failo trukmė sekundėmis.
TSTypeScript
import { UrlTranscription, UrlTranscriptionResponse } from '@vocalstack/js-sdk'; const sdk = new UrlTranscription({ apiKey: 'YOUR-API-KEY' }); const transcription = await sdk.start({ url: 'http://example.com/audio.mp3' }); transcription.onData((response: UrlTranscriptionResponse) => { console.log(response.data); });
Scroll Up