Obțineți date din transcrieri în așteptare sau finalizate
Transcrieți vorbirea în direct de la un microfon sau de la un flux live
Monitorizați și gestionați starea transcrierii cu sesiuni
Traduceți textul transcris într-o altă limbă
Transcrieți vorbirea din audio preînregistrat într-un URL în text simplu
Creează un token de autentificare temporar pentru solicitările de pe partea clientului
Creați o sesiune care poate fi folosită pentru a difuza o transcriere în direct printr-un link public partajat
language
Codul ISO 639-1 al limbii pentru vorbire. De exemplu, "en" (engleză), sau "ro" (română). În mod implicit, VocalStack va încerca să transcrie în toate limbile dacă această opțiune nu este furnizată. Acest lucru poate fi util pentru vorbirea multilingvă. Totuși, dacă cunoașteți limba vorbirii, oferirea acestei opțiuni poate crește acuratețea transcrierii. Durata, în secunde, a fișierului audio. duration_s
Această opțiune este folosită ca o gardă pentru a vă asigura că transcrierea dvs. are loc numai dacă lungimea fișierului audio se potrivește cu durata opțiunii. În mod implicit, această opțiune este ignorată, iar transcrierile vor fi procesate indiferent de lungimea lor. Durata maximă care poate fi transcrisă, în secunde. Utilizaţi această opţiune dacă doriţi să limitaţi cantitatea de vorbire transcrisă. Setează această opţiune la max_duration_s
Dacă doriți să procesați întreaga transcriere, indiferent de durata acesteia (⚠️ utilizați cu prudență). În mod implicit, această opţiune este setată la. , asigurându-se că sunt transcrise doar primele două ore ale discursului.Răspunsul la transcriere0
Puteți monitoriza asincron datele de transcriere pe măsură ce devin disponibile folosind. 7200
handler de evenimente care oferă onData
The. response
Acest obiect are următoarele proprietăți:response
Dacă starea este "procesare" sau "terminat", obiectul cronologie va fi disponibil, arătând întreaga transcriere disponibilă până în acel moment. Cronologia este un array de obiecte care conține aceste proprietăți:status
: ora de începere a segmentului de transcrieredata.progress
: ora de sfârșit a segmentului de transcrieredata.timeline
: bucata de text din segmentul de transcriere: un depozit de coduri de limbă în ISO 639-1 și traduceri (această proprietate este disponibilă numai dacă transcrierea are cel puțin o traducere)start
Post-procesareend
Odată ce transcrierea este completă, va avea loc post-procesarea, în acest moment. text
va fi trimis la translations
.În răspunsul final, starea transcrierii va fi "done", iar aceste noi proprietăţi vor fi incluse în. response
: întreaga transcriere grupată în paragrafe, segmentate pe teme, sau printr-o tranziție semnificativă la un nou subiectonData
Suport pentru Typescriptdata
VocalStack JavaScript SDK are suport complet pentru TypeScript. De exemplu, keywords
obiectul are summary
Tipul. paragraphs
Запрос на транскрипциюresponse
Например, "en" (англ.) или "ro" (румынский). По умолчанию, если эта опция не предоставлена, VocalStack будет пытаться транскрибировать на все языки. Это может быть полезно для многоязычной речи. Однако, если вы знаете язык речи, предоставление этой опции может повысить точность транскрипции. UrlTranscriptionResponse
Продолжительность аудиофайла в секундах. TypeScriptimport { UrlTranscription, UrlTranscriptionResponse } from '@vocalstack/js-sdk'; const sdk = new UrlTranscription({ apiKey: 'YOUR-API-KEY' }); const transcription = await sdk.start({ url: 'http://example.com/audio.mp3' }); transcription.onData((response: UrlTranscriptionResponse) => { console.log(response.data); });