VocalStack Logo

Cerere de transcriere și răspuns

Răsfoiți documentația
Opțiuni de solicitare și răspunsuri comune pentru toate operațiunile de transcriere Utilizați opțiunile pentru a configura setările de transcriere.
VocalStack va încerca să transcrie audio folosind opțiuni de configurare implicite sensibile. Cu toate acestea, puteți configura în continuare cererea de transcriere cu următoarele opțiuni:
  • languageCodul ISO 639-1 al limbii pentru vorbire. De exemplu, "en" (engleză), sau "ro" (română). În mod implicit, VocalStack va încerca să transcrie în toate limbile dacă această opțiune nu este furnizată. Acest lucru poate fi util pentru vorbirea multilingvă. Totuși, dacă cunoașteți limba vorbirii, oferirea acestei opțiuni poate crește acuratețea transcrierii. Durata, în secunde, a fișierului audio.
  • duration_s Această opțiune este folosită ca o gardă pentru a vă asigura că transcrierea dvs. are loc numai dacă lungimea fișierului audio se potrivește cu durata opțiunii. În mod implicit, această opțiune este ignorată, iar transcrierile vor fi procesate indiferent de lungimea lor. Durata maximă care poate fi transcrisă, în secunde. Utilizaţi această opţiune dacă doriţi să limitaţi cantitatea de vorbire transcrisă. Setează această opţiune la
  • max_duration_s Dacă doriți să procesați întreaga transcriere, indiferent de durata acesteia (⚠️ utilizați cu prudență). În mod implicit, această opţiune este setată la. , asigurându-se că sunt transcrise doar primele două ore ale discursului.Răspunsul la transcriere0Puteți monitoriza asincron datele de transcriere pe măsură ce devin disponibile folosind. 7200 handler de evenimente care oferă
Obiectul de răspunsonDataThe. response Acest obiect are următoarele proprietăți:
: O valoare între 0 și 1 care indică procentul de progres al transcrieriiresponse Dacă starea este "procesare" sau "terminat", obiectul cronologie va fi disponibil, arătând întreaga transcriere disponibilă până în acel moment. Cronologia este un array de obiecte care conține aceste proprietăți:
  • status: ora de începere a segmentului de transcriere
  • data.progress: ora de sfârșit a segmentului de transcriere
  • data.timeline: bucata de text din segmentul de transcriere: un depozit de coduri de limbă în ISO 639-1 și traduceri (această proprietate este disponibilă numai dacă transcrierea are cel puțin o traducere)
    • startPost-procesare
    • endOdată ce transcrierea este completă, va avea loc post-procesarea, în acest moment.
    • text va fi trimis la
    • translations.În răspunsul final, starea transcrierii va fi "done", iar aceste noi proprietăţi vor fi incluse în.
: un rezumat al întregii transcrieri, într-un singur paragrafresponse: întreaga transcriere grupată în paragrafe, segmentate pe teme, sau printr-o tranziție semnificativă la un nou subiectonDataSuport pentru TypescriptdataVocalStack JavaScript SDK are suport complet pentru TypeScript. De exemplu,
  • keywords obiectul are
  • summary Tipul.
  • paragraphsЗапрос на транскрипцию
Код языка ISO 639-1 для речи.response Например, "en" (англ.) или "ro" (румынский). По умолчанию, если эта опция не предоставлена, VocalStack будет пытаться транскрибировать на все языки. Это может быть полезно для многоязычной речи. Однако, если вы знаете язык речи, предоставление этой опции может повысить точность транскрипции. UrlTranscriptionResponseПродолжительность аудиофайла в секундах.
TSTypeScript
import { UrlTranscription, UrlTranscriptionResponse } from '@vocalstack/js-sdk'; const sdk = new UrlTranscription({ apiKey: 'YOUR-API-KEY' }); const transcription = await sdk.start({ url: 'http://example.com/audio.mp3' }); transcription.onData((response: UrlTranscriptionResponse) => { console.log(response.data); });
Scroll Up