Documentation

VocalStack va încerca să transcrie audio folosind opțiuni de configurare implicite sensibile. Cu toate acestea, puteți configura în continuare cererea de transcriere cu următoarele opțiuni:

languageCodul ISO 639-1 al limbii pentru vorbire. De exemplu, "en" (engleză), sau "ro" (română). În mod implicit, VocalStack va încerca să transcrie în toate limbile dacă această opțiune nu este furnizată. Acest lucru poate fi util pentru vorbirea multilingvă. Totuși, dacă cunoașteți limba vorbirii, oferirea acestei opțiuni poate crește acuratețea transcrierii. Durata, în secunde, a fișierului audio.
duration_s Această opțiune este folosită ca o gardă pentru a vă asigura că transcrierea dvs. are loc numai dacă lungimea fișierului audio se potrivește cu durata opțiunii. În mod implicit, această opțiune este ignorată, iar transcrierile vor fi procesate indiferent de lungimea lor. Durata maximă care poate fi transcrisă, în secunde. Utilizaţi această opţiune dacă doriţi să limitaţi cantitatea de vorbire transcrisă. Setează această opţiune la
max_duration_s Dacă doriți să procesați întreaga transcriere, indiferent de durata acesteia (⚠️ utilizați cu prudență). În mod implicit, această opţiune este setată la. , asigurându-se că sunt transcrise doar primele două ore ale discursului.Răspunsul la transcriere0Puteți monitoriza asincron datele de transcriere pe măsură ce devin disponibile folosind. 7200 handler de evenimente care oferă

- Obiect.

Obiectul de răspunsonDataThe. response Acest obiect are următoarele proprietăți:

: Una dintre "așteptare", "procesare", "terminat" sau "eroare"

: O valoare între 0 și 1 care indică procentul de progres al transcrieriiresponse Dacă starea este "procesare" sau "terminat", obiectul cronologie va fi disponibil, arătând întreaga transcriere disponibilă până în acel moment. Cronologia este un array de obiecte care conține aceste proprietăți:

status: ora de începere a segmentului de transcriere
data.progress: ora de sfârșit a segmentului de transcriere
data.timeline: bucata de text din segmentul de transcriere: un depozit de coduri de limbă în ISO 639-1 și traduceri (această proprietate este disponibilă numai dacă transcrierea are cel puțin o traducere)
- startPost-procesare
- endOdată ce transcrierea este completă, va avea loc post-procesarea, în acest moment.
- text va fi trimis la
- translations.În răspunsul final, starea transcrierii va fi "done", iar aceste noi proprietăţi vor fi incluse în.

: câteva cuvinte cheie reprezentând subiecte din transcriere

: un rezumat al întregii transcrieri, într-un singur paragrafresponse: întreaga transcriere grupată în paragrafe, segmentate pe teme, sau printr-o tranziție semnificativă la un nou subiectonDataSuport pentru TypescriptdataVocalStack JavaScript SDK are suport complet pentru TypeScript. De exemplu,

keywords obiectul are
summary Tipul.
paragraphsЗапрос на транскрипцию

VocalStack попытается транскрибировать ваше аудио с использованием разумных параметров конфигурации по умолчанию. Однако вы можете дополнительно настроить запрос на транскрипцию с помощью следующих параметров:

Код языка ISO 639-1 для речи.response Например, "en" (англ.) или "ro" (румынский). По умолчанию, если эта опция не предоставлена, VocalStack будет пытаться транскрибировать на все языки. Это может быть полезно для многоязычной речи. Однако, если вы знаете язык речи, предоставление этой опции может повысить точность транскрипции. UrlTranscriptionResponseПродолжительность аудиофайла в секундах.

TypeScript
import { UrlTranscription, UrlTranscriptionResponse } from '@vocalstack/js-sdk';

const sdk = new UrlTranscription({ apiKey: 'YOUR-API-KEY' });
const transcription = await sdk.start({ url: 'http://example.com/audio.mp3' });

transcription.onData((response: UrlTranscriptionResponse) => {
  console.log(response.data);
});

Scroll Up

Polyglot

Business

Deblochează lumea cu transcrierea poliglotă a VocalStack!

De ce contează modelele AI mari în transcriere

Documentație

Referință pentru API

Documentation

Obțineți date de transcriere

Transcrierea de la un microfon sau LiveStream

Sesiuni de transcriere

Traduceți o transcriere

Transcrie audio de la URL

Token-uri de autentificare pe partea clientului

Cerere de transcriere și răspuns

Transcrie și prezintă o sesiune poliglotă

Cerere de transcriere și răspuns