VocalStack Logo

Documentation

Získať údaje o prepise

Získať údaje z čakajúcich alebo dokončených prepisov

Transkripčné relácie

Monitorovať a spravovať stav prepisu s reláciami

Preložiť prepis

Preložiť prepísaný text do iného jazyka

Prepis zvuku z URL

Prepis reči z vopred nahratého zvuku v URL na obyčajný text

Tokeny overenia na strane klienta

Vytvoriť dočasný token overenia pre požiadavky na strane klienta

Žiadosť o prepis a odpoveď

Spoločné možnosti žiadosti a odpovede pre všetky operácie prepisu

Prepis a prezentácia polyglotovej relácie

Vytvorte reláciu, ktorá môže byť použitá na vysielanie živého prepisu prostredníctvom verejného zdieľaného odkazu

Prepis z mikrofónu alebo LiveStream

Prehľadávať dokumentáciu
Prepisujte živú reč z mikrofónu alebo živého prenosu. Integrujte s Polyglotom a vytvorte verejný zdieľateľný odkaz na prepis, ktorý si môžu používatelia prečítať v ľubovoľnom jazyku.
Na prepis z mikrofónu musíme neustále posielať audio dátové pakety do VocalStack API.
JavaScript
import { LiveTranscription } from '@vocalstack/js-sdk'; const sdk = new LiveTranscription({ apiKey: 'YOUR-API-KEY' }); const stream = await sdk.connect({ // Optional: Integrate this stream with a Polyglot session polyglot_id: 'YOUR-POLYGLOT-SESSION-ID', // Optional: language of the speech spoken // (this can be used to improve the transcription accuracy) language: 'en', // Optional: Translate the transcription to these languages translations: ['de'], // Optional: Stop the stream after this many seconds of inactivity timeout_period_s: 60, // Optional: Hard stop the stream after this many seconds max_duration_s: 300, }); // Start the stream stream.start(); // Get audio data from a microphone and send it to the stream // stream.sendBuffer(buffer); // *** This is a placeholder for the actual implementation *** // Manually stop the stream (in this example, after 60 seconds) // If max_duration_s is set, stopping the stream is optional setTimeout(() => stream.stop(), 60000); // Listen for stream transcription data stream.onData((response) => { const { status, data } = response; console.log(status); // 'waiting', 'processing', 'done', 'stopping' or 'error' if (data) { console.log(data.timeline); // an object with the transcription timeline } if (status === 'done') { console.log(data.summary); // a summary of the transcription console.log(data.keywords); // an array of keywords console.log(data.paragraphs); // the entire transcription in paragraph form } });
Získanie dát audio streamu sa bude líšiť v závislosti od prostredia, v ktorom chcete vykonať operáciu prepisu. Tu je niekoľko príkladov, ako by ste to mohli urobiť:
V NextJS by ste mali nainštalovať balík, ktorý dokáže načítať audio dáta z vášho zariadenia, ktoré potom môžete preposlať do VocalStack API. Tu je príklad:
JavaScript
const mic = require('mic'); // Create a new instance of the microphone utility const micInstance = mic(); // Get the audio input stream const micStream = micInstance.getAudioStream(); // Capture the audio data from the microphone micStream.on('data', (data) => { stream.sendBuffer(data); // send the buffer data to the VocalStack API }); // Start capturing audio from the microphone micInstance.start();
Vo webovom prehliadači môžete použiť príkaz. MediaRecorder API ako je vidieť na nasledujúcom príklade (Môže byť tiež dobrý nápad použiť balík ako recordrtc ktorý zlepšuje kompatibilitu prehliadača)
JavaScript
// Request access to the microphone const mediaStream = await navigator.mediaDevices.getUserMedia({ audio: true }); // Create a MediaRecorder instance to capture audio data const mediaRecorder = new MediaRecorder(mediaStream); // Event handler to process audio data packets mediaRecorder.ondataavailable = async (event) => { const blob = event.data; // this is the audio packet (Blob) const buffer = await blob.arrayBuffer(); // convert the Blob to a Buffer stream.sendBuffer(buffer); // send the buffer data to the VocalStack API }; // Start capturing audio, and send it to the stream every second mediaRecorder.start(1000);
Všimnite si, že pre prístup k VocalStack API na webových klientoch budete musieť použiť auth token:
Tokeny overenia na strane klienta
Vytvoriť dočasný token overenia pre požiadavky na strane klienta. Bezpečne implementujte požiadavky API vo webových prehliadačoch bez toho, aby ste zverejnili svoje kľúče API.
VocalStack API môže byť použité na prepis akejkoľvek HLS LiveStream URL, vrátane zdrojov ako Youtube Live, Facebook Live a Twitch. Upozorňujeme, že URL streamu musí byť. . m3u8 je prípona súboru, ktorá predstavuje platný súbor zoznamu skladieb HLS (HTTP Live Streaming).
JavaScript
import { LiveTranscription } from '@vocalstack/js-sdk'; const sdk = new LiveTranscription({ apiKey: 'YOUR-API-KEY' }); const stream = await sdk.connect({ // must be a valid HLS streaming protocol livestream_url: 'http://a.files.bbci.co.uk/media/live/manifesto/audio/simulcast/hls/nonuk/sbr_low/ak/bbc_world_service.m3u8', // The rest of these options are the same as for microphone live transcriptons }); stream.start(); stream.onData((response) => { // The response object is the same as the one // returned by microphone transcriptions });
Integrácia živých prepisov s Polyglotom je taká jednoduchá ako pridanie. polyglot_ id možnosť na požiadanie o prepis, ako je to znázornené v príkladoch vyššie.
Polyglot vytvorí verejný zdieľateľný odkaz spojený s vašimi prepismi (odkaz môže byť chránený heslom):
  • Používatelia si môžu prečítať váš prepis v reálnom čase pomocou prepojenia.
  • Používatelia si môžu vybrať jazyk, v ktorom sa má prepis čítať v reálnom čase.
  • Používatelia si môžu prečítať váš prepis neskôr, a všetky ostatné prepisy integrované s konkrétnou reláciou Polyglot.
Môžete použiť VocalStack API a implementovať svoje vlastné UI s bielym štítkom namiesto použitia toho, ktorý poskytuje VocalStack. Radi by sme počuť o tom, ak áno, aby sme sa mohli dozvedieť, ako zlepšiť náš produkt!
Zistite viac o tom, ako Polyglot funguje na. Vyhľadávanie na vocalstack.com/polyglot.
Prepis a prezentácia polyglotovej relácie
Vytvorte reláciu, ktorá môže byť použitá na vysielanie živého prepisu prostredníctvom verejného zdieľaného odkazu. Používatelia si môžu prečítať živé prepisy vo svojom preferovanom jazyku a dokonca aj predchádzajúce prepisy, keď je vaša relácia neaktívna.
Získať údaje o prepise
Získať údaje z čakajúcich alebo dokončených prepisov. To zahŕňa časovú os prepisu, kľúčové slová, súhrn a segmenty odsekov.
Tokeny overenia na strane klienta
Vytvoriť dočasný token overenia pre požiadavky na strane klienta. Bezpečne implementujte požiadavky API vo webových prehliadačoch bez toho, aby ste zverejnili svoje kľúče API.
Scroll Up