Documentation

Získání dat přepisu

Získejte data z čekajících nebo dokončených přepisů

Přepisovací sezení

Monitorování a správa stavu přepisu pomocí relací

Přeložit přepis

Přeložit přepsaný text do jiného jazyka

Přepisovat zvuk z URL

Přepis řeči z předem nahraného zvuku v URL do prostého textu

Tokeny ověřování na straně klienta

Vytvořit dočasný token ověření pro požadavky na straně klienta

Žádost o přepis a odpověď

Společné možnosti požadavků a odpovědí pro všechny operace přepisu

Přepisujte a prezentujte polyglot session

Vytvořte relaci, kterou lze použít k vysílání živého přepisu prostřednictvím veřejného sdíleného odkazu

Přepis z mikrofonu nebo LiveStream

Procházet dokumentaci
Přepisujte živou řeč z mikrofonu nebo živého streamu. Integrujte s Polyglotem a vytvořte veřejný sdílitelný odkaz na přepis, který si uživatelé mohou přečíst v jakémkoli jazyce.
Pro přepis z mikrofonu musíme neustále posílat audio datové pakety do VocalStack API.
JavaScript
import { LiveTranscription } from '@vocalstack/js-sdk'; const sdk = new LiveTranscription({ apiKey: 'YOUR-API-KEY' }); const stream = await sdk.connect({ // Optional: Integrate this stream with a Polyglot session polyglot_id: 'YOUR-POLYGLOT-SESSION-ID', // Optional: language of the speech spoken // (this can be used to improve the transcription accuracy) language: 'en', // Optional: Translate the transcription to these languages translations: ['de'], // Optional: Stop the stream after this many seconds of inactivity timeout_period_s: 60, // Optional: Hard stop the stream after this many seconds max_duration_s: 300, }); // Start the stream stream.start(); // Get audio data from a microphone and send it to the stream // stream.sendBuffer(buffer); // *** This is a placeholder for the actual implementation *** // Manually stop the stream (in this example, after 60 seconds) // If max_duration_s is set, stopping the stream is optional setTimeout(() => stream.stop(), 60000); // Listen for stream transcription data stream.onData((response) => { const { status, data } = response; console.log(status); // 'waiting', 'processing', 'done', 'stopping' or 'error' if (data) { console.log(data.timeline); // an object with the transcription timeline } if (status === 'done') { console.log(data.summary); // a summary of the transcription console.log(data.keywords); // an array of keywords console.log(data.paragraphs); // the entire transcription in paragraph form } });
Získání dat audio streamu se bude lišit podle prostředí, ve kterém chcete provést operaci přepisu. Zde je několik příkladů, jak byste to mohli udělat:
V NextJS byste měli nainstalovat balíček, který dokáže načíst audio data z vašeho zařízení, která pak můžete předat do VocalStack API. Zde je příklad:
JavaScript
const mic = require('mic'); // Create a new instance of the microphone utility const micInstance = mic(); // Get the audio input stream const micStream = micInstance.getAudioStream(); // Capture the audio data from the microphone micStream.on('data', (data) => { stream.sendBuffer(data); // send the buffer data to the VocalStack API }); // Start capturing audio from the microphone micInstance.start();
Ve webovém prohlížeči můžete použít příkaz. MediaRecorder (Také může být dobrý nápad použít balíček jako, který umožňuje vytvořit vlastní API, které bude fungovat jako. recordrtc which improves browser compatibility)
JavaScript
// Request access to the microphone const mediaStream = await navigator.mediaDevices.getUserMedia({ audio: true }); // Create a MediaRecorder instance to capture audio data const mediaRecorder = new MediaRecorder(mediaStream); // Event handler to process audio data packets mediaRecorder.ondataavailable = async (event) => { const blob = event.data; // this is the audio packet (Blob) const buffer = await blob.arrayBuffer(); // convert the Blob to a Buffer stream.sendBuffer(buffer); // send the buffer data to the VocalStack API }; // Start capturing audio, and send it to the stream every second mediaRecorder.start(1000);
Všimněte si, že pro přístup k VocalStack API na webových klientech budete muset použít autentizační token:
Tokeny ověřování na straně klienta
Vytvořit dočasný token ověření pro požadavky na straně klienta. Bezpečně implementujte požadavky API ve webových prohlížečích bez odhalení klíčů API.
VocalStack API může být použito k přepisu libovolné HLS LiveStream URL, včetně zdrojů jako Youtube Live, Facebook Live a Twitch. Upozorňujeme, že URL streamu musí být. .M3U8 je přípona souboru, která představuje platný soubor seznamu skladeb HLS (HTTP Live Streaming).
JavaScript
import { LiveTranscription } from '@vocalstack/js-sdk'; const sdk = new LiveTranscription({ apiKey: 'YOUR-API-KEY' }); const stream = await sdk.connect({ // must be a valid HLS streaming protocol livestream_url: 'http://a.files.bbci.co.uk/media/live/manifesto/audio/simulcast/hls/nonuk/sbr_low/ak/bbc_world_service.m3u8', // The rest of these options are the same as for microphone live transcriptons }); stream.start(); stream.onData((response) => { // The response object is the same as the one // returned by microphone transcriptions });
Integrace živých přepisů s Polyglotem je stejně jednoduchá jako přidání. polyglot_id možnost k žádosti o přepis, jak je ukázáno v příkladech výše.
Polyglot vytvoří veřejný sdílitelný odkaz spojený s vašimi přepisy (odkaz může být chráněn heslem):
  • Uživatelé si mohou přepis přečíst v reálném čase pomocí odkazu.
  • Uživatelé si mohou vybrat jazyk, ve kterém si přepis přečtou v reálném čase.
  • Uživatelé si mohou přečíst váš přepis později, a všechny ostatní přepisy integrované s vaší konkrétní Polyglot relace.
Můžete použít VocalStack API a implementovat své vlastní uživatelské rozhraní s bílou značkou namísto použití rozhraní poskytovaného VocalStack. Rádi bychom o tom slyšeli, pokud ano, abychom se mohli naučit, jak náš produkt vylepšit!
Zjistěte více o tom, jak Polyglot funguje na. vocalstack.com/polyglot.
Přepisujte a prezentujte polyglot session
Vytvořte relaci, kterou lze použít k vysílání živého přepisu prostřednictvím veřejného sdíleného odkazu. Uživatelé si mohou přečíst živé přepisy ve svém preferovaném jazyce a dokonce i minulé přepisy, když je relace neaktivní.
Získání dat přepisu
Získejte data z čekajících nebo dokončených přepisů. To zahrnuje časovou osu přepisu, klíčová slova, souhrn a segmenty odstavců.
Tokeny ověřování na straně klienta
Vytvořit dočasný token ověření pro požadavky na straně klienta. Bezpečně implementujte požadavky API ve webových prohlížečích bez odhalení klíčů API.
Scroll Up