VocalStack Logo

Documentation

Átírási adatok beolvasása

Adatok lekérése függőben lévő vagy befejezett átiratokból

Átírási munkamenetek

A transzkripciós állapot figyelése és kezelése munkamenetekkel

Fordíts le egy átiratot

Átírt szöveg fordítása másik nyelvre

Hang átírása URL-ről

A beszéd átírása előre rögzített hangból egy URL-ben egyszerű szöveggé

Ügyféloldali hitelesítési tokenek

Ideiglenes hitelesítési token létrehozása az ügyféloldali kérelmekhez

Átírási kérelem és válasz

Az összes átírási művelethez tartozó közös kérési beállítások és válaszok: A beállítások használatával konfigurálhatja az átírási beállításokat

Átírja és bemutatja a Polyglot Session

Hozzon létre egy munkamenetet, amelyet egy élő átirat közvetítésére használhat egy nyilvános megosztható linken keresztül

Átírás mikrofonról vagy élő közvetítésről

Dokumentáció böngészése
Élő beszéd átírása mikrofonról vagy élő közvetítésről. Integrálja a Polyglot-tal, hogy létrehozzon egy nyilvánosan megosztható linket az átíráshoz, amelyet a felhasználók bármilyen nyelven elolvashatják.
A mikrofonról történő átíráshoz folyamatosan kell küldenünk audio adatfolyamokat a VocalStack API-nak.
JavaScript
import { LiveTranscription } from '@vocalstack/js-sdk'; const sdk = new LiveTranscription({ apiKey: 'YOUR-API-KEY' }); const stream = await sdk.connect({ // Optional: Integrate this stream with a Polyglot session polyglot_id: 'YOUR-POLYGLOT-SESSION-ID', // Optional: language of the speech spoken // (this can be used to improve the transcription accuracy) language: 'en', // Optional: Translate the transcription to these languages translations: ['de'], // Optional: Stop the stream after this many seconds of inactivity timeout_period_s: 60, // Optional: Hard stop the stream after this many seconds max_duration_s: 300, }); // Start the stream stream.start(); // Get audio data from a microphone and send it to the stream // stream.sendBuffer(buffer); // *** This is a placeholder for the actual implementation *** // Manually stop the stream (in this example, after 60 seconds) // If max_duration_s is set, stopping the stream is optional setTimeout(() => stream.stop(), 60000); // Listen for stream transcription data stream.onData((response) => { const { status, data } = response; console.log(status); // 'waiting', 'processing', 'done', 'stopping' or 'error' if (data) { console.log(data.timeline); // an object with the transcription timeline } if (status === 'done') { console.log(data.summary); // a summary of the transcription console.log(data.keywords); // an array of keywords console.log(data.paragraphs); // the entire transcription in paragraph form } });
A hangfolyam adatainak beszerzése attól függően változik, hogy milyen környezetben szeretnéd végrehajtani az átírási műveletet. Íme néhány példa arra, hogy hogyan lehet ezt megtenni:
A NextJS-ben telepíteni kell egy csomagot, ami képes letölteni az audio adatokat az eszközről, amit aztán továbbíthat a VocalStack API-hoz. Itt van egy példa:
JavaScript
const mic = require('mic'); // Create a new instance of the microphone utility const micInstance = mic(); // Get the audio input stream const micStream = micInstance.getAudioStream(); // Capture the audio data from the microphone micStream.on('data', (data) => { stream.sendBuffer(data); // send the buffer data to the VocalStack API }); // Start capturing audio from the microphone micInstance.start();
A webböngészőben használhatja a. MediaRecorder (Az is jó ötlet lehet, ha egy olyan csomagot használunk, mint például a phpMyAdmin vagy a phpMyAdmin2.) recordrtc which improves browser compatibility)
JavaScript
// Request access to the microphone const mediaStream = await navigator.mediaDevices.getUserMedia({ audio: true }); // Create a MediaRecorder instance to capture audio data const mediaRecorder = new MediaRecorder(mediaStream); // Event handler to process audio data packets mediaRecorder.ondataavailable = async (event) => { const blob = event.data; // this is the audio packet (Blob) const buffer = await blob.arrayBuffer(); // convert the Blob to a Buffer stream.sendBuffer(buffer); // send the buffer data to the VocalStack API }; // Start capturing audio, and send it to the stream every second mediaRecorder.start(1000);
Megjegyzés: A VocalStack API webes klienseken történő eléréséhez egy hitelesítési tokenre lesz szükséged:
Ügyféloldali hitelesítési tokenek
Ideiglenes hitelesítési token létrehozása az ügyféloldali kérelmekhez. API-kéréseket biztonságosan hajthat végre webböngészőben az API-kulcsok felfedése nélkül.
A VocalStack API bármely HLS LiveStream URL átírására használható, beleértve az olyan forrásokat, mint a Youtube Live, a Facebook Live és a Twitch. Kérjük, vegye figyelembe, hogy a stream URL-nek. .m3u8 .hls egy fájl kiterjesztése, amely egy érvényes HLS (HTTP Live Streaming) lejátszási lista fájlt képvisel.
JavaScript
import { LiveTranscription } from '@vocalstack/js-sdk'; const sdk = new LiveTranscription({ apiKey: 'YOUR-API-KEY' }); const stream = await sdk.connect({ // must be a valid HLS streaming protocol livestream_url: 'http://a.files.bbci.co.uk/media/live/manifesto/audio/simulcast/hls/nonuk/sbr_low/ak/bbc_world_service.m3u8', // The rest of these options are the same as for microphone live transcriptons }); stream.start(); stream.onData((response) => { // The response object is the same as the one // returned by microphone transcriptions });
Az élő átiratok integrálása a Polyglot-tal olyan egyszerű, mint egy. polyglot_id opciót a transzkripciós kéréshez, amint azt a fenti példák mutatják.
A Polyglot létrehoz egy nyilvános linket az átiratokhoz (a link jelszóval védett lehet):
  • A felhasználók a link segítségével valós időben elolvashatják az átiratot.
  • A felhasználók kiválaszthatják azt a nyelvet, amelyen valós időben olvassák az átiratot.
  • A felhasználók később elolvashatják az átiratodat, és az összes többi átiratot integrálják az adott Polyglot munkamenethez.
A VocalStack API-t használva saját, fehér címkével ellátott felhasználói felületet is létrehozhat a VocalStack által biztosított helyett. Szeretnénk hallani róla, ha igen, hogy megtanuljuk, hogyan tegyük jobbá a termékeinket!
Tudjon meg többet arról, hogyan működik a Polyglot itt:. vocalstack.com/polyglot.
Átírja és bemutatja a Polyglot Session
Hozzon létre egy munkamenetet, amelyet egy élő átirat közvetítésére használhat egy nyilvános megosztható linken keresztül. A felhasználók az élő átiratokat a kívánt nyelven olvashatják, sőt a korábbi átiratokat is, amikor a munkamenet inaktív.
Átírási adatok beolvasása
Adatok lekérése függőben lévő vagy befejezett átiratokból. Ez magában foglalja az átírási idővonalat, a kulcsszavakat, az összefoglalót és a bekezdésszegmenseket.
Ügyféloldali hitelesítési tokenek
Ideiglenes hitelesítési token létrehozása az ügyféloldali kérelmekhez. API-kéréseket biztonságosan hajthat végre webböngészőben az API-kulcsok felfedése nélkül.
Scroll Up