VocalStack Logo

Documentation

Transkriptsiooniandmete hankimine

Saa andmed ootel olevatest või lõpetatud transkriptsioonidest

Transkriptsiooni seansid

Transkriptsiooni staatuse jälgimine ja haldamine seansside abil

Tõlgi transkriptsioon

Tõlgi transkribeeritud teksti teise keelde

Transkribeeri audio URL-ist

Transkribeeri kõne eelsalvestatud heli URL-i lihttekstiks

Kliendipoolsed autentimismärgid

Loo ajutine autentimismärk kliendipoolsete päringute jaoks

Transkriptsiooni taotlus ja vastus

Ühised päringu suvandid ja vastused kõigi transkriptsioonitoimingute jaoks

Transkribeerige ja esitage polüglottide seanss

Looge seanss, mida saab kasutada reaalajas transkriptsiooni edastamiseks avaliku jagatava lingi kaudu

Mikrofonist või LiveStreamist transkribeerimine

Sirvi dokumentatsiooni
Transkribeeri reaalajas kõne mikrofonist või reaalajas voogedastus. Integreeri Polyglotiga, et luua avalik ja jagatav link transkriptsioonile, mida kasutajad saavad lugeda mis tahes keeles.
Mikrofonist transkribeerimiseks peame me pidevalt saatma audio andmevoogu pakette VocalStack API-le.
JavaScript
import { LiveTranscription } from '@vocalstack/js-sdk'; const sdk = new LiveTranscription({ apiKey: 'YOUR-API-KEY' }); const stream = await sdk.connect({ // Optional: Integrate this stream with a Polyglot session polyglot_id: 'YOUR-POLYGLOT-SESSION-ID', // Optional: language of the speech spoken // (this can be used to improve the transcription accuracy) language: 'en', // Optional: Translate the transcription to these languages translations: ['de'], // Optional: Stop the stream after this many seconds of inactivity timeout_period_s: 60, // Optional: Hard stop the stream after this many seconds max_duration_s: 300, }); // Start the stream stream.start(); // Get audio data from a microphone and send it to the stream // stream.sendBuffer(buffer); // *** This is a placeholder for the actual implementation *** // Manually stop the stream (in this example, after 60 seconds) // If max_duration_s is set, stopping the stream is optional setTimeout(() => stream.stop(), 60000); // Listen for stream transcription data stream.onData((response) => { const { status, data } = response; console.log(status); // 'waiting', 'processing', 'done', 'stopping' or 'error' if (data) { console.log(data.timeline); // an object with the transcription timeline } if (status === 'done') { console.log(data.summary); // a summary of the transcription console.log(data.keywords); // an array of keywords console.log(data.paragraphs); // the entire transcription in paragraph form } });
Audiovoogu andmete hankimine erineb sõltuvalt keskkonnast, kus te soovite transkriptsiooni operatsiooni käivitada. Siin on mõned näited, kuidas seda teha:
NextJS-is peaksite installima paketi, mis suudab teie seadmest heliandmeid tuua, mida saate seejärel VocalStack API-le edastada. Siin on näide:
JavaScript
const mic = require('mic'); // Create a new instance of the microphone utility const micInstance = mic(); // Get the audio input stream const micStream = micInstance.getAudioStream(); // Capture the audio data from the microphone micStream.on('data', (data) => { stream.sendBuffer(data); // send the buffer data to the VocalStack API }); // Start capturing audio from the microphone micInstance.start();
Veebibrauseris võite kasutada klahvi. MediaRecorder API, nagu näidatud järgmises näites (võib olla hea mõte kasutada ka paketti nagu ) recordrtc , mis parandab brauseri ühilduvust)
JavaScript
// Request access to the microphone const mediaStream = await navigator.mediaDevices.getUserMedia({ audio: true }); // Create a MediaRecorder instance to capture audio data const mediaRecorder = new MediaRecorder(mediaStream); // Event handler to process audio data packets mediaRecorder.ondataavailable = async (event) => { const blob = event.data; // this is the audio packet (Blob) const buffer = await blob.arrayBuffer(); // convert the Blob to a Buffer stream.sendBuffer(buffer); // send the buffer data to the VocalStack API }; // Start capturing audio, and send it to the stream every second mediaRecorder.start(1000);
Pange tähele, et juurdepääsuks VocalStack API-le veebiklientidel on vaja kasutada auth tokenit:
Kliendipoolsed autentimismärgid
Loo ajutine autentimismärk kliendipoolsete päringute jaoks. Rakendage API-päringuid veebibrauserites turvaliselt, ilma et avaldaksite oma API-võtmeid.
VocalStack API-d saab kasutada mis tahes HLS LiveStream URL-i transkriptsiooniks, sealhulgas allikatest nagu Youtube Live, Facebook Live ja Twitch. Pange tähele, et voogedastuse URL peab olema. .m3u8 faililaiend, mis tähistab kehtivat HLS (HTTP Live Streaming) esitusloendi faili.
JavaScript
import { LiveTranscription } from '@vocalstack/js-sdk'; const sdk = new LiveTranscription({ apiKey: 'YOUR-API-KEY' }); const stream = await sdk.connect({ // must be a valid HLS streaming protocol livestream_url: 'http://a.files.bbci.co.uk/media/live/manifesto/audio/simulcast/hls/nonuk/sbr_low/ak/bbc_world_service.m3u8', // The rest of these options are the same as for microphone live transcriptons }); stream.start(); stream.onData((response) => { // The response object is the same as the one // returned by microphone transcriptions });
Reaalajas transkriptsioonide integreerimine Polyglotiga on sama lihtne kui lisamise. polüklo_t_id võimalust transkriptsiooni taotlemiseks, nagu on näidatud eespool toodud näidetes.
Polyglot loob sinu transkriptsioonidega seotud avaliku jagatava lingi (link võib olla parooliga kaitstud):
  • Kasutajad saavad teie ärakirja reaalajas lugeda, kasutades linki.
  • Kasutajad saavad valida keele, milles nad soovivad transkriptsiooni reaalajas lugeda.
  • Kasutajad saavad lugeda sinu transkriptsiooni hiljem ja kõik teised transkriptsioonid on integreeritud sinu konkreetse Polyglot sessiooniga.
Te võite kasutada VocalStacki API-d ja rakendada oma valge märgistusega kasutajaliidest, selle asemel et kasutada VocalStacki pakutavat. Meile meeldiks kuulda sellest, kui sa seda teed, et saaksime õppida, kuidas oma toodet paremaks muuta!
Loe lähemalt, kuidas Polyglot töötab juures. vocalstack.com/polyglot.
Transkribeerige ja esitage polüglottide seanss
Looge seanss, mida saab kasutada reaalajas transkriptsiooni edastamiseks avaliku jagatava lingi kaudu. Kasutajad saavad lugeda reaalajas transkriptsioone oma eelistatud keeles ja isegi varasemaid transkriptsioone, kui teie seanss on passiivne.
Transkriptsiooniandmete hankimine
Saa andmed ootel olevatest või lõpetatud transkriptsioonidest. See hõlmab transkriptsiooni ajaskaalat, võtmesõnu, kokkuvõtet ja lõigusegmente.
Kliendipoolsed autentimismärgid
Loo ajutine autentimismärk kliendipoolsete päringute jaoks. Rakendage API-päringuid veebibrauserites turvaliselt, ilma et avaldaksite oma API-võtmeid.
Scroll Up