Documentation

Preuzmi podatke o transkripciji

Dohvati podatke iz čekanja ili završenih transkripcija

Transkripcija

Nadzire i upravlja stanjem transkripcije sa seansama

Prevedi transkripciju

Prevodi transkripciju teksta na drugi jezik

Prepisivaj audio sa URL-a

Pretvara govor iz prethodno snimljenog zvuka u URL u obični tekst

Tokeni za provjeru autentičnosti na strani klijenta

Napravi privremeni token za provjeru autentičnosti za zahtjeve sa strane klijenta

Zahtjev za prepisivanje i odgovor

Opcije zajedničkog zahtjeva i odgovora za sve operacije prepisa

Prepisivati i prezentirati poliglotsku sesiju

Napravite sesiju koja se može koristiti za emitiranje transkripcije uživo putem javne poveznice za dijeljenje

Prepisivati iz mikrofona ili LiveStreama

Pregledaj dokumentaciju
Prepisivati govor uživo iz mikrofona ili live streama. Integrirajte se sa Polyglotom da biste stvorili link za javno dijeljenje transkripcije koju korisnici mogu čitati na bilo kojem jeziku.
Da bi se prepisalo iz mikrofona, moramo kontinuirano slati audio pakete podataka u VocalStack API.
JavaScript
import { LiveTranscription } from '@vocalstack/js-sdk'; const sdk = new LiveTranscription({ apiKey: 'YOUR-API-KEY' }); const stream = await sdk.connect({ // Optional: Integrate this stream with a Polyglot session polyglot_id: 'YOUR-POLYGLOT-SESSION-ID', // Optional: language of the speech spoken // (this can be used to improve the transcription accuracy) language: 'en', // Optional: Translate the transcription to these languages translations: ['de'], // Optional: Stop the stream after this many seconds of inactivity timeout_period_s: 60, // Optional: Hard stop the stream after this many seconds max_duration_s: 300, }); // Start the stream stream.start(); // Get audio data from a microphone and send it to the stream // stream.sendBuffer(buffer); // *** This is a placeholder for the actual implementation *** // Manually stop the stream (in this example, after 60 seconds) // If max_duration_s is set, stopping the stream is optional setTimeout(() => stream.stop(), 60000); // Listen for stream transcription data stream.onData((response) => { const { status, data } = response; console.log(status); // 'waiting', 'processing', 'done', 'stopping' or 'error' if (data) { console.log(data.timeline); // an object with the transcription timeline } if (status === 'done') { console.log(data.summary); // a summary of the transcription console.log(data.keywords); // an array of keywords console.log(data.paragraphs); // the entire transcription in paragraph form } });
Dobivanje audio podataka će se razlikovati na osnovu okruženja u kojem želite izvršiti transkripciju. Evo nekoliko primjera kako biste to mogli uraditi:
U NextJS-u trebate instalirati paket koji može dohvatiti audio podatke sa vašeg uređaja, koji se zatim mogu prosljeđivati na VocalStack API. Evo primjera:
JavaScript
const mic = require('mic'); // Create a new instance of the microphone utility const micInstance = mic(); // Get the audio input stream const micStream = micInstance.getAudioStream(); // Capture the audio data from the microphone micStream.on('data', (data) => { stream.sendBuffer(data); // send the buffer data to the VocalStack API }); // Start capturing audio from the microphone micInstance.start();
Na web pregledniku možete koristiti. MediaRecorder API kao što se može vidjeti u sljedećem primjeru. (Može biti dobra ideja da se koristi paket kao što je ) recordrtc which improves browser compatibility)
JavaScript
// Request access to the microphone const mediaStream = await navigator.mediaDevices.getUserMedia({ audio: true }); // Create a MediaRecorder instance to capture audio data const mediaRecorder = new MediaRecorder(mediaStream); // Event handler to process audio data packets mediaRecorder.ondataavailable = async (event) => { const blob = event.data; // this is the audio packet (Blob) const buffer = await blob.arrayBuffer(); // convert the Blob to a Buffer stream.sendBuffer(buffer); // send the buffer data to the VocalStack API }; // Start capturing audio, and send it to the stream every second mediaRecorder.start(1000);
Imajte na umu da za pristup VocalStack API na web klijentima morate koristiti autentifikacijski token:
Tokeni za provjeru autentičnosti na strani klijenta
Napravi privremeni token za provjeru autentičnosti za zahtjeve sa strane klijenta. Sigurno implementirajte API zahtjeve u web preglednicima bez izlaganja vaših API ključeva.
VocalStack API može se koristiti za prepisivanje bilo kojeg HLS LiveStream URL-a, uključujući izvore kao što su Youtube Live, Facebook Live i Twitch. Imajte na umu da URL toka mora biti. .M3U8 file extension that represents a valid HLS (HTTP Live Streaming) playlist file.
JavaScript
import { LiveTranscription } from '@vocalstack/js-sdk'; const sdk = new LiveTranscription({ apiKey: 'YOUR-API-KEY' }); const stream = await sdk.connect({ // must be a valid HLS streaming protocol livestream_url: 'http://a.files.bbci.co.uk/media/live/manifesto/audio/simulcast/hls/nonuk/sbr_low/ak/bbc_world_service.m3u8', // The rest of these options are the same as for microphone live transcriptons }); stream.start(); stream.onData((response) => { // The response object is the same as the one // returned by microphone transcriptions });
Integriranje transkripcije uživo sa Polyglotom je jednostavno kao dodavanje. polyglot_id opcija za zahtjev za transkripciju, kao što je prikazano u gornjim primjerima.
Polyglot stvara javni link koji se može dijeliti povezan s vašim transkripcijama (link može biti zaštićen lozinkom):
  • Korisnici mogu čitati vašu transkripciju u realnom vremenu koristeći vezu.
  • Korisnici mogu odabrati jezik na kojem će čitati transkripciju u realnom vremenu.
  • Korisnici mogu čitati vašu transkripciju kasnije, a sve ostale transkripcije integrirane sa vašom posebnom Polyglot sesijom.
Dobrodošli ste da koristite VocalStack API i implementirate svoj vlastiti bijeli UI umjesto da koristite onaj koji pruža VocalStack. Voljeli bismo da čujemo o tome ako znaš, tako da možemo naučiti kako da poboljšamo naš proizvod!
Saznajte više o tome kako Polyglot radi na. vocalstack.com/polyglot.
Prepisivati i prezentirati poliglotsku sesiju
Napravite sesiju koja se može koristiti za emitiranje transkripcije uživo putem javne poveznice za dijeljenje. Korisnici mogu čitati live transkripcije na svom jeziku, pa čak i prošlih transkripcija kada je vaša sesija neaktivna.
Preuzmi podatke o transkripciji
Dohvati podatke iz čekanja ili završenih transkripcija. To uključuje vremensku crtu transkripcije, ključne riječi, sažetak i segmente paragrafa.
Tokeni za provjeru autentičnosti na strani klijenta
Napravi privremeni token za provjeru autentičnosti za zahtjeve sa strane klijenta. Sigurno implementirajte API zahtjeve u web preglednicima bez izlaganja vaših API ključeva.
Scroll Up