Documentation

Hent transkripsjonsdata

Hent data fra ventende eller fullførte transkripsjoner

Transkripsjonsøkter

Overvåk og administrer transkripsjonsstatus med økter

Oversett en transkripsjon

Oversett transkribert tekst til et annet språk

Transkriber lyd fra URL

Transkriber tale fra forhåndsinnspilt lyd i en URL til ren tekst

Autentiseringstegn på klientsiden

Opprett et midlertidig autentiseringsmerke for forespørsler fra klientsiden

Forespørsel om transkripsjon og svar

Vanlige forespørselsvalg og svar for alle transkripsjonsoperasjoner

Transkribere og presentere en Polyglot-økt

Opprett en økt som kan brukes til å kringkaste en direktetranskripsjon via en offentlig delbar kobling

Transkribere fra en mikrofon eller LiveStream

Bla gjennom dokumentasjon
Transkriber live tale fra en mikrofon eller live stream. Integrer med Polyglot for å lage en offentlig delbar lenke for transkripsjonen som brukere kan lese på alle språk.
For å transkribere fra en mikrofon må vi kontinuerlig sende lyddatastrømpakker til VocalStack API.
JavaScript
import { LiveTranscription } from '@vocalstack/js-sdk'; const sdk = new LiveTranscription({ apiKey: 'YOUR-API-KEY' }); const stream = await sdk.connect({ // Optional: Integrate this stream with a Polyglot session polyglot_id: 'YOUR-POLYGLOT-SESSION-ID', // Optional: language of the speech spoken // (this can be used to improve the transcription accuracy) language: 'en', // Optional: Translate the transcription to these languages translations: ['de'], // Optional: Stop the stream after this many seconds of inactivity timeout_period_s: 60, // Optional: Hard stop the stream after this many seconds max_duration_s: 300, }); // Start the stream stream.start(); // Get audio data from a microphone and send it to the stream // stream.sendBuffer(buffer); // *** This is a placeholder for the actual implementation *** // Manually stop the stream (in this example, after 60 seconds) // If max_duration_s is set, stopping the stream is optional setTimeout(() => stream.stop(), 60000); // Listen for stream transcription data stream.onData((response) => { const { status, data } = response; console.log(status); // 'waiting', 'processing', 'done', 'stopping' or 'error' if (data) { console.log(data.timeline); // an object with the transcription timeline } if (status === 'done') { console.log(data.summary); // a summary of the transcription console.log(data.keywords); // an array of keywords console.log(data.paragraphs); // the entire transcription in paragraph form } });
Å hente lydstrømdata vil variere basert på miljøet der du vil utføre transkripsjonsoperasjonen. Her er et par eksempler på hvordan du kan gjøre dette:
I NextJS bør du installere en pakke som kan hente lyddata fra enheten, som du deretter kan videresende til VocalStack API. Her er et eksempel:
JavaScript
const mic = require('mic'); // Create a new instance of the microphone utility const micInstance = mic(); // Get the audio input stream const micStream = micInstance.getAudioStream(); // Capture the audio data from the microphone micStream.on('data', (data) => { stream.sendBuffer(data); // send the buffer data to the VocalStack API }); // Start capturing audio from the microphone micInstance.start();
I nettleseren kan det være lurt å bruke. MediaRecorder API som kan sees i følgende eksempel. (Det kan også være en god idé å bruke en pakke som recordrtc som forbedrer nettleserkompatibilitet)
JavaScript
// Request access to the microphone const mediaStream = await navigator.mediaDevices.getUserMedia({ audio: true }); // Create a MediaRecorder instance to capture audio data const mediaRecorder = new MediaRecorder(mediaStream); // Event handler to process audio data packets mediaRecorder.ondataavailable = async (event) => { const blob = event.data; // this is the audio packet (Blob) const buffer = await blob.arrayBuffer(); // convert the Blob to a Buffer stream.sendBuffer(buffer); // send the buffer data to the VocalStack API }; // Start capturing audio, and send it to the stream every second mediaRecorder.start(1000);
Merk at for tilgang til VocalStack API på web-klienter må du bruke en autentiseringskode:
Autentiseringstegn på klientsiden
Opprett et midlertidig autentiseringsmerke for forespørsler fra klientsiden. Implementer API-forespørsler trygt i nettlesere uten å avsløre API-nøklene dine.
VocalStack API kan brukes til å transkribere enhver HLS LiveStream URL, inkludert kilder som Youtube Live, Facebook Live, og Twitch. Vennligst merk at strømmen URL må være en. .m3u8 filer som representerer en gyldig HLS (HTTP Live Streaming) spillelistefil.
JavaScript
import { LiveTranscription } from '@vocalstack/js-sdk'; const sdk = new LiveTranscription({ apiKey: 'YOUR-API-KEY' }); const stream = await sdk.connect({ // must be a valid HLS streaming protocol livestream_url: 'http://a.files.bbci.co.uk/media/live/manifesto/audio/simulcast/hls/nonuk/sbr_low/ak/bbc_world_service.m3u8', // The rest of these options are the same as for microphone live transcriptons }); stream.start(); stream.onData((response) => { // The response object is the same as the one // returned by microphone transcriptions });
Å integrere live transkripsjoner med Polyglot er like enkelt som å legge til en. polyglot_ id alternativet til transkripsjonsforespørselen, som vist i eksemplene ovenfor.
Polyglot oppretter en offentlig delbar lenke tilknyttet transkripsjonene dine (lenken kan være passordbeskyttet):
  • Brukere kan lese transkripsjonen i sanntid ved hjelp av koblingen.
  • Brukere kan velge språket som skal leses transkripsjonen i sanntid.
  • Brukere kan lese transkripsjonen din på et senere tidspunkt, og alle andre transkripsjoner integrert med din spesielle Polyglot-økt.
Du er velkommen til å bruke VocalStack API og implementere din egen hvit merket UI i stedet for å bruke den som leveres av VocalStack. Vi vil gjerne høre om det hvis du gjør det, så vi kan lære om hvordan vi kan gjøre produktet vårt bedre!
Lær mer om hvordan Polyglot fungerer på. Finn ut mer på vocalstack.com/polyglot.
Transkribere og presentere en Polyglot-økt
Opprett en økt som kan brukes til å kringkaste en direktetranskripsjon via en offentlig delbar kobling. Brukere kan lese direktetranskripsjoner på deres foretrukne språk, og til og med tidligere transkripsjoner når økten din er inaktiv.
Hent transkripsjonsdata
Hent data fra ventende eller fullførte transkripsjoner. Dette inkluderer transkripsjonstidslinjen, nøkkelord, sammendrag og avsnittssegmenter.
Autentiseringstegn på klientsiden
Opprett et midlertidig autentiseringsmerke for forespørsler fra klientsiden. Implementer API-forespørsler trygt i nettlesere uten å avsløre API-nøklene dine.
Scroll Up