VocalStack Logo

Documentation

Transcriptiegegevens ophalen

Haal gegevens op van lopende of voltooide transcripties

Transcriptiesessies voor studenten

Bewaak en beheer de transcriptiestatus met sessies

Een transcriptie vertalen

Vertaal getranscribeerde tekst naar een andere taal

Audio van URL transcriberen

Transcribeer spraak van vooraf opgenomen audio in een URL naar platte tekst

Tokens voor client-side-verificatie

Maak een tijdelijk authenticatie token voor client-side verzoeken

Transcriptieaanvraag en antwoord

Gebruik de opties om de transcriptie-instellingen te configureren en de transcriptie-instellingen te wijzigen

Een Polyglot-sessie transcriberen en presenteren

Maak een sessie die kan worden gebruikt om een live transcriptie uit te zenden via een openbare link die kan worden gedeeld

Transcriberen van een microfoon of LiveStream

Blader door de documentatie
Transcribeer live spraak van een microfoon of live stream. Integreer met Polyglot om een openbare link te maken voor de transcriptie die gebruikers in elke taal kunnen lezen.
Om vanuit een microfoon te transcriberen moeten we continu audio data stream pakketten naar de VocalStack API sturen.
JavaScript
import { LiveTranscription } from '@vocalstack/js-sdk'; const sdk = new LiveTranscription({ apiKey: 'YOUR-API-KEY' }); const stream = await sdk.connect({ // Optional: Integrate this stream with a Polyglot session polyglot_id: 'YOUR-POLYGLOT-SESSION-ID', // Optional: language of the speech spoken // (this can be used to improve the transcription accuracy) language: 'en', // Optional: Translate the transcription to these languages translations: ['de'], // Optional: Stop the stream after this many seconds of inactivity timeout_period_s: 60, // Optional: Hard stop the stream after this many seconds max_duration_s: 300, }); // Start the stream stream.start(); // Get audio data from a microphone and send it to the stream // stream.sendBuffer(buffer); // *** This is a placeholder for the actual implementation *** // Manually stop the stream (in this example, after 60 seconds) // If max_duration_s is set, stopping the stream is optional setTimeout(() => stream.stop(), 60000); // Listen for stream transcription data stream.onData((response) => { const { status, data } = response; console.log(status); // 'waiting', 'processing', 'done', 'stopping' or 'error' if (data) { console.log(data.timeline); // an object with the transcription timeline } if (status === 'done') { console.log(data.summary); // a summary of the transcription console.log(data.keywords); // an array of keywords console.log(data.paragraphs); // the entire transcription in paragraph form } });
Het verkrijgen van de audiostream gegevens zal verschillen op basis van de omgeving waar u de transcriptie bewerking wilt uitvoeren. Hier zijn een paar voorbeelden van hoe je dit kunt doen:
In NextJS moet je een pakket installeren dat audio data van je apparaat kan ophalen, die je dan door kunt sturen naar de VocalStack API. Hier is een voorbeeld:
JavaScript
const mic = require('mic'); // Create a new instance of the microphone utility const micInstance = mic(); // Get the audio input stream const micStream = micInstance.getAudioStream(); // Capture the audio data from the microphone micStream.on('data', (data) => { stream.sendBuffer(data); // send the buffer data to the VocalStack API }); // Start capturing audio from the microphone micInstance.start();
In de webbrowser kunt u de knop gebruiken MediaRecorder (Het kan ook een goed idee zijn om een pakket te gebruiken zoals , zoals in het volgende voorbeeld.) recordrtc welke de browsercompatibiliteit verbetert)
JavaScript
// Request access to the microphone const mediaStream = await navigator.mediaDevices.getUserMedia({ audio: true }); // Create a MediaRecorder instance to capture audio data const mediaRecorder = new MediaRecorder(mediaStream); // Event handler to process audio data packets mediaRecorder.ondataavailable = async (event) => { const blob = event.data; // this is the audio packet (Blob) const buffer = await blob.arrayBuffer(); // convert the Blob to a Buffer stream.sendBuffer(buffer); // send the buffer data to the VocalStack API }; // Start capturing audio, and send it to the stream every second mediaRecorder.start(1000);
Let op dat voor toegang tot de VocalStack API op webclients u een auth token moet gebruiken:
Tokens voor client-side-verificatie
Maak een tijdelijk authenticatie token voor client-side verzoeken. Implementeer API-verzoeken veilig in webbrowsers zonder uw API-sleutels bloot te stellen.
VocalStack API kan worden gebruikt om elke HLS LiveStream URL te transcriberen, inclusief bronnen zoals Youtube Live, Facebook Live en Twitch. Let op: de stream URL moet een. .m3u8 .hls is een bestandsextensie die een geldig HLS (HTTP Live Streaming) afspeellijstbestand vertegenwoordigt.
JavaScript
import { LiveTranscription } from '@vocalstack/js-sdk'; const sdk = new LiveTranscription({ apiKey: 'YOUR-API-KEY' }); const stream = await sdk.connect({ // must be a valid HLS streaming protocol livestream_url: 'http://a.files.bbci.co.uk/media/live/manifesto/audio/simulcast/hls/nonuk/sbr_low/ak/bbc_world_service.m3u8', // The rest of these options are the same as for microphone live transcriptons }); stream.start(); stream.onData((response) => { // The response object is the same as the one // returned by microphone transcriptions });
Het integreren van live transcripties met Polyglot is zo eenvoudig als het toevoegen van een. polyglot_id optie voor het transcriptieverzoek, zoals in de bovenstaande voorbeelden wordt getoond.
Polyglot maakt een openbare link aan die gekoppeld kan worden aan uw transcripties (de link kan beveiligd worden met een wachtwoord):
  • Gebruikers kunnen uw transcriptie in realtime lezen via de link.
  • Gebruikers kunnen de taal kiezen waarin ze de transcriptie in realtime willen lezen.
  • Gebruikers kunnen uw transcriptie op een later tijdstip lezen, en alle andere transcripties geïntegreerd met uw specifieke Polyglot sessie.
U bent van harte welkom om de VocalStack API te gebruiken en uw eigen white label UI te implementeren in plaats van de door VocalStack geleverde UI te gebruiken. We horen het graag als je dat doet, zodat we kunnen leren hoe we ons product beter kunnen maken!
Leer meer over hoe Polyglot werkt bij. Bekijk de website vocalstack.com/polyglot.
Een Polyglot-sessie transcriberen en presenteren
Maak een sessie die kan worden gebruikt om een live transcriptie uit te zenden via een openbare link die kan worden gedeeld. Gebruikers kunnen live transcripties lezen in de taal van hun voorkeur, en zelfs transcripties uit het verleden wanneer uw sessie inactief is.
Transcriptiegegevens ophalen
Haal gegevens op van lopende of voltooide transcripties. Dit omvat de transcriptietijdlijn, trefwoorden, samenvatting en alineasegmenten.
Tokens voor client-side-verificatie
Maak een tijdelijk authenticatie token voor client-side verzoeken. Implementeer API-verzoeken veilig in webbrowsers zonder uw API-sleutels bloot te stellen.
Scroll Up