Documentation

Kry Transkripsie Data

Kry data van in-verwagting of voltooide transkripsies

Transkripsiesessies

Monitor en bestuur transkripsiestatus met sessies

Vertaal 'n transkripsie

Vertaal getranskribeer teks na 'n ander taal

Transkribeer oudio vanaf URL

Transkribeer spraak van vooraf opgeneemde oudio in 'n URL na gewone teks

Kliënt Kant Geldigheidstoets Tokens

Skep 'n tydelike geldigheidsverklaring token vir kliënt kant versoeke

Transkripsie Versoek en Antwoord

Gemeenskaplike versoek opsies en antwoorde vir alle transkripsie operasies

Transkribeer en voorsit 'n Polyglot sessie

Skep 'n sessie wat gebruik kan word om 'n live transkripsie via 'n openbare deelbare skakel uit te saai

Transkribeer vanaf 'n Mikrofoon of LiveStream

Blaai Dokumentasie
Transkribeer live spraak vanaf 'n mikrofone of live stroom. Integreer met Polyglot om 'n openbare deelbare skakel vir die transkripsie te skep wat gebruikers in enige taal kan lees.
Om van 'n mikrofone te transkribeer, moet ons voortdurend oudiodatastroompakkette na die VocalStack API stuur.
JavaScript
import { LiveTranscription } from '@vocalstack/js-sdk'; const sdk = new LiveTranscription({ apiKey: 'YOUR-API-KEY' }); const stream = await sdk.connect({ // Optional: Integrate this stream with a Polyglot session polyglot_id: 'YOUR-POLYGLOT-SESSION-ID', // Optional: language of the speech spoken // (this can be used to improve the transcription accuracy) language: 'en', // Optional: Translate the transcription to these languages translations: ['de'], // Optional: Stop the stream after this many seconds of inactivity timeout_period_s: 60, // Optional: Hard stop the stream after this many seconds max_duration_s: 300, }); // Start the stream stream.start(); // Get audio data from a microphone and send it to the stream // stream.sendBuffer(buffer); // *** This is a placeholder for the actual implementation *** // Manually stop the stream (in this example, after 60 seconds) // If max_duration_s is set, stopping the stream is optional setTimeout(() => stream.stop(), 60000); // Listen for stream transcription data stream.onData((response) => { const { status, data } = response; console.log(status); // 'waiting', 'processing', 'done', 'stopping' or 'error' if (data) { console.log(data.timeline); // an object with the transcription timeline } if (status === 'done') { console.log(data.summary); // a summary of the transcription console.log(data.keywords); // an array of keywords console.log(data.paragraphs); // the entire transcription in paragraph form } });
Die verkryging van die oudiostroom data sal verskil volgens die omgewing waar jy die transkripsie operasie wil uitvoer. Hier is 'n paar voorbeelde van hoe jy dit kan doen:
In NextJS moet jy 'n pakket installeer wat oudio data van jou toestel kan haal, wat jy dan kan deurstuur na die VocalStack API. Hier is 'n voorbeeld:
JavaScript
const mic = require('mic'); // Create a new instance of the microphone utility const micInstance = mic(); // Get the audio input stream const micStream = micInstance.getAudioStream(); // Capture the audio data from the microphone micStream.on('data', (data) => { stream.sendBuffer(data); // send the buffer data to the VocalStack API }); // Start capturing audio from the microphone micInstance.start();
Op die webblaaier kan jy dalk die Media Opnemer API soos in die volgende voorbeeld gesien kan word. (Dit kan ook 'n goeie idee wees om 'n pakket soos te gebruik recordrtc wat die blaaierverenigbaarheid verbeter)
JavaScript
// Request access to the microphone const mediaStream = await navigator.mediaDevices.getUserMedia({ audio: true }); // Create a MediaRecorder instance to capture audio data const mediaRecorder = new MediaRecorder(mediaStream); // Event handler to process audio data packets mediaRecorder.ondataavailable = async (event) => { const blob = event.data; // this is the audio packet (Blob) const buffer = await blob.arrayBuffer(); // convert the Blob to a Buffer stream.sendBuffer(buffer); // send the buffer data to the VocalStack API }; // Start capturing audio, and send it to the stream every second mediaRecorder.start(1000);
Let daarop dat vir toegang tot die VocalStack API op webkliënte jy 'n magtiging token moet gebruik:
Kliënt Kant Geldigheidstoets Tokens
Skep 'n tydelike geldigheidsverklaring token vir kliënt kant versoeke. Implementeer API versoeke veilig in webblaaiers sonder om jou API sleutels bloot te stel.
VocalStack API kan gebruik word om enige HLS LiveStream URL te transkribeer, insluitend bronne soos Youtube Live, Facebook Live en Twitch. Asseblief let daarop dat die stroom URL moet wees 'n .m3u8 lêer uitbreiding wat 'n geldige HLS (HTTP Live Streaming) speellys lêer verteenwoordig.
JavaScript
import { LiveTranscription } from '@vocalstack/js-sdk'; const sdk = new LiveTranscription({ apiKey: 'YOUR-API-KEY' }); const stream = await sdk.connect({ // must be a valid HLS streaming protocol livestream_url: 'http://a.files.bbci.co.uk/media/live/manifesto/audio/simulcast/hls/nonuk/sbr_low/ak/bbc_world_service.m3u8', // The rest of these options are the same as for microphone live transcriptons }); stream.start(); stream.onData((response) => { // The response object is the same as the one // returned by microphone transcriptions });
Die integrering van live transkripsies met Polyglot is so eenvoudig soos die byvoeging van 'n polyglot_id opsie vir die transkripsieversoek, soos in die voorbeelde hierbo aangetoon.
Polyglot skep 'n openbare deelbare skakel wat met jou transkripsies geassosieer word (die skakel kan met wagwoord beveilig word):
  • Gebruikers kan jou transkripsie in reële tyd lees deur die skakel te gebruik.
  • Gebruikers kan kies die taal in wat na lees die transkripsie in reële tyd.
  • Gebruikers kan jou transkripsie later lees, en alle ander transkripsies geïntegreer met jou spesifieke Polyglot sessie.
Jy is welkom om die VocalStack API te gebruik en jou eie wit geëtiketteerde UI te implementeer in plaas van die een wat deur VocalStack verskaf word. Ons sal graag daarvan wil hoor as jy dit doen, sodat ons kan leer hoe om ons produk beter te maak!
Leer meer oor hoe Polyglot werk by vocalstack.com/polyglot.
Transkribeer en voorsit 'n Polyglot sessie
Skep 'n sessie wat gebruik kan word om 'n live transkripsie via 'n openbare deelbare skakel uit te saai. Gebruikers kan live transkripsies in hul voorkeurtaal lees, en selfs verlede transkripsies wanneer jou sessie onaktief is.
Kry Transkripsie Data
Kry data van in-verwagting of voltooide transkripsies. Hierdie sluit in die transkripsie tydlyn, sleutelwoorde, opsomming, en paragraaf segmente.
Kliënt Kant Geldigheidstoets Tokens
Skep 'n tydelike geldigheidsverklaring token vir kliënt kant versoeke. Implementeer API versoeke veilig in webblaaiers sonder om jou API sleutels bloot te stel.
Scroll Up