VocalStack Logo

Documentation

Gauti transkribavimo duomenis

Gauti duomenis iš laukiančių arba baigtų transkripcijų

Transkripcijos seansai

Stebėti ir valdyti transkripcijos būseną su seansais

Išversti transkribą

Verskite transkribuotą tekstą į kitą kalbą

Transkribuoti garso iš URL

Transkripuoti kalbą iš iš anksto įrašyto garso URL į paprastą tekstą

Kliento pusės autentifikavimo žetonai

Sukurti laikiną autentifikavimo ženklą kliento pusės užklausoms

Transkribavimo užklausa ir atsakymas

Bendrosios visų transkripcijos operacijų užklausos parinktys ir atsakymai

Transkribuoti ir pristatyti poliglotą sesiją

Sukurti sesiją, kuri gali būti naudojama transliuoti tiesioginę transkripciją per viešą bendrinimo nuorodą

Transkribavimas iš mikrofono arba LiveStream

Naršyti dokumentaciją
Transkripuoti gyvą kalbą iš mikrofono ar tiesioginio srauto. Integruokite su Polyglot, kad sukurtumėte viešą transkripcijos nuorodą, kuria naudotojai galėtų dalintis bet kuria kalba.
Norėdami transkripuoti iš mikrofono, turime nuolat siųsti garso duomenų srauto paketus į VocalStack API.
JavaScript
import { LiveTranscription } from '@vocalstack/js-sdk'; const sdk = new LiveTranscription({ apiKey: 'YOUR-API-KEY' }); const stream = await sdk.connect({ // Optional: Integrate this stream with a Polyglot session polyglot_id: 'YOUR-POLYGLOT-SESSION-ID', // Optional: language of the speech spoken // (this can be used to improve the transcription accuracy) language: 'en', // Optional: Translate the transcription to these languages translations: ['de'], // Optional: Stop the stream after this many seconds of inactivity timeout_period_s: 60, // Optional: Hard stop the stream after this many seconds max_duration_s: 300, }); // Start the stream stream.start(); // Get audio data from a microphone and send it to the stream // stream.sendBuffer(buffer); // *** This is a placeholder for the actual implementation *** // Manually stop the stream (in this example, after 60 seconds) // If max_duration_s is set, stopping the stream is optional setTimeout(() => stream.stop(), 60000); // Listen for stream transcription data stream.onData((response) => { const { status, data } = response; console.log(status); // 'waiting', 'processing', 'done', 'stopping' or 'error' if (data) { console.log(data.timeline); // an object with the transcription timeline } if (status === 'done') { console.log(data.summary); // a summary of the transcription console.log(data.keywords); // an array of keywords console.log(data.paragraphs); // the entire transcription in paragraph form } });
Garso srauto duomenų gavimas skirsis priklausomai nuo aplinkos, kurioje norite atlikti transkripcijos operaciją. Štai keletas pavyzdžių, kaip tai galite padaryti:
NextJS jūs turėtumėte įdiegti paketą, kuris gali gauti garso duomenis iš jūsų įrenginio, kurį tada galite persiųsti į VocalStack API. Štai pavyzdys:
JavaScript
const mic = require('mic'); // Create a new instance of the microphone utility const micInstance = mic(); // Get the audio input stream const micStream = micInstance.getAudioStream(); // Capture the audio data from the microphone micStream.on('data', (data) => { stream.sendBuffer(data); // send the buffer data to the VocalStack API }); // Start capturing audio from the microphone micInstance.start();
Žiniatinklio naršyklėje galite naudoti. MediaRecorder API, kaip galima pamatyti iš toliau pateikto pavyzdžio (taip pat gali būti gera idėja naudoti paketą, pvz., recordrtc which improves browser compatibility)
JavaScript
// Request access to the microphone const mediaStream = await navigator.mediaDevices.getUserMedia({ audio: true }); // Create a MediaRecorder instance to capture audio data const mediaRecorder = new MediaRecorder(mediaStream); // Event handler to process audio data packets mediaRecorder.ondataavailable = async (event) => { const blob = event.data; // this is the audio packet (Blob) const buffer = await blob.arrayBuffer(); // convert the Blob to a Buffer stream.sendBuffer(buffer); // send the buffer data to the VocalStack API }; // Start capturing audio, and send it to the stream every second mediaRecorder.start(1000);
Atkreipkite dėmesį, kad norint prisijungti prie VocalStack API interneto klientų jums reikės naudoti auth token:
Kliento pusės autentifikavimo žetonai
Sukurti laikiną autentifikavimo ženklą kliento pusės užklausoms. Saugiai įdiekite API užklausas žiniatinklio naršyklėse, neatskleidžiant savo API raktų.
VocalStack API gali būti naudojamas transliuoti bet kokį HLS LiveStream URL, įskaitant šaltinius, tokius kaip Youtube Live, Facebook Live ir Twitch. Atkreipkite dėmesį, kad srauto URL turi būti. . m3u8 failo plėtinys, kuris reiškia galiojantį HLS (HTTP Live Streaming) grojaraščio failą.
JavaScript
import { LiveTranscription } from '@vocalstack/js-sdk'; const sdk = new LiveTranscription({ apiKey: 'YOUR-API-KEY' }); const stream = await sdk.connect({ // must be a valid HLS streaming protocol livestream_url: 'http://a.files.bbci.co.uk/media/live/manifesto/audio/simulcast/hls/nonuk/sbr_low/ak/bbc_world_service.m3u8', // The rest of these options are the same as for microphone live transcriptons }); stream.start(); stream.onData((response) => { // The response object is the same as the one // returned by microphone transcriptions });
Integruoti gyvus transkribavimo įrašus su Polyglot yra taip paprasta, kaip pridėti poliglotas_id galimybė transkripcijos užklausai, kaip parodyta pirmiau pateiktuose pavyzdžiuose.
Polyglot sukuria viešą nuorodą, susijusią su jūsų transkripcijomis (nuoroda gali būti apsaugota slaptažodžiu):
  • Naudotojai gali skaityti jūsų nuorašą realiuoju laiku naudodami saitą.
  • Vartotojai gali pasirinkti kalbą, kuria nori skaityti transkripciją realiu laiku.
  • Vartotojai gali perskaityti jūsų transkripciją vėliau, o visi kiti transkripcijos integruoti su jūsų konkrečiu Polyglot seansu.
Jūs galite naudoti VocalStack API ir įdiegti savo baltą UI vietoj to, kad naudotumėte VocalStack. Mes norėtume išgirsti apie tai, jei jūs darote, kad galėtume išmokti, kaip padaryti mūsų produktą geresnį!
Sužinokite daugiau apie tai, kaip Polyglot veikia. vocalstack.com/polyglot.
Transkribuoti ir pristatyti poliglotą sesiją
Sukurti sesiją, kuri gali būti naudojama transliuoti tiesioginę transkripciją per viešą bendrinimo nuorodą. Vartotojai gali skaityti tiesiogines transkripcijas savo pageidaujama kalba ir net praeities transkripcijas, kai jūsų sesija yra neaktyvi.
Gauti transkribavimo duomenis
Gauti duomenis iš laukiančių arba baigtų transkripcijų. Tai apima transkribavimo laiko planavimo juostą, raktinius žodžius, santrauką ir pastraipų segmentus.
Kliento pusės autentifikavimo žetonai
Sukurti laikiną autentifikavimo ženklą kliento pusės užklausoms. Saugiai įdiekite API užklausas žiniatinklio naršyklėse, neatskleidžiant savo API raktų.
Scroll Up