VocalStack Logo

Documentation

Iegūt transkripcijas datus

Iegūt datus no gaidošām vai pabeigtām transkripcijām

Transkripcijas sesijas

Uzraudzīt un pārvaldīt transkripcijas statusu ar sesijām

Tulkot transkripciju

Tulkot transkripcijas tekstu citā valodā

Transcribe Audio no URL

Transkribēt runu no iepriekš ierakstīta audio URL vienkāršā tekstā

Klienta puses autentifikācijas žetoni

Izveidot pagaidu autentifikācijas žetonu klienta puses pieprasījumiem

Transkripcijas pieprasījums un atbilde

Vispārējās pieprasījumu opcijas un atbildes visām transkripcijas darbībām

Pārrakstīt un prezentēt Polyglot sesiju

Izveidojiet sesiju, kuru var izmantot, lai pārraidītu tiešraides transkripciju, izmantojot publiski kopīgojamu saiti

Transkripts no mikrofona vai LiveStream

Pārlūkot dokumentāciju
Transcribe tiešraides runu no mikrofona vai tiešraides straumi. Integrējiet ar Polyglot, lai izveidotu publiski koplietojamu saiti uz transkripciju, kuru lietotāji var lasīt jebkurā valodā.
Lai transkriptu no mikrofona, mums ir nepārtraukti jāsūta audio datu plūsmas paketes uz VocalStack API.
JavaScript
import { LiveTranscription } from '@vocalstack/js-sdk'; const sdk = new LiveTranscription({ apiKey: 'YOUR-API-KEY' }); const stream = await sdk.connect({ // Optional: Integrate this stream with a Polyglot session polyglot_id: 'YOUR-POLYGLOT-SESSION-ID', // Optional: language of the speech spoken // (this can be used to improve the transcription accuracy) language: 'en', // Optional: Translate the transcription to these languages translations: ['de'], // Optional: Stop the stream after this many seconds of inactivity timeout_period_s: 60, // Optional: Hard stop the stream after this many seconds max_duration_s: 300, }); // Start the stream stream.start(); // Get audio data from a microphone and send it to the stream // stream.sendBuffer(buffer); // *** This is a placeholder for the actual implementation *** // Manually stop the stream (in this example, after 60 seconds) // If max_duration_s is set, stopping the stream is optional setTimeout(() => stream.stop(), 60000); // Listen for stream transcription data stream.onData((response) => { const { status, data } = response; console.log(status); // 'waiting', 'processing', 'done', 'stopping' or 'error' if (data) { console.log(data.timeline); // an object with the transcription timeline } if (status === 'done') { console.log(data.summary); // a summary of the transcription console.log(data.keywords); // an array of keywords console.log(data.paragraphs); // the entire transcription in paragraph form } });
Audio plūsmas datu iegūšana atšķirsies atkarībā no vides, kurā vēlaties veikt transkripcijas operāciju. Šeit ir daži piemēri, kā jūs varētu darīt to:
NextJS jums vajadzētu instalēt paketi, kas var ielādēt audio datus no ierīces, ko pēc tam var pārsūtīt uz VocalStack API. Lūk, piemērs:
JavaScript
const mic = require('mic'); // Create a new instance of the microphone utility const micInstance = mic(); // Get the audio input stream const micStream = micInstance.getAudioStream(); // Capture the audio data from the microphone micStream.on('data', (data) => { stream.sendBuffer(data); // send the buffer data to the VocalStack API }); // Start capturing audio from the microphone micInstance.start();
Tīmekļa pārlūkprogrammā varat izmantot. MediaRecorderName API, kā redzams šajā piemērā (var būt arī laba ideja izmantot tādu paketi kā ) recordrtc kas uzlabo pārlūka saderību)
JavaScript
// Request access to the microphone const mediaStream = await navigator.mediaDevices.getUserMedia({ audio: true }); // Create a MediaRecorder instance to capture audio data const mediaRecorder = new MediaRecorder(mediaStream); // Event handler to process audio data packets mediaRecorder.ondataavailable = async (event) => { const blob = event.data; // this is the audio packet (Blob) const buffer = await blob.arrayBuffer(); // convert the Blob to a Buffer stream.sendBuffer(buffer); // send the buffer data to the VocalStack API }; // Start capturing audio, and send it to the stream every second mediaRecorder.start(1000);
Ņemiet vērā, ka, lai piekļūtu VocalStack API tīmekļa klientos, jums būs nepieciešams izmantot autentifikācijas žetonu:
Klienta puses autentifikācijas žetoni
Izveidot pagaidu autentifikācijas žetonu klienta puses pieprasījumiem. Droši ieviesiet API pieprasījumus tīmekļa pārlūkprogrammās, nepakļaujot savas API atslēgas.
VocalStack API var izmantot, lai pārrakstītu jebkuru HLS LiveStream URL, ieskaitot avotus, piemēram, Youtube Live, Facebook Live un Twitch. Lūdzu, ņemiet vērā, ka straumes URL ir jābūt. . m3u8 faila paplašinājums, kas attēlo derīgu HLS (HTTP tiešraides) atskaņošanas saraksta failu.
JavaScript
import { LiveTranscription } from '@vocalstack/js-sdk'; const sdk = new LiveTranscription({ apiKey: 'YOUR-API-KEY' }); const stream = await sdk.connect({ // must be a valid HLS streaming protocol livestream_url: 'http://a.files.bbci.co.uk/media/live/manifesto/audio/simulcast/hls/nonuk/sbr_low/ak/bbc_world_service.m3u8', // The rest of these options are the same as for microphone live transcriptons }); stream.start(); stream.onData((response) => { // The response object is the same as the one // returned by microphone transcriptions });
Integrējot tiešraides transkripcijas ar Polyglot ir tikpat vienkārši, kā pievienojot. poliglots_ id opcija transkripcijas pieprasījumam, kā parādīts iepriekš minētajos piemēros.
Polyglot izveido publisku saiti, kas saistīta ar jūsu transkripcijām (saite var būt aizsargāta ar paroli):
  • Lietotāji var lasīt jūsu transkripciju reālajā laikā, izmantojot saiti.
  • Lietotāji var izvēlēties valodu, kurā lasīt transkripciju reālajā laikā.
  • Lietotāji var lasīt jūsu transkripciju vēlāk, un visas pārējās transkripcijas integrētas ar jūsu konkrēto Polyglot sesiju.
Jūs esat laipni aicināti izmantot VocalStack API un īstenot savu balto marķējumu UI, nevis izmantojot vienu, ko nodrošina VocalStack. Mēs labprāt dzirdētu par to, ja jūs darāt, lai mēs varētu uzzināt, kā padarīt mūsu produktu labāku!
Uzziniet vairāk par to, kā Polyglot strādā. Apmeklējiet vocalstack.com/polyglot.
Pārrakstīt un prezentēt Polyglot sesiju
Izveidojiet sesiju, kuru var izmantot, lai pārraidītu tiešraides transkripciju, izmantojot publiski kopīgojamu saiti. Lietotāji var lasīt tiešraides transkripcijas savā izvēlētajā valodā un pat iepriekšējās transkripcijas, kad jūsu sesija ir neaktīva.
Iegūt transkripcijas datus
Iegūt datus no gaidošām vai pabeigtām transkripcijām. Tas ietver transkripcijas laika grafiku, atslēgvārdus, kopsavilkumu un rindkopu segmentus.
Klienta puses autentifikācijas žetoni
Izveidot pagaidu autentifikācijas žetonu klienta puses pieprasījumiem. Droši ieviesiet API pieprasījumus tīmekļa pārlūkprogrammās, nepakļaujot savas API atslēgas.
Scroll Up