VocalStack Logo

Documentation

Примени податоци за транскрипција

Добиј податоци од чекање или завршени транскрипции

Сесии за транскрипција

Набљудување и управување со транскрипција со сесии

Преведи транскрипција

Преведување на транскрибираниот текст на друг јазик

Пренесе аудио од URL

Преведување на говор од претходно снимен аудио во URL во обичен текст

Токени за клиентска автентикација

Креирај привремен токен за проверка на автентичноста за клиентски барања

Барање за транскрипција и одговор

Опции за заедничко барање и одговори за сите операции на транскрипција

Преведете и презентирајте сесија на ПолиглотName

Создадете сесија која може да се користи за емитување на транскрипција во живо преку јавна споделлива врска

Препраќање на микрофонот или LiveStreamName

Прегледај ја документацијата
Пренесете говор во живо од микрофон или пренос во живо. Интегрирајте се со Полиглот за да создадете јавна врска за транскрипцијата која корисниците можат да ја прочитаат на било кој јазик.
За да се транскрибира од микрофонот мора постојано да се испраќаат пакети со аудио податоци до VocalStack API.
JavaScript
import { LiveTranscription } from '@vocalstack/js-sdk'; const sdk = new LiveTranscription({ apiKey: 'YOUR-API-KEY' }); const stream = await sdk.connect({ // Optional: Integrate this stream with a Polyglot session polyglot_id: 'YOUR-POLYGLOT-SESSION-ID', // Optional: language of the speech spoken // (this can be used to improve the transcription accuracy) language: 'en', // Optional: Translate the transcription to these languages translations: ['de'], // Optional: Stop the stream after this many seconds of inactivity timeout_period_s: 60, // Optional: Hard stop the stream after this many seconds max_duration_s: 300, }); // Start the stream stream.start(); // Get audio data from a microphone and send it to the stream // stream.sendBuffer(buffer); // *** This is a placeholder for the actual implementation *** // Manually stop the stream (in this example, after 60 seconds) // If max_duration_s is set, stopping the stream is optional setTimeout(() => stream.stop(), 60000); // Listen for stream transcription data stream.onData((response) => { const { status, data } = response; console.log(status); // 'waiting', 'processing', 'done', 'stopping' or 'error' if (data) { console.log(data.timeline); // an object with the transcription timeline } if (status === 'done') { console.log(data.summary); // a summary of the transcription console.log(data.keywords); // an array of keywords console.log(data.paragraphs); // the entire transcription in paragraph form } });
Придобивките од дигиталните аудио записи се разликуваат во зависност од средината во која се извршува транскрипцијата. Еве неколку примери за тоа како би можеле да го направите ова:
Во NextJS треба да инсталирате пакет кој може да донесе аудио податоци од вашиот уред, кои потоа можете да ги препратите на VocalStack API. Еве еден пример:
JavaScript
const mic = require('mic'); // Create a new instance of the microphone utility const micInstance = mic(); // Get the audio input stream const micStream = micInstance.getAudioStream(); // Capture the audio data from the microphone micStream.on('data', (data) => { stream.sendBuffer(data); // send the buffer data to the VocalStack API }); // Start capturing audio from the microphone micInstance.start();
На веб-прелистувачот може да сакате да го користите Медиумски снимачName API како што може да се види во следниов пример. (Можеби е добра идеја да се користи пакет како recordrtc што ја подобрува компатибилноста на прелистувачот)
JavaScript
// Request access to the microphone const mediaStream = await navigator.mediaDevices.getUserMedia({ audio: true }); // Create a MediaRecorder instance to capture audio data const mediaRecorder = new MediaRecorder(mediaStream); // Event handler to process audio data packets mediaRecorder.ondataavailable = async (event) => { const blob = event.data; // this is the audio packet (Blob) const buffer = await blob.arrayBuffer(); // convert the Blob to a Buffer stream.sendBuffer(buffer); // send the buffer data to the VocalStack API }; // Start capturing audio, and send it to the stream every second mediaRecorder.start(1000);
Забележете дека за пристап до VocalStack API на веб- клиентите ќе ви треба да користите токен за автентикација:
Токени за клиентска автентикација
Креирај привремен токен за проверка на автентичноста за клиентски барања. Безбедно имплементирајте API барања во веб прелистувачите без да ги изложите вашите API клучеви.
VocalStack API може да се користи за транскрипција на било кој HLS LiveStream URL, вклучувајќи извори како што се YouTube Live, Facebook Live и Twitch. Имајте на ум дека URL-то на потокот мора да биде. .m3u8 extension датотека која претставува валидна HLS (HTTP Live Streaming) плејлиста.
JavaScript
import { LiveTranscription } from '@vocalstack/js-sdk'; const sdk = new LiveTranscription({ apiKey: 'YOUR-API-KEY' }); const stream = await sdk.connect({ // must be a valid HLS streaming protocol livestream_url: 'http://a.files.bbci.co.uk/media/live/manifesto/audio/simulcast/hls/nonuk/sbr_low/ak/bbc_world_service.m3u8', // The rest of these options are the same as for microphone live transcriptons }); stream.start(); stream.onData((response) => { // The response object is the same as the one // returned by microphone transcriptions });
Интегрирањето на транскрипции во живо со Полиглот е едноставно како додавање на. полиглот_ид опција за барањето за транскрипција, како што е прикажано во примерите погоре.
Полиглот создава јавна врска за споделување поврзана со вашите транскрипции (врската може да биде заштитена со лозинка):
  • Корисниците можат да ја читаат вашата транскрипција во реално време користејќи ја врската.
  • Корисниците можат да го изберат јазикот на кој ќе се чита транскрипцијата во реално време.
  • Корисниците можат да ја прочитаат вашата транскрипција подоцна, а сите други транскрипции се интегрирани со вашата посебна сесија на Полиглот.
Вие сте добредојдени да го користите VocalStack API и да го имплементирате вашиот сопствен бело означен кориснички интерфејс наместо да го користите оној што го обезбедува VocalStack. Би сакале да слушнеме за тоа ако го направиш тоа, за да можеме да научиме како да го направиме нашиот производ подобар!
Научете повеќе за тоа како работи Полиглот на vocalstack.com/polyglot.
Преведете и презентирајте сесија на ПолиглотName
Создадете сесија која може да се користи за емитување на транскрипција во живо преку јавна споделлива врска. Корисниците можат да читаат транскрипции во живо на нивниот префериран јазик, па дури и минати транскрипции кога вашата сесија е неактивна.
Примени податоци за транскрипција
Добиј податоци од чекање или завршени транскрипции. Ова вклучува временска линија на транскрипција, клучни зборови, резиме и сегменти од параграфи.
Токени за клиентска автентикација
Креирај привремен токен за проверка на автентичноста за клиентски барања. Безбедно имплементирајте API барања во веб прелистувачите без да ги изложите вашите API клучеви.
Scroll Up