VocalStack Logo

Documentation

Преузми податке о транскрипцији

Добијени подаци из чекања или завршених транскрипција

Транскрипција

Наблюдавати и управљати стањем транскрипције са сесијама

Преводи транскрипцију

Преводио је са латинског на друге језике

Преписивање аудио- фајла са URL- а

Преписивање говора из претходно снимљеног аудио у URL у обични текст

Токени за аутентикацију са стране клијента

Креирај привремени токен аутентикације за захтеве са стране клијента

Захтев за транскрипцију и одговор

Уобичајене опције захтева и одговора за све операције транскрипције

Преписивање и приказивање полиглотске сесије

Створити сеансу која се може користити за емитовање транскрипције уживо преко јавног дељивог линка

Преписивање са микрофона или LiveStream- а

Прегледај документацију
Преписивање говора уживо са микрофона или стрима. Интегрисање са Полиглотом да би се створио јавни линк за транскрипцију који корисници могу да читају на било ком језику.
Да би се транскрибовао са микрофона морамо континуирано да шаљемо аудио пакете података у VocalStack API.
JavaScript
import { LiveTranscription } from '@vocalstack/js-sdk'; const sdk = new LiveTranscription({ apiKey: 'YOUR-API-KEY' }); const stream = await sdk.connect({ // Optional: Integrate this stream with a Polyglot session polyglot_id: 'YOUR-POLYGLOT-SESSION-ID', // Optional: language of the speech spoken // (this can be used to improve the transcription accuracy) language: 'en', // Optional: Translate the transcription to these languages translations: ['de'], // Optional: Stop the stream after this many seconds of inactivity timeout_period_s: 60, // Optional: Hard stop the stream after this many seconds max_duration_s: 300, }); // Start the stream stream.start(); // Get audio data from a microphone and send it to the stream // stream.sendBuffer(buffer); // *** This is a placeholder for the actual implementation *** // Manually stop the stream (in this example, after 60 seconds) // If max_duration_s is set, stopping the stream is optional setTimeout(() => stream.stop(), 60000); // Listen for stream transcription data stream.onData((response) => { const { status, data } = response; console.log(status); // 'waiting', 'processing', 'done', 'stopping' or 'error' if (data) { console.log(data.timeline); // an object with the transcription timeline } if (status === 'done') { console.log(data.summary); // a summary of the transcription console.log(data.keywords); // an array of keywords console.log(data.paragraphs); // the entire transcription in paragraph form } });
Добијање аудио података се разликује на основу окружења у којем желите да извршите операцију транскрипције. Ево неколико примера како можете да то урадите:
У NextJS-у треба да инсталирате пакет који може да добије аудио податке са вашег уређаја, који се онда могу пренети на VocalStack API. Ево примера:
JavaScript
const mic = require('mic'); // Create a new instance of the microphone utility const micInstance = mic(); // Get the audio input stream const micStream = micInstance.getAudioStream(); // Capture the audio data from the microphone micStream.on('data', (data) => { stream.sendBuffer(data); // send the buffer data to the VocalStack API }); // Start capturing audio from the microphone micInstance.start();
На веб-претраживачу можете да користите Медиа рекордер API као што се може видети у следећем примеру. (Може бити добра идеја да се користи пакет као што је ) рекордртц који побољшава компатибилност прегледача)
JavaScript
// Request access to the microphone const mediaStream = await navigator.mediaDevices.getUserMedia({ audio: true }); // Create a MediaRecorder instance to capture audio data const mediaRecorder = new MediaRecorder(mediaStream); // Event handler to process audio data packets mediaRecorder.ondataavailable = async (event) => { const blob = event.data; // this is the audio packet (Blob) const buffer = await blob.arrayBuffer(); // convert the Blob to a Buffer stream.sendBuffer(buffer); // send the buffer data to the VocalStack API }; // Start capturing audio, and send it to the stream every second mediaRecorder.start(1000);
Забележите да ће за приступ VocalStack API на веб клијентима требати да користите аутентикациони токен:
Токени за аутентикацију са стране клијента
Креирај привремени токен аутентикације за захтеве са стране клијента. Безбедно имплементирајте АПИ захтеве у веб прегледачима без изложивања АПИ кључева.
VocalStack API може бити коришћен за транскрипцију било ког HLS LiveStream URL-а, укључујући изворе као што су Youtube Live, Facebook Live, и Twitch. Молимо да имате на уму да URL тока мора бити. .м3у8 екстензија датотека која представља валидан HLS (HTTP Live Streaming) плејлист.
JavaScript
import { LiveTranscription } from '@vocalstack/js-sdk'; const sdk = new LiveTranscription({ apiKey: 'YOUR-API-KEY' }); const stream = await sdk.connect({ // must be a valid HLS streaming protocol livestream_url: 'http://a.files.bbci.co.uk/media/live/manifesto/audio/simulcast/hls/nonuk/sbr_low/ak/bbc_world_service.m3u8', // The rest of these options are the same as for microphone live transcriptons }); stream.start(); stream.onData((response) => { // The response object is the same as the one // returned by microphone transcriptions });
Интегрисање транскрипција уживо са Полиглотом је једноставно као додавање. полиглот_ид опција за захтев за транскрипцију, као што је показано у горњим примерима.
Полиглот креира јавну линк за дељење повезан са вашим транскрипцијама (линк може бити заштићен лозинком):
  • Корисници могу да читају своју транскрипцију у реалном времену користећи линк.
  • Корисници могу да бирају језик на којем ће читати транскрипцију у реалном времену.
  • Корисници могу да читају Вашу транскрипцију касније, а све остале транскрипције су интегрисане са Вашом конкретном Полиглот сесијом.
Добродошли сте да користите VocalStack API и имплементирате свој сопствени бело означени кориснички интерфејс уместо да користите оно што је обезбедио VocalStack. Волели бисмо да чујем о томе ако то радиш, тако да можемо да научимо о томе како да учинимо наш производ бољим!
Сазнајте више о томе како Полиглот ради на. Портал Биографија vocalstack.com/polyglot.
Преписивање и приказивање полиглотске сесије
Створити сеансу која се може користити за емитовање транскрипције уживо преко јавног дељивог линка. Корисници могу да читају транскрипције у живо на њиховом преферираном језику, па чак и прошле транскрипције када је сесија неактивна.
Преузми податке о транскрипцији
Добијени подаци из чекања или завршених транскрипција. Ово укључује временску линију транскрипције, кључне речи, сажетак и сегменте параграфа.
Токени за аутентикацију са стране клијента
Креирај привремени токен аутентикације за захтеве са стране клијента. Безбедно имплементирајте АПИ захтеве у веб прегледачима без изложивања АПИ кључева.
Scroll Up