VocalStack Logo

Documentation

Транскрипция деректерді алу

Тексерудегі немесе аяқталған транскрипциялардан деректерді алу

Транскрипция сеанстары

Транскрипция күйін сеанс арқылы бақылау және басқару

Аударма

Транскрипцияланған мәтіннің басқа тілге аударылуы

Аудио URL- інен аудару

URL-де алдын ала жазылған дыбыстарды жай мәтінге аудару

Клиент тарапының аутентификация токендері

Клиент тарапынан сұраныс үшін уақытша аутентификация токені жасау

Транскрипция сұрауы мен жауап

Барлық аудару әрекеттер үшін ортақ сұраныс параметрлері мен жауаптары

Полиглот сеансын транскрипциялап және таныстыруName

Ашық ортақ сілтеме арқылы тікелей транскрипцияны таратуға арналған сеанс құру

Микрофон немесе LiveStream- дан транскрипциялауName

Құжаттаманы қарау
Тікелей микрофоннан немесе тікелей эфирден сөйлеу транскрипциясын жасау. Polyglot-пен біріктіріп, кез келген тілде оқылатын транскрипция үшін ашық, бөлісуге болатын сілтеме жасау.
Микрофоннан транскрипция жасау үшін біз үнемі VocalStack API- ға аудио деректер пакеттерін жіберуіміз керек.
JavaScript
import { LiveTranscription } from '@vocalstack/js-sdk'; const sdk = new LiveTranscription({ apiKey: 'YOUR-API-KEY' }); const stream = await sdk.connect({ // Optional: Integrate this stream with a Polyglot session polyglot_id: 'YOUR-POLYGLOT-SESSION-ID', // Optional: language of the speech spoken // (this can be used to improve the transcription accuracy) language: 'en', // Optional: Translate the transcription to these languages translations: ['de'], // Optional: Stop the stream after this many seconds of inactivity timeout_period_s: 60, // Optional: Hard stop the stream after this many seconds max_duration_s: 300, }); // Start the stream stream.start(); // Get audio data from a microphone and send it to the stream // stream.sendBuffer(buffer); // *** This is a placeholder for the actual implementation *** // Manually stop the stream (in this example, after 60 seconds) // If max_duration_s is set, stopping the stream is optional setTimeout(() => stream.stop(), 60000); // Listen for stream transcription data stream.onData((response) => { const { status, data } = response; console.log(status); // 'waiting', 'processing', 'done', 'stopping' or 'error' if (data) { console.log(data.timeline); // an object with the transcription timeline } if (status === 'done') { console.log(data.summary); // a summary of the transcription console.log(data.keywords); // an array of keywords console.log(data.paragraphs); // the entire transcription in paragraph form } });
Аудио ағым деректерді алу тәсілі транскрипцияны орындайтын ортаға байланысты өзгереді. Мұны қалай істеуге болатынын бірнеше мысалдар келтіріледі:
NextJS- те құрылғыдан аудио деректерді алу үшін пакет орнатып, содан кейін оларды VocalStack API- ге жіберу керек. Мысалы:
JavaScript
const mic = require('mic'); // Create a new instance of the microphone utility const micInstance = mic(); // Get the audio input stream const micStream = micInstance.getAudioStream(); // Capture the audio data from the microphone micStream.on('data', (data) => { stream.sendBuffer(data); // send the buffer data to the VocalStack API }); // Start capturing audio from the microphone micInstance.start();
Веб шолғышта келесіні қолдануға болады: Медиа жазушысыName API, келесі мысалда көрсетілгендей. (Мысалы, recordrtc which improves browser compatibility)
JavaScript
// Request access to the microphone const mediaStream = await navigator.mediaDevices.getUserMedia({ audio: true }); // Create a MediaRecorder instance to capture audio data const mediaRecorder = new MediaRecorder(mediaStream); // Event handler to process audio data packets mediaRecorder.ondataavailable = async (event) => { const blob = event.data; // this is the audio packet (Blob) const buffer = await blob.arrayBuffer(); // convert the Blob to a Buffer stream.sendBuffer(buffer); // send the buffer data to the VocalStack API }; // Start capturing audio, and send it to the stream every second mediaRecorder.start(1000);
Веб- клиенттерде VocalStack API- ге қатынау үшін аутентификациялау токенін қолдану керектігін ескеріңіз:
Клиент тарапының аутентификация токендері
Клиент тарапынан сұраныс үшін уақытша аутентификация токені жасау. API сұраныстарын веб шолғыштарда API кілттеріңізді жарияламастан қауіпсіз орындау.
VocalStack API кез келген HLS LiveStream URL-ін, соның ішінде Youtube Live, Facebook Live және Twitch сияқты көздерді транскрипциялауға қолданылады. Ақпардың URL- і. . m3u8 дұрыс HLS (HTTP Live Streaming) ойнату тізім файлын білдіретін файл жұрнағы.
JavaScript
import { LiveTranscription } from '@vocalstack/js-sdk'; const sdk = new LiveTranscription({ apiKey: 'YOUR-API-KEY' }); const stream = await sdk.connect({ // must be a valid HLS streaming protocol livestream_url: 'http://a.files.bbci.co.uk/media/live/manifesto/audio/simulcast/hls/nonuk/sbr_low/ak/bbc_world_service.m3u8', // The rest of these options are the same as for microphone live transcriptons }); stream.start(); stream.onData((response) => { // The response object is the same as the one // returned by microphone transcriptions });
Полиглотпен тірі транскрипцияны біріктіру. полиглот_т жоғарыда келтірілген мысалдарда көрсетілгендей, транскрипция сұрауын таңдау мүмкіндігі.
Polyglot сіздің транскрипцияларыңызбен байланысты ашық ортақ сілтемені құрады (парольмен қорғалған сілтеме болуы мүмкін):
  • Пайдаланушылар сіздің транскрипцияңызды сілтеме арқылы тікелей оқи алады.
  • Пайдаланушылар транскрипцияны қалай оқу керектігін таңдай алады.
  • Пайдаланушылар сіздің транскрипцияңызды кейін оқып шыға алады, сонымен қатар басқа да барлық транскрипциялар да сіздің Polyglot сеансымен біріктірілген.
VocalStack API-ін пайдаланып, VocalStack ұсынған интерфейстің орнына өзіңіздің ақ логотипті интерфейсіңізді енгізуге шақырамыз. Біз оны естігенімізді қалаймыз, сондықтан біз өнімімізді қалай жақсартуға болатынын үйрене аламыз!
Polyglot қалай жұмыс істейтінін біліңіз Ұлттық.
Полиглот сеансын транскрипциялап және таныстыруName
Ашық ортақ сілтеме арқылы тікелей транскрипцияны таратуға арналған сеанс құру. Пайдаланушылар өз тілдерінде тірі транскрипцияларды, тіпті сеансы белсенді емес кездегі бұрынғы транскрипцияларды да оқи алады.
Транскрипция деректерді алу
Тексерудегі немесе аяқталған транскрипциялардан деректерді алу. Бұл ретте транскрипция уақыты, кілтт сөздер, тұжырымдар және абзац сегменттері де қамтылады.
Клиент тарапының аутентификация токендері
Клиент тарапынан сұраныс үшін уақытша аутентификация токені жасау. API сұраныстарын веб шолғыштарда API кілттеріңізді жарияламастан қауіпсіз орындау.
Scroll Up