VocalStack Logo

Documentation

ट्रांसक्रिप्शन डाटा प्राप्त करें

प्रतीक्षारत या पूर्ण अनुक्रमणों से डाटा प्राप्त करें

ट्रांसक्रिप्शन सत्र

सत्रों के साथ अनुक्रमण स्थिति की निगरानी और प्रबंधन करें

अनुवाद

अन्य भाषा में अनुवादित पाठ

यूआरएल से ऑडियो ट्रांसक्राइब करें

एक यूआरएल में पूर्व-रिकॉर्ड ऑडियो से सादा पाठ में भाषण को ट्रांसक्रिप्ट करें

क्लाएंट साइड सत्यापन टोकन

क्लाइंट पक्ष निवेदनों के लिए अस्थायी प्रमाणीकरण टोकन बनाएँ

ट्रांसक्रिप्शन निवेदन तथा जवाब

सभी ट्रांसक्रिप्शन ऑपरेशन के लिए सामान्य निवेदन विकल्प तथा जवाब

पॉलीग्लोट सत्र को ट्रांसक्राइब व प्रस्तुत करें

एक सत्र बनाएँ जिसका उपयोग सार्वजनिक साझा लिंक के माध्यम से लाइव अनुक्रमण प्रसारित करने के लिए किया जा सकता है। उपयोगकर्ता अपने पसंदीदा भाषा में लाइव अनुक्रमण पढ़ सकते हैं, और यहां तक ​​कि पिछले अनुक्रमण भी पढ़ सकते हैं जब आपका सत्र निष्क्रिय है।

माइक्रोफोन या लाइवस्ट्रीम से ट्रांसक्रिप्शन करें

दस्तावेज़ ब्राउज़ करें
माइक्रोफोन या लाइव स्ट्रीम से लाइव भाषण का अनुकरण करें। पॉलीग्लोट के साथ एकीकृत करें ताकि ट्रांसक्रिप्शन के लिए एक सार्वजनिक साझा लिंक बनाया जा सके जिसे उपयोगकर्ता किसी भी भाषा में पढ़ सकते हैं।
एक माइक्रोफोन से ट्रांसक्रिप्शन करने के लिए हमें लगातार ऑडियो डेटा स्ट्रीम पैकेट्स को VocalStack API को भेजना चाहिए।.
JavaScript
import { LiveTranscription } from '@vocalstack/js-sdk'; const sdk = new LiveTranscription({ apiKey: 'YOUR-API-KEY' }); const stream = await sdk.connect({ // Optional: Integrate this stream with a Polyglot session polyglot_id: 'YOUR-POLYGLOT-SESSION-ID', // Optional: language of the speech spoken // (this can be used to improve the transcription accuracy) language: 'en', // Optional: Translate the transcription to these languages translations: ['de'], // Optional: Stop the stream after this many seconds of inactivity timeout_period_s: 60, // Optional: Hard stop the stream after this many seconds max_duration_s: 300, }); // Start the stream stream.start(); // Get audio data from a microphone and send it to the stream // stream.sendBuffer(buffer); // *** This is a placeholder for the actual implementation *** // Manually stop the stream (in this example, after 60 seconds) // If max_duration_s is set, stopping the stream is optional setTimeout(() => stream.stop(), 60000); // Listen for stream transcription data stream.onData((response) => { const { status, data } = response; console.log(status); // 'waiting', 'processing', 'done', 'stopping' or 'error' if (data) { console.log(data.timeline); // an object with the transcription timeline } if (status === 'done') { console.log(data.summary); // a summary of the transcription console.log(data.keywords); // an array of keywords console.log(data.paragraphs); // the entire transcription in paragraph form } });
ऑडियो स्ट्रीम डेटा प्राप्त करना पर्यावरण के आधार पर अलग होगा जहां आप ट्रांसक्रिप्शन ऑपरेशन को चलाना चाहते हैं। यहाँ आप यह कैसे कर सकते हैं इसके लिए कुछ उदाहरण हैं:
NextJS में आपको एक पैकेज स्थापित करना चाहिए जो आपके उपकरण से ऑडियो डेटा प्राप्त कर सकता है, जिसे आप फिर VocalStack API को आगे बढ़ा सकते हैं। यहाँ एक उदाहरण है:
JavaScript
const mic = require('mic'); // Create a new instance of the microphone utility const micInstance = mic(); // Get the audio input stream const micStream = micInstance.getAudioStream(); // Capture the audio data from the microphone micStream.on('data', (data) => { stream.sendBuffer(data); // send the buffer data to the VocalStack API }); // Start capturing audio from the microphone micInstance.start();
वेब ब्राउज़र पर आप उपयोग करना चाहेंगे मीडियारेकॉर्डर API जैसे कि निम्न उदाहरण में देखा जा सकता है. (यह भी एक अच्छा विचार हो सकता है जैसे कि एक पैकेज का उपयोग करें रिकॉर्डआरटीसी जो ब्राउज़र संगतता में सुधार करता है)
JavaScript
// Request access to the microphone const mediaStream = await navigator.mediaDevices.getUserMedia({ audio: true }); // Create a MediaRecorder instance to capture audio data const mediaRecorder = new MediaRecorder(mediaStream); // Event handler to process audio data packets mediaRecorder.ondataavailable = async (event) => { const blob = event.data; // this is the audio packet (Blob) const buffer = await blob.arrayBuffer(); // convert the Blob to a Buffer stream.sendBuffer(buffer); // send the buffer data to the VocalStack API }; // Start capturing audio, and send it to the stream every second mediaRecorder.start(1000);
ध्यान दें कि वेब क्लाएंट पर VocalStack API पर पहुँच के लिए आपको एक प्रमाणीकरण टोकन का उपयोग करने की आवश्यकता होगी:
क्लाएंट साइड सत्यापन टोकन
क्लाइंट पक्ष निवेदनों के लिए अस्थायी प्रमाणीकरण टोकन बनाएँ. वेब ब्राउज़र में अपने एपीआई कुंजी को खुला छोड़े बिना सुरक्षित रूप से एपीआई अनुरोधों को लागू करें।.
वॉकलस्टैक एपीआई का उपयोग किसी भी एचएलएस लाइवस्ट्रीम यूआरएल को ट्रांसक्राइब करने के लिए किया जा सकता है, जिसमें यूट्यूब लाइव, फेसबुक लाइव और ट्विच जैसे स्रोत शामिल हैं। कृपया ध्यान दें कि स्ट्रीम यूआरएल को एक होना चाहिए .m3u8 फ़ाइल एक्सटेंशन जो एक वैध एचटीटीपी लाइव स्ट्रीमिंग (HLS) प्लेलिस्ट फ़ाइल का प्रतिनिधित्व करता है.
JavaScript
import { LiveTranscription } from '@vocalstack/js-sdk'; const sdk = new LiveTranscription({ apiKey: 'YOUR-API-KEY' }); const stream = await sdk.connect({ // must be a valid HLS streaming protocol livestream_url: 'http://a.files.bbci.co.uk/media/live/manifesto/audio/simulcast/hls/nonuk/sbr_low/ak/bbc_world_service.m3u8', // The rest of these options are the same as for microphone live transcriptons }); stream.start(); stream.onData((response) => { // The response object is the same as the one // returned by microphone transcriptions });
पॉलीग्लोट के साथ लाइव अनुक्रमणों को एकीकृत करना एक जोड़ने के रूप में सरल है पॉलीग्लोट (_i) अनुक्रमण अनुरोध के लिए विकल्प, जैसा कि ऊपर के उदाहरणों में दिखाया गया है।
पॉलीग्लोट आपके अनुक्रमणों से सम्बंधित एक सार्वजनिक साझा करने योग्य लिंक बनाता है (लिंक पासवर्ड संरक्षित हो सकता है):
  • उपयोगकर्ता इस लिंक का उपयोग करके वास्तविक समय में अपनी प्रतिलिपि पढ़ सकते हैं।.
  • उपयोगकर्ता वास्तविक समय में अनुवाद को पढ़ने के लिए भाषा चुन सकते हैं।.
  • इसका उपयोग किसी भी प्रकार के संदेश के लिए किया जा सकता है, और यह सभी प्रकार के संदेशों को एक साथ भेजने के लिए भी उपयोगी है।.
आप वॉकलस्टैक एपीआई का उपयोग करने के लिए आमंत्रित हैं और वॉकलस्टैक द्वारा प्रदान किए गए एक का उपयोग करने के बजाय अपने स्वयं के व्हाइट लेबल यूआई को लागू करें। हम आप करते हैं तो इसके बारे में सुनना पसंद करेंगे, इसलिए हम अपने उत्पाद को बेहतर बनाने के बारे में सीख सकते हैं!
Polyglot कैसे काम करता है के बारे में अधिक जानें vocalstack.com/polyglot.
पॉलीग्लोट सत्र को ट्रांसक्राइब व प्रस्तुत करें
एक सत्र बनाएँ जिसका उपयोग सार्वजनिक साझा लिंक के माध्यम से लाइव अनुक्रमण प्रसारित करने के लिए किया जा सकता है। उपयोगकर्ता अपने पसंदीदा भाषा में लाइव अनुक्रमण पढ़ सकते हैं, और यहां तक ​​कि पिछले अनुक्रमण भी पढ़ सकते हैं जब आपका सत्र निष्क्रिय है।.
ट्रांसक्रिप्शन डाटा प्राप्त करें
प्रतीक्षारत या पूर्ण अनुक्रमणों से डाटा प्राप्त करें. इसमें अनुवाद समयरेखा, मुख्य शब्द, सारांश और अनुच्छेद खंड शामिल हैं।.
क्लाएंट साइड सत्यापन टोकन
क्लाइंट पक्ष निवेदनों के लिए अस्थायी प्रमाणीकरण टोकन बनाएँ. वेब ब्राउज़र में अपने एपीआई कुंजी को खुला छोड़े बिना सुरक्षित रूप से एपीआई अनुरोधों को लागू करें।.
Scroll Up