VocalStack Logo

Documentation

حصل على بيانات النسخ

الحصول على بيانات من النصوص المستنسخة قيد النظر أو المكتملة

جلسات النصوص المستنسخة

رصد وإدارة حالة النسخ مع الجلسات

ترجمة نص

ترجمة النص المستنسخ إلى لغة أخرى

نسخ الصوت من URL

نسخ الكلام من الصوت المسجل مسبقاً في عنوان URL إلى نص عادي

رموز التحقق من الهوية على جانب العميل

إنشاء رمز مؤقت للتحقق من الطلبات من جانب العميل

طلب النصوص والرد

خيارات الطلب المشتركة والاستجابات لجميع عمليات النسخ

نسخ وعرض جلسة متعددة اللغات

إنشاء جلسة يمكن استخدامها لبث نسخة حية من خلال وصلة عامة قابلة للتقاسم

نسخ من ميكروفون أو LiveStream

تصفح الوثائق
نسخ خطاب حي من ميكروفون أو تدفق حي. إدماجها مع Polyglot لإنشاء وصلة عامة قابلة للتقاسم للنسخة التي يمكن للمستخدمين قراءتها بأي لغة.
لنقل النص من الميكروفون علينا أن نرسل باستمرار حزم تدفق البيانات الصوتية إلى واجهة البرنامج التطبيقي VocalStack.
JavaScript
import { LiveTranscription } from '@vocalstack/js-sdk'; const sdk = new LiveTranscription({ apiKey: 'YOUR-API-KEY' }); const stream = await sdk.connect({ // Optional: Integrate this stream with a Polyglot session polyglot_id: 'YOUR-POLYGLOT-SESSION-ID', // Optional: language of the speech spoken // (this can be used to improve the transcription accuracy) language: 'en', // Optional: Translate the transcription to these languages translations: ['de'], // Optional: Stop the stream after this many seconds of inactivity timeout_period_s: 60, // Optional: Hard stop the stream after this many seconds max_duration_s: 300, }); // Start the stream stream.start(); // Get audio data from a microphone and send it to the stream // stream.sendBuffer(buffer); // *** This is a placeholder for the actual implementation *** // Manually stop the stream (in this example, after 60 seconds) // If max_duration_s is set, stopping the stream is optional setTimeout(() => stream.stop(), 60000); // Listen for stream transcription data stream.onData((response) => { const { status, data } = response; console.log(status); // 'waiting', 'processing', 'done', 'stopping' or 'error' if (data) { console.log(data.timeline); // an object with the transcription timeline } if (status === 'done') { console.log(data.summary); // a summary of the transcription console.log(data.keywords); // an array of keywords console.log(data.paragraphs); // the entire transcription in paragraph form } });
الحصول على بيانات تدفق الصوت سوف تختلف بناء على البيئة التي تريد تنفيذ عملية النسخ. وفيما يلي بضعة أمثلة على كيفية القيام بذلك:
في NextJS يجب عليك تثبيت حزمة يمكنها استعادة البيانات الصوتية من جهازك، والتي يمكنك بعد ذلك إرسالها إلى واجهة البرنامج المساعد VocalStack. وفيما يلي مثال على ذلك:
JavaScript
const mic = require('mic'); // Create a new instance of the microphone utility const micInstance = mic(); // Get the audio input stream const micStream = micInstance.getAudioStream(); // Capture the audio data from the microphone micStream.on('data', (data) => { stream.sendBuffer(data); // send the buffer data to the VocalStack API }); // Start capturing audio from the microphone micInstance.start();
في متصفح الويب قد ترغب في استخدام. مسجل وسائط API كما يمكن رؤيته في المثال التالي. (قد تكون فكرة جيدة أيضاً استخدام حزمة مثل ) تسجيل )الذي يحسن توافق المتصفح(
JavaScript
// Request access to the microphone const mediaStream = await navigator.mediaDevices.getUserMedia({ audio: true }); // Create a MediaRecorder instance to capture audio data const mediaRecorder = new MediaRecorder(mediaStream); // Event handler to process audio data packets mediaRecorder.ondataavailable = async (event) => { const blob = event.data; // this is the audio packet (Blob) const buffer = await blob.arrayBuffer(); // convert the Blob to a Buffer stream.sendBuffer(buffer); // send the buffer data to the VocalStack API }; // Start capturing audio, and send it to the stream every second mediaRecorder.start(1000);
لاحظ أنه للوصول إلى واجهة البرنامج التطبيقي VocalStack على العملاء الشبكيين، ستحتاج إلى استخدام رمز للتوثيق:
رموز التحقق من الهوية على جانب العميل
إنشاء رمز مؤقت للتحقق من الطلبات من جانب العميل. تنفيذ طلبات API بشكل آمن في متصفحات الويب دون الكشف عن مفاتيح API الخاصة بك.
يمكن استخدام واجهة البرنامج التطبيقي VocalStack لنقل أي عنوان URL HLS LiveStream، بما في ذلك المصادر مثل يوتيوب مباشرة، فيسبوك مباشرة، وتويتش. يرجى ملاحظة أن عنوان المسار يجب أن يكون. .m3u8 ملف امتداد ملف يمثل ملف قائمة تشغيل HLS (HTTP Live Streaming) الصحيح.
JavaScript
import { LiveTranscription } from '@vocalstack/js-sdk'; const sdk = new LiveTranscription({ apiKey: 'YOUR-API-KEY' }); const stream = await sdk.connect({ // must be a valid HLS streaming protocol livestream_url: 'http://a.files.bbci.co.uk/media/live/manifesto/audio/simulcast/hls/nonuk/sbr_low/ak/bbc_world_service.m3u8', // The rest of these options are the same as for microphone live transcriptons }); stream.start(); stream.onData((response) => { // The response object is the same as the one // returned by microphone transcriptions });
إدماج النصوص الحية مع بوليغلوت هو بسيط مثل إضافة صوت لغة متعددة خيار لطلب النصوص، كما هو مبين في الأمثلة أعلاه.
يقوم Polyglot بإنشاء رابط عام قابل للتقاسم مرتبط بنسخك (يمكن حماية الرابط بكلمة سر):
  • يمكن للمستخدمين قراءة نسختك في الوقت الحقيقي باستخدام الرابط.
  • ويمكن للمستعملين اختيار اللغة التي يقرأون بها النص المستنسخ في الوقت الحقيقي.
  • يمكن للمستخدمين قراءة نسختك في وقت لاحق، وجميع النسخ الأخرى مدمجة مع جلسة متعدد اللغات الخاصة بك.
يمكنك استخدام واجهة البرنامج التطبيقي لـ VocalStack وتنفيذ واجهة المستخدم الخاصة بك ذات العلامة البيضاء بدلاً من استخدام تلك التي توفرها VocalStack. نحن نحب أن نسمع عن ذلك إذا فعلت،, لكي نتعلم كيف نجعل منتجنا أفضل!
اعرف المزيد عن كيفية عمل Polyglot في. موقع vocalstack.com/polyglot.
نسخ وعرض جلسة متعددة اللغات
إنشاء جلسة يمكن استخدامها لبث نسخة حية من خلال وصلة عامة قابلة للتقاسم. ويمكن للمستخدمين قراءة النصوص الحية باللغة التي يفضلونها، بل وحتى النصوص السابقة عندما تكون جلستك غير نشطة.
حصل على بيانات النسخ
الحصول على بيانات من النصوص المستنسخة قيد النظر أو المكتملة. ويشمل ذلك الجدول الزمني للنسخ، والكلمات الرئيسية، والموجز، وأجزاء الفقرات.
رموز التحقق من الهوية على جانب العميل
إنشاء رمز مؤقت للتحقق من الطلبات من جانب العميل. تنفيذ طلبات API بشكل آمن في متصفحات الويب دون الكشف عن مفاتيح API الخاصة بك.
Scroll Up