VocalStack Logo

Documentation

گرفتن داده‌های رونوشت

داده‌ها را از رونوشت‌های منتظر یا تکمیل شده بدست آورید

نشستهای رونوشت

نظارت و مدیریت وضعیت رونویسی با جلسات

ترجمه یک رونوشت

ترجمه متن رونوشت شده به زبان دیگر

رونوشت صدا از نشانی وب

رونوشت گفتار از صدای پیش‌ساخته شده در یک URL به متن ساده

نشانکهای احراز هویت سمت کارساز

ایجاد یک نشانه تأیید هویت موقت برای درخواست‌های سمت کارگزار

درخواست و پاسخ رونوشت

گزینه‌های درخواست و پاسخهای مشترک برای همۀ عملیات رونوشت

رونوشت و ارائه یک نشست چندزبانه

یک جلسه ایجاد کنید که می‌تواند برای پخش یک رونوشت زنده از طریق یک پیوند عمومی قابل اشتراک استفاده شود

رونوشت از یک میکروفون یا LiveStream

بررسى مستندات
رونوشت سخنرانی زنده از یک میکروفون یا جریان زنده. یکپارچه سازی با Polyglot برای ایجاد یک لینک عمومی قابل اشتراک برای رونویسی که کاربران می‌توانند در هر زبانی بخوانند.
برای رونویسی از یک میکروفون باید بسته‌های جریان داده صوتی را به صورت مداوم به VocalStack API ارسال کنیم.
JavaScript
import { LiveTranscription } from '@vocalstack/js-sdk'; const sdk = new LiveTranscription({ apiKey: 'YOUR-API-KEY' }); const stream = await sdk.connect({ // Optional: Integrate this stream with a Polyglot session polyglot_id: 'YOUR-POLYGLOT-SESSION-ID', // Optional: language of the speech spoken // (this can be used to improve the transcription accuracy) language: 'en', // Optional: Translate the transcription to these languages translations: ['de'], // Optional: Stop the stream after this many seconds of inactivity timeout_period_s: 60, // Optional: Hard stop the stream after this many seconds max_duration_s: 300, }); // Start the stream stream.start(); // Get audio data from a microphone and send it to the stream // stream.sendBuffer(buffer); // *** This is a placeholder for the actual implementation *** // Manually stop the stream (in this example, after 60 seconds) // If max_duration_s is set, stopping the stream is optional setTimeout(() => stream.stop(), 60000); // Listen for stream transcription data stream.onData((response) => { const { status, data } = response; console.log(status); // 'waiting', 'processing', 'done', 'stopping' or 'error' if (data) { console.log(data.timeline); // an object with the transcription timeline } if (status === 'done') { console.log(data.summary); // a summary of the transcription console.log(data.keywords); // an array of keywords console.log(data.paragraphs); // the entire transcription in paragraph form } });
در این روش، داده‌های خروجی از سیستم به وسیلهٔ یک پردازنده پردازش می‌شود که در آن، داده‌های خروجی به صورت رمزگذاری شده ذخیره می‌شوند. در اینجا چند مثال برای اینکه چگونه می‌توانید این کار را انجام دهید، آورده شده است:
در NextJS شما باید یک بسته نصب کنید که می‌تواند داده‌های صوتی را از دستگاه شما دریافت کند، که می‌توانید آن را به API VocalStack ارسال کنید. مثالی از این کار:
JavaScript
const mic = require('mic'); // Create a new instance of the microphone utility const micInstance = mic(); // Get the audio input stream const micStream = micInstance.getAudioStream(); // Capture the audio data from the microphone micStream.on('data', (data) => { stream.sendBuffer(data); // send the buffer data to the VocalStack API }); // Start capturing audio from the microphone micInstance.start();
در مرورگر وب ممکن است بخواهید از استفاده کنید ضبط‌کننده رسانهName API که می‌تواند در مثال زیر دیده شود. (این ممکن است ایده خوبی باشد که از بسته‌ای مانند استفاده کنید ) recordrtc که سازگاری مرورگر را بهبود می بخشد)
JavaScript
// Request access to the microphone const mediaStream = await navigator.mediaDevices.getUserMedia({ audio: true }); // Create a MediaRecorder instance to capture audio data const mediaRecorder = new MediaRecorder(mediaStream); // Event handler to process audio data packets mediaRecorder.ondataavailable = async (event) => { const blob = event.data; // this is the audio packet (Blob) const buffer = await blob.arrayBuffer(); // convert the Blob to a Buffer stream.sendBuffer(buffer); // send the buffer data to the VocalStack API }; // Start capturing audio, and send it to the stream every second mediaRecorder.start(1000);
توجه داشته باشید که برای دسترسی به API VocalStack در کارگزارهای وب ، نیاز به استفاده از یک نشانه تأیید هویت دارید:
نشانکهای احراز هویت سمت کارساز
ایجاد یک نشانه تأیید هویت موقت برای درخواست‌های سمت کارگزار. در این روش، درخواست‌های API را بدون افشای کلیدهای API خود، در مرورگرهای وب پیاده‌سازی کنید.
VocalStack API می‌تواند برای رونویسی هر HLS LiveStream URL، از جمله منابعی مانند یوتیوب زنده، فیسبوک زنده و توییت استفاده شود.. لطفاً توجه داشته باشید که نشانی وب جریان باید یک باشد .m3u8 extension که یک فایل پخش‌کننده HLS (HTTP Live Streaming) معتبر را نشان می‌دهد.
JavaScript
import { LiveTranscription } from '@vocalstack/js-sdk'; const sdk = new LiveTranscription({ apiKey: 'YOUR-API-KEY' }); const stream = await sdk.connect({ // must be a valid HLS streaming protocol livestream_url: 'http://a.files.bbci.co.uk/media/live/manifesto/audio/simulcast/hls/nonuk/sbr_low/ak/bbc_world_service.m3u8', // The rest of these options are the same as for microphone live transcriptons }); stream.start(); stream.onData((response) => { // The response object is the same as the one // returned by microphone transcriptions });
ادغام رونوشت زنده با Polyglot به سادگی اضافه کردن یک. چندزبانه گزینه برای درخواست رونویسی، همانطور که در مثال‌های بالا نشان داده شده‌است.
Polyglot یک پیوند عمومی قابل اشتراک مرتبط با رونوشتهای شما ایجاد می‌کند (پیوند می‌تواند با گذرواژه محافظت شود):
  • کاربران می‌توانند رونوشت خود را در زمان واقعی با استفاده از لینک بخوانند.
  • کاربران می‌توانند زبانی را که در آن رونوشت را می‌خوانند را در زمان واقعی انتخاب کنند.
  • کاربران می‌توانند رونوشت شما را در زمان بعد بخوانند و تمام رونوشت‌های دیگر با جلسه خاص پلی‌گلوت شما یکپارچه می‌شوند.
شما از API VocalStack استفاده کرده و رابط کاربری خود را به جای استفاده از آنچه توسط VocalStack ارائه شده است، پیاده‌سازی کنید. ما دوست داريم که در موردش بشنوي اگه تو اين کارو بکني, تا بتونيم درباره اينکه چطور محصولمون رو بهتر کنيم ياد بگيريم!
بیشتر بدانید که چگونه Polyglot کار می‌کند در. ..ویکی‌پدیای انگلیسی.
رونوشت و ارائه یک نشست چندزبانه
یک جلسه ایجاد کنید که می‌تواند برای پخش یک رونوشت زنده از طریق یک پیوند عمومی قابل اشتراک استفاده شود. کاربران می‌توانند رونوشت‌های زنده را در زبان مورد علاقه خود بخوانند، و حتی رونوشت‌های گذشته را هنگامی که جلسه شما غیرفعال است.
گرفتن داده‌های رونوشت
داده‌ها را از رونوشت‌های منتظر یا تکمیل شده بدست آورید. این شامل خط زمانی رونویسی، کلمات کلیدی، خلاصه و بخش‌های پاراگراف است.
نشانکهای احراز هویت سمت کارساز
ایجاد یک نشانه تأیید هویت موقت برای درخواست‌های سمت کارگزار. در این روش، درخواست‌های API را بدون افشای کلیدهای API خود، در مرورگرهای وب پیاده‌سازی کنید.
Scroll Up