VocalStack Logo

Documentation

Dapatkan Data Pentranskripsian

Dapatkan data dari transkripsi yang menunggu atau selesai

Sesi Transkripsi

Monitor dan urus keadaan transkripsi dengan sesi

Terjemahkan Transkripsi

Terjemah teks yang ditranskripsikan ke bahasa lain

Tulis semula Audio dari URL

Transkrip ucapan dari audio pra-rekod dalam URL ke teks biasa

Token Pengesahihan Sisi Klien

Cipta token pengesahan sementara untuk permintaan sisi klien

Permintaan dan Balasan Penukaran

Pilihan permintaan dan respon umum untuk semua operasi transkripsi

Tulis dan Kemukakan Sesi Polyglot

Cipta sesi yang boleh digunakan untuk menyiarkan transkripsi langsung melalui pautan boleh kongsi awam

Transkripsi dari Mikrofon atau LiveStream

Layari Dokumentasi
Tulis semula ucapan langsung dari mikrofon atau aliran langsung. Integriti dengan Polyglot untuk mencipta pautan boleh dikongsi awam untuk transkripsi yang pengguna boleh baca dalam mana-mana bahasa.
Untuk mentranskripsikan dari mikrofon kita mesti terus menghantar pakej aliran data audio ke API VocalStack.
JavaScript
import { LiveTranscription } from '@vocalstack/js-sdk'; const sdk = new LiveTranscription({ apiKey: 'YOUR-API-KEY' }); const stream = await sdk.connect({ // Optional: Integrate this stream with a Polyglot session polyglot_id: 'YOUR-POLYGLOT-SESSION-ID', // Optional: language of the speech spoken // (this can be used to improve the transcription accuracy) language: 'en', // Optional: Translate the transcription to these languages translations: ['de'], // Optional: Stop the stream after this many seconds of inactivity timeout_period_s: 60, // Optional: Hard stop the stream after this many seconds max_duration_s: 300, }); // Start the stream stream.start(); // Get audio data from a microphone and send it to the stream // stream.sendBuffer(buffer); // *** This is a placeholder for the actual implementation *** // Manually stop the stream (in this example, after 60 seconds) // If max_duration_s is set, stopping the stream is optional setTimeout(() => stream.stop(), 60000); // Listen for stream transcription data stream.onData((response) => { const { status, data } = response; console.log(status); // 'waiting', 'processing', 'done', 'stopping' or 'error' if (data) { console.log(data.timeline); // an object with the transcription timeline } if (status === 'done') { console.log(data.summary); // a summary of the transcription console.log(data.keywords); // an array of keywords console.log(data.paragraphs); // the entire transcription in paragraph form } });
Mendapatkan data strim audio akan berbeza berdasarkan persekitaran di mana anda ingin melaksanakan operasi transkripsi. Ini adalah beberapa contoh bagaimana anda boleh melakukannya:
Dalam NextJS anda patut memasang pakej yang boleh ambil data audio dari peranti anda, yang kemudian anda boleh hantar ke API VocalStack. Ini contohnya:
JavaScript
const mic = require('mic'); // Create a new instance of the microphone utility const micInstance = mic(); // Get the audio input stream const micStream = micInstance.getAudioStream(); // Capture the audio data from the microphone micStream.on('data', (data) => { stream.sendBuffer(data); // send the buffer data to the VocalStack API }); // Start capturing audio from the microphone micInstance.start();
Pada pelayar web anda mungkin ingin menggunakan MediaRecorder API seperti yang boleh dilihat dalam contoh berikut. (Ia juga mungkin idea yang baik untuk menggunakan pakej seperti recordrtc yang meningkatkan keserasian pelayar)
JavaScript
// Request access to the microphone const mediaStream = await navigator.mediaDevices.getUserMedia({ audio: true }); // Create a MediaRecorder instance to capture audio data const mediaRecorder = new MediaRecorder(mediaStream); // Event handler to process audio data packets mediaRecorder.ondataavailable = async (event) => { const blob = event.data; // this is the audio packet (Blob) const buffer = await blob.arrayBuffer(); // convert the Blob to a Buffer stream.sendBuffer(buffer); // send the buffer data to the VocalStack API }; // Start capturing audio, and send it to the stream every second mediaRecorder.start(1000);
Ambil perhatian bahawa untuk akses ke API VocalStack pada klien web anda perlu menggunakan token pengesahan:
Token Pengesahihan Sisi Klien
Cipta token pengesahan sementara untuk permintaan sisi klien. Implementasikan permintaan API dengan selamat dalam pelayar web tanpa mendedahkan kekunci API anda.
API VocalStack boleh digunakan untuk mentranskripsikan URL HLS LiveStream, termasuk sumber seperti Youtube Live, Facebook Live, dan Twitch. Sila ambil perhatian bahawa URL strim mesti .m3u8 Sambungan fail yang mewakili fail senarai main HLS (Streaming Segera HTTP) yang sah.
JavaScript
import { LiveTranscription } from '@vocalstack/js-sdk'; const sdk = new LiveTranscription({ apiKey: 'YOUR-API-KEY' }); const stream = await sdk.connect({ // must be a valid HLS streaming protocol livestream_url: 'http://a.files.bbci.co.uk/media/live/manifesto/audio/simulcast/hls/nonuk/sbr_low/ak/bbc_world_service.m3u8', // The rest of these options are the same as for microphone live transcriptons }); stream.start(); stream.onData((response) => { // The response object is the same as the one // returned by microphone transcriptions });
Mengintegrasikan transkripsi hidup dengan Polyglot adalah mudah seperti menambahkan poliglot_id pilihan untuk permintaan transkripsi, seperti ditunjukkan dalam contoh di atas.
Polyglot mencipta pautan boleh kongsi awam yang berkaitan dengan transkripsi anda (pautan boleh dilindungi kata laluan):
  • Pengguna boleh membaca transkripsi anda dalam masa nyata menggunakan pautan.
  • Pengguna boleh memilih bahasa yang mana untuk membaca transkripsi dalam masa nyata.
  • Pengguna boleh membaca transkripsi anda pada masa akan datang, dan semua transkripsi lain diintegrasikan dengan sesi Polyglot anda.
Anda dialu-alukan untuk menggunakan API VocalStack dan melaksanakan UI berlabel putih anda sendiri, bukannya menggunakan yang disediakan oleh VocalStack. Kami ingin mendengar tentangnya jika anda melakukannya, supaya kita boleh belajar tentang bagaimana untuk membuat produk kami lebih baik!
Ketahui lebih lanjut tentang bagaimana Polyglot berfungsi di vocalstack.com/polyglot.
Tulis dan Kemukakan Sesi Polyglot
Cipta sesi yang boleh digunakan untuk menyiarkan transkripsi langsung melalui pautan boleh kongsi awam. Pengguna boleh membaca transkripsi hidup dalam bahasa yang mereka pilih, dan bahkan transkripsi terdahulu apabila sesi anda tidak aktif.
Dapatkan Data Pentranskripsian
Dapatkan data dari transkripsi yang menunggu atau selesai. Ini termasuk garis masa transkripsi, perkataan kunci, ringkasan, dan segmen perenggan.
Token Pengesahihan Sisi Klien
Cipta token pengesahan sementara untuk permintaan sisi klien. Implementasikan permintaan API dengan selamat dalam pelayar web tanpa mendedahkan kekunci API anda.
Scroll Up