VocalStack Logo

Documentation

Dapatkan Data Transkripsi

Dapatkan data dari transkripsi yang menunggu atau selesai

Transkripsi

Memantau dan mengelola status transkripsi dengan sesi

Terjemahkan sebuah transkripsi

Menerjemahkan teks yang ditranskripsikan ke bahasa lain

Transkripsi Audio dari URL

Transkrip pembicaraan dari audio yang direkam sebelumnya dalam URL ke teks biasa

Token Otentikasi Sisi Klien

Buat token otentikasi sementara untuk permintaan sisi klien

Permintaan dan Balasan Transkripsi

Opsi permintaan dan respon umum untuk semua operasi transkripsi

Transkripsi dan Presentasi Sesi Polyglot

Membuat sesi yang dapat digunakan untuk menyiarkan transkripsi langsung melalui tautan yang dapat dibagikan secara publik

Transkripsi dari Mikrofon atau LiveStream

Lihat Dokumentasi
Transkrip pidato langsung dari mikrofon atau streaming langsung. Mengintegrasikan dengan Polyglot untuk membuat tautan yang dapat dibagikan untuk transkripsi yang dapat dibaca oleh pengguna dalam bahasa apapun.
Untuk mentranskripsi dari mikrofon kita harus terus menerus mengirim paket aliran data audio ke VocalStack API.
JavaScript
import { LiveTranscription } from '@vocalstack/js-sdk'; const sdk = new LiveTranscription({ apiKey: 'YOUR-API-KEY' }); const stream = await sdk.connect({ // Optional: Integrate this stream with a Polyglot session polyglot_id: 'YOUR-POLYGLOT-SESSION-ID', // Optional: language of the speech spoken // (this can be used to improve the transcription accuracy) language: 'en', // Optional: Translate the transcription to these languages translations: ['de'], // Optional: Stop the stream after this many seconds of inactivity timeout_period_s: 60, // Optional: Hard stop the stream after this many seconds max_duration_s: 300, }); // Start the stream stream.start(); // Get audio data from a microphone and send it to the stream // stream.sendBuffer(buffer); // *** This is a placeholder for the actual implementation *** // Manually stop the stream (in this example, after 60 seconds) // If max_duration_s is set, stopping the stream is optional setTimeout(() => stream.stop(), 60000); // Listen for stream transcription data stream.onData((response) => { const { status, data } = response; console.log(status); // 'waiting', 'processing', 'done', 'stopping' or 'error' if (data) { console.log(data.timeline); // an object with the transcription timeline } if (status === 'done') { console.log(data.summary); // a summary of the transcription console.log(data.keywords); // an array of keywords console.log(data.paragraphs); // the entire transcription in paragraph form } });
Mendapatkan data aliran audio akan berbeda berdasarkan lingkungan di mana Anda ingin menjalankan operasi transkripsi. Berikut ini beberapa contoh untuk bagaimana Anda bisa melakukan ini:
Di NextJS Anda harus menginstal paket yang dapat mengambil data audio dari perangkat Anda, yang kemudian Anda dapat mengirimkannya ke API VocalStack. Ini contohnya:
JavaScript
const mic = require('mic'); // Create a new instance of the microphone utility const micInstance = mic(); // Get the audio input stream const micStream = micInstance.getAudioStream(); // Capture the audio data from the microphone micStream.on('data', (data) => { stream.sendBuffer(data); // send the buffer data to the VocalStack API }); // Start capturing audio from the microphone micInstance.start();
Pada peramban web Anda mungkin ingin menggunakan MediaRecorder API seperti yang dapat dilihat pada contoh berikut. (Ini juga mungkin ide yang baik untuk menggunakan paket seperti recordrtc yang meningkatkan kompatibilitas browser)
JavaScript
// Request access to the microphone const mediaStream = await navigator.mediaDevices.getUserMedia({ audio: true }); // Create a MediaRecorder instance to capture audio data const mediaRecorder = new MediaRecorder(mediaStream); // Event handler to process audio data packets mediaRecorder.ondataavailable = async (event) => { const blob = event.data; // this is the audio packet (Blob) const buffer = await blob.arrayBuffer(); // convert the Blob to a Buffer stream.sendBuffer(buffer); // send the buffer data to the VocalStack API }; // Start capturing audio, and send it to the stream every second mediaRecorder.start(1000);
Perhatian bahwa untuk mengakses API VocalStack pada klien web Anda akan perlu menggunakan token otentikasi:
Token Otentikasi Sisi Klien
Buat token otentikasi sementara untuk permintaan sisi klien. Implementasikan permintaan API dengan aman di peramban web tanpa mengungkapkan kunci API Anda.
VocalStack API dapat digunakan untuk mentranskripsikan URL HLS LiveStream apapun, termasuk sumber seperti Youtube Live, Facebook Live, dan Twitch. Silakan perhatikan bahwa URL stream harus .m3u8 ekstensi berkas yang mewakili berkas playlist HLS (HTTP Live Streaming) yang valid.
JavaScript
import { LiveTranscription } from '@vocalstack/js-sdk'; const sdk = new LiveTranscription({ apiKey: 'YOUR-API-KEY' }); const stream = await sdk.connect({ // must be a valid HLS streaming protocol livestream_url: 'http://a.files.bbci.co.uk/media/live/manifesto/audio/simulcast/hls/nonuk/sbr_low/ak/bbc_world_service.m3u8', // The rest of these options are the same as for microphone live transcriptons }); stream.start(); stream.onData((response) => { // The response object is the same as the one // returned by microphone transcriptions });
Mengintegrasikan transkripsi langsung dengan Polyglot adalah sederhana seperti menambahkan. polyglot_id opsi untuk permintaan transkripsi, seperti yang ditunjukkan dalam contoh di atas.
Polyglot menciptakan tautan umum yang dapat dibagikan yang terkait dengan transkripsi Anda (tautan dapat dilindungi dengan sandi):
  • Pengguna dapat membaca transkripsi Anda dalam waktu nyata menggunakan tautan.
  • Pengguna dapat memilih bahasa yang akan dibaca transkripsi dalam waktu nyata.
  • Pengguna dapat membaca transkripsi Anda di kemudian hari, dan semua transkripsi lainnya terintegrasi dengan sesi Polyglot Anda.
Anda diundang untuk menggunakan API VocalStack dan menerapkan UI berlabel putih Anda sendiri daripada menggunakan yang disediakan oleh VocalStack. Kami akan senang mendengar tentang itu jika Anda melakukannya, jadi kita bisa belajar tentang bagaimana membuat produk kita lebih baik!
Mengetahui lebih lanjut tentang bagaimana Polyglot bekerja di vocalstack.com/polyglot.
Transkripsi dan Presentasi Sesi Polyglot
Membuat sesi yang dapat digunakan untuk menyiarkan transkripsi langsung melalui tautan yang dapat dibagikan secara publik. Pengguna dapat membaca transkripsi langsung dalam bahasa yang mereka inginkan, dan bahkan transkripsi masa lalu ketika sesi Anda tidak aktif.
Dapatkan Data Transkripsi
Dapatkan data dari transkripsi yang menunggu atau selesai. Ini termasuk timeline transkripsi, kata kunci, ringkasan, dan segmen paragraf.
Token Otentikasi Sisi Klien
Buat token otentikasi sementara untuk permintaan sisi klien. Implementasikan permintaan API dengan aman di peramban web tanpa mengungkapkan kunci API Anda.
Scroll Up