VocalStack Logo

Documentation

Dapatkan Data Transkripsi

Dapatkan data dari transkripsi yang menunggu atau selesai

Transkripsi dari Mikrofon atau LiveStream

Transkrip pidato langsung dari mikrofon atau streaming langsung

Transkripsi

Memantau dan mengelola status transkripsi dengan sesi

Terjemahkan sebuah transkripsi

Menerjemahkan teks yang ditranskripsikan ke bahasa lain

Transkripsi Audio dari URL

Transkrip pembicaraan dari audio yang direkam sebelumnya dalam URL ke teks biasa

Token Otentikasi Sisi Klien

Buat token otentikasi sementara untuk permintaan sisi klien

Transkripsi dan Presentasi Sesi Polyglot

Membuat sesi yang dapat digunakan untuk menyiarkan transkripsi langsung melalui tautan yang dapat dibagikan secara publik

Permintaan dan Balasan Transkripsi

Lihat Dokumentasi
Opsi permintaan dan respon umum untuk semua operasi transkripsi. Gunakan opsi untuk mengkonfigurasi pengaturan transkripsi.
VocalStack akan mencoba untuk mentranskripsikan audio Anda menggunakan opsi konfigurasi default yang masuk akal. Namun, Anda dapat mengkonfigurasi permintaan transkripsi Anda dengan pilihan berikut:
  • languageKode bahasa ISO 639-1 untuk pidato tersebut. Contohnya "en" (Inggris), atau "ro" (Rumania). Secara default, VocalStack akan mencoba untuk mentranskripsikan dalam semua bahasa jika opsi ini tidak disediakan. Hal ini dapat berguna untuk pembicaraan multibahasa. Namun, jika Anda tahu bahasa dari pidato, memberikan opsi ini dapat meningkatkan akurasi transkripsi. Durasi, dalam detik, dari berkas audio.
  • duration_s Opsi ini digunakan sebagai penjaga untuk memastikan bahwa transkripsi Anda hanya terjadi jika panjang berkas audio sesuai dengan durasi pilihan. Secara default, opsi ini diabaikan, dan transkripsi akan diproses tanpa memperhatikan panjangnya. Durasi maksimum yang dapat ditranskripsikan, dalam detik. Gunakan opsi ini jika Anda ingin membatasi jumlah ucapan yang ditranskripsikan. Tetapkan ini ke
  • max_duration_s jika Anda ingin memproses seluruh transkripsi, tanpa memperhatikan durasinya (⚠️ gunakan dengan hati-hati). Secara default, opsi ini ditetapkan ke , memastikan bahwa hanya dua jam pertama dari pidato ditranskripsikan.Balasan Transkripsi0Anda dapat mengawasi data transkripsi secara asynchronous saat tersedia menggunakan. 7200 event handler yang menyediakan
Objek BalasanonDataThe response object memiliki properti berikut:
: Nilai antara 0 dan 1 yang menunjukkan persentase kemajuan transkripsiresponse Jika statusnya adalah "melakukan" atau "sudah selesai", objek timeline akan tersedia, menunjukkan seluruh transkripsi yang tersedia sampai saat itu. Timeline adalah sebuah aray dari objek yang berisi properti-properti berikut:
  • status: waktu awal dari segmen transkripsi
  • data.progress: waktu akhir dari segmen transkripsi
  • data.timeline: potongan teks dalam segmen transkripsi: sebuah gudang kunci-nilai dari kode bahasa dalam ISO 639-1 dan terjemahan (sifat ini hanya tersedia jika transkripsi setidaknya memiliki satu terjemahan)
    • startPasca-pemrosesan
    • endSetelah transkripsi selesai, post-proses akan terjadi, pada titik di mana
    • text akan dikirim ke
    • translations. Dalam respon akhir, status transkripsi akan "dilakukan", dan properti baru ini akan dimasukkan ke.
: ringkasan paragraf tunggal dari seluruh transkripsiresponse: seluruh transkripsi dikelompokkan menjadi paragraf, disegmentasi oleh tema, atau oleh transisi yang berarti ke topik baruonDataDukungan TypescriptdataVocalStack's JavaScript SDK memiliki dukungan TypeScript penuh. Sebagai contoh,
  • keywords objek memiliki
  • summary type.
  • paragraphsRichiesta di trascrizione
Il codice ISO 639-1 della lingua per il discorso.response Ad esempio "en" (inglese), o "ro" (rumeno). Per impostazione predefinita, VocalStack tenterà di trascrivere in tutte le lingue se questa opzione non è fornita. Questo può essere utile per il discorso multilingue. Tuttavia, se si conosce la lingua del discorso, fornendo questa opzione si può aumentare la precisione della trascrizione. UrlTranscriptionResponseLa durata, in secondi, del file audio.
TSTypeScript
import { UrlTranscription, UrlTranscriptionResponse } from '@vocalstack/js-sdk'; const sdk = new UrlTranscription({ apiKey: 'YOUR-API-KEY' }); const transcription = await sdk.start({ url: 'http://example.com/audio.mp3' }); transcription.onData((response: UrlTranscriptionResponse) => { console.log(response.data); });
Scroll Up