Dapatkan data dari transkripsi yang menunggu atau selesai
Transkrip pidato langsung dari mikrofon atau streaming langsung
Memantau dan mengelola status transkripsi dengan sesi
Menerjemahkan teks yang ditranskripsikan ke bahasa lain
Transkrip pembicaraan dari audio yang direkam sebelumnya dalam URL ke teks biasa
Buat token otentikasi sementara untuk permintaan sisi klien
Membuat sesi yang dapat digunakan untuk menyiarkan transkripsi langsung melalui tautan yang dapat dibagikan secara publik
language
Kode bahasa ISO 639-1 untuk pidato tersebut. Contohnya "en" (Inggris), atau "ro" (Rumania). Secara default, VocalStack akan mencoba untuk mentranskripsikan dalam semua bahasa jika opsi ini tidak disediakan. Hal ini dapat berguna untuk pembicaraan multibahasa. Namun, jika Anda tahu bahasa dari pidato, memberikan opsi ini dapat meningkatkan akurasi transkripsi. Durasi, dalam detik, dari berkas audio. duration_s
Opsi ini digunakan sebagai penjaga untuk memastikan bahwa transkripsi Anda hanya terjadi jika panjang berkas audio sesuai dengan durasi pilihan. Secara default, opsi ini diabaikan, dan transkripsi akan diproses tanpa memperhatikan panjangnya. Durasi maksimum yang dapat ditranskripsikan, dalam detik. Gunakan opsi ini jika Anda ingin membatasi jumlah ucapan yang ditranskripsikan. Tetapkan ini ke max_duration_s
jika Anda ingin memproses seluruh transkripsi, tanpa memperhatikan durasinya (⚠️ gunakan dengan hati-hati). Secara default, opsi ini ditetapkan ke , memastikan bahwa hanya dua jam pertama dari pidato ditranskripsikan.Balasan Transkripsi0
Anda dapat mengawasi data transkripsi secara asynchronous saat tersedia menggunakan. 7200
event handler yang menyediakan onData
The response
object memiliki properti berikut:response
Jika statusnya adalah "melakukan" atau "sudah selesai", objek timeline akan tersedia, menunjukkan seluruh transkripsi yang tersedia sampai saat itu. Timeline adalah sebuah aray dari objek yang berisi properti-properti berikut:status
: waktu awal dari segmen transkripsidata.progress
: waktu akhir dari segmen transkripsidata.timeline
: potongan teks dalam segmen transkripsi: sebuah gudang kunci-nilai dari kode bahasa dalam ISO 639-1 dan terjemahan (sifat ini hanya tersedia jika transkripsi setidaknya memiliki satu terjemahan)start
Pasca-pemrosesanend
Setelah transkripsi selesai, post-proses akan terjadi, pada titik di mana text
akan dikirim ke translations
. Dalam respon akhir, status transkripsi akan "dilakukan", dan properti baru ini akan dimasukkan ke. response
: seluruh transkripsi dikelompokkan menjadi paragraf, disegmentasi oleh tema, atau oleh transisi yang berarti ke topik baruonData
Dukungan Typescriptdata
VocalStack's JavaScript SDK memiliki dukungan TypeScript penuh. Sebagai contoh, keywords
objek memiliki summary
type. paragraphs
Richiesta di trascrizioneresponse
Ad esempio "en" (inglese), o "ro" (rumeno). Per impostazione predefinita, VocalStack tenterà di trascrivere in tutte le lingue se questa opzione non è fornita. Questo può essere utile per il discorso multilingue. Tuttavia, se si conosce la lingua del discorso, fornendo questa opzione si può aumentare la precisione della trascrizione. UrlTranscriptionResponse
La durata, in secondi, del file audio. TypeScriptimport { UrlTranscription, UrlTranscriptionResponse } from '@vocalstack/js-sdk'; const sdk = new UrlTranscription({ apiKey: 'YOUR-API-KEY' }); const transcription = await sdk.start({ url: 'http://example.com/audio.mp3' }); transcription.onData((response: UrlTranscriptionResponse) => { console.log(response.data); });