VocalStack Logo

Permintaan dan Balasan Penukaran

Layari Dokumentasi
Pilihan permintaan dan respon umum untuk semua operasi transkripsi. Guna pilihan untuk mengkonfigur seting transkripsi.
VocalStack akan cuba mentranskripsikan audio anda menggunakan pilihan konfigurasi lalai yang bermakna. Bagaimanapun, anda boleh tetapkan permintaan transkripsi anda dengan pilihan berikut:
  • languageKod bahasa ISO 639-1 untuk ucapan. Contohnya "en" (Bahasa Inggeris), atau "ro" (Bahasa Romania). Secara default, VocalStack akan cuba untuk transkripsi dalam semua bahasa jika pilihan ini tidak disediakan. Ini boleh berguna untuk ucapan berbilang bahasa. Bagaimanapun, jika anda tahu bahasa ucapan, memberikan pilihan ini boleh meningkatkan ketepatan transkripsi. Tempoh, dalam saat, bagi fail audio.
  • duration_s Opsyen ini digunakan sebagai pengawal untuk memastikan bahawa transkripsi anda hanya berlaku jika panjang fail audio sepadan dengan tempoh pilihan. Secara default, pilihan ini diabaikan, dan transkripsi akan diproses tanpa mengira panjangnya. Tempoh maksimum yang boleh ditranskripsikan, dalam saat. Guna pilihan ini jika anda ingin hadkan jumlah ucapan yang ditranskripsikan. Tetapkan ini kepada
  • max_duration_s jika anda ingin memproses keseluruhan transkripsi, tanpa mengira tempohnya (⚠️ gunakan dengan berhati-hati). Secara default, pilihan ini ditetapkan kepada , memastikan bahawa hanya dua jam pertama ucapan itu ditranskripsikan.Balasan Transkripsi0Anda boleh mengawal data transkripsi secara asynchronous apabila ia tersedia menggunakan 7200 pengendali peristiwa yang menyediakan
Objek BalasanonDataThe response objek mempunyai ciri-ciri berikut:
: Nilai antara 0 dan 1 menunjukkan peratusan kemajuan transkripsiresponse Jika status adalah "memproses" atau "selesai" objek garis masa akan tersedia, memaparkan keseluruhan transkripsi yang tersedia sehingga ke titik itu. Garis masa adalah aras objek yang mengandungi ciri-ciri ini:
  • status: masa mula bagi segmen transkripsi
  • data.progress: masa akhir bagi segmen transkripsi
  • data.timeline: bahagian teks dalam segmen transkripsi: storan nilai-kunci kod bahasa dalam ISO 639-1 dan terjemahan (ciri ini hanya tersedia jika transkripsi mempunyai sekurang-kurangnya satu terjemahan)
    • startPasca pemprosesan
    • endApabila transkripsi selesai, pemprosesan akan berlaku, pada titik yang akhir.
    • text akan dihantar ke
    • translations. Dalam respon akhir, status transkripsi akan "dilakukan", dan ciri-ciri baru ini akan dimasukkan dalam.
: ringkasan perenggan tunggal bagi keseluruhan transkripsiresponse: keseluruhan transkripsi dikumpulkan ke dalam perenggan, dibahagikan mengikut tema, atau oleh peralihan bermakna ke topik baruonDataSokongan TypescriptdataSDK JavaScript VocalStack mempunyai sokongan TypeScript penuh. Sebagai contoh,
  • keywords objek mempunyai
  • summary jenis.
  • paragraphsट्रांसक्रिप्शन विनंती
ISO 639-1 भाषा कोड:.response उदाहरणार्थ, "en" (इंग्रजी), किंवा "ro" (रोमानियाई). या भाषेत लिखित स्वरूपात लिहिलेल्या सर्व ग्रंथांना मराठी भाषेत अनुवादित केले जाते. हे बहुभाषिक भाषणासाठी उपयोगी ठरू शकते. परंतु, जर तुम्हाला भाषणाची भाषा माहीत असेल तर हा पर्याय उपलब्ध करून देणे, लिप्यंतरणाची अचूकता वाढवू शकते. UrlTranscriptionResponseऑडिओ फाइलचे सेकंद अंतर्गत अंतर.
TSTypeScript
import { UrlTranscription, UrlTranscriptionResponse } from '@vocalstack/js-sdk'; const sdk = new UrlTranscription({ apiKey: 'YOUR-API-KEY' }); const transcription = await sdk.start({ url: 'http://example.com/audio.mp3' }); transcription.onData((response: UrlTranscriptionResponse) => { console.log(response.data); });
Scroll Up