Transkrip ucapan ke teks menggunakan model AI terbesar dan paling kuat yang ada, termasuk: OpenAI Whisper large-v3 LLM. Pengendalian bunyi latar belakang yang baik, beberapa loghat, atau ucapan langsung.
Jadilah penerima awal dan terima jam transkripsi percuma tambahan setiap bulan!
Tiada kos berulang
$40 setiap bulan Dicaj setiap tahun Setiap tahunBulanan Setiap tahun |
Transkripsi Pra-Direkam | $0.35 per jam |
---|---|
Transkripsi | $0.80 per jam |
Akses API | |
---|---|
Akses Pangkalan Data | |
Servis Diurus | |
Had Kadar Pentranskripsian | maksimum 50 sesi serentak |
Mula Pelayan | warm boot in non-peak times |
Transkrip Audio dari Fail Dimuatnaik | |
---|---|
Sunting Audio dari URL | |
Tulis semula Audio dari Mikrofon | |
Eksport Subtajuk dan Fail | |
Terjemah Transkripsi | |
Polyglot |
Tulis dari Mikrofon | |
---|---|
Transkripsi dari Strim Langsung | |
Transkripsi Masa-Real melalui URL Awam | |
Terjemahan Masa-Real melalui URL Awam | |
Transkripsi Sejarah melalui URL Pubic | |
Aktifkan Perlindungan Kata Laluan | |
Transkripsi Strim Langsung Terjadual |
Sokongan Bahasa | 57 bahasa plus dialek dan aksen |
---|---|
Pengesanan Bahasa Automatik | |
Segmen Perenggan | |
Ringkasan | |
Setem Masa Tahap Perkataan | |
Jajaran Aras-Perkataan | |
Diarization Speaker |
Bantuan & Sokongan | Sokongan Emel dan Sembang Langsung |
---|---|
SLA |
VocalStack menggunakan model bahasa besar (LLMs) untuk mendapatkan kualiti transkripsi terbaik yang mungkin, walaupun dalam persekitaran audio yang paling mencabar. Ini termasuk Whisper, yang berfungsi sebagai model inti untuk platform VocalStack. Model Whisper yang besar adalah model AI terkini yang telah dilatih pada jumlah data yang besar untuk memahami dan mentranskripsikan ucapan dengan tepat.
Untuk lebih memahami kesan saiz model AI, mari kita gunakan model Whisper yang berbeza untuk mentranskripsikan sekeping fiksyen:
Tidak, anda tidak akan dikenakan untuk seluruh jam. Kos bil kami selalu dikira setiap saat dari audio yang direkodkan tanpa mengira sama ada transkripsi adalah audio yang direkodkan atau audio langsung. Ini bermakna anda hanya mendapat bil untuk apa yang anda perlu transkripsi. Satu-satunya pengecualian adalah bahawa audio mesti sekurang-kurangnya satu minit panjang. Jika tidak, anda akan dicaj untuk semua minit.
Untuk menyederhanakan lagi, inilah yang akan dicaj pada setiap rancangan untuk transkripsi pra-rekod (asumsikan anda telah menggunakan semua jam transkripsi percuma anda untuk bulan):
Tidak, tiada kos tersembunyi. Anda hanya membayar untuk transkripsi kandungan audio anda. (Dengan kata lain, hanya untuk kos yang tersenarai dalam jadual harga. ) Ciri-ciri lain seperti pengesanan bahasa automatik, terjemahan, ringkasan, segmen perenggan, pengesanan kata kunci, dan setem masa dimasukkan secara percuma.
Yang penting, jumlah terjemahan tidak mempengaruhi kos transkripsi. Sebagai contoh, jika anda mentranskripsikan fail audio dalam bahasa Inggeris dan kemudian menterjemahkannya ke dalam bahasa Sepanyol, Perancis, dan Jerman, anda hanya akan dicaj untuk pentranskripsian audio dalam bahasa Inggeris. Ini juga terpakai kepada transkripsi langsung menggunakan Polyglot. Anda boleh melakukan jumlah terjemahan tidak terhad pada bila- bila masa tanpa sebarang bayaran tambahan.
Transkripsi pra-rekod merujuk kepada proses transkripsi audio yang telah direkodkan sebelumnya. Ia boleh dimuat naik sebagai fail audio dan ditranskripsikan pada masa akan datang, menjadikannya sesuai untuk podcast, temubual, video, dan kandungan direkod lain.
Pentranskripsian langsung merujuk kepada proses pentranskripsian audio dalam masa nyata seperti yang diucapkan. Ini berguna untuk strim langsung, podcast, acara, mesyuarat, ceramah, dan skenario lain di mana transkripsi segera (dan mungkin terjemahan) diperlukan