使用最大型、最强大的 AI 模型将语音转换为文本,包括: OpenAI Whisper large-v3 LLM. 优异的处理背景噪音,多重口音,或现场讲话。.
成为早期采用者,并且每月获得额外的免费转录小时!
$40 每月 每年开具发票 每年每月 每年 |
预先录制的抄录 | $0.35 每小时 |
---|---|
現場轉錄 | $0.80 每小时 |
API 访问 | |
---|---|
数据库访问 | |
管理服务 | |
转录速率限制 | 最多 50 个并发会话 |
服务器启动 | warm boot in non-peak times |
从上传文件转录音频 | |
---|---|
从 URL 转录音频 | |
从麦克风转录音频 | |
导出字幕和文件 | |
翻译抄录 | |
Polyglot |
从麦克风转录 | |
---|---|
从直播流转录 | |
通过公共 URL 实时转录 | |
通过公共 URL 实时翻译 | |
通过公共网址获取历史抄录 | |
启用密码保护 | |
计划的直播转录 |
语言支持 | 57种语言加上方言和口音 |
---|---|
自动语言检测 | |
段落分割 | |
摘要 | |
字级时间戳 | |
字级对齐 | |
發言人透析 |
帮助&支持 | 电子邮件和在线聊天支持 |
---|---|
斯洛文尼亚解放军 |
VocalStack 使用大型语言模型 (LLM) 即使在最具挑战性的音频环境中也能获得最佳的转录质量。 这包括Whisper,它是VocalStack平台的核心模型。 大型 Whisper 模型是基于大量数据训练的先进 AI 模型,可准确理解和转录语音。.
为了更好地理解 AI 模型大小的影响,让我们使用不同的 Whisper 模型转录一个虚拟摘录:
不,您不会被收取整个小时的费用。 无论转录是预先录制的音频还是现场音频,我们的计费费用始终按照转录音频的每秒计算。 这意味着您只需为您需要转录的内容付费。 唯一的例外是音频必须至少一分钟长。 否则,您将被收取整分钟的费用。.
为了进一步简化这一点,下面是每个计划中预录制的转录将向您收取的费用(假设您已使用了该月的所有免费转录小时 ) :
不,没有隐藏成本。 您只需为音频内容的转录付费。 (换句话说,仅适用于定价表中列出的费用。 ) 其他功能,如自动语言检测,翻译,摘要,段落分割,关键字检测和时间戳是免费的。.
重要的是,翻译的数量不会影响转录成本。 例如,如果您转录英语音频文件,然后将其翻译成西班牙语、法语和德语,您只需为英文音频的转录付费。 这也适用于使用 Polyglot 的现场转录。 您可以在任何时候进行无限数量的翻译,而无需任何额外费用。.
预录音转录是指转录以前录制的音频的过程。 它可以作为音频文件上传并在稍后转录,因此适合播客、采访、视频和其他录制内容。.
实时转录 是指实时转录语音的过程。 这对直播、播客、活动、会议、讲座和其他需要立即转录(可能还需要翻译)的场景非常有用