最大で最も強力なAIモデルを使用して音声をテキストに変換します。: OpenAI Whisper large-v3 LLM. 背景雑音,複数アクセント,またはライブスピーチの優れた処理。.
早期採用者になり、毎月無料で追加の転写時間を受け取ってください!!
$40 1ヶ月あたり 年間 年度月別 年度 |
録音済みの転写 | $0.35 1時間あたり |
---|---|
ライブトランスペアレント | $0.80 1時間あたり |
APIアクセス | |
---|---|
データベースアクセス | |
マネージドサービス | |
転写速度制限 | 最大50の同時セッション |
サーバ開始 | warm boot in non-peak times |
アップロードしたファイルからオーディオを転写 | |
---|---|
URL からオーディオを転写 | |
マイクから音声を転写 | |
字幕とファイルをエクスポート | |
翻訳 | |
Polyglot |
マイクから転写 | |
---|---|
ライブストリームから転写 | |
公開URLを通じたリアルタイム転写 | |
公開URLを通じたリアルタイム翻訳 | |
歴史的な転写 | |
パスワード保護を有効にする | |
スケジュールされたライブストリームの転写 |
言語サポート | 57の言語と方言とアクセント |
---|---|
自動言語検出 | |
段落分割 | |
総括 | |
ワードレベルのタイムスタンプ | |
ワードレベルの整列 | |
ディアリゼーション |
ヘルプとサポート | 電子メールとライブチャットサポート |
---|---|
SLA |
VocalStackは大規模言語モデル(LLM)を用いて,最も困難な音声環境においても可能な限り最良の転写品質を得る。 これには、VocalStackプラットフォームのコアモデルとして機能するWhisperが含まれる。 大規模Whisperモデルは,音声を正確に理解し転写するために,膨大なデータを用いて訓練された最新のAIモデルである。.
人工知能モデルの大きさの影響をよりよく理解するために,異なるWhisperモデルを用いて仮想的な摘要を書き換える。:
いいえ、あなたは1時間全体の料金を請求されません。 私たちの請求コストは、転写されたオーディオが予め録音されたオーディオかライブオーディオかにかかわらず、常に転写されたオーディオの秒単位で計算されます。 つまり、必要なものだけが 請求されるということです 唯一の例外は、オーディオは少なくとも1分間の長さが必要であることである。 さもなければ、あなたは1分全部の料金を請求されます。.
これをさらに簡略化するために、各プランで予め録音された転写に対して請求される金額を示します(月ごとのフリー転写時間をすべて使い切ったと仮定):
いや、隠されたコストはない。 あなたはオーディオコンテンツの転写のみを支払います。 (すなわち、価格表に記載されている費用のみ。 また,自動言語検出,翻訳,要約,段落分割,キーワード検出,タイムスタンプなどの他の機能も無料で含まれている。.
重要なことは,翻訳の数は転写コストに影響しないことである。 例えば、英語の音声ファイルを転写し、それをスペイン語、フランス語、ドイツ語に翻訳すると、英語の音声の転写のみが請求される。 これは Polyglot を使ったライブ録音にも適用される。 あなたはいつでも追加料金なしに無制限の翻訳を行うことができます。.
プリレコーディング(英: pre-recorded transcription)とは、以前に録音された音声を転写するプロセスである。 音声ファイルとしてアップロードし,後で転写することができ,ポッドキャスト,インタビュー,ビデオ,その他の録音コンテンツに適している。.
ライブ転写(ライブてんしゃ、英: live transcription)とは、音声を実時間で転写するプロセスである。 これは、ライブストリーム、ポッドキャスト、イベント、会議、講演、その他、即時の転写(翻訳も可能)が必要なシナリオに有用です。