다음을 포함한 가장 크고 강력한 AI 모델을 사용하여 음성을 텍스트로 변환합니다.: OpenAI Whisper large-v3 LLM. 배경 소음, 여러 억양 또는 라이브 연설을 탁월하게 처리합니다.
조기 채택자가 되어 매달 추가 무료 번역 시간을 받으세요!
$40 월당 연간 청구 매년월별 매년 |
미리 녹음된 녹음본 | $0.35 시간당 |
---|---|
라이브 번역 | $0.80 시간당 |
API 액세스 | |
---|---|
데이터베이스 액세스 | |
관리형 서비스 | |
변환 속도 제한 | 최대 50개의 동시 세션 |
서버 시작 | warm boot in non-peak times |
업로드된 파일에서 오디오 녹음하기 | |
---|---|
URL에서 오디오 녹음 | |
마이크에서 오디오를 녹음 | |
자막 및 파일 내보내기 | |
번역 | |
Polyglot |
마이크에서 녹음하기 | |
---|---|
라이브 스트림에서 녹음하기 | |
공개 URL을 통한 실시간 번역 | |
공개 URL을 통해 실시간 번역 | |
공공 URL을 통한 역사적 녹음 | |
암호 보호 사용하기 | |
예약된 라이브스트림 녹음 |
언어 지원 | 57개 언어와 방언 및 억양 |
---|---|
자동 언어 감지 | |
단락 세그먼트 | |
요약 | |
단어 수준 시간 스탬프 | |
단어 수준 정렬 | |
스피커 디아리제이션 |
도움말 & 지원 | 이메일 및 라이브 채팅 지원 |
---|---|
SLA |
VocalStack은 대규모 언어 모델(LLM)을 사용하여 가장 어려운 오디오 환경에서도 최상의 녹음 품질을 얻습니다. 여기에는 VocalStack 플랫폼의 핵심 모델인 Whisper가 포함된다. 대형 Whisper 모델은 엄청난 양의 데이터를 기반으로 훈련된 최첨단 AI 모델로, 음성을 정확하게 이해하고 기록합니다.
AI 모델의 크기가 미치는 영향을 더 잘 이해하려면 다양한 Whisper 모델을 사용하여 가상의 구절을 기록해 보겠습니다.:
아니요, 전체 시간에 대해 청구되지 않습니다. 저희의 청구 비용은 항상 사전 녹음된 오디오인지 라이브 오디오인지에 관계없이 초당 녹음된 오디오로 계산됩니다. 이것은 당신이 당신이 필요로하는 것을 기록에 대한 청구를 얻을 것을 의미합니다. 유일한 예외는 오디오가 최소한 1분 길이여야 한다는 것이다. 그렇지 않으면 전체 분에 대해 요금이 청구됩니다.
이것을 더욱 간단하게 설명하자면, 미리 녹음된 녹음에 대해 각 플랜에서 청구되는 요금은 다음과 같습니다(해당 달의 모든 무료 녹음 시간을 사용했다고 가정):
아니요, 숨겨진 비용은 없습니다. 오디오 콘텐츠의 기록에 대해서만 비용을 지불합니다. (다른 말로, 가격 테이블에 나열된 비용에 대해서만. ) 자동 언어 감지, 번역, 요약, 단락 분할, 키워드 감지 및 타임스탬프와 같은 다른 기능은 무료로 포함되어 있습니다.
중요한 점은 번역의 수가 기록 비용에 영향을 미치지 않는다는 점입니다. 예를 들어 영어로 오디오 파일을 기록한 다음 스페인어, 프랑스어, 독일어로 번역하는 경우 영어 오디오의 기록에 대해서만 요금이 청구됩니다. 이것은 Polyglot를 사용하는 실시간 녹음에도 적용됩니다. 추가 요금 없이 언제든지 무제한 번역을 수행할 수 있습니다.
사전 녹음 녹음은 이전에 녹음된 오디오를 녹음하는 과정을 의미합니다. 오디오 파일로 업로드하고 나중에 기록할 수 있으므로 팟캐스트, 인터뷰, 동영상 및 기타 녹음된 콘텐츠에 적합합니다.
라이브 트랜스크립션(Live transcription)은 말하는 대로 실시간으로 오디오를 트랜스크립션하는 과정을 말한다. 이 기능은 라이브 스트림, 팟캐스트, 이벤트, 회의, 강연 및 즉각적인 기록(아마도 번역)이 필요한 기타 시나리오에 유용합니다