Transkribera tal till text med hjälp av de största och mest kraftfulla AI-modellerna som finns tillgängliga, inklusive: OpenAI Whisper large-v3 LLM. Utmärkt hantering av bakgrundsljud, flera accenter eller levande tal.
Bli en tidig användare och få ytterligare gratis transkriptionstimmar varje månad!
Inga återkommande kostnader
$40 per månad Faktureras årligen ÅrligenMånadsvis Årligen |
Förinspelade transkriptioner | $0.35 per timme |
---|---|
Live Transkription | $0.80 per timme |
API Access-tjänster | |
---|---|
Databasåtkomst | |
Managed Services för företag | |
Gräns för transkriptionshastighet | max 50 samtidiga sessioner |
Serverstart | warm boot in non-peak times |
Transkribera ljud från uppladdad fil | |
---|---|
Transkribera ljud från URL | |
Transkribera ljud från mikrofon | |
Exportera undertexter och filer | |
Översätt Transkriptioner | |
Polyglot |
Transkribera från mikrofon | |
---|---|
Transkribera från Live Stream | |
Realtidstranskription via offentlig URL | |
Realtidsöversättningar via offentlig URL | |
Historiska transkriptioner via offentlig URL | |
Aktivera lösenordsskydd | |
Schemalagda livestream-transkriptioner |
Språkstöd för Android | 57 språk plus dialekter och accenter |
---|---|
Automatisk språkidentifiering | |
Styckesegmentering | |
Sammanfattning | |
Tidsstämplar på ordnivå | |
Justering på ordnivå | |
Diarisering av högtalare |
Hjälp & support | E-post och livechattsupport |
---|---|
SLA |
VocalStack använder stora språkmodeller (LLM) för att få bästa möjliga transkriptionskvalitet, även i de mest utmanande ljudmiljöer. Detta inkluderar Whisper, som fungerar som kärnmodellen för VocalStack-plattformen. Den stora Whisper-modellen är en toppmodern AI-modell som har tränats på en enorm mängd data för att förstå och transkribera tal korrekt.
För att bättre förstå effekten av en AI-modells storlek, låt oss använda de olika Whisper-modellerna för att transkribera ett fiktivt utdrag:
Nej, du kommer inte att debiteras för hela timmen. Våra faktureringskostnader beräknas alltid per sekund av transkriberat ljud oavsett om transkriptionen är förinspelat ljud eller live-ljud. Det innebär att du bara faktureras för det du behöver transkribera. Det enda undantaget är att ljudet måste vara minst en minut långt. Annars debiteras du för hela minuten.
För att förenkla detta ytterligare, här är vad du kommer att debiteras i varje plan för en förinspelad transkription (förutsatt att du har använt upp alla dina gratis transkriptionstimmar för månaden):
Nej, det finns inga dolda kostnader. Du betalar bara för transkriptionen av ditt ljudinnehåll. (Med andra ord, endast för de kostnader som anges i prislistan. ) Andra funktioner som automatisk språkidentifiering, översättningar, sammanfattningar, stycke segmentering, nyckelord upptäckt, och tidsstämplar ingår gratis.
Det är viktigt att antalet översättningar inte påverkar transkriptionskostnaden. Om du till exempel transkriberar en ljudfil på engelska och sedan översätter den till spanska, franska och tyska, kommer du endast att debiteras för transkriptionen av det engelska ljudet. Detta gäller även för live-transkriptioner med Polyglot. Du kan utföra ett obegränsat antal översättningar när som helst utan extra kostnad.
Förinspelad transkription avser processen att transkribera ljud som tidigare har spelats in. Det kan laddas upp som en ljudfil och transkriberas vid ett senare tillfälle, vilket gör det lämpligt för podcasts, intervjuer, videor och annat inspelat innehåll.
Livetranskription avser processen att transkribera ljud i realtid medan det talas. Detta är användbart för livestreams, podcasts, evenemang, möten, föreläsningar och andra scenarier där omedelbar transkription (och eventuellt översättning) krävs