Transkriber tale til tekst ved hjelp av de største og kraftigste AI-modellene som er tilgjengelige, inkludert: OpenAI Whisper large-v3 LLM. Utmerket håndtering av bakgrunnsstøy, flere aksenter eller levende tale.
Vær en tidlig adopter og motta ekstra gratis transkripsjonstimer hver måned!
Ingen gjentakende kostnader
$40 per måned Faktureres årlig ÅrligMånedlig Årlig |
Forhåndsinnspilte transkripsjoner | $0.35 per time |
---|---|
Direktetranskripsjon | $0.80 per time |
API- tilgang | |
---|---|
Databasetilgang | |
Administrerte tjenester | |
Grense for transkripsjonsfrekvens | maks 50 samtidige økter |
Tjenerstart | warm boot in non-peak times |
Transkriber lyd fra opplastet fil | |
---|---|
Transkriber lyd fra URL | |
Transkriber lyd fra mikrofon | |
Eksporter undertekster og filer | |
Oversett transkripsjoner | |
Polyglot |
Transkriber fra mikrofon | |
---|---|
Transkribere fra direktestrøm | |
Sanntidstranskripsjoner via offentlig URL | |
Sanntids oversettelser via offentlig URL | |
Historiske transkripsjoner via Pubic URL | |
Slå på passordbeskyttelse | |
Planlagte transkripsjoner av direktestrømmer |
Språkstøtte | 57 språk pluss dialekter og aksenter |
---|---|
Automatisk språkgjenkjenning | |
Avsnittssegmentering | |
Oppsummering | |
Tidsstempler på ordnivå | |
Justering på ordnivå | |
Høyttalerdialyse |
Hjelp & støtte | E-post og live chat-støtte |
---|---|
SLA |
VocalStack bruker store språkmodeller (LLM) for å få best mulig transkripsjonskvalitet, selv i de mest utfordrende lydmiljøer. Dette inkluderer Whisper, som fungerer som kjernemodellen for VocalStack-plattformen. Den store Whisper-modellen er en toppmoderne AI-modell som har blitt trent på en enorm mengde data for å forstå og transkribere tale nøyaktig.
For å bedre forstå effekten av en AI-modells størrelse, la oss bruke de forskjellige Whisper-modellene til å transkribere et fiktivt utdrag:
Nei, du vil ikke bli fakturert for hele timen. Våre faktureringskostnader beregnes alltid per sekund av transkribert lyd, uavhengig av om transkripsjonen er forhåndsinnspilt lyd eller live lyd. Dette betyr at du bare blir fakturert for det du trenger transkribert. Det eneste unntaket er at lyden må være minst ett minutt lang. Ellers vil du bli fakturert for hele minuttet.
For å forenkle dette ytterligere, her er hva du vil bli fakturert i hvert abonnement for en forhåndsinnspilt transkripsjon (forutsatt at du har brukt opp alle dine gratis transkripsjonstimer for måneden):
Nei, det er ingen skjulte kostnader. Du betaler bare for transkripsjonen av lydinnholdet ditt. (Med andre ord, bare for kostnadene som er oppført i pristabellen. ) Andre funksjoner som automatisk språkgjenkjenning, oversettelser, oppsummeringer, avsnitt segmentering, søkeord deteksjon, og tidsstempler er inkludert gratis.
Det er viktig å merke seg at antall oversettelser ikke påvirker transkripsjonskostnadene. Hvis du for eksempel transkriberer en lydfil på engelsk og deretter oversetter den til spansk, fransk og tysk, vil du bare bli fakturert for transkripsjonen av den engelske lyden. Dette gjelder også live transkripsjoner ved hjelp av Polyglot. Du kan utføre et ubegrenset antall oversettelser når som helst uten ekstra kostnader.
Forhåndsinnspilt transkripsjon refererer til prosessen med å transkribere lyd som tidligere har blitt innspilt. Den kan lastes opp som en lydfil og transkriberes på et senere tidspunkt, noe som gjør den egnet for podcaster, intervjuer, videoer og annet innspilt innhold.
Live transkripsjon refererer til prosessen med å transkribere lyd i sanntid som det blir talt. Dette er nyttig for live-strømmer, podcaster, arrangementer, møter, forelesninger og andre scenarier der umiddelbar transkripsjon (og muligens oversettelse) er nødvendig