Transcrieți vorbirea în text folosind cele mai mari și mai puternice modele AI disponibile, inclusiv: OpenAI Whisper large-v3 LLM. Gestionare excelentă a zgomotului de fundal, a accentelor multiple sau a vorbirii în timp real.
Fii un adoptator timpuriu și primește ore suplimentare de transcriere gratuite în fiecare lună!
Fără costuri recurente
$40 pe lună Facturat anual AnualLunar Anual |
Transcrieri pre-înregistrate | $0.35 pe oră |
---|---|
Transcriere în timp real | $0.80 pe oră |
Acces la API | |
---|---|
Acces la baza de date | |
Servicii de management | |
Limita ratei de transcriere | max 50 sesiuni concurente |
Pornirea serverului | warm boot in non-peak times |
Transcrie audio din fișierul încărcat | |
---|---|
Transcrie audio din URL | |
Transcrie audio de la microfon | |
Exportul de subtitrări și fișiere | |
Traduceți Transcrieri în engleză | |
Polyglot |
Transcrie din microfon | |
---|---|
Transcrie din Live Stream | |
Transcrieri în timp real prin URL public | |
Traduceri în timp real prin URL public | |
Transcrieri istorice prin URL public | |
Activarea protecției prin parolă | |
Transcrieri livestream programate |
Suport pentru limbi străine | 57 de limbi plus dialecte și accente |
---|---|
Detectarea automată a limbii | |
Segmentarea paragrafelor | |
Rezumat | |
Timbru de timp la nivel de cuvânt | |
Aliniere la nivel de cuvânt | |
Diarizarea difuzoarelor |
Ajutor & suport | Suport prin e-mail și chat live |
---|---|
SLA |
VocalStack utilizează modele de limbă mari (LLM) pentru a obține cea mai bună calitate de transcriere posibilă, chiar și în cele mai dificile medii audio. Aceasta include Whisper, care servește ca model de bază pentru platforma VocalStack. Modelul Whisper este un model AI de ultimă generație care a fost instruit pe o cantitate mare de date pentru a înțelege și transcrie cu acuratețe vorbirea.
Pentru a înțelege mai bine impactul dimensiunii unui model AI, să folosim diferitele modele Whisper pentru a transcrie un fragment fictiv:
Nu, nu veți fi facturat pentru întreaga oră. Costurile noastre de facturare sunt întotdeauna calculate pe secundă de audio transcris, indiferent dacă transcrierea este un audio pre-înregistrat sau audio live. Aceasta înseamnă că veți fi facturat doar pentru ceea ce trebuie transcris. Singura excepţie este că fişierul audio trebuie să aibă cel puţin un minut. În caz contrar, veți fi facturat pentru întregul minut.
Pentru a simplifica și mai mult, iată ce veți fi facturat în fiecare plan pentru o transcriere preînregistrată (presupunând că ați utilizat toate orele de transcriere gratuite pentru luna respectivă):
Nu, nu există costuri ascunse. Plătiți doar pentru transcrierea conținutului audio. (Cu alte cuvinte, numai pentru costurile enumerate în tabelul de prețuri. ) Alte caracteristici, cum ar fi detectarea automată a limbii, traduceri, rezumate, segmentarea paragrafului, detectarea cuvintelor cheie și marcajele de timp sunt incluse gratuit.
În mod important, numărul de traduceri nu afectează costul transcrierii. De exemplu, dacă transcrii un fișier audio în limba engleză și apoi îl traduci în spaniolă, franceză și germană, vei fi facturat doar pentru transcrierea fișierului audio în limba engleză. Acest lucru este valabil și pentru transcrierile live folosind Polyglot. Puteți efectua un număr nelimitat de traduceri în orice moment, fără taxe suplimentare.
Transcrierea preînregistrată se referă la procesul de transcriere a sunetului care a fost înregistrat anterior. Acesta poate fi încărcat ca fișier audio și transcris la un moment ulterior, făcându-l potrivit pentru podcast-uri, interviuri, videoclipuri și alte conținuturi înregistrate.
Transcrierea în timp real se referă la procesul de transcriere a sunetului în timp real, în timp ce este vorbit. Acest lucru este util pentru fluxuri live, podcast-uri, evenimente, întâlniri, prelegeri și alte scenarii în care este necesară transcrierea imediată (și eventual traducerea)