Trascrivi il parlato in testo utilizzando i modelli di IA più grandi e potenti disponibili, tra cui: OpenAI Whisper large-v3 LLM. Eccellente gestione del rumore di fondo, accenti multipli o discorsi dal vivo.
Sii un early adopter e ricevi ore di trascrizione gratuite ogni mese!
Nessun costo ricorrente
Prezzo al mese
Fatturato mensilmenteFatturato annualmente
$40 Prezzo al mese Fatturato annualmente AnnualmenteMensile Annualmente |
Trascrizioni pre-registrate | $0.35 Prezzo all'ora |
---|---|
Trascrizione dal vivo | $0.80 Prezzo all'ora |
Accesso alle API | |
---|---|
Accesso al database | |
Servizi gestiti | |
Limite di velocità di trascrizione | max 50 sessioni simultanee |
Avvio del server | warm boot in non-peak times |
Trascrivi l'audio dal file caricato | |
---|---|
Trascrivi Audio da URL | |
Trascrivere l'audio dal microfono | |
Esportazione di sottotitoli e file | |
Traduci le trascrizioni | |
Polyglot |
Trascrivere dal microfono | |
---|---|
Trascrivi dal Live Stream | |
Trascrizioni in tempo reale tramite URL pubblico | |
Traduzioni in tempo reale tramite URL pubblico | |
Trascrizioni storiche tramite Pubic URL | |
Abilitare la protezione con password | |
Trascrizioni di Livestream pianificate |
Supporto linguistico | 57 lingue più dialetti e accenti |
---|---|
Rilevamento automatico della lingua | |
Segmentazione del paragrafo | |
Sintesi | |
Word-Level Time Stamps | |
Allineamento a livello di parola | |
Speaker Diarization |
Aiuto & supporto | Supporto via e-mail e live chat |
---|---|
SLA |
VocalStack utilizza grandi modelli linguistici (LLM) per ottenere la migliore qualità di trascrizione possibile, anche negli ambienti audio più impegnativi. Questo include Whisper, che serve come modello di base per la piattaforma VocalStack. Il grande modello Whisper è un modello di IA all'avanguardia che è stato addestrato su una vasta quantità di dati per comprendere e trascrivere il parlato con precisione.
Per capire meglio l'impatto delle dimensioni di un modello di IA, usiamo i diversi modelli Whisper per trascrivere un estratto fittizia:
No, non ti verrà addebitata l'intera ora. I nostri costi di fatturazione sono sempre calcolati per secondo di audio trascritto, indipendentemente dal fatto che la trascrizione sia un audio preregistrato o dal vivo. Ciò significa che vi verrà fatturato solo ciò che avete bisogno di trascrivere. L'unica eccezione è che l'audio deve durare almeno un minuto. In caso contrario, ti verrà addebitato l'intero minuto.
Per semplificare ulteriormente, ecco quanto ti verrà fatturato in ogni piano per una trascrizione preregistrata (assumendo che tu abbia utilizzato tutte le ore di trascrizione gratuite per il mese):
No, non ci sono costi nascosti. Paghi solo per la trascrizione del tuo contenuto audio. (In altre parole, solo per i costi elencati nella tabella dei prezzi. ) Altre funzionalità come il rilevamento automatico della lingua, traduzioni, riassunti, segmentazione dei paragrafi, rilevamento delle parole chiave e timestamp sono inclusi gratuitamente.
È importante sottolineare che il numero di traduzioni non influisce sul costo della trascrizione. Ad esempio, se trascrivi un file audio in inglese e poi lo traduci in spagnolo, francese e tedesco, ti verrà addebitata solo la trascrizione dell'audio in inglese. Questo vale anche per le trascrizioni dal vivo utilizzando Polyglot. È possibile eseguire un numero illimitato di traduzioni in qualsiasi momento senza costi aggiuntivi.
La trascrizione preregistrata si riferisce al processo di trascrizione di audio che è stato precedentemente registrato. Può essere caricato come file audio e trascritto in un secondo momento, rendendolo adatto per podcast, interviste, video e altri contenuti registrati.
La trascrizione dal vivo si riferisce al processo di trascrizione dell'audio in tempo reale mentre viene parlato. Ciò è utile per live stream, podcast, eventi, riunioni, lezioni e altri scenari in cui è richiesta la trascrizione immediata (ed eventualmente la traduzione)