Transcrivez la parole en texte à l'aide des modèles d'IA les plus grands et les plus puissants disponibles, notamment: OpenAI Whisper large-v3 LLM. Excellente gestion du bruit de fond, des accents multiples ou de la parole en direct.
Soyez un des premiers utilisateurs et recevez des heures de transcription gratuites supplémentaires chaque mois!
Pas de coûts récurrents
par mois
Facturée mensuellementFacturée annuellement
$40 par mois Facturée annuellement AnnuellementMensuelle |
Transcriptions préenregistrées | $0.35 par heure |
---|---|
Transcription en direct | $0.80 par heure |
Accès à l'API | |
---|---|
Accès à la base de données | |
Services gérés | |
Limite du taux de transcription | max 50 sessions simultanées |
Démarrage du serveur | warm boot in non-peak times |
Transcription audio à partir du fichier téléchargé | |
---|---|
Transcrire l'audio à partir d'une URL | |
Transcription audio à partir d'un microphone | |
Exporter des sous-titres et des fichiers | |
Traduire les transcriptions | |
Polyglot |
Transcription depuis Microphone | |
---|---|
Transcrire depuis Live Stream | |
Transcriptions en temps réel via URL publique | |
Traductions en temps réel via URL publique | |
Transcriptions historiques via URL publique | |
Activer la protection par mot de passe | |
Transcriptions de Livestream planifiées |
Soutien linguistique | 57 langues plus dialectes et accents |
---|---|
Détection automatique de la langue | |
Segmentation de paragraphe | |
Résumé | |
Horodateurs au niveau du mot | |
Alignement au niveau des mots | |
Speaker Diarization |
Aide & support | Support par e-mail et chat en direct |
---|---|
SLA |
VocalStack utilise de grands modèles linguistiques (LLM) pour obtenir la meilleure qualité de transcription possible, même dans les environnements audio les plus difficiles. Cela inclut Whisper, qui sert de modèle de base pour la plateforme VocalStack. Le grand modèle Whisper est un modèle d'IA de pointe qui a été formé sur une grande quantité de données pour comprendre et transcrire la parole avec précision.
Pour mieux comprendre l'impact de la taille d'un modèle d'IA, utilisons les différents modèles Whisper pour transcrire un extrait fictif:
Non, vous ne serez pas facturé pour l'heure entière. Nos coûts de facturation sont toujours calculés par seconde de transcription audio, que la transcription soit préenregistrée ou en direct. Cela signifie que vous ne serez facturé que pour ce que vous avez besoin de transcrire. La seule exception est que l'audio doit durer au moins une minute. Sinon, vous serez facturé pour la minute entière.
Pour simplifier davantage, voici ce que vous serez facturé dans chaque plan pour une transcription préenregistrée (en supposant que vous avez utilisé toutes vos heures de transcription gratuites pour le mois) :
Non, il n'y a pas de coûts cachés. Vous ne payez que pour la transcription de votre contenu audio. (En d'autres termes, seulement pour les coûts indiqués dans le tableau des prix. ) D'autres fonctionnalités telles que la détection automatique de la langue, les traductions, les résumés, la segmentation des paragraphes, la détection des mots-clés et les horodatages sont incluses gratuitement.
Fait important, le nombre de traductions n'affecte pas le coût de la transcription. Par exemple, si vous transcrivez un fichier audio en anglais puis le traduisez en espagnol, français et allemand, vous ne serez facturé que pour la transcription de l'audio en anglais. Cela s'applique également aux transcriptions en direct utilisant Polyglot. Vous pouvez effectuer un nombre illimité de traductions à tout moment sans frais supplémentaires.
La transcription préenregistrée fait référence au processus de transcription de l'audio qui a été préalablement enregistré. Il peut être téléchargé en tant que fichier audio et transcrit ultérieurement, ce qui le rend approprié pour les podcasts, les interviews, les vidéos et autres contenus enregistrés.
La transcription en direct fait référence au processus de transcription de l'audio en temps réel au fur et à mesure qu'il est parlé. Ceci est utile pour les diffusions en direct, les podcasts, les événements, les réunions, les conférences et autres scénarios où une transcription immédiate (et éventuellement une traduction) est requise