VocalStack Logo

Prix simple - Qualité supérieure

Transcrivez la parole en texte à l'aide des modèles d'IA les plus grands et les plus puissants disponibles, notamment: OpenAI Whisper large-v3 LLM. Excellente gestion du bruit de fond, des accents multiples ou de la parole en direct.

🎉   Bienvenue à la version bêta de VocalStack!

Soyez un des premiers utilisateurs et recevez des heures de transcription gratuites supplémentaires chaque mois!

Hobby

$0

Pas de coûts récurrents

  • 8 heures de transcriptions gratuites par mois
  • Même transcription de haute qualité que dans les plans payants
  • Aucune carte de crédit requise pour les transcriptions mensuelles gratuites

Premium

$40

par mois

Facturée annuellement

AnnuellementMensuelle
Annuellement
  • 40 heures de transcriptions gratuites chaque mois
  • 0,35 $ par heure supplémentaire de transcription préenregistrée
  • 0,80 $ par heure supplémentaire de transcription en direct
  • Accès illimité à Polyglot
  • API pour l'accès programmatique

Enterprise

Prix sur mesure
Parlons-en
  • Transcriptions en illimité
  • Sessions simultanées illimitées
  • Support informatique dédié
  • SLA personnalisé

Comparaison des plans de prix

Premium

Un plan qui évolue avec vos besoins

$40

par mois

Facturée annuellement

AnnuellementMensuelle
Annuellement

Transcriptions
Les 40 premières heures sont gratuites chaque mois

Transcriptions préenregistrées
$0.35 par heure
Transcription en direct
$0.80 par heure

DevelopersIntégrez les fonctionnalités de VocalStack dans votre infrastructure existante en utilisant API ou JavaScript SDK.

Accès à l'API
Accès à la base de données
Services gérés
Limite du taux de transcription
max 50 sessions simultanées
Démarrage du serveur
warm boot in non-peak times

DashboardPrêt à l'emploi immédiatement après l'inscription à un compte. Aucune compétence technique requise. Accessible De n'importe quel appareil Avec un navigateur web.

Transcription audio à partir du fichier téléchargé
Transcrire l'audio à partir d'une URL
Transcription audio à partir d'un microphone
Exporter des sous-titres et des fichiers
Traduire les transcriptions
Polyglot

PolyglotPartagez votre transcription en direct via un lien public, et Les téléspectateurs peuvent lire dans leur langue préférée.

Transcription depuis Microphone
Transcrire depuis Live Stream
Transcriptions en temps réel via URL publique
Traductions en temps réel via URL publique
Transcriptions historiques via URL publique
Activer la protection par mot de passe
Transcriptions de Livestream planifiées

Améliorations de l'IASans frais supplémentaires, VocalStack exploite une gamme diversifiée de modèles d'IA pour améliorer considérablement la qualité de chaque transcription.

Soutien linguistique
57 langues plus dialectes et accents
Détection automatique de la langue
Segmentation de paragraphe
Résumé
Horodateurs au niveau du mot
Alignement au niveau des mots
Speaker Diarization

Appui

Aide & support
Support par e-mail et chat en direct
SLA

Calculateur de tarification

HobbyPremium
Hobby
AnnuellementMensuelle
Annuellement
Pré-enregistréLive
Pré-enregistré
Hobby
Pre-recorded
Premium
Pre-recordedBilled Annually

Questions fréquemment posées

VocalStack utilise de grands modèles linguistiques (LLM) pour obtenir la meilleure qualité de transcription possible, même dans les environnements audio les plus difficiles. Cela inclut Whisper, qui sert de modèle de base pour la plateforme VocalStack. Le grand modèle Whisper est un modèle d'IA de pointe qui a été formé sur une grande quantité de données pour comprendre et transcrire la parole avec précision.

Pour mieux comprendre l'impact de la taille d'un modèle d'IA, utilisons les différents modèles Whisper pour transcrire un extrait fictif:

97%
DifférenceTexte brut
Différence
In a quaint little cafée near the Thames, Claire chuckled as Pierre ate eight eclairs all in one go. Anticipating gastroesophageal reflux, he said, "nNope, they're not worth it!". Later, they called a Lyft to drive them to the park, as Pierre thinks it's cheaper than Uber. As they walked under the glow of the noctilucent sky, they jumped when they'd seen a bear clothed only in his bare fur. Pierre cried out loud, "Mon Dieu!" They both leapt hastily into the river and swam for Chiswick Eyot. "Phew!"
Original Text
In a quaint little café near the Thames, Claire chuckled as Pierre ate eight eclairs all in one go. Anticipating gastroesophageal reflux, he said "nope, they're not worth it!" Later, they called a Lyft to drive them to the park, as Pierre thinks its cheaper than Uber. As they walked under the glow of the noctilucent sky, they jumped when they'd seen a bear clothed only in his bare fur. Pierre cried out loud, "Mon Dieu!" They both leapt hastily into the river and swam for Chiswick Eyot. Phew!

Non, vous ne serez pas facturé pour l'heure entière. Nos coûts de facturation sont toujours calculés par seconde de transcription audio, que la transcription soit préenregistrée ou en direct. Cela signifie que vous ne serez facturé que pour ce que vous avez besoin de transcrire. La seule exception est que l'audio doit durer au moins une minute. Sinon, vous serez facturé pour la minute entière.

Pour simplifier davantage, voici ce que vous serez facturé dans chaque plan pour une transcription préenregistrée (en supposant que vous avez utilisé toutes vos heures de transcription gratuites pour le mois) :

30 minutes
Hobby Plan Coût de la transcription préenregistrée
$0.3500
Premium Plan Coût de la transcription préenregistrée
$0.1750

Non, il n'y a pas de coûts cachés. Vous ne payez que pour la transcription de votre contenu audio. (En d'autres termes, seulement pour les coûts indiqués dans le tableau des prix. ) D'autres fonctionnalités telles que la détection automatique de la langue, les traductions, les résumés, la segmentation des paragraphes, la détection des mots-clés et les horodatages sont incluses gratuitement.

Fait important, le nombre de traductions n'affecte pas le coût de la transcription. Par exemple, si vous transcrivez un fichier audio en anglais puis le traduisez en espagnol, français et allemand, vous ne serez facturé que pour la transcription de l'audio en anglais. Cela s'applique également aux transcriptions en direct utilisant Polyglot. Vous pouvez effectuer un nombre illimité de traductions à tout moment sans frais supplémentaires.

La transcription préenregistrée fait référence au processus de transcription de l'audio qui a été préalablement enregistré. Il peut être téléchargé en tant que fichier audio et transcrit ultérieurement, ce qui le rend approprié pour les podcasts, les interviews, les vidéos et autres contenus enregistrés.

La transcription en direct fait référence au processus de transcription de l'audio en temps réel au fur et à mesure qu'il est parlé. Ceci est utile pour les diffusions en direct, les podcasts, les événements, les réunions, les conférences et autres scénarios où une transcription immédiate (et éventuellement une traduction) est requise

Prise en charge de plus de 57 langues, y compris différents dialectes et accents. Les langues prises en charge sont les suivantes : afrikaans, arabe, arménien, azerbaïdjanais, biélorusse, bosniaque, bulgare, catalan, chinois, croate, tchèque, danois, néerlandais, anglais, estonien, finnois, français, galicien, allemand, grec, hébreu, hindi, hongrois, islandais, indonésien, italien, japonais, kannada, kazakh, coréen, letton, lituanien, macédonien, malais, marathi,.