Transkribieren Sie Sprache in Text mit den größten und leistungsstärksten KI-Modellen, die verfügbar sind, einschließlich: OpenAI Whisper large-v3 LLM. Hervorragende Verarbeitung von Hintergrundgeräuschen, mehreren Akzenten oder Live-Sprache.
Werden Sie ein Early Adopter und erhalten Sie jeden Monat zusätzliche kostenlose Transkriptionsstunden!
Keine wiederkehrenden Kosten
Preis pro Monat
Monatlich in Rechnung gestelltJährlich in Rechnung gestellt
$40 Preis pro Monat Jährlich in Rechnung gestellt JährlichMonatlich Jährlich |
Voraufgezeichnete Transkriptionen | $0.35 pro Stunde |
---|---|
Live Transkription | $0.80 pro Stunde |
API Access | |
---|---|
Datenbankzugriff | |
Managed Services für Unternehmen | |
Transkriptionsrate begrenzen | max. 50 gleichzeitige Sitzungen |
Server Start | warm boot in non-peak times |
Audio aus hochgeladener Datei transkribieren | |
---|---|
Audio aus URL transkribieren | |
Audio aus dem Mikrofon transkribieren | |
Exportieren von Untertiteln und Dateien | |
Transkriptionen übersetzen | |
Polyglot |
Transkribieren von Mikrofon | |
---|---|
Transkribieren aus Live Stream | |
Echtzeit-Transkriptionen über öffentliche URL | |
Echtzeit-Übersetzungen über öffentliche URL | |
Historische Transkriptionen über öffentliche URL | |
Aktivieren des Kennwortschutzes | |
Geplante Livestream-Transkriptionen |
Sprachunterstützung für Windows | 57 Sprachen plus Dialekte & Akzente |
---|---|
Automatische Spracherkennung | |
Absatzsegmentierung | |
Summierung | |
Zeitstempel auf Wortebene | |
Ausrichtung auf Wortebene | |
Speaker Diarization |
Hilfe & Hilfe & Support | E-Mail und Live-Chat-Support |
---|---|
SLA |
VocalStack verwendet große Sprachmodelle (Large Language Models, LLMs), um die bestmögliche Transkriptionsqualität zu erzielen, selbst in den anspruchsvollsten Audioumgebungen. Dazu gehört Whisper, das als Kernmodell für die VocalStack-Plattform dient. Das große Whisper-Modell ist ein hochmodernes KI-Modell, das auf einer großen Datenmenge trainiert wurde, um Sprache genau zu verstehen und zu transkribieren.
Um die Auswirkungen der Größe eines KI-Modells besser zu verstehen, verwenden wir die verschiedenen Whisper-Modelle, um einen fiktiven Auszug zu transkribieren:
Nein, Sie werden nicht für die ganze Stunde in Rechnung gestellt. Unsere Abrechnungskosten werden immer pro Sekunde des transkribierten Audios berechnet, unabhängig davon, ob es sich um ein voraufgezeichnetes Audio oder ein Live-Audio handelt. Das bedeutet, dass Sie nur für das abgerechnet werden, was Sie transkribieren müssen. Die einzige Ausnahme ist, dass das Audio mindestens eine Minute lang sein muss. Andernfalls wird Ihnen die gesamte Minute in Rechnung gestellt.
Um es noch einfacher zu machen, hier ist, was Sie in jedem Plan für eine voraufgezeichnete Transkription in Rechnung gestellt werden (vorausgesetzt, Sie haben alle Ihre kostenlosen Transkriptionsstunden für den Monat aufgebraucht):
Nein, es gibt keine versteckten Kosten. Sie zahlen nur für die Transkription Ihrer Audioinhalte. (Mit anderen Worten, nur für die Kosten, die in der Preistabelle aufgeführt sind. ) Andere Funktionen wie automatische Spracherkennung, Übersetzungen, Zusammenfassungen, Absatzsegmentierung, Schlüsselworterkennung und Zeitstempel sind kostenlos enthalten.
Wichtig ist, dass die Anzahl der Übersetzungen die Transkriptionskosten nicht beeinflusst. Wenn Sie beispielsweise eine Audiodatei in Englisch transkribieren und sie dann in Spanisch, Französisch und Deutsch übersetzen, wird Ihnen nur die Transkription der englischen Audiodatei in Rechnung gestellt. Dies gilt auch für Live-Transkriptionen mit Polyglot. Sie können jederzeit eine unbegrenzte Anzahl von Übersetzungen ohne zusätzliche Kosten durchführen.
Voraufgezeichnete Transkription bezieht sich auf den Prozess der Transkription von Audio, das zuvor aufgenommen wurde. Es kann als Audiodatei hochgeladen und zu einem späteren Zeitpunkt transkribiert werden, so dass es für Podcasts, Interviews, Videos und andere aufgezeichnete Inhalte geeignet ist.
Live-Transkription bezieht sich auf den Prozess der Transkription von Audio in Echtzeit, während es gesprochen wird. Dies ist nützlich für Live-Streams, Podcasts, Veranstaltungen, Meetings, Vorlesungen und andere Szenarien, bei denen eine sofortige Transkription (und möglicherweise Übersetzung) erforderlich ist