VocalStack Logo

Documentation

Transkriptionsdaten abrufen

Abrufen von Daten aus ausstehenden oder abgeschlossenen Transkriptionen

Transkribieren von einem Mikrofon oder LiveStream

Transkribieren Sie Live-Sprache von einem Mikrofon oder Live-Stream

Transkriptionssitzungen

Überwachen und verwalten Sie den Transkriptionsstatus mit Sitzungen

Übersetzen einer Transkription

Übersetzen Sie transkribierten Text in eine andere Sprache

Audio aus URL transkribieren

Transkribieren Sie Sprache aus voraufgezeichnetem Audio in einer URL in Klartext

Clientseitige Authentifizierungs-Token

Erstellen Sie ein temporäres Authentifizierungstoken für clientseitige Anforderungen

Transkribieren und Präsentieren einer Polyglot-Sitzung

Erstellen Sie eine Sitzung, die verwendet werden kann, um eine Live-Transkription über einen öffentlichen Link zu übertragen

Transkriptionsanfrage und Antwort

Dokumentation durchsuchen
Gemeinsame Anforderungsoptionen und Antworten für alle Transkriptionsvorgänge.Verwenden Sie Optionen, um die Transkriptionseinstellungen zu konfigurieren.
VocalStack wird versuchen, Ihr Audio mit vernünftigen Standardkonfigurationsoptionen zu transkribieren. Sie können Ihre Transkriptionsanfrage jedoch mit den folgenden Optionen weiter konfigurieren:
  • languageDer ISO 639-1-Sprachcode für die Sprache. Zum Beispiel "en" (Englisch) oder "ro" (Rumänisch). Standardmäßig wird VocalStack versuchen, in allen Sprachen zu transkribieren, wenn diese Option nicht zur Verfügung steht. Dies kann für mehrsprachige Sprache nützlich sein. Wenn Sie jedoch die Sprache der Rede kennen, kann die Bereitstellung dieser Option die Transkriptionsgenauigkeit erhöhen. Die Dauer der Audiodatei in Sekunden.
  • duration_s Diese Option wird als Schutz verwendet, um sicherzustellen, dass Ihre Transkription nur dann erfolgt, wenn die Länge der Audiodatei mit der Dauer der Option übereinstimmt. Standardmäßig wird diese Option ignoriert und Transkriptionen werden unabhängig von ihrer Länge verarbeitet. Die maximale Dauer, die in Sekunden transkribiert werden kann. Verwenden Sie diese Option, wenn Sie die Menge der transkribierten Sprache begrenzen möchten.
  • max_duration_s Wenn Sie die gesamte Transkription verarbeiten möchten, unabhängig von ihrer Dauer (⚠️ mit Vorsicht verwenden). Standardmäßig ist diese Option auf gestellt. , wobei sichergestellt wird, dass nur die ersten zwei Stunden der Rede transkribiert werden.Transkriptionsantwort0Sie können die Transkriptionsdaten asynchron überwachen, sobald sie verfügbar sind, indem Sie 7200 Event-Handler, der die
Das AntwortobjektonDataThe response Das Objekt hat folgende Eigenschaften:
: Ein Wert zwischen 0 und 1, der den Prozentsatz des Transkriptionsfortschritts angibtresponse Wenn der Status "verarbeitet" oder "erledigt" lautet, wird das Zeitleistenobjekt verfügbar sein und die gesamte Transkription bis zu diesem Zeitpunkt anzeigen. Die Zeitleiste ist ein Array von Objekten, die diese Eigenschaften enthalten:
  • status: die Startzeit des Transkriptionssegments
  • data.progress: die Endzeit des Transkriptionssegments
  • data.timeline: der Textabschnitt im Transkriptionssegment: ein Schlüssel-Wert-Speicher von Sprachcodes in ISO 639-1 und Übersetzungen (diese Eigenschaft ist nur verfügbar, wenn die Transkription mindestens eine Übersetzung enthält)
    • startNachbearbeitung
    • endSobald die Transkription abgeschlossen ist, wird die Nachbearbeitung durchgeführt, an welcher Stelle die endgültige
    • text wird an gesendet
    • translations.In der letzten Antwort wird der Status der Transkription "fertig" sein, und diese neuen Eigenschaften werden in.
: eine Zusammenfassung der gesamten Transkription in einem Absatzresponse: die gesamte Transkription in Absätze gruppiert, nach Themen oder durch einen sinnvollen Übergang zu einem neuen Thema segmentiertonDataTypescript-UnterstützungdataDas JavaScript SDK von VocalStack unterstützt TypeScript vollständig. Zum Beispiel die
  • keywords Objekt hat die
  • summary type.
  • paragraphsΑίτημα για μεταγραφή
Ο κωδικός γλώσσας ISO 639-1 για την ομιλία.response Για παράδειγμα, "en" (Αγγλικά), ή "ro" (Ρουμανικά). Από προεπιλογή, το VocalStack θα προσπαθήσει να μεταγράψει σε όλες τις γλώσσες αν αυτή η επιλογή δεν παρέχεται. Αυτό μπορεί να είναι χρήσιμο για πολύγλωσση ομιλία. Ωστόσο, αν γνωρίζετε τη γλώσσα της ομιλίας, η παροχή αυτής της επιλογής μπορεί να αυξήσει την ακρίβεια της μεταγραφής. UrlTranscriptionResponseΗ διάρκεια, σε δευτερόλεπτα, του αρχείου ήχου.
TSTypeScript
import { UrlTranscription, UrlTranscriptionResponse } from '@vocalstack/js-sdk'; const sdk = new UrlTranscription({ apiKey: 'YOUR-API-KEY' }); const transcription = await sdk.start({ url: 'http://example.com/audio.mp3' }); transcription.onData((response: UrlTranscriptionResponse) => { console.log(response.data); });
Scroll Up