Abrufen von Daten aus ausstehenden oder abgeschlossenen Transkriptionen
Transkribieren Sie Live-Sprache von einem Mikrofon oder Live-Stream
Überwachen und verwalten Sie den Transkriptionsstatus mit Sitzungen
Übersetzen Sie transkribierten Text in eine andere Sprache
Transkribieren Sie Sprache aus voraufgezeichnetem Audio in einer URL in Klartext
Erstellen Sie ein temporäres Authentifizierungstoken für clientseitige Anforderungen
Erstellen Sie eine Sitzung, die verwendet werden kann, um eine Live-Transkription über einen öffentlichen Link zu übertragen
language
Der ISO 639-1-Sprachcode für die Sprache. Zum Beispiel "en" (Englisch) oder "ro" (Rumänisch). Standardmäßig wird VocalStack versuchen, in allen Sprachen zu transkribieren, wenn diese Option nicht zur Verfügung steht. Dies kann für mehrsprachige Sprache nützlich sein. Wenn Sie jedoch die Sprache der Rede kennen, kann die Bereitstellung dieser Option die Transkriptionsgenauigkeit erhöhen. Die Dauer der Audiodatei in Sekunden. duration_s
Diese Option wird als Schutz verwendet, um sicherzustellen, dass Ihre Transkription nur dann erfolgt, wenn die Länge der Audiodatei mit der Dauer der Option übereinstimmt. Standardmäßig wird diese Option ignoriert und Transkriptionen werden unabhängig von ihrer Länge verarbeitet. Die maximale Dauer, die in Sekunden transkribiert werden kann. Verwenden Sie diese Option, wenn Sie die Menge der transkribierten Sprache begrenzen möchten. max_duration_s
Wenn Sie die gesamte Transkription verarbeiten möchten, unabhängig von ihrer Dauer (⚠️ mit Vorsicht verwenden). Standardmäßig ist diese Option auf gestellt. , wobei sichergestellt wird, dass nur die ersten zwei Stunden der Rede transkribiert werden.Transkriptionsantwort0
Sie können die Transkriptionsdaten asynchron überwachen, sobald sie verfügbar sind, indem Sie 7200
Event-Handler, der die onData
The response
Das Objekt hat folgende Eigenschaften:response
Wenn der Status "verarbeitet" oder "erledigt" lautet, wird das Zeitleistenobjekt verfügbar sein und die gesamte Transkription bis zu diesem Zeitpunkt anzeigen. Die Zeitleiste ist ein Array von Objekten, die diese Eigenschaften enthalten:status
: die Startzeit des Transkriptionssegmentsdata.progress
: die Endzeit des Transkriptionssegmentsdata.timeline
: der Textabschnitt im Transkriptionssegment: ein Schlüssel-Wert-Speicher von Sprachcodes in ISO 639-1 und Übersetzungen (diese Eigenschaft ist nur verfügbar, wenn die Transkription mindestens eine Übersetzung enthält)start
Nachbearbeitungend
Sobald die Transkription abgeschlossen ist, wird die Nachbearbeitung durchgeführt, an welcher Stelle die endgültige text
wird an gesendet translations
.In der letzten Antwort wird der Status der Transkription "fertig" sein, und diese neuen Eigenschaften werden in. response
: die gesamte Transkription in Absätze gruppiert, nach Themen oder durch einen sinnvollen Übergang zu einem neuen Thema segmentiertonData
Typescript-Unterstützungdata
Das JavaScript SDK von VocalStack unterstützt TypeScript vollständig. Zum Beispiel die keywords
Objekt hat die summary
type. paragraphs
Αίτημα για μεταγραφήresponse
Για παράδειγμα, "en" (Αγγλικά), ή "ro" (Ρουμανικά). Από προεπιλογή, το VocalStack θα προσπαθήσει να μεταγράψει σε όλες τις γλώσσες αν αυτή η επιλογή δεν παρέχεται. Αυτό μπορεί να είναι χρήσιμο για πολύγλωσση ομιλία. Ωστόσο, αν γνωρίζετε τη γλώσσα της ομιλίας, η παροχή αυτής της επιλογής μπορεί να αυξήσει την ακρίβεια της μεταγραφής. UrlTranscriptionResponse
Η διάρκεια, σε δευτερόλεπτα, του αρχείου ήχου. TypeScriptimport { UrlTranscription, UrlTranscriptionResponse } from '@vocalstack/js-sdk'; const sdk = new UrlTranscription({ apiKey: 'YOUR-API-KEY' }); const transcription = await sdk.start({ url: 'http://example.com/audio.mp3' }); transcription.onData((response: UrlTranscriptionResponse) => { console.log(response.data); });