Documentation

Transkriptionsdaten abrufen

Abrufen von Daten aus ausstehenden oder abgeschlossenen Transkriptionen

Transkribieren von einem Mikrofon oder LiveStream

Transkribieren Sie Live-Sprache von einem Mikrofon oder Live-Stream

Transkriptionssitzungen

Überwachen und verwalten Sie den Transkriptionsstatus mit Sitzungen

Übersetzen einer Transkription

Übersetzen Sie transkribierten Text in eine andere Sprache

Audio aus URL transkribieren

Transkribieren Sie Sprache aus voraufgezeichnetem Audio in einer URL in Klartext

Clientseitige Authentifizierungs-Token

Erstellen Sie ein temporäres Authentifizierungstoken für clientseitige Anforderungen

Transkriptionsanfrage und Antwort

Anfrage nach Transkription
Einspruch.
- : Eine von "warten", "verarbeiten", "fertig" oder "Fehler"
- : ein paar Schlüsselwörter, die Themen aus der Transkription darstellen
Το VocalStack θα προσπαθήσει να μεταγράψει τον ήχο σας χρησιμοποιώντας λογικές προεπιλεγμένες επιλογές διαμόρφωσης. Ωστόσο, μπορείτε να ρυθμίσετε περαιτέρω το αίτημα μεταγραφής σας με τις ακόλουθες επιλογές:

Transkribieren und Präsentieren einer Polyglot-Sitzung

Erstellen Sie eine Sitzung, die verwendet werden kann, um eine Live-Transkription über einen öffentlichen Link zu übertragen

Transkriptionsanfrage und Antwort

Dokumentation durchsuchen

Gemeinsame Anforderungsoptionen und Antworten für alle Transkriptionsvorgänge.Verwenden Sie Optionen, um die Transkriptionseinstellungen zu konfigurieren.

Anfrage nach Transkription

VocalStack wird versuchen, Ihr Audio mit vernünftigen Standardkonfigurationsoptionen zu transkribieren. Sie können Ihre Transkriptionsanfrage jedoch mit den folgenden Optionen weiter konfigurieren:

languageDer ISO 639-1-Sprachcode für die Sprache. Zum Beispiel "en" (Englisch) oder "ro" (Rumänisch). Standardmäßig wird VocalStack versuchen, in allen Sprachen zu transkribieren, wenn diese Option nicht zur Verfügung steht. Dies kann für mehrsprachige Sprache nützlich sein. Wenn Sie jedoch die Sprache der Rede kennen, kann die Bereitstellung dieser Option die Transkriptionsgenauigkeit erhöhen. Die Dauer der Audiodatei in Sekunden.
duration_s Diese Option wird als Schutz verwendet, um sicherzustellen, dass Ihre Transkription nur dann erfolgt, wenn die Länge der Audiodatei mit der Dauer der Option übereinstimmt. Standardmäßig wird diese Option ignoriert und Transkriptionen werden unabhängig von ihrer Länge verarbeitet. Die maximale Dauer, die in Sekunden transkribiert werden kann. Verwenden Sie diese Option, wenn Sie die Menge der transkribierten Sprache begrenzen möchten.
max_duration_s Wenn Sie die gesamte Transkription verarbeiten möchten, unabhängig von ihrer Dauer (⚠️ mit Vorsicht verwenden). Standardmäßig ist diese Option auf gestellt. , wobei sichergestellt wird, dass nur die ersten zwei Stunden der Rede transkribiert werden.Transkriptionsantwort0Sie können die Transkriptionsdaten asynchron überwachen, sobald sie verfügbar sind, indem Sie 7200 Event-Handler, der die

Einspruch.

Das AntwortobjektonDataThe response Das Objekt hat folgende Eigenschaften:

: Eine von "warten", "verarbeiten", "fertig" oder "Fehler"

: Ein Wert zwischen 0 und 1, der den Prozentsatz des Transkriptionsfortschritts angibtresponse Wenn der Status "verarbeitet" oder "erledigt" lautet, wird das Zeitleistenobjekt verfügbar sein und die gesamte Transkription bis zu diesem Zeitpunkt anzeigen. Die Zeitleiste ist ein Array von Objekten, die diese Eigenschaften enthalten:

status: die Startzeit des Transkriptionssegments
data.progress: die Endzeit des Transkriptionssegments
data.timeline: der Textabschnitt im Transkriptionssegment: ein Schlüssel-Wert-Speicher von Sprachcodes in ISO 639-1 und Übersetzungen (diese Eigenschaft ist nur verfügbar, wenn die Transkription mindestens eine Übersetzung enthält)
- startNachbearbeitung
- endSobald die Transkription abgeschlossen ist, wird die Nachbearbeitung durchgeführt, an welcher Stelle die endgültige
- text wird an gesendet
- translations.In der letzten Antwort wird der Status der Transkription "fertig" sein, und diese neuen Eigenschaften werden in.

: ein paar Schlüsselwörter, die Themen aus der Transkription darstellen

: eine Zusammenfassung der gesamten Transkription in einem Absatzresponse: die gesamte Transkription in Absätze gruppiert, nach Themen oder durch einen sinnvollen Übergang zu einem neuen Thema segmentiertonDataTypescript-UnterstützungdataDas JavaScript SDK von VocalStack unterstützt TypeScript vollständig. Zum Beispiel die

keywords Objekt hat die
summary type.
paragraphsΑίτημα για μεταγραφή

Το VocalStack θα προσπαθήσει να μεταγράψει τον ήχο σας χρησιμοποιώντας λογικές προεπιλεγμένες επιλογές διαμόρφωσης. Ωστόσο, μπορείτε να ρυθμίσετε περαιτέρω το αίτημα μεταγραφής σας με τις ακόλουθες επιλογές:

Ο κωδικός γλώσσας ISO 639-1 για την ομιλία.response Για παράδειγμα, "en" (Αγγλικά), ή "ro" (Ρουμανικά). Από προεπιλογή, το VocalStack θα προσπαθήσει να μεταγράψει σε όλες τις γλώσσες αν αυτή η επιλογή δεν παρέχεται. Αυτό μπορεί να είναι χρήσιμο για πολύγλωσση ομιλία. Ωστόσο, αν γνωρίζετε τη γλώσσα της ομιλίας, η παροχή αυτής της επιλογής μπορεί να αυξήσει την ακρίβεια της μεταγραφής. UrlTranscriptionResponseΗ διάρκεια, σε δευτερόλεπτα, του αρχείου ήχου.

TypeScript
import { UrlTranscription, UrlTranscriptionResponse } from '@vocalstack/js-sdk';

const sdk = new UrlTranscription({ apiKey: 'YOUR-API-KEY' });
const transcription = await sdk.start({ url: 'http://example.com/audio.mp3' });

transcription.onData((response: UrlTranscriptionResponse) => {
  console.log(response.data);
});

Scroll Up

Polyglot

Business

Entdecken Sie die Welt mit VocalStacks Polyglot-Transkription!

Warum große KI-Modelle bei der Transkription wichtig sind

Dokumentation

API Referenz

Documentation

Transkriptionsdaten abrufen

Transkribieren von einem Mikrofon oder LiveStream

Transkriptionssitzungen

Übersetzen einer Transkription

Audio aus URL transkribieren

Clientseitige Authentifizierungs-Token

Transkriptionsanfrage und Antwort

Transkribieren und Präsentieren einer Polyglot-Sitzung

Transkriptionsanfrage und Antwort

Anfrage nach Transkription

Einspruch.

: Eine von "warten", "verarbeiten", "fertig" oder "Fehler"

: ein paar Schlüsselwörter, die Themen aus der Transkription darstellen