VocalStack Logo

Documentation

Transkribieren von einem Mikrofon oder LiveStream

Transkribieren Sie Live-Sprache von einem Mikrofon oder Live-Stream

Transkriptionssitzungen

Überwachen und verwalten Sie den Transkriptionsstatus mit Sitzungen

Übersetzen einer Transkription

Übersetzen Sie transkribierten Text in eine andere Sprache

Audio aus URL transkribieren

Transkribieren Sie Sprache aus voraufgezeichnetem Audio in einer URL in Klartext

Clientseitige Authentifizierungs-Token

Erstellen Sie ein temporäres Authentifizierungstoken für clientseitige Anforderungen

Transkriptionsanfrage und Antwort

Gemeinsame Anforderungsoptionen und Antworten für alle Transkriptionsvorgänge

Transkribieren und Präsentieren einer Polyglot-Sitzung

Erstellen Sie eine Sitzung, die verwendet werden kann, um eine Live-Transkription über einen öffentlichen Link zu übertragen

Transkriptionsdaten abrufen

Dokumentation durchsuchen
Abrufen von Daten aus ausstehenden oder abgeschlossenen Transkriptionen. Dazu gehören die Transkriptionszeitleiste, Schlüsselwörter, Zusammenfassung und Absatzsegmente.
Sie können die VocalStack-API verwenden, um Transkriptionsdaten abzurufen, nachdem Sie mit einer der folgenden Methoden mit der Transkription von Audio gestartet haben:
Audio aus URL transkribieren
Transkribieren Sie Sprache aus voraufgezeichnetem Audio in einer URL in Klartext. Die wichtigsten Dateiformate werden unterstützt, einschließlich MP3, WAV, FLAC und OGG.
Transkribieren von einem Mikrofon oder LiveStream
Transkribieren Sie Live-Sprache von einem Mikrofon oder Live-Stream. Integrieren Sie Polyglot, um einen öffentlichen Link für die Transkription zu erstellen, den Benutzer in jeder Sprache lesen können.
Transkribieren und Präsentieren einer Polyglot-Sitzung
Erstellen Sie eine Sitzung, die verwendet werden kann, um eine Live-Transkription über einen öffentlichen Link zu übertragen. Benutzer können Live-Transkripte in ihrer bevorzugten Sprache lesen und sogar vergangene Transkripte, wenn Ihre Sitzung inaktiv ist.
Das Abrufen aller Transkriptionen wird mit erreicht Transcriptions aus dem VocalStack SDK:
JavaScript
import { Transcriptions } from '@vocalstack/js-sdk'; const sdk = new Transcriptions({ apiKey: 'YOUR-API-KEY' }); const transcriptions = await sdk.getAllTranscriptions(); transcriptions.data?.forEach((transcription) => { // the transcription ID (use this to get more details about the transcription) console.log(transcription.id); // 'waiting', 'processing', 'done', or 'error' console.log(transcription.status); // the time the transcription started console.log(transcription.start); // the time the transcription finalized console.log(transcription.end); // the keywords associated with the transcription console.log(transcription.keywords); // the length of the transcription in seconds console.log(transcription.duration); });
Um alle für eine Transkription verfügbaren Daten zu erhalten, müssen wir die Funktion. id von dieser Transkription. Die id Dieser wird zurückgegeben, wenn ein Transkriptionsprozess zum ersten Mal initiiert wird. Sie kann aber auch durch Betrachtung aller Transkriptionen mit der oben genannten API ermittelt werden.
Um eine bestimmte Transkription zu erhalten, verwenden Sie Transcriptions aus dem VocalStack SDK:
JavaScript
import { Transcriptions } from '@vocalstack/js-sdk'; const sdk = new Transcriptions({ apiKey: 'YOUR-API-KEY' }); const transcription = await sdk.getTranscription({ id: 'TRANSCRIPTION-ID' }); const data = transcription.data; if (data) { // the transcription ID (use this to get more details about the transcription) console.log(data.id); // 'waiting', 'processing', 'done', or 'error' console.log(data.status); // the time the transcription started console.log(data.start); // the time the transcription finalized console.log(data.end); // the keywords associated with the transcription console.log(data.keywords); // the length of the transcription in seconds console.log(data.duration); // an object with the transcription timeline console.log(data.timeline); // a summary of the transcription console.log(data.summary); // the entire transcription in paragraph form console.log(data.paragraphs); }
In den meisten Szenarien wären Sie nur daran interessiert, Daten für eine einzelne Transkription zu erhalten, wenn diese Transkription die Verarbeitung beendet hat. Das liegt daran, dass Transkriptionen asynchrone Vorgänge sind, deren Fortschritt asynchron überwacht werden kann, wo Sie den Transkriptionsprozess ausführen. Wenn Sie jedoch Transkriptionsdaten für eine Transkription anfordern, die noch aussteht, erhalten Sie trotzdem alle für diese Transkription verfügbaren Daten, einschließlich der aktuellsten Version. timeline.
Wenn eine Transkription abgeschlossen ist, hat sie eine Nachbearbeitung durchlaufen, und in diesem Fall enthalten die Transkriptionsdaten auch Werte für keywords, summary und paragraphs.
Überprüfen Sie das Antwortobjekt, das mit jeder Transkription zurückgegeben wird:
Transkriptionsanfrage und Antwort
Gemeinsame Anforderungsoptionen und Antworten für alle Transkriptionsvorgänge.Verwenden Sie Optionen, um die Transkriptionseinstellungen zu konfigurieren.
Scroll Up