VocalStack Logo

Documentation

Transkriptionsdaten abrufen

Abrufen von Daten aus ausstehenden oder abgeschlossenen Transkriptionen

Transkribieren von einem Mikrofon oder LiveStream

Transkribieren Sie Live-Sprache von einem Mikrofon oder Live-Stream

Transkriptionssitzungen

Überwachen und verwalten Sie den Transkriptionsstatus mit Sitzungen

Übersetzen einer Transkription

Übersetzen Sie transkribierten Text in eine andere Sprache

Clientseitige Authentifizierungs-Token

Erstellen Sie ein temporäres Authentifizierungstoken für clientseitige Anforderungen

Transkriptionsanfrage und Antwort

Gemeinsame Anforderungsoptionen und Antworten für alle Transkriptionsvorgänge

Transkribieren und Präsentieren einer Polyglot-Sitzung

Erstellen Sie eine Sitzung, die verwendet werden kann, um eine Live-Transkription über einen öffentlichen Link zu übertragen

Audio aus URL transkribieren

Dokumentation durchsuchen
Transkribieren Sie Sprache aus voraufgezeichnetem Audio in einer URL in Klartext. Die wichtigsten Dateiformate werden unterstützt, einschließlich MP3, WAV, FLAC und OGG.
Transkribieren Sie eine Audiodatei in einer URL (wie z.B. eine MP3) in Text mit nur wenigen Zeilen Code:
JavaScript
import { UrlTranscription } from '@vocalstack/js-sdk'; const sdk = new UrlTranscription({ apiKey: 'YOUR-API-KEY' }); const transcription = await sdk.connect({ url: 'http://example.com/files/meaningless.mp3', }); transcription.start(); // This will print the transcription data as it comes in transcription.onData(console.log); /* { status: 'processing', data: { id: 'd1e7b3b0-7b3b-4b3b-8b3b-0b3b7b3b3b3b', operation: 'transcription-prerecorded', progress: 0.1, timeline: [ { start: 0, end: 7.52, text: 'Meaningless, meaningless, says the teacher, utterly meaningless, everything is meaningless.', language: 'en', translations: { ... }, }, ... ] } } */
Es stehen mehrere Anforderungsoptionen zur Verfügung, um die Transkriptionseinstellungen anzupassen. Darüber hinaus stellt das Antwortobjekt in verschiedenen Phasen des Transkriptionsprozesses unterschiedliche Daten bereit.
Transkriptionsanfrage und Antwort
Gemeinsame Anforderungsoptionen und Antworten für alle Transkriptionsvorgänge.Verwenden Sie Optionen, um die Transkriptionseinstellungen zu konfigurieren.
Schauen wir uns nun an, wie wir benutzerdefinierte Optionen verwenden können, um unseren Transkriptionsprozess zu konfigurieren:
JavaScript
// Run "npm install @voca l-stack/js-sdk" to install the package import { UrlTranscription } from '@vocalstack/js-sdk'; // Get your key here ⇢ https://www.vocalstack.com/dashboard/api-keys const sdk = new UrlTranscription({ apiKey: 'YOUR-API-KEY' }); const transcription = await sdk.connect({ // URL to the audio file url: 'http://example.com/files/audio.mp3', // Optional: language of the speech spoken // (this can be used to improve the transcription accuracy) language: 'en', // Optional: the maximum duration to transcribe, in seconds // (if not provided, the entire audio file will be transcribed) max_duration_s: 1800, // Optional: the actual duration of the audio file, in seconds // (the transcription starts only if the audio file matches this duration) duration_s: 3600, }); // Start the transcription transcription.start(); // Listen for transcription data transcription.onData((response) => { const { status, data } = response; console.log(status); // 'waiting', 'processing', 'done', or 'error' if (data) { console.log(data.progress); // a value between 0 and 1 console.log(data.timeline); // an object with the transcription timeline } if (status === 'done') { console.log(data.summary); // a summary of the transcription console.log(data.keywords); // an array of keywords console.log(data.paragraphs); // the entire transcription in paragraph form } });
Wenn Sie die Rede in Ihre Audiodatei transkribiert haben, können Sie mit einer der folgenden Aktionen fortfahren:
Transkriptionsdaten abrufen
Abrufen von Daten aus ausstehenden oder abgeschlossenen Transkriptionen. Dazu gehören die Transkriptionszeitleiste, Schlüsselwörter, Zusammenfassung und Absatzsegmente.
Übersetzen einer Transkription
Übersetzen Sie transkribierten Text in eine andere Sprache. Dies kann für jede Transkription erfolgen, einschließlich voraufgezeichneter Transkriptionen, Live-Transkriptionen oder Transkriptionen von Polyglot-Sitzungen.
Transkriptionssitzungen
Überwachen und verwalten Sie den Transkriptionsstatus mit Sitzungen. Mit Sessions können Sie eine zuvor erstellte asynchrone Verbindung wiederherstellen.
Scroll Up