VocalStack Logo

Documentation

Obtenir des données de transcription

Obtenez des données à partir de transcriptions en attente ou terminées

Transcrire à partir d'un microphone ou d'un LiveStream

Transcrire le discours en direct à partir d'un microphone ou d'un flux en direct

Sessions de transcription

Surveiller et gérer l'état de la transcription avec des sessions

Traduire une transcription

Traduire le texte transcrit dans une autre langue

Jetons d'authentification côté client

Créer un jeton d'authentification temporaire pour les requêtes côté client

Demande de transcription et réponse

Options et réponses de requête communes pour toutes les opérations de transcription

Transcrire et présenter une session polyglotte

Créer une session pouvant être utilisée pour diffuser une transcription en direct via un lien public partageable

Transcription audio à partir d'URL

Parcourir la documentation
Transcrire la parole d'un audio préenregistré dans une URL en texte brut. Les principaux formats de fichiers sont pris en charge, y compris MP3, WAV, FLAC et OGG.
Transcrire un fichier audio dans une URL (comme un mp3) en texte avec seulement quelques lignes de code:
JavaScript
import { UrlTranscription } from '@vocalstack/js-sdk'; const sdk = new UrlTranscription({ apiKey: 'YOUR-API-KEY' }); const transcription = await sdk.connect({ url: 'http://example.com/files/meaningless.mp3', }); transcription.start(); // This will print the transcription data as it comes in transcription.onData(console.log); /* { status: 'processing', data: { id: 'd1e7b3b0-7b3b-4b3b-8b3b-0b3b7b3b3b3b', operation: 'transcription-prerecorded', progress: 0.1, timeline: [ { start: 0, end: 7.52, text: 'Meaningless, meaningless, says the teacher, utterly meaningless, everything is meaningless.', language: 'en', translations: { ... }, }, ... ] } } */
Il existe plusieurs options de demande disponibles pour personnaliser les paramètres de transcription. De plus, l'objet de réponse fournit différentes données à différentes étapes du processus de transcription.
Demande de transcription et réponse
Options et réponses de requête communes pour toutes les opérations de transcription. Utilisez les options pour configurer les paramètres de transcription.
Voyons maintenant comment nous pouvons utiliser des options personnalisées pour configurer notre processus de transcription:
JavaScript
// Run "npm install @voca l-stack/js-sdk" to install the package import { UrlTranscription } from '@vocalstack/js-sdk'; // Get your key here ⇢ https://www.vocalstack.com/dashboard/api-keys const sdk = new UrlTranscription({ apiKey: 'YOUR-API-KEY' }); const transcription = await sdk.connect({ // URL to the audio file url: 'http://example.com/files/audio.mp3', // Optional: language of the speech spoken // (this can be used to improve the transcription accuracy) language: 'en', // Optional: the maximum duration to transcribe, in seconds // (if not provided, the entire audio file will be transcribed) max_duration_s: 1800, // Optional: the actual duration of the audio file, in seconds // (the transcription starts only if the audio file matches this duration) duration_s: 3600, }); // Start the transcription transcription.start(); // Listen for transcription data transcription.onData((response) => { const { status, data } = response; console.log(status); // 'waiting', 'processing', 'done', or 'error' if (data) { console.log(data.progress); // a value between 0 and 1 console.log(data.timeline); // an object with the transcription timeline } if (status === 'done') { console.log(data.summary); // a summary of the transcription console.log(data.keywords); // an array of keywords console.log(data.paragraphs); // the entire transcription in paragraph form } });
Une fois que vous avez transcrit le discours dans votre fichier audio, vous pouvez passer à l'une des options suivantes :
Obtenir des données de transcription
Obtenez des données à partir de transcriptions en attente ou terminées. Cela inclut la chronologie de la transcription, les mots clés, le résumé et les segments de paragraphe.
Traduire une transcription
Traduire le texte transcrit dans une autre langue. Cela peut être fait pour n'importe quelle transcription, y compris les transcriptions préenregistrées, les transcriptions en direct ou les transcriptions de session Polyglot.
Sessions de transcription
Surveiller et gérer l'état de la transcription avec des sessions. En utilisant les sessions, vous pouvez vous reconnecter à une connexion asynchrone précédemment créée.
Scroll Up