VocalStack Logo

Documentation

Obtener datos de transcripción

Obtenga datos de transcripciones pendientes o completadas

Transcribir desde un micrófono o LiveStream

Transcribe el discurso en vivo desde un micrófono o transmisión en vivo

Sesiones de transcripción

Monitoree y administre el estado de transcripción con sesiones

Traducir una transcripción

Traducir texto transcrito a otro idioma

Tokens de autenticación del lado del cliente

Crear un token de autenticación temporal para solicitudes del lado del cliente

Solicitud y respuesta de transcripción

Opciones de solicitud y respuestas comunes para todas las operaciones de transcripción

Transcribir y presentar una sesión políglota

Crear una sesión que se pueda utilizar para transmitir una transcripción en vivo a través de un enlace público compartible

Transcribir audio desde URL

Buscar en la documentación
Transcribir el discurso de audio pregrabado en una URL a texto plano. Los principales formatos de archivo son compatibles, incluyendo MP3, WAV, FLAC y OGG.
Transcribe un archivo de audio en una URL (como un mp3) a texto con solo unas pocas líneas de código:
JavaScript
import { UrlTranscription } from '@vocalstack/js-sdk'; const sdk = new UrlTranscription({ apiKey: 'YOUR-API-KEY' }); const transcription = await sdk.connect({ url: 'http://example.com/files/meaningless.mp3', }); transcription.start(); // This will print the transcription data as it comes in transcription.onData(console.log); /* { status: 'processing', data: { id: 'd1e7b3b0-7b3b-4b3b-8b3b-0b3b7b3b3b3b', operation: 'transcription-prerecorded', progress: 0.1, timeline: [ { start: 0, end: 7.52, text: 'Meaningless, meaningless, says the teacher, utterly meaningless, everything is meaningless.', language: 'en', translations: { ... }, }, ... ] } } */
Hay varias opciones de solicitud disponibles para personalizar la configuración de transcripción. Además, el objeto de respuesta proporciona diferentes datos en varias etapas del proceso de transcripción.
Solicitud y respuesta de transcripción
Opciones de solicitud y respuestas comunes para todas las operaciones de transcripción.Utilice las opciones para configurar los ajustes de transcripción.
Ahora veamos cómo podemos usar opciones personalizadas para configurar nuestro proceso de transcripción:
JavaScript
// Run "npm install @voca l-stack/js-sdk" to install the package import { UrlTranscription } from '@vocalstack/js-sdk'; // Get your key here ⇢ https://www.vocalstack.com/dashboard/api-keys const sdk = new UrlTranscription({ apiKey: 'YOUR-API-KEY' }); const transcription = await sdk.connect({ // URL to the audio file url: 'http://example.com/files/audio.mp3', // Optional: language of the speech spoken // (this can be used to improve the transcription accuracy) language: 'en', // Optional: the maximum duration to transcribe, in seconds // (if not provided, the entire audio file will be transcribed) max_duration_s: 1800, // Optional: the actual duration of the audio file, in seconds // (the transcription starts only if the audio file matches this duration) duration_s: 3600, }); // Start the transcription transcription.start(); // Listen for transcription data transcription.onData((response) => { const { status, data } = response; console.log(status); // 'waiting', 'processing', 'done', or 'error' if (data) { console.log(data.progress); // a value between 0 and 1 console.log(data.timeline); // an object with the transcription timeline } if (status === 'done') { console.log(data.summary); // a summary of the transcription console.log(data.keywords); // an array of keywords console.log(data.paragraphs); // the entire transcription in paragraph form } });
Una vez que hayas transcrito el discurso en tu archivo de audio, es posible que quieras pasar a una de las siguientes:
Obtener datos de transcripción
Obtenga datos de transcripciones pendientes o completadas. Esto incluye la línea de tiempo de transcripción, palabras clave, resumen y segmentos de párrafo.
Traducir una transcripción
Traducir texto transcrito a otro idioma. Esto se puede hacer para cualquier transcripción, incluyendo transcripciones pre-grabadas, transcripciones en vivo o transcripciones de sesiones de Polyglot.
Sesiones de transcripción
Monitoree y administre el estado de transcripción con sesiones. Usando sesiones puede volver a conectarse a una conexión asíncrona creada previamente.
Scroll Up