VocalStack Logo

Documentation

Obter dados de transcrição

Obtenha dados de transcrições pendentes ou concluídas

Transcrever de um microfone ou LiveStream

Transcreva falas ao vivo de um microfone ou transmissão ao vivo

Sessões de transcrição

Monitore e gerencie o estado da transcrição com sessões

Traduzir uma transcrição

Traduza o texto transcrito para outro idioma

Tokens de autenticação do lado do cliente

Criar um token de autenticação temporário para solicitações do lado do cliente

Pedido e Resposta de Transcrição

Opções de solicitação e respostas comuns para todas as operações de transcrição

Transcrever e Apresentar uma Sessão Poliglota

Crie uma sessão que possa ser usada para transmitir uma transcrição ao vivo por meio de um link compartilhável público

Transcrever áudio a partir de URL

Procurar na documentação
Transcrever fala de áudio pré-gravado em um URL para texto simples. Os principais formatos de arquivo são suportados, incluindo MP3, WAV, FLAC e OGG.
Transcreva um arquivo de áudio em um URL (como um mp3) para texto com apenas algumas linhas de código:
JavaScript
import { UrlTranscription } from '@vocalstack/js-sdk'; const sdk = new UrlTranscription({ apiKey: 'YOUR-API-KEY' }); const transcription = await sdk.connect({ url: 'http://example.com/files/meaningless.mp3', }); transcription.start(); // This will print the transcription data as it comes in transcription.onData(console.log); /* { status: 'processing', data: { id: 'd1e7b3b0-7b3b-4b3b-8b3b-0b3b7b3b3b3b', operation: 'transcription-prerecorded', progress: 0.1, timeline: [ { start: 0, end: 7.52, text: 'Meaningless, meaningless, says the teacher, utterly meaningless, everything is meaningless.', language: 'en', translations: { ... }, }, ... ] } } */
Existem várias opções de solicitação disponíveis para personalizar as configurações de transcrição. Além disso, o objeto de resposta fornece dados diferentes em vários estágios do processo de transcrição.
Pedido e Resposta de Transcrição
Opções de solicitação e respostas comuns para todas as operações de transcrição. Use opções para configurar as configurações de transcrição.
Agora vamos ver como podemos usar opções personalizadas para configurar nosso processo de transcrição:
JavaScript
// Run "npm install @voca l-stack/js-sdk" to install the package import { UrlTranscription } from '@vocalstack/js-sdk'; // Get your key here ⇢ https://www.vocalstack.com/dashboard/api-keys const sdk = new UrlTranscription({ apiKey: 'YOUR-API-KEY' }); const transcription = await sdk.connect({ // URL to the audio file url: 'http://example.com/files/audio.mp3', // Optional: language of the speech spoken // (this can be used to improve the transcription accuracy) language: 'en', // Optional: the maximum duration to transcribe, in seconds // (if not provided, the entire audio file will be transcribed) max_duration_s: 1800, // Optional: the actual duration of the audio file, in seconds // (the transcription starts only if the audio file matches this duration) duration_s: 3600, }); // Start the transcription transcription.start(); // Listen for transcription data transcription.onData((response) => { const { status, data } = response; console.log(status); // 'waiting', 'processing', 'done', or 'error' if (data) { console.log(data.progress); // a value between 0 and 1 console.log(data.timeline); // an object with the transcription timeline } if (status === 'done') { console.log(data.summary); // a summary of the transcription console.log(data.keywords); // an array of keywords console.log(data.paragraphs); // the entire transcription in paragraph form } });
Depois de transcrever o discurso em seu arquivo de áudio, você pode querer passar para um dos seguintes:
Obter dados de transcrição
Obtenha dados de transcrições pendentes ou concluídas. Isso inclui a linha do tempo da transcrição, palavras-chave, resumo e segmentos de parágrafo.
Traduzir uma transcrição
Traduza o texto transcrito para outro idioma. Isso pode ser feito para qualquer transcrição, incluindo transcrições pré-gravadas, transcrições ao vivo ou transcrições de sessões Polyglot.
Sessões de transcrição
Monitore e gerencie o estado da transcrição com sessões. Usando sessões, você pode se reconectar a uma conexão assíncrona criada anteriormente.
Scroll Up