Documentation

Por exemplo, "en" (inglês), ou "ro" (romanês). Por padrão, VocalStack tentará transcrever em todos os idiomas se esta opção não for fornecida. Isso pode ser útil para discursos multilíngues. No entanto, se você conhece a língua do discurso, fornecer essa opção pode aumentar a precisão da transcrição.

languageA duração, em segundos, do arquivo de áudio. Esta opção é usada como uma proteção para garantir que a transcrição ocorra somente se o comprimento do arquivo de áudio corresponder à duração da opção. Por padrão, esta opção é ignorada, e as transcrições serão processadas independentemente do seu comprimento. A duração máxima que pode ser transcrita, em segundos.
duration_s Use esta opção se você quiser limitar a quantidade de fala transcrita. se você quiser processar toda a transcrição, independentemente da sua duração (⚠️ use com cuidado). Por padrão, esta opção é definida como. , assegurando que apenas as duas primeiras horas do discurso sejam transcritas.
max_duration_sResposta de transcriçãoVocê pode monitorar de forma assíncrona os dados de transcrição à medida que eles ficam disponíveis usando. manipulador de eventos que fornece o 0 Objecção.7200O objeto de resposta

O

O objeto tem as seguintes propriedades:onData: Um de "esperando", "processando", "feito" ou "erro"response: Um valor entre 0 e 1 que indica a porcentagem de progresso da transcrição

Se o status for "processando" ou "concluído", o objeto da linha do tempo estará disponível, mostrando toda a transcrição disponível até esse ponto. A linha do tempo é um array de objetos contendo estas propriedades:

: o tempo de início do segmento de transcriçãoresponse: o tempo de término do segmento de transcrição

status: o pedaço de texto no segmento de transcrição
data.progress: um armazenamento de chave-valor de códigos de idiomas em ISO 639-1 e traduções (essa propriedade só está disponível se a transcrição tiver pelo menos uma tradução)
data.timelinePós-processamentoUma vez que a transcrição está completa, o pós-processamento ocorrerá, em que ponto o
- start será enviado para
- end.Na resposta final, o status da transcrição será "concluído", e essas novas propriedades serão incluídas no ficheiro de transcrição.
- text: algumas palavras-chave que representam tópicos da transcrição
- translations: um único parágrafo de resumo de toda a transcrição

: a transcrição inteira agrupada em parágrafos, segmentada por temas, ou por uma transição significativa para um novo tópico

Suporte para TypescriptresponseO SDK JavaScript do VocalStack tem suporte completo para TypeScript. Por exemplo, o onData objecto tem o data type.

keywords:,:
summary:,:
paragraphs:,

:,

:, response:,:UrlTranscriptionResponse:,:

TypeScript
import { UrlTranscription, UrlTranscriptionResponse } from '@vocalstack/js-sdk';

const sdk = new UrlTranscription({ apiKey: 'YOUR-API-KEY' });
const transcription = await sdk.start({ url: 'http://example.com/audio.mp3' });

transcription.onData((response: UrlTranscriptionResponse) => {
  console.log(response.data);
});

Scroll Up

Polyglot

Business

Desbloqueie o mundo com a transcrição poliglota da VocalStack!

Por que grandes modelos de IA são importantes na transcrição

Documentação

Referência da API

Documentation

Obter dados de transcrição

Transcrever de um microfone ou LiveStream

Sessões de transcrição

Traduzir uma transcrição

Transcrever áudio a partir de URL

Tokens de autenticação do lado do cliente

Pedido e Resposta de Transcrição

Transcrever e Apresentar uma Sessão Poliglota

Pedido e Resposta de Transcrição

O código de idioma ISO 639-1 para o discurso.

O

Se o status for "processando" ou "concluído", o objeto da linha do tempo estará disponível, mostrando toda a transcrição disponível até esse ponto. A linha do tempo é um array de objetos contendo estas propriedades:

: a transcrição inteira agrupada em parágrafos, segmentada por temas, ou por uma transição significativa para um novo tópico

:,