VocalStack Logo

Documentation

Obter dados de transcrição

Obtenha dados de transcrições pendentes ou concluídas

Transcrever de um microfone ou LiveStream

Transcreva falas ao vivo de um microfone ou transmissão ao vivo

Sessões de transcrição

Monitore e gerencie o estado da transcrição com sessões

Traduzir uma transcrição

Traduza o texto transcrito para outro idioma

Transcrever áudio a partir de URL

Transcrever fala de áudio pré-gravado em um URL para texto simples

Tokens de autenticação do lado do cliente

Criar um token de autenticação temporário para solicitações do lado do cliente

Transcrever e Apresentar uma Sessão Poliglota

Crie uma sessão que possa ser usada para transmitir uma transcrição ao vivo por meio de um link compartilhável público

Pedido e Resposta de Transcrição

Procurar na documentação
Opções de solicitação e respostas comuns para todas as operações de transcrição. Use opções para configurar as configurações de transcrição.
Por exemplo, "en" (inglês), ou "ro" (romanês). Por padrão, VocalStack tentará transcrever em todos os idiomas se esta opção não for fornecida. Isso pode ser útil para discursos multilíngues. No entanto, se você conhece a língua do discurso, fornecer essa opção pode aumentar a precisão da transcrição.
  • languageA duração, em segundos, do arquivo de áudio. Esta opção é usada como uma proteção para garantir que a transcrição ocorra somente se o comprimento do arquivo de áudio corresponder à duração da opção. Por padrão, esta opção é ignorada, e as transcrições serão processadas independentemente do seu comprimento. A duração máxima que pode ser transcrita, em segundos.
  • duration_s Use esta opção se você quiser limitar a quantidade de fala transcrita. se você quiser processar toda a transcrição, independentemente da sua duração (⚠️ use com cuidado). Por padrão, esta opção é definida como. , assegurando que apenas as duas primeiras horas do discurso sejam transcritas.
  • max_duration_sResposta de transcriçãoVocê pode monitorar de forma assíncrona os dados de transcrição à medida que eles ficam disponíveis usando. manipulador de eventos que fornece o 0 Objecção.7200O objeto de resposta
O objeto tem as seguintes propriedades:onData: Um de "esperando", "processando", "feito" ou "erro"response: Um valor entre 0 e 1 que indica a porcentagem de progresso da transcrição
: o tempo de início do segmento de transcriçãoresponse: o tempo de término do segmento de transcrição
  • status: o pedaço de texto no segmento de transcrição
  • data.progress: um armazenamento de chave-valor de códigos de idiomas em ISO 639-1 e traduções (essa propriedade só está disponível se a transcrição tiver pelo menos uma tradução)
  • data.timelinePós-processamentoUma vez que a transcrição está completa, o pós-processamento ocorrerá, em que ponto o
    • start será enviado para
    • end.Na resposta final, o status da transcrição será "concluído", e essas novas propriedades serão incluídas no ficheiro de transcrição.
    • text: algumas palavras-chave que representam tópicos da transcrição
    • translations: um único parágrafo de resumo de toda a transcrição
Suporte para TypescriptresponseO SDK JavaScript do VocalStack tem suporte completo para TypeScript. Por exemplo, o onData objecto tem o data type.
  • keywords:,:
  • summary:,:
  • paragraphs:,
:, response:,:UrlTranscriptionResponse:,:
TSTypeScript
import { UrlTranscription, UrlTranscriptionResponse } from '@vocalstack/js-sdk'; const sdk = new UrlTranscription({ apiKey: 'YOUR-API-KEY' }); const transcription = await sdk.start({ url: 'http://example.com/audio.mp3' }); transcription.onData((response: UrlTranscriptionResponse) => { console.log(response.data); });
Scroll Up