VocalStack Logo

Documentation

Obter os datos de transcrición

Obter datos de transcricións pendentes ou completadas

Transcreba desde un micrófono ou LiveStream

Transcreba o discurso en directo desde un micrófono ou unha transmisión en directo

Sesións de transcripción

Vixiar e xestionar o estado da transcrición con sesións

Traducir unha transcrición

Traducir o texto transcrito a outro idioma

Transcreba o son desde un URL

Transcríbe a voz de audio pregrabado nun URL a texto simple

Tokens de autenticación do lado do cliente

Crear un token de autenticación temporal para as solicitudes do lado do cliente

Transcreba e presente unha sesión de Polyglot

Crear unha sesión que se poida usar para difundir unha transcrición en directo mediante unha ligazón pública compartible

Solicitude e resposta de transcrición

Examinar a documentación
Opcións de petición e respostas comúns para todas as operacións de transcrición. Empregue as opcións para configurar as opcións de transcrición.
Por exemplo, "en" (inglés), ou "ro" (romanés). Por omisión, VocalStack tentará transcreber en todos os idiomas se non se fornece esta opción. Isto pode ser útil para a fala multilingüe. Porén, se coñece a lingua da fala, fornecer esta opción pode aumentar a precisión da transcrición.
  • languageA duración, en segundos, do ficheiro de son. Esta opción emprégase como garda para asegurar que a transcrición só se produce se a lonxitude do ficheiro de son coincide coa duración da opción. Por omisión, esta opción é ignorada, e as transcricións serán procesadas independentemente da súa lonxitude. A duración máxima que se pode transcreber, en segundos.
  • duration_s Use esta opción se quere limitar a cantidade de fala transcrita. Axuste isto a se quere procesar toda a transcrición, independentemente da súa duración (⚠️ use con coidado). Por omisión, esta opción está definida como , asegurando que só se transcríben as dúas primeiras horas do discurso.
  • max_duration_sResposta de transcripciónPode vixiar de forma asincrónica os datos de transcrición a medida que se fagan dispoñíbeis empregando xestor de eventos que fornece o 0 Obxecto.7200O obxecto de resposta
obxecto ten as seguintes propiedades:onData: Un de "agardando", "procesando", "feito" ou "erro"response: Un valor entre 0 e 1 que indica a porcentaxe de progreso da transcrición
: a hora de inicio do segmento de transcriciónresponse: a hora de fin do segmento de transcrición
  • status: o anaco de texto no segmento de transcrición
  • data.progress: un almacén de chave- valor de códigos de lingua en ISO 639- 1 e traducións (esta propiedade só está dispoñíbel se a transcrición ten polo menos unha tradución)
  • data.timelinePost- procesamentoUnha vez completada a transcrición, ocorrerá o post- procesamento, no que o ficheiro final será.
    • start será enviado a
    • end. Na resposta final, o estado da transcrición será "feito", e estas novas propiedades serán incluídas en.
    • text: algunhas palabras chave que representan temas da transcrición
    • translations: un resumo dun só parágrafo de toda a transcrición
Soporte de TypescriptresponseO SDK de JavaScript de VocalStack ten soporte completo para TypeScript. Por exemplo, o onData obxecto ten o data type.
  • keywords:,:
  • summary:,:
  • paragraphs:,
:, response:,:UrlTranscriptionResponse:,:
TSTypeScript
import { UrlTranscription, UrlTranscriptionResponse } from '@vocalstack/js-sdk'; const sdk = new UrlTranscription({ apiKey: 'YOUR-API-KEY' }); const transcription = await sdk.start({ url: 'http://example.com/audio.mp3' }); transcription.onData((response: UrlTranscriptionResponse) => { console.log(response.data); });
Scroll Up