VocalStack Logo

Documentation

Obtén les dades de transcripció

Obtén dades de les transcripcions pendents o completades

Transcriviu des d'un micròfon o LiveStream

Transcriviu el discurs en directe des d'un micròfon o una transmissió en directe

Sessions de transcripció

Monitoritzeu i gestioneu l'estat de la transcripció amb sessions

Tradueix una transcripció

Tradueix el text transcrit a un altre idioma

Transcriu àudio des d' URL

Transcriu la veu d'àudio preenregistrat en un URL a text pla

Tokens d' autenticació del client

Crea un token d' autenticació temporal per a peticions del client

Transcriviu i presenteu una sessió poliglota

Crea una sessió que es pot usar per a emetre una transcripció en directe a través d' un enllaç públic compartible

Petició i resposta de transcripció

Navega per la documentació
Opcions de petició i respostes comunes per a totes les operacions de transcripció. Useu les opcions per a configurar els paràmetres de transcripció.
La durada màxima que es pot transcriure, en segons.
  • language Useu aquesta opció si voleu limitar la quantitat de veu transcrita. Establiu- ho a si voleu processar tota la transcripció, independentment de la seva durada (⚠️ useu-lo amb precaució). Per omissió, aquesta opció està establerta a , assegurant que només les primeres dues hores del discurs són transcrites.
  • duration_sResposta de transcripcióPodeu controlar de manera asíncrona les dades de transcripció a mesura que es fan disponibles usant gestor d' esdeveniments que proporciona el
  • max_duration_s Objecte.L' objecte de respostaEl 0 object té les següents propietats:7200:,
:, onData:,:response:,:
:, response:,
  • status: Un d' "esperant", "processant", "fet" o "error"
  • data.progress: Un valor entre 0 i 1 que indica el percentatge de progrés de la transcripció
  • data.timeline Si l' estat és "processant" o "fet", l' objecte de la línia de temps estarà disponible, mostrant tota la transcripció disponible fins a aquest punt. La línia de temps és un array d' objectes que conté aquestes propietats:: l' hora d' inici del segment de transcripció
    • start: l' hora de finalització del segment de transcripció
    • end: el tros de text en el segment de transcripció
    • text: un magatzem de valors clau dels codis d' idioma en ISO 639- 1 i traduccions (aquesta propietat només està disponible si la transcripció té almenys una traducció)
    • translationsPost- processament
serà enviat a response. En la resposta final, l' estat de la transcripció serà "fet", i aquestes noves propietats s' inclouran en. onData: algunes paraules clau que representen temes de la transcripciódata: un resum d' un sol paràgraf de tota la transcripció
  • keywords: la transcripció sencera agrupada en paràgrafs, segmentada per temes, o per una transició significativa a un nou tema
  • summaryImplementació de Typescript
  • paragraphsL' SDK JavaScript de VocalStack té compatibilitat completa amb TypeScript. Per exemple, el
tipus. response转录请求UrlTranscriptionResponseVocalStack 将尝试使用合理的默认配置选项转录您的音频。 但是,您可以使用以下选项进一步配置转录请求:
TSTypeScript
import { UrlTranscription, UrlTranscriptionResponse } from '@vocalstack/js-sdk'; const sdk = new UrlTranscription({ apiKey: 'YOUR-API-KEY' }); const transcription = await sdk.start({ url: 'http://example.com/audio.mp3' }); transcription.onData((response: UrlTranscriptionResponse) => { console.log(response.data); });
Scroll Up