Documentation

Por exemplo, "en" (inglés), ou "ro" (romanés). Por omisión, VocalStack tentará transcreber en todos os idiomas se non se fornece esta opción. Isto pode ser útil para a fala multilingüe. Porén, se coñece a lingua da fala, fornecer esta opción pode aumentar a precisión da transcrición.

languageA duración, en segundos, do ficheiro de son. Esta opción emprégase como garda para asegurar que a transcrición só se produce se a lonxitude do ficheiro de son coincide coa duración da opción. Por omisión, esta opción é ignorada, e as transcricións serán procesadas independentemente da súa lonxitude. A duración máxima que se pode transcreber, en segundos.
duration_s Use esta opción se quere limitar a cantidade de fala transcrita. Axuste isto a se quere procesar toda a transcrición, independentemente da súa duración (⚠️ use con coidado). Por omisión, esta opción está definida como , asegurando que só se transcríben as dúas primeiras horas do discurso.
max_duration_sResposta de transcripciónPode vixiar de forma asincrónica os datos de transcrición a medida que se fagan dispoñíbeis empregando xestor de eventos que fornece o 0 Obxecto.7200O obxecto de resposta

O

obxecto ten as seguintes propiedades:onData: Un de "agardando", "procesando", "feito" ou "erro"response: Un valor entre 0 e 1 que indica a porcentaxe de progreso da transcrición

Se o estado é "procesando" ou "feito", o obxecto da liña de tempo estará dispoñíbel, mostrando toda a transcrición dispoñíbel ata ese punto. A liña de tempo é unha matriz de obxectos que contén estas propiedades:

: a hora de inicio do segmento de transcriciónresponse: a hora de fin do segmento de transcrición

status: o anaco de texto no segmento de transcrición
data.progress: un almacén de chave- valor de códigos de lingua en ISO 639- 1 e traducións (esta propiedade só está dispoñíbel se a transcrición ten polo menos unha tradución)
data.timelinePost- procesamentoUnha vez completada a transcrición, ocorrerá o post- procesamento, no que o ficheiro final será.
- start será enviado a
- end. Na resposta final, o estado da transcrición será "feito", e estas novas propiedades serán incluídas en.
- text: algunhas palabras chave que representan temas da transcrición
- translations: un resumo dun só parágrafo de toda a transcrición

: a transcrición completa agrupada en parágrafos, segmentados por temas, ou por unha transición significativa a un novo tema

Soporte de TypescriptresponseO SDK de JavaScript de VocalStack ten soporte completo para TypeScript. Por exemplo, o onData obxecto ten o data type.

keywords:,:
summary:,:
paragraphs:,

:,

:, response:,:UrlTranscriptionResponse:,:

TypeScript
import { UrlTranscription, UrlTranscriptionResponse } from '@vocalstack/js-sdk';

const sdk = new UrlTranscription({ apiKey: 'YOUR-API-KEY' });
const transcription = await sdk.start({ url: 'http://example.com/audio.mp3' });

transcription.onData((response: UrlTranscriptionResponse) => {
  console.log(response.data);
});

Scroll Up

Polyglot

Business

Desbloquee o mundo coa transcripción poliglota de VocalStack!

Por que os grandes modelos de IA importan na transcrición

Documentación

Referencia da API

Documentation

Obter os datos de transcrición

Transcreba desde un micrófono ou LiveStream

Sesións de transcripción

Traducir unha transcrición

Transcreba o son desde un URL

Tokens de autenticación do lado do cliente

Solicitude e resposta de transcrición

Transcreba e presente unha sesión de Polyglot

Solicitude e resposta de transcrición

O código ISO 639- 1 da lingua para o discurso.

O

Se o estado é "procesando" ou "feito", o obxecto da liña de tempo estará dispoñíbel, mostrando toda a transcrición dispoñíbel ata ese punto. A liña de tempo é unha matriz de obxectos que contén estas propiedades:

: a transcrición completa agrupada en parágrafos, segmentados por temas, ou por unha transición significativa a un novo tema

:,