Documentation

For eksempel "en" (engelsk), eller "ro" (rumænsk). Som standard vil VocalStack forsøge at transskribere på alle sprog, hvis denne mulighed ikke er angivet. Dette kan være nyttigt for flersproget tale. Hvis du kender talesproget, kan denne indstilling dog øge transskriptionsnøjagtigheden.

languageLydfilens varighed i sekunder. Denne indstilling bruges som en vagt for at sikre, at din transskription kun sker, hvis længden af lydfilen matcher varigheden af indstillingen. Som standard ignoreres denne mulighed, og transskriptioner vil blive behandlet uanset deres længde. Den maksimale varighed, der kan transskriberes, i sekunder.
duration_s Brug denne indstilling, hvis du vil begrænse mængden af tale, der transskriberes. Sæt dette til hvis du ønsker at behandle hele transskriptionen, uanset dens varighed (⚠️ brug med forsigtighed). Som standard er denne indstilling sat til. , og sørg for, at kun de første to timer af talen bliver transskriberet.
max_duration_sTransskriptionssvarDu kan asynkront overvåge transskriptionsdataene, når de bliver tilgængelige ved hjælp af. hændelseshåndtering, som giver 0 - Nej, tak.7200Svarobjektet

The

objektet har følgende egenskaber:onData: En af "venter", "behandler", "færdig" eller "fejl"response: En værdi mellem 0 og 1, der angiver transskriptionsfremskridtet i procent

Hvis status er "processing" eller "done", vil tidslinjeobjektet være tilgængeligt, og vise hele transskriptionen tilgængelig op til dette punkt. Tidslinjen er en matrix af objekter, der indeholder disse egenskaber:

: starttidspunktet for transskriptionssegmentetresponse: sluttidspunktet for transskriptionssegmentet

status: den del af teksten i transskriptionssegmentet
data.progress: et nøgle-værdi lager af sprogkoder i ISO 639-1 og oversættelser (denne egenskab er kun tilgængelig, hvis transskriptionen har mindst én oversættelse)
data.timelineEfterbehandlingNår transskriptionen er færdig, vil efterbehandlingen finde sted, hvorefter den endelige.
- start vil blive sendt til
- end.I det endelige svar vil status for transskriptionen være "færdig", og disse nye egenskaber vil blive inkluderet i.
- text: et par nøgleord, der repræsenterer emner fra transskriptionen
- translations: et enkelt afsnits sammendrag af hele transskriptionen

: hele transskriptionen grupperet i afsnit, segmenteret efter temaer eller ved en meningsfuld overgang til et nyt emne

Typescript- understøttelseresponseVocalStacks JavaScript SDK har fuld TypeScript-understøttelse. For eksempel. onData objektet har data type.

keywords:,:
summary:,:
paragraphs:,

:,

:, response:,:UrlTranscriptionResponse:,:

TypeScript
import { UrlTranscription, UrlTranscriptionResponse } from '@vocalstack/js-sdk';

const sdk = new UrlTranscription({ apiKey: 'YOUR-API-KEY' });
const transcription = await sdk.start({ url: 'http://example.com/audio.mp3' });

transcription.onData((response: UrlTranscriptionResponse) => {
  console.log(response.data);
});

Scroll Up

Polyglot

Business

Lås op for verden med VocalStacks Polyglot Transskription!

Hvorfor store AI-modeller betyder noget i transskription

Dokumentation

API- reference

Documentation

Hent transskriptionsdata

Transskriber fra en mikrofon eller LiveStream

Transskriptionssessioner

Oversæt en transskription

Transskriber lyd fra URL

Tokens til godkendelse på klientsiden

Anmodning om transskription og svar

Transskriber og præsenter en Polyglot-session

Anmodning om transskription og svar

ISO 639-1 sprogkoden for talen.

The

Hvis status er "processing" eller "done", vil tidslinjeobjektet være tilgængeligt, og vise hele transskriptionen tilgængelig op til dette punkt. Tidslinjen er en matrix af objekter, der indeholder disse egenskaber:

: hele transskriptionen grupperet i afsnit, segmenteret efter temaer eller ved en meningsfuld overgang til et nyt emne

:,