Documentation

VocalStack vil forsøke å transkribere lyden din ved hjelp av fornuftige standardkonfigurasjonsalternativer. Du kan imidlertid konfigurere transkripsjonsforespørselen ytterligere med følgende alternativer:

languageISO 639-1-språkkoden for talen. For eksempel "en" (engelsk), eller "ro" (rumensk). Som standard vil VocalStack forsøke å transkribere på alle språk hvis dette alternativet ikke er oppgitt. Dette kan være nyttig for flerspråklig tale. Hvis du imidlertid kjenner språket i talen, kan dette alternativet øke transkripsjonsnøyaktigheten. Varigheten i sekunder av lydfila.
duration_s Dette valget brukes som en vakt for å sikre at transkripsjonen bare skjer hvis lydfillengden samsvarer med varigheten for valget. Som standard ignoreres dette valget, og transkripsjoner vil bli behandlet uavhengig av lengden. Maksimal varighet som kan transkriberes, i sekunder. Bruk dette valget hvis du vil begrense mengden tale som transkriberes. Sett dette til
max_duration_s Hvis du ønsker å behandle hele transkripsjonen, uavhengig av varighet (⚠️ bruk med forsiktighet). Som standard er dette valget satt til. , og sørger for at bare de to første timene av talen blir transkribert.Transkripsjonssvar0Du kan asynkront overvåke transkripsjonsdataene etter hvert som de blir tilgjengelige ved hjelp av. 7200 hendelsesbehandler som gir

Objekt.

SvarobjektetonDataThe response objektet har følgende egenskaper:

: En av "venter", "behandler", "ferdig" eller "feil"

: En verdi mellom 0 og 1 som angir transkripsjonsfremdriften i prosentresponse Hvis statusen er "behandler" eller "ferdig" vil tidslinjeobjektet være tilgjengelig, og vise hele transkripsjonen som er tilgjengelig opp til dette punktet. Tidslinjen er en matrise av objekter som inneholder disse egenskapene:

status: starttidspunktet for transkripsjonssegmentet
data.progress: sluttid for transkripsjonssegmentet
data.timeline: teksten i transkripsjonssegmentet: et nøkkel-verdi-lager av språkkoder i ISO 639-1 og oversettelser (denne egenskapen er bare tilgjengelig hvis transkripsjonen har minst én oversettelse)
- startEtterbehandling
- endNår transkripsjonen er fullført, vil etterbehandlingen skje, på hvilket tidspunkt den endelige teksten vil bli skrevet.
- text vil bli sendt til
- translations.I det endelige svaret vil statusen for transkripsjonen være "ferdig", og disse nye egenskapene vil bli inkludert i.

: noen nøkkelord som representerer emner fra transkripsjonen

: et enkelt avsnitt oppsummering av hele transkripsjonenresponse: hele transkripsjonen gruppert i avsnitt, segmentert etter temaer, eller ved en meningsfull overgang til et nytt emneonDataTypescript- støttedataVocalStacks JavaScript SDK har full støtte for TypeScript. For eksempel

keywords objektet har
summary type.
paragraphsTranskrypcja

VocalStack spróbuje przetranskrybować dźwięk używając rozsądnych domyślnych opcji konfiguracji. Możesz jednak skonfigurować swoje żądanie transkrypcji z następujących opcji:

Kod języka ISO 639-1 dla tej mowy.response Na przykład "en" (angielski) lub "ro" (rumuński). Domyślnie VocalStack będzie próbował transkrybować we wszystkich językach, jeśli ta opcja nie jest podana. Może to być przydatne w przypadku mowy wielojęzycznej. Jeśli jednak znasz język mowy, udostępnienie tej opcji może zwiększyć dokładność transkrypcji. UrlTranscriptionResponseCzas trwania pliku audio w sekundach.

TypeScript
import { UrlTranscription, UrlTranscriptionResponse } from '@vocalstack/js-sdk';

const sdk = new UrlTranscription({ apiKey: 'YOUR-API-KEY' });
const transcription = await sdk.start({ url: 'http://example.com/audio.mp3' });

transcription.onData((response: UrlTranscriptionResponse) => {
  console.log(response.data);
});

Scroll Up

Polyglot

Business

Lås opp verden med VocalStack Polyglot Transkripsjon!

Hvorfor store AI-modeller betyr noe i transkripsjon

Dokumentasjon

API- referanse

Documentation

Hent transkripsjonsdata

Transkribere fra en mikrofon eller LiveStream

Transkripsjonsøkter

Oversett en transkripsjon

Transkriber lyd fra URL

Autentiseringstegn på klientsiden

Forespørsel om transkripsjon og svar

Transkribere og presentere en Polyglot-økt

Forespørsel om transkripsjon og svar

Transkripsjonsforespørsel

Objekt.

: En av "venter", "behandler", "ferdig" eller "feil"

: noen nøkkelord som representerer emner fra transkripsjonen

VocalStack spróbuje przetranskrybować dźwięk używając rozsądnych domyślnych opcji konfiguracji. Możesz jednak skonfigurować swoje żądanie transkrypcji z następujących opcji: