Documentation

Hent transskriptionsdata

Hent data fra ventende eller afsluttede transskriptioner

Transskriber fra en mikrofon eller LiveStream

Transskribere fra en mikrofon
- På serveren
- I webbrowseren
Transskribere fra en HLS LiveStream
Integration med Polyglot
De næste trin

Transskriptionssessioner

Overvåg og administrer transskriptionsstatus med sessioner

Oversæt en transskription

Oversæt transskriberet tekst til et andet sprog

Transskriber lyd fra URL

Transskriber tale fra forudindspillet lyd i en URL til almindelig tekst

Tokens til godkendelse på klientsiden

Opret et midlertidigt godkendelsestegn til anmodninger på klientsiden

Anmodning om transskription og svar

Fælles anmodningsindstillinger og svar for alle transskriptionshandlinger Brug indstillinger til at konfigurere transskriptionsindstillingerne

Transskriber og præsenter en Polyglot-session

Opret en session, der kan bruges til at udsende en live-transskription via et offentligt link, der kan deles

Transskriber fra en mikrofon eller LiveStream

Gennemse dokumentation

Transskriber live tale fra en mikrofon eller live stream. Integrer med Polyglot for at skabe et offentligt link til transskriptionen, som brugerne kan læse på ethvert sprog.

Transskribere fra en mikrofon

For at transskribere fra en mikrofon skal vi løbende sende lyddatastrømpakker til VocalStack API.

JavaScript
import { LiveTranscription } from '@vocalstack/js-sdk';

const sdk = new LiveTranscription({ apiKey: 'YOUR-API-KEY' });

const stream = await sdk.connect({
  // Optional: Integrate this stream with a Polyglot session
  polyglot_id: 'YOUR-POLYGLOT-SESSION-ID',
  // Optional: language of the speech spoken
  // (this can be used to improve the transcription accuracy)
  language: 'en',
  // Optional: Translate the transcription to these languages
  translations: ['de'],
  // Optional: Stop the stream after this many seconds of inactivity
  timeout_period_s: 60,
  // Optional: Hard stop the stream after this many seconds
  max_duration_s: 300,
});

// Start the stream
stream.start();

// Get audio data from a microphone and send it to the stream
// stream.sendBuffer(buffer);
// *** This is a placeholder for the actual implementation ***

// Manually stop the stream (in this example, after 60 seconds)
// If max_duration_s is set, stopping the stream is optional
setTimeout(() => stream.stop(), 60000);

// Listen for stream transcription data
stream.onData((response) => {
  const { status, data } = response;
  console.log(status); // 'waiting', 'processing', 'done', 'stopping' or 'error'
  if (data) {
    console.log(data.timeline); // an object with the transcription timeline
  }
  if (status === 'done') {
    console.log(data.summary); // a summary of the transcription
    console.log(data.keywords); // an array of keywords
    console.log(data.paragraphs); // the entire transcription in paragraph form
  }
});

At få lydstrømsdataene vil variere baseret på det miljø, hvor du vil udføre transskriptionsoperationen. Her er et par eksempler på, hvordan du kan gøre dette:

På serveren

I NextJS skal du installere en pakke, der kan hente lyddata fra din enhed, som du derefter kan videresende til VocalStack API. Her er et eksempel:

JavaScript
const mic = require('mic');

// Create a new instance of the microphone utility
const micInstance = mic();

// Get the audio input stream
const micStream = micInstance.getAudioStream();

// Capture the audio data from the microphone
micStream.on('data', (data) => {
  stream.sendBuffer(data); // send the buffer data to the VocalStack API
});

// Start capturing audio from the microphone
micInstance.start();

I webbrowseren kan du bruge kommandoen. MediaRecorder (Det kan også være en god idé at bruge en pakke som.py, som kan bruges til at lave en.py-fil). recordrtc hvilket forbedrer browserkompatibilitet)

JavaScript
// Request access to the microphone
const mediaStream = await navigator.mediaDevices.getUserMedia({ audio: true });

// Create a MediaRecorder instance to capture audio data
const mediaRecorder = new MediaRecorder(mediaStream);

// Event handler to process audio data packets
mediaRecorder.ondataavailable = async (event) => {
  const blob = event.data; // this is the audio packet (Blob)
  const buffer = await blob.arrayBuffer(); // convert the Blob to a Buffer
  stream.sendBuffer(buffer); // send the buffer data to the VocalStack API
};

// Start capturing audio, and send it to the stream every second
mediaRecorder.start(1000);

Bemærk, at for at få adgang til VocalStack API på webklienter, skal du bruge et godkendelsestegn:

Tokens til godkendelse på klientsiden

Opret et midlertidigt godkendelsestegn til anmodninger på klientsiden. Implementer API-anmodninger sikkert i webbrowsere uden at afsløre dine API-nøgler.

Transskribere fra en HLS LiveStream

VocalStack API kan bruges til at transskribere enhver HLS LiveStream URL, herunder kilder som Youtube Live, Facebook Live og Twitch. Bemærk venligst, at stream URL skal være en. .m3u8 .hls er en filtypenavnetype, der repræsenterer en gyldig HLS (HTTP Live Streaming) afspilningslistefil.

JavaScript
import { LiveTranscription } from '@vocalstack/js-sdk';

const sdk = new LiveTranscription({ apiKey: 'YOUR-API-KEY' });

const stream = await sdk.connect({
  // must be a valid HLS streaming protocol
  livestream_url:
    'http://a.files.bbci.co.uk/media/live/manifesto/audio/simulcast/hls/nonuk/sbr_low/ak/bbc_world_service.m3u8',

  // The rest of these options are the same as for microphone live transcriptons
});

stream.start();

stream.onData((response) => {
  // The response object is the same as the one
  // returned by microphone transcriptions
});

Integration med Polyglot

Integration af live transskriptioner med Polyglot er så simpelt som at tilføje en. polyglot_ id mulighed for at anmode om transskription, som vist i eksemplerne ovenfor.

Ydelser

Polyglot opretter et offentligt link, der kan deles, til dine transskriptioner (linket kan være adgangskodebeskyttet):

Brugere kan læse din transskription i realtid ved hjælp af linket.
Brugere kan vælge det sprog, hvorpå de vil læse transskriptionen i realtid.
Brugere kan læse din transskription på et senere tidspunkt, og alle andre transskriptioner integreret med din særlige Polyglot session.

White labelling

Du er velkommen til at bruge VocalStack API og implementere din egen white labelled UI i stedet for at bruge den, der leveres af VocalStack. Vi vil meget gerne høre om det, hvis du gør, så vi kan lære om, hvordan vi kan gøre vores produkt bedre!

Lær mere om

Lær mere om hvordan Polyglot arbejder på. Læs mere på vocalstack.com/polyglot.

De næste trin

Transskriber og præsenter en Polyglot-session

Opret en session, der kan bruges til at udsende en live-transskription via et offentligt link, der kan deles. Brugere kan læse live-transskriptioner på deres foretrukne sprog og endda tidligere transskriptioner, når din session er inaktiv.

Hent transskriptionsdata

Hent data fra ventende eller afsluttede transskriptioner. Dette omfatter transskriptionstidslinjen, nøgleord, resumé og afsnitssegmenter.

Tokens til godkendelse på klientsiden

Opret et midlertidigt godkendelsestegn til anmodninger på klientsiden. Implementer API-anmodninger sikkert i webbrowsere uden at afsløre dine API-nøgler.

Scroll Up

Polyglot

Business

Lås op for verden med VocalStacks Polyglot Transskription!

Hvorfor store AI-modeller betyder noget i transskription

Dokumentation

API- reference

Documentation

Hent transskriptionsdata

Transskriber fra en mikrofon eller LiveStream

Transskriptionssessioner

Oversæt en transskription

Transskriber lyd fra URL

Tokens til godkendelse på klientsiden

Anmodning om transskription og svar

Transskriber og præsenter en Polyglot-session

Transskriber fra en mikrofon eller LiveStream