VocalStack Logo

Documentation

Hanki transkriptiotietoja

Hae tietoja odotettavissa olevista tai valmiista transkriptioista

Transkriptio-istunnot

Valvo ja hallitse transkriptiotilan istuntoja

Käännä transkriptio

Käännä transkriptoitu teksti toiselle kielelle

Puhtaaksi kirjoittaa ääntä URL-osoitteesta

Puheen transkriptio URL-osoitteessa olevasta valmiiksi tallennetusta äänestä pelkäksi tekstiksi

Asiakaspuolen todennusmerkit

Luo väliaikainen todennustunnus asiakaspuolen pyyntöjä varten

Transkriptiopyyntö ja vastaus

Kaikkien transkriptio-operaatioiden yhteiset pyyntöasetukset ja vastaukset

Polyglot-istunnon transkriptio ja esittely

Luo istunto, jota voidaan käyttää lähettämään live-puhekirjotusta julkisesti jaettavan linkin kautta

Puhtaaksi kirjoittaminen mikrofonista tai LiveStream-palvelusta

Selaa dokumentaatiota
Puhtaaksi kirjoita live-puhe mikrofonista tai live-suoratoisto. Integroi Polyglot-palveluun ja luo julkinen jaettavissa oleva linkki transkriptioon, jonka käyttäjät voivat lukea millä tahansa kielellä.
Jotta voisimme transkriboida mikrofonista, meidän on lähetettävä jatkuvasti äänitietovirtapaketteja VocalStack API:lle.
JavaScript
import { LiveTranscription } from '@vocalstack/js-sdk'; const sdk = new LiveTranscription({ apiKey: 'YOUR-API-KEY' }); const stream = await sdk.connect({ // Optional: Integrate this stream with a Polyglot session polyglot_id: 'YOUR-POLYGLOT-SESSION-ID', // Optional: language of the speech spoken // (this can be used to improve the transcription accuracy) language: 'en', // Optional: Translate the transcription to these languages translations: ['de'], // Optional: Stop the stream after this many seconds of inactivity timeout_period_s: 60, // Optional: Hard stop the stream after this many seconds max_duration_s: 300, }); // Start the stream stream.start(); // Get audio data from a microphone and send it to the stream // stream.sendBuffer(buffer); // *** This is a placeholder for the actual implementation *** // Manually stop the stream (in this example, after 60 seconds) // If max_duration_s is set, stopping the stream is optional setTimeout(() => stream.stop(), 60000); // Listen for stream transcription data stream.onData((response) => { const { status, data } = response; console.log(status); // 'waiting', 'processing', 'done', 'stopping' or 'error' if (data) { console.log(data.timeline); // an object with the transcription timeline } if (status === 'done') { console.log(data.summary); // a summary of the transcription console.log(data.keywords); // an array of keywords console.log(data.paragraphs); // the entire transcription in paragraph form } });
Äänivirran tietojen hankkiminen vaihtelee sen mukaan, missä ympäristössä haluat suorittaa transkriptio-operaation. Tässä on muutama esimerkki siitä, miten voit tehdä tämän:
NextJS:ssä sinun pitäisi asentaa paketti, joka voi hakea äänitietoja laitteeltasi, jonka voit sitten välittää VocalStack API:lle. Tässä on esimerkki:
JavaScript
const mic = require('mic'); // Create a new instance of the microphone utility const micInstance = mic(); // Get the audio input stream const micStream = micInstance.getAudioStream(); // Capture the audio data from the microphone micStream.on('data', (data) => { stream.sendBuffer(data); // send the buffer data to the VocalStack API }); // Start capturing audio from the microphone micInstance.start();
Verkkoselaimessa voit käyttää vaihtoehtoa. MediaRecorder (Voi olla myös hyvä idea käyttää pakettia kuten, joka on suunniteltu käyttämään.NET-ohjelmointirajapintaa.) recordrtc joka parantaa selaimen yhteensopivuutta)
JavaScript
// Request access to the microphone const mediaStream = await navigator.mediaDevices.getUserMedia({ audio: true }); // Create a MediaRecorder instance to capture audio data const mediaRecorder = new MediaRecorder(mediaStream); // Event handler to process audio data packets mediaRecorder.ondataavailable = async (event) => { const blob = event.data; // this is the audio packet (Blob) const buffer = await blob.arrayBuffer(); // convert the Blob to a Buffer stream.sendBuffer(buffer); // send the buffer data to the VocalStack API }; // Start capturing audio, and send it to the stream every second mediaRecorder.start(1000);
Huomaa, että jotta pääset käyttämään VocalStack API:a verkko-ohjelmissa, sinun on käytettävä todennusmerkkiä:
Asiakaspuolen todennusmerkit
Luo väliaikainen todennustunnus asiakaspuolen pyyntöjä varten. Toteuta API-pyynnöt turvallisesti verkkoselaimissa ilman, että API-avaimet paljastuvat.
VocalStack API:ta voidaan käyttää minkä tahansa HLS LiveStream URL:n transkriptioon, mukaan lukien lähteet kuten Youtube Live, Facebook Live ja Twitch. Huomaa, että streamin URL-osoitteen on oltava. .m3u8 .hls on tiedostotunniste, joka edustaa kelvollista HLS (HTTP Live Streaming) -soittolistatiedostoa.
JavaScript
import { LiveTranscription } from '@vocalstack/js-sdk'; const sdk = new LiveTranscription({ apiKey: 'YOUR-API-KEY' }); const stream = await sdk.connect({ // must be a valid HLS streaming protocol livestream_url: 'http://a.files.bbci.co.uk/media/live/manifesto/audio/simulcast/hls/nonuk/sbr_low/ak/bbc_world_service.m3u8', // The rest of these options are the same as for microphone live transcriptons }); stream.start(); stream.onData((response) => { // The response object is the same as the one // returned by microphone transcriptions });
Live-transkriptioiden integrointi Polyglotiin on yhtä helppoa kuin. polyglot_id vaihtoehto transkriptiopyyntöön, kuten yllä olevissa esimerkeissä on esitetty.
Polyglot luo julkisen jaettavan linkin, joka liittyy transkriptioihin (linkki voidaan suojata salasanalla):
  • Käyttäjät voivat lukea transkriptiosi reaaliajassa linkin kautta.
  • Käyttäjät voivat valita, millä kielellä he haluavat lukea transkription reaaliajassa.
  • Käyttäjät voivat lukea transkriptiosi myöhemmin, ja kaikki muut transkriptit integroidaan sinun tiettyyn Polyglot-istuntoosi.
Voit käyttää VocalStack API:a ja toteuttaa oman white label -käyttöliittymän sen sijaan, että käyttäisit VocalStackin tarjoamaa. Haluaisimme kuulla siitä, jos teet, jotta voimme oppia, miten voimme tehdä tuotteestamme paremman!
Lue lisää siitä, miten Polyglot toimii osoitteessa. Lisää tietoa vocalstack.com/polyglot.
Polyglot-istunnon transkriptio ja esittely
Luo istunto, jota voidaan käyttää lähettämään live-puhekirjotusta julkisesti jaettavan linkin kautta. Käyttäjät voivat lukea live-transkriptioita haluamallaan kielellä ja jopa aiempia transkriptioita, kun istuntosi on passiivinen.
Hanki transkriptiotietoja
Hae tietoja odotettavissa olevista tai valmiista transkriptioista. Tämä sisältää transkription aikajanan, avainsanat, yhteenvedon ja kappalesegmentit.
Asiakaspuolen todennusmerkit
Luo väliaikainen todennustunnus asiakaspuolen pyyntöjä varten. Toteuta API-pyynnöt turvallisesti verkkoselaimissa ilman, että API-avaimet paljastuvat.
Scroll Up