VocalStack Logo

Documentation

Λήψη δεδομένων μεταγραφής

Λήψη δεδομένων από εκκρεμείς ή ολοκληρωμένες μεταγραφές

Συνεδριάσεις μεταγραφής

Παρακολούθηση και διαχείριση της κατάστασης μεταγραφής με συνεδρίες

Μετάφραση μιας Μεταγραφής

Μετάφραση μεταγραφικού κειμένου σε άλλη γλώσσα

Μεταγραφή ήχου από διεύθυνση

Μεταγράψτε ομιλία από προ-ηχογραφημένο ήχο σε μια διεύθυνση URL σε απλό κείμενο

Διακριτικά ελέγχου ταυτότητας από την πλευρά του πελάτη

Δημιουργία προσωρινού διακριτικού ελέγχου ταυτότητας για αιτήματα από την πλευρά του πελάτη

Αίτημα και Απάντηση

Κοινές επιλογές αιτήματος και απαντήσεις για όλες τις λειτουργίες μεταγραφής Χρησιμοποιήστε τις επιλογές για να ρυθμίσετε τις παραμέτρους των ρυθμίσεων μεταγραφής

Μεταγράψτε και παρουσιάστε μια πολυγλωσσική συνεδρία

Δημιουργήστε μια συνεδρία που μπορεί να χρησιμοποιηθεί για τη μετάδοση μιας ζωντανής μεταγραφής μέσω ενός δημόσιου κοινόχρηστου συνδέσμου

Μεταγραφή από μικρόφωνο ή Ζωντανή ροή

Περιήγηση στην τεκμηρίωση
Μεταγράψτε ζωντανή ομιλία από ένα μικρόφωνο ή ζωντανή ροή. Ενσωματώστε το Polyglot για να δημιουργήσετε έναν δημόσιο κοινόχρηστο σύνδεσμο για τη μεταγραφή που οι χρήστες μπορούν να διαβάσουν σε οποιαδήποτε γλώσσα.
Για να μεταγράψουμε από ένα μικρόφωνο πρέπει συνεχώς να στέλνουμε πακέτα ροής δεδομένων ήχου στο API του VocalStack.
JavaScript
import { LiveTranscription } from '@vocalstack/js-sdk'; const sdk = new LiveTranscription({ apiKey: 'YOUR-API-KEY' }); const stream = await sdk.connect({ // Optional: Integrate this stream with a Polyglot session polyglot_id: 'YOUR-POLYGLOT-SESSION-ID', // Optional: language of the speech spoken // (this can be used to improve the transcription accuracy) language: 'en', // Optional: Translate the transcription to these languages translations: ['de'], // Optional: Stop the stream after this many seconds of inactivity timeout_period_s: 60, // Optional: Hard stop the stream after this many seconds max_duration_s: 300, }); // Start the stream stream.start(); // Get audio data from a microphone and send it to the stream // stream.sendBuffer(buffer); // *** This is a placeholder for the actual implementation *** // Manually stop the stream (in this example, after 60 seconds) // If max_duration_s is set, stopping the stream is optional setTimeout(() => stream.stop(), 60000); // Listen for stream transcription data stream.onData((response) => { const { status, data } = response; console.log(status); // 'waiting', 'processing', 'done', 'stopping' or 'error' if (data) { console.log(data.timeline); // an object with the transcription timeline } if (status === 'done') { console.log(data.summary); // a summary of the transcription console.log(data.keywords); // an array of keywords console.log(data.paragraphs); // the entire transcription in paragraph form } });
Η λήψη των δεδομένων ροής ήχου θα διαφέρει ανάλογα με το περιβάλλον στο οποίο θέλετε να εκτελέσετε τη λειτουργία μεταγραφής. Ακολουθούν μερικά παραδείγματα για το πώς μπορείτε να το κάνετε αυτό:
Στο NextJS θα πρέπει να εγκαταστήσετε ένα πακέτο που μπορεί να φέρει δεδομένα ήχου από τη συσκευή σας, τα οποία μπορείτε στη συνέχεια να προωθήσετε στο VocalStack API. Ακολουθεί ένα παράδειγμα:
JavaScript
const mic = require('mic'); // Create a new instance of the microphone utility const micInstance = mic(); // Get the audio input stream const micStream = micInstance.getAudioStream(); // Capture the audio data from the microphone micStream.on('data', (data) => { stream.sendBuffer(data); // send the buffer data to the VocalStack API }); // Start capturing audio from the microphone micInstance.start();
Στο πρόγραμμα περιήγησης ίσως θελήσετε να χρησιμοποιήσετε το. Εγγραφέας πολυμέσων (Μπορεί επίσης να είναι καλή ιδέα να χρησιμοποιήσετε ένα πακέτο όπως το ) Εγγραφή which improves browser compatibility)
JavaScript
// Request access to the microphone const mediaStream = await navigator.mediaDevices.getUserMedia({ audio: true }); // Create a MediaRecorder instance to capture audio data const mediaRecorder = new MediaRecorder(mediaStream); // Event handler to process audio data packets mediaRecorder.ondataavailable = async (event) => { const blob = event.data; // this is the audio packet (Blob) const buffer = await blob.arrayBuffer(); // convert the Blob to a Buffer stream.sendBuffer(buffer); // send the buffer data to the VocalStack API }; // Start capturing audio, and send it to the stream every second mediaRecorder.start(1000);
Σημειώστε ότι για πρόσβαση στο ΑΡΙ σε πελάτες διαδικτύου θα χρειαστεί να χρησιμοποιήσετε ένα διακριτικό εξουσιοδότησης:
Διακριτικά ελέγχου ταυτότητας από την πλευρά του πελάτη
Δημιουργία προσωρινού διακριτικού ελέγχου ταυτότητας για αιτήματα από την πλευρά του πελάτη. Εφαρμόστε με ασφάλεια αιτήματα σε προγράμματα περιήγησης χωρίς να εκθέσετε τα κλειδιά σας.
Το VocalStack API μπορεί να χρησιμοποιηθεί για να μεταγράψει οποιαδήποτε HLS LiveStream URL, συμπεριλαμβανομένων πηγών όπως το Youtube Live, το Facebook Live και το Twitch. Παρακαλούμε σημειώστε ότι η διεύθυνση της ροής πρέπει να είναι. .m3u8 επέκταση αρχείου που αντιπροσωπεύει ένα έγκυρο αρχείο λίστας αναπαραγωγής ζωντανής ροής.
JavaScript
import { LiveTranscription } from '@vocalstack/js-sdk'; const sdk = new LiveTranscription({ apiKey: 'YOUR-API-KEY' }); const stream = await sdk.connect({ // must be a valid HLS streaming protocol livestream_url: 'http://a.files.bbci.co.uk/media/live/manifesto/audio/simulcast/hls/nonuk/sbr_low/ak/bbc_world_service.m3u8', // The rest of these options are the same as for microphone live transcriptons }); stream.start(); stream.onData((response) => { // The response object is the same as the one // returned by microphone transcriptions });
Η ενσωμάτωση ζωντανών μεταγραφών με το Πολύγλωσσο είναι τόσο απλή όσο η προσθήκη ενός. Πολύγλωσσο επιλογή στο αίτημα μεταγραφής, όπως φαίνεται στα παραπάνω παραδείγματα.
Το δημιουργεί έναν δημόσιο κοινόχρηστο σύνδεσμο που σχετίζεται με τις μεταγραφές σας (ο σύνδεσμος μπορεί να προστατευθεί με κωδικό πρόσβασης):
  • Οι χρήστες μπορούν να διαβάσουν τη μεταγραφή σας σε πραγματικό χρόνο χρησιμοποιώντας τη σύνδεση.
  • Οι χρήστες μπορούν να επιλέξουν τη γλώσσα στην οποία θα διαβάσουν τη μεταγραφή σε πραγματικό χρόνο.
  • Οι χρήστες μπορούν να διαβάσουν τη μεταγραφή σας αργότερα, και όλες τις άλλες μεταγραφές ενσωματωμένες με τη συγκεκριμένη συνεδρία σας.
Μπορείτε να χρησιμοποιήσετε το API του VocalStack και να υλοποιήσετε το δικό σας UI με λευκή ετικέτα αντί να χρησιμοποιήσετε αυτό που παρέχεται από το VocalStack. Θα θέλαμε να το ακούσουμε αν το κάνετε, ώστε να μπορέσουμε να μάθουμε πώς να κάνουμε το προϊόν μας καλύτερο!
Μάθετε περισσότερα για το πώς λειτουργεί το Πολύγλωσσο στο. Πολύγλωσσο λογισμικό για φωνητική φόρτωση.
Μεταγράψτε και παρουσιάστε μια πολυγλωσσική συνεδρία
Δημιουργήστε μια συνεδρία που μπορεί να χρησιμοποιηθεί για τη μετάδοση μιας ζωντανής μεταγραφής μέσω ενός δημόσιου κοινόχρηστου συνδέσμου. Οι χρήστες μπορούν να διαβάσουν ζωντανές μεταγραφές στη γλώσσα της προτίμησής τους, ακόμα και παλαιότερες μεταγραφές όταν η συνεδρία σας είναι ανενεργή.
Λήψη δεδομένων μεταγραφής
Λήψη δεδομένων από εκκρεμείς ή ολοκληρωμένες μεταγραφές. Αυτό περιλαμβάνει τη λωρίδα χρόνου μεταγραφής, λέξεις-κλειδιά, περίληψη και τμήματα παραγράφων.
Διακριτικά ελέγχου ταυτότητας από την πλευρά του πελάτη
Δημιουργία προσωρινού διακριτικού ελέγχου ταυτότητας για αιτήματα από την πλευρά του πελάτη. Εφαρμόστε με ασφάλεια αιτήματα σε προγράμματα περιήγησης χωρίς να εκθέσετε τα κλειδιά σας.
Scroll Up