VocalStack Logo

Documentation

Nhập dữ liệu phiên âm

Lấy dữ liệu từ các bản dịch đang chờ hoặc đã hoàn thành

Transcript từ Microphone hoặc LiveStream

Transcribe live speech from a microphone or live stream

Phiên bản

Kiểm tra và quản lý trạng thái phiên dịch với các phiên

Dịch một bản dịch

Dịch văn bản được phiên âm sang ngôn ngữ khác

Mã xác thực bên máy khách

Tạo một ký hiệu xác thực tạm thời cho các yêu cầu bên máy khách

Yêu cầu và đáp ứng phiên âm

Tùy chọn yêu cầu và đáp ứng chung cho tất cả các thao tác phiên âm

Transcribe và trình bày một phiên họp Polyglot

Tạo một phiên họp có thể được sử dụng để phát sóng một bản ghi trực tiếp thông qua một liên kết chia sẻ công cộng

Bản dịch âm thanh từ URL

Xem tài liệu
Transcribe speech from pre-recorded audio in a URL to plain text (bằng tiếng Anh). Các định dạng file chính được hỗ trợ, bao gồm MP3, WAV, FLAC, và OGG.
Phiên âm một tập tin âm thanh trong một URL (như một mp3) thành văn bản chỉ với vài dòng mã:
JavaScript
import { UrlTranscription } from '@vocalstack/js-sdk'; const sdk = new UrlTranscription({ apiKey: 'YOUR-API-KEY' }); const transcription = await sdk.connect({ url: 'http://example.com/files/meaningless.mp3', }); transcription.start(); // This will print the transcription data as it comes in transcription.onData(console.log); /* { status: 'processing', data: { id: 'd1e7b3b0-7b3b-4b3b-8b3b-0b3b7b3b3b3b', operation: 'transcription-prerecorded', progress: 0.1, timeline: [ { start: 0, end: 7.52, text: 'Meaningless, meaningless, says the teacher, utterly meaningless, everything is meaningless.', language: 'en', translations: { ... }, }, ... ] } } */
Có một số tùy chọn yêu cầu sẵn sàng để tùy chỉnh các cài đặt phiên âm. Ngoài ra, đối tượng đáp ứng cung cấp dữ liệu khác nhau tại các giai đoạn khác nhau của quá trình phiên mã.
Yêu cầu và đáp ứng phiên âm
Tùy chọn yêu cầu và đáp ứng chung cho tất cả các thao tác phiên âm. Dùng tùy chọn để cấu hình thiết lập phiên âm.
Bây giờ hãy xem cách chúng ta có thể sử dụng các tùy chọn tùy chỉnh để cấu hình quá trình phiên âm của chúng ta:
JavaScript
// Run "npm install @voca l-stack/js-sdk" to install the package import { UrlTranscription } from '@vocalstack/js-sdk'; // Get your key here ⇢ https://www.vocalstack.com/dashboard/api-keys const sdk = new UrlTranscription({ apiKey: 'YOUR-API-KEY' }); const transcription = await sdk.connect({ // URL to the audio file url: 'http://example.com/files/audio.mp3', // Optional: language of the speech spoken // (this can be used to improve the transcription accuracy) language: 'en', // Optional: the maximum duration to transcribe, in seconds // (if not provided, the entire audio file will be transcribed) max_duration_s: 1800, // Optional: the actual duration of the audio file, in seconds // (the transcription starts only if the audio file matches this duration) duration_s: 3600, }); // Start the transcription transcription.start(); // Listen for transcription data transcription.onData((response) => { const { status, data } = response; console.log(status); // 'waiting', 'processing', 'done', or 'error' if (data) { console.log(data.progress); // a value between 0 and 1 console.log(data.timeline); // an object with the transcription timeline } if (status === 'done') { console.log(data.summary); // a summary of the transcription console.log(data.keywords); // an array of keywords console.log(data.paragraphs); // the entire transcription in paragraph form } });
Sau khi bạn đã phiên âm bài nói trong tập tin âm thanh, bạn có thể muốn chuyển sang một trong những cách sau:
Nhập dữ liệu phiên âm
Lấy dữ liệu từ các bản dịch đang chờ hoặc đã hoàn thành. Điều này bao gồm thời gian phiên âm, từ khóa, tóm tắt, và các đoạn văn.
Dịch một bản dịch
Dịch văn bản được phiên âm sang ngôn ngữ khác. Điều này có thể được thực hiện cho bất kỳ phiên âm nào, bao gồm phiên âm ghi âm trước, phiên âm trực tiếp hoặc phiên âm Polyglot.
Phiên bản
Kiểm tra và quản lý trạng thái phiên dịch với các phiên. Sử dụng các phiên bạn có thể kết nối lại với một kết nối không đồng bộ đã tạo trước đó.
Scroll Up