VocalStack Logo

Documentation

Nhập dữ liệu phiên âm

Lấy dữ liệu từ các bản dịch đang chờ hoặc đã hoàn thành

Transcript từ Microphone hoặc LiveStream

Transcribe live speech from a microphone or live stream

Phiên bản

Kiểm tra và quản lý trạng thái phiên dịch với các phiên

Dịch một bản dịch

Dịch văn bản được phiên âm sang ngôn ngữ khác

Bản dịch âm thanh từ URL

Transcribe speech from pre-recorded audio in a URL to plain text (bằng tiếng Anh)

Mã xác thực bên máy khách

Tạo một ký hiệu xác thực tạm thời cho các yêu cầu bên máy khách

Transcribe và trình bày một phiên họp Polyglot

Tạo một phiên họp có thể được sử dụng để phát sóng một bản ghi trực tiếp thông qua một liên kết chia sẻ công cộng

Yêu cầu và đáp ứng phiên âm

Xem tài liệu
Tùy chọn yêu cầu và đáp ứng chung cho tất cả các thao tác phiên âm. Dùng tùy chọn để cấu hình thiết lập phiên âm.
Ví dụ "en" (tiếng Anh), hoặc "ro" (tiếng Romania). Mặc định, VocalStack sẽ cố gắng phiên âm trong tất cả các ngôn ngữ nếu tùy chọn này không được cung cấp. Điều này có thể hữu ích cho các bài phát biểu đa ngôn ngữ. Tuy nhiên, nếu bạn biết ngôn ngữ của bài phát biểu, cung cấp tùy chọn này có thể tăng độ chính xác phiên âm.
  • languageThời gian, theo giây, của tập tin âm thanh. Tùy chọn này được dùng như một bảo vệ để đảm bảo rằng việc phiên âm của bạn chỉ xảy ra nếu độ dài tập tin âm thanh phù hợp với thời gian tùy chọn. Mặc định, tùy chọn này bị bỏ qua, và phiên âm sẽ được xử lý bất kể độ dài của chúng. Thời gian tối đa có thể được phiên âm, theo giây.
  • duration_s Dùng tùy chọn này nếu muốn giới hạn số lượng lời nói được phiên âm. Đặt nó là nếu bạn muốn xử lý toàn bộ bản ghi, bất kể thời gian của nó (⚠️ sử dụng cẩn thận). Mặc định, tùy chọn này được đặt là , đảm bảo rằng chỉ hai giờ đầu tiên của bài phát biểu được ghi lại.
  • max_duration_sPhản hồi phiên âmBạn có thể theo dõi dữ liệu phiên âm khi nó có sẵn bằng cách sử dụng. Điều khiển sự kiện cung cấp 0 Đối tượng.7200Đối tượng đáp ứng
object có các thuộc tính sau:onData: Một trong "chờ", "xử lý", "đã hoàn thành" hoặc "lỗi"response: Một giá trị giữa 0 và 1 cho biết tỷ lệ phần trăm tiến độ phiên âm
: thời gian bắt đầu của đoạn phiên âmresponse: thời gian kết thúc của đoạn phiên âm
  • status: phần văn bản trong đoạn phiên âm
  • data.progress: một kho khóa- giá trị của mã ngôn ngữ trong ISO 639- 1 và dịch (sự kiện này chỉ có thể nếu bản dịch có ít nhất một dịch)
  • data.timelineXử lý sauKhi phiên mã hoàn tất, xử lý sau sẽ xảy ra, tại thời điểm đó.
    • start sẽ được gửi đến
    • end.Trong phản hồi cuối cùng, trạng thái của phiên dịch sẽ là "đã hoàn thành", và các tính chất mới này sẽ được bao gồm trong.
    • text: một vài từ khóa đại diện cho các chủ đề từ bản dịch
    • translations: một đoạn văn tóm tắt toàn bộ bản dịch
Hỗ trợ TypescriptresponseSDK JavaScript của VocalStack hỗ trợ đầy đủ TypeScript. Ví dụ, onData object has the data type.
  • keywords:,:
  • summary:,:
  • paragraphs:,
:, response:,:UrlTranscriptionResponse:,:
TSTypeScript
import { UrlTranscription, UrlTranscriptionResponse } from '@vocalstack/js-sdk'; const sdk = new UrlTranscription({ apiKey: 'YOUR-API-KEY' }); const transcription = await sdk.start({ url: 'http://example.com/audio.mp3' }); transcription.onData((response: UrlTranscriptionResponse) => { console.log(response.data); });
Scroll Up