Documentation

Ví dụ "en" (tiếng Anh), hoặc "ro" (tiếng Romania). Mặc định, VocalStack sẽ cố gắng phiên âm trong tất cả các ngôn ngữ nếu tùy chọn này không được cung cấp. Điều này có thể hữu ích cho các bài phát biểu đa ngôn ngữ. Tuy nhiên, nếu bạn biết ngôn ngữ của bài phát biểu, cung cấp tùy chọn này có thể tăng độ chính xác phiên âm.

languageThời gian, theo giây, của tập tin âm thanh. Tùy chọn này được dùng như một bảo vệ để đảm bảo rằng việc phiên âm của bạn chỉ xảy ra nếu độ dài tập tin âm thanh phù hợp với thời gian tùy chọn. Mặc định, tùy chọn này bị bỏ qua, và phiên âm sẽ được xử lý bất kể độ dài của chúng. Thời gian tối đa có thể được phiên âm, theo giây.
duration_s Dùng tùy chọn này nếu muốn giới hạn số lượng lời nói được phiên âm. Đặt nó là nếu bạn muốn xử lý toàn bộ bản ghi, bất kể thời gian của nó (⚠️ sử dụng cẩn thận). Mặc định, tùy chọn này được đặt là , đảm bảo rằng chỉ hai giờ đầu tiên của bài phát biểu được ghi lại.
max_duration_sPhản hồi phiên âmBạn có thể theo dõi dữ liệu phiên âm khi nó có sẵn bằng cách sử dụng. Điều khiển sự kiện cung cấp 0 Đối tượng.7200Đối tượng đáp ứng

The

object có các thuộc tính sau:onData: Một trong "chờ", "xử lý", "đã hoàn thành" hoặc "lỗi"response: Một giá trị giữa 0 và 1 cho biết tỷ lệ phần trăm tiến độ phiên âm

Nếu trạng thái là "xử lý" hoặc "đã hoàn thành" đối tượng timeline sẽ có sẵn, hiển thị toàn bộ phiên âm có sẵn cho đến thời điểm đó. Thời gian là một ma trận của các đối tượng chứa các thuộc tính sau:

: thời gian bắt đầu của đoạn phiên âmresponse: thời gian kết thúc của đoạn phiên âm

status: phần văn bản trong đoạn phiên âm
data.progress: một kho khóa- giá trị của mã ngôn ngữ trong ISO 639- 1 và dịch (sự kiện này chỉ có thể nếu bản dịch có ít nhất một dịch)
data.timelineXử lý sauKhi phiên mã hoàn tất, xử lý sau sẽ xảy ra, tại thời điểm đó.
- start sẽ được gửi đến
- end.Trong phản hồi cuối cùng, trạng thái của phiên dịch sẽ là "đã hoàn thành", và các tính chất mới này sẽ được bao gồm trong.
- text: một vài từ khóa đại diện cho các chủ đề từ bản dịch
- translations: một đoạn văn tóm tắt toàn bộ bản dịch

: toàn bộ bản dịch được nhóm thành các đoạn, phân chia theo chủ đề, hoặc theo một chuyển tiếp có ý nghĩa đến một chủ đề mới

Hỗ trợ TypescriptresponseSDK JavaScript của VocalStack hỗ trợ đầy đủ TypeScript. Ví dụ, onData object has the data type.

keywords:,:
summary:,:
paragraphs:,

:,

:, response:,:UrlTranscriptionResponse:,:

TypeScript
import { UrlTranscription, UrlTranscriptionResponse } from '@vocalstack/js-sdk';

const sdk = new UrlTranscription({ apiKey: 'YOUR-API-KEY' });
const transcription = await sdk.start({ url: 'http://example.com/audio.mp3' });

transcription.onData((response: UrlTranscriptionResponse) => {
  console.log(response.data);
});

Scroll Up

Polyglot

Business

Mở khóa thế giới với Polyglot Transcription của VocalStack!

Why Large AI Models Matter in Transcription (bằng tiếng Anh).

Tài liệu

Điều kiện API

Documentation

Nhập dữ liệu phiên âm

Transcript từ Microphone hoặc LiveStream

Phiên bản

Dịch một bản dịch

Bản dịch âm thanh từ URL

Mã xác thực bên máy khách

Yêu cầu và đáp ứng phiên âm

Transcribe và trình bày một phiên họp Polyglot

Yêu cầu và đáp ứng phiên âm

Mã ngôn ngữ ISO 639-1 cho tiếng nói.

The

Nếu trạng thái là "xử lý" hoặc "đã hoàn thành" đối tượng timeline sẽ có sẵn, hiển thị toàn bộ phiên âm có sẵn cho đến thời điểm đó. Thời gian là một ma trận của các đối tượng chứa các thuộc tính sau:

: toàn bộ bản dịch được nhóm thành các đoạn, phân chia theo chủ đề, hoặc theo một chuyển tiếp có ý nghĩa đến một chủ đề mới

:,