

从待处理或已完成的转录中获取数据。 这包括转录时间线、关键字、摘要和段落段。


通过会话监控和管理转录状态。 使用会话,您可以重新连接到之前创建的异步连接。


将转录的文本翻译成另一种语言。 这可以对任何转录进行,包括预录制的转录、现场转录或多语种会话转录。

从 URL 转录音频

将 URL 中预先录制的音频转录为纯文本。 支持主要文件格式,包括 MP3、WAV、FLAC 和 OGG。


为客户端请求创建临时身份验证令牌。 在 Web 浏览器中安全实现 API 请求,而不会暴露您的 API 密钥。


所有转录操作的常见请求选项和响应。 使用选项配置转录设置。


创建一个会话,可用于通过公共可共享链接广播实时转录。 用户可以用他们首选的语言阅读实时转录,甚至在您的会话处于闲置状态时,也可以阅读过去的转录。

从麦克风或 LiveStream 转录

从麦克风或直播流转录实时演讲。 与 Polyglot 集成,为用户可以用任何语言阅读的转录创建公共可共享链接。
要从麦克风中转录,我们必须不断地向 VocalStack API 发送音频数据流包。.
import { LiveTranscription } from '@vocalstack/js-sdk'; const sdk = new LiveTranscription({ apiKey: 'YOUR-API-KEY' }); const stream = await sdk.connect({ // Optional: Integrate this stream with a Polyglot session polyglot_id: 'YOUR-POLYGLOT-SESSION-ID', // Optional: language of the speech spoken // (this can be used to improve the transcription accuracy) language: 'en', // Optional: Translate the transcription to these languages translations: ['de'], // Optional: Stop the stream after this many seconds of inactivity timeout_period_s: 60, // Optional: Hard stop the stream after this many seconds max_duration_s: 300, }); // Start the stream stream.start(); // Get audio data from a microphone and send it to the stream // stream.sendBuffer(buffer); // *** This is a placeholder for the actual implementation *** // Manually stop the stream (in this example, after 60 seconds) // If max_duration_s is set, stopping the stream is optional setTimeout(() => stream.stop(), 60000); // Listen for stream transcription data stream.onData((response) => { const { status, data } = response; console.log(status); // 'waiting', 'processing', 'done', 'stopping' or 'error' if (data) { console.log(data.timeline); // an object with the transcription timeline } if (status === 'done') { console.log(data.summary); // a summary of the transcription console.log(data.keywords); // an array of keywords console.log(data.paragraphs); // the entire transcription in paragraph form } });
获取音频流数据的方式将根据您要执行转录操作的环境而有所不同。 下面是一些例子,说明如何做到这一点:
在 NextJS 中,您应该安装一个可以从您的设备中获取音频数据的软件包,然后将其转发到 VocalStack API。 下面是一个例子:
const mic = require('mic'); // Create a new instance of the microphone utility const micInstance = mic(); // Get the audio input stream const micStream = micInstance.getAudioStream(); // Capture the audio data from the microphone micStream.on('data', (data) => { stream.sendBuffer(data); // send the buffer data to the VocalStack API }); // Start capturing audio from the microphone micInstance.start();
在网络浏览器中,您可能想要使用. 媒體錄音機 如下例所示,API 是可以使用的。 (使用 等软件包也是一个好主意。 记录 改善浏览器兼容性)
// Request access to the microphone const mediaStream = await navigator.mediaDevices.getUserMedia({ audio: true }); // Create a MediaRecorder instance to capture audio data const mediaRecorder = new MediaRecorder(mediaStream); // Event handler to process audio data packets mediaRecorder.ondataavailable = async (event) => { const blob =; // this is the audio packet (Blob) const buffer = await blob.arrayBuffer(); // convert the Blob to a Buffer stream.sendBuffer(buffer); // send the buffer data to the VocalStack API }; // Start capturing audio, and send it to the stream every second mediaRecorder.start(1000);
请注意,要在 Web 客户端上访问 VocalStack API,您需要使用授权令牌:
为客户端请求创建临时身份验证令牌。 在 Web 浏览器中安全实现 API 请求,而不会暴露您的 API 密钥。.
VocalStack API 可用于转录任何 HLS LiveStream URL,包括 Youtube Live、Facebook Live 和 Twitch 等来源。 请注意,流 URL 必须是. .m3u8文件扩展名 文件扩展名,表示有效的 HLS (HTTP 直播流媒体)播放列表文件。.
import { LiveTranscription } from '@vocalstack/js-sdk'; const sdk = new LiveTranscription({ apiKey: 'YOUR-API-KEY' }); const stream = await sdk.connect({ // must be a valid HLS streaming protocol livestream_url: '', // The rest of these options are the same as for microphone live transcriptons }); stream.start(); stream.onData((response) => { // The response object is the same as the one // returned by microphone transcriptions });
将实时抄录与 Polyglot 集成起来就像添加一个 多语种 选项转录请求,如上面的示例所示。
Polyglot 会创建一个与您的抄录相关的公共可共享链接(该链接可以受密码保护 ) :
  • 用户可以使用链接实时阅读您的转录。.
  • 用户可以选择实时阅读转录的语言。.
  • 用户可以在稍后阅读您的抄录,所有其他抄录都集成到您的特定 Polyglot 会话中。.
欢迎您使用 VocalStack API 并实现您自己的白标 UI,而不是使用 VocalStack 提供的 UI。 我们很乐意听到它,如果你这样做, 让我们能够学习如何使我们的产品更好!
了解更多关于 Polyglot 如何工作的信息 多语言.
创建一个会话,可用于通过公共可共享链接广播实时转录。 用户可以用他们首选的语言阅读实时转录,甚至在您的会话处于闲置状态时,也可以阅读过去的转录。.
从待处理或已完成的转录中获取数据。 这包括转录时间线、关键字、摘要和段落段。.
为客户端请求创建临时身份验证令牌。 在 Web 浏览器中安全实现 API 请求,而不会暴露您的 API 密钥。.
Scroll Up