VocalStack Logo

Documentation

Получить данные транскрипции

Получить данные из ожидающих или завершенных транскрипций

Транскрипция с микрофона или LiveStream

Переписать речь в прямом эфире с микрофона или поток

Сеансы транскрипции

Мониторинг и управление состоянием транскрипции с помощью сеансов

Транскрипция аудио из URL

Транскрипция речи из заранее записанного аудио в URL в обычный текст

Токены проверки подлинности на стороне клиента

Создать временный токен проверки подлинности для запросов со стороны клиента

Запрос и ответ на транскрипцию

Общие параметры запроса и ответы для всех операций транскрипции

Транскрипция и презентация сеанса полиглота

Создать сеанс, который может быть использован для трансляции транскрипции в реальном времени через публичную ссылку для совместного использования

Перевести транскрипцию

Просмотр документации
Перевод транскрибированного текста на другой язык. Это можно сделать для любой транскрипции, включая предварительно записанные транскрипции, транскрипции в реальном времени или транскрипции сессий Polyglot.
Вы можете использовать API VocalStack для перевода любой транскрипции, независимо от того, закончена она или еще находится в процессе обработки. Если вы еще не начали транскрибировать аудио, вы можете сделать это любым из следующих способов:
Транскрипция аудио из URL
Транскрипция речи из заранее записанного аудио в URL в обычный текст. Поддерживаются основные форматы файлов, включая MP3, WAV, FLAC и OGG.
Транскрипция с микрофона или LiveStream
Переписать речь в прямом эфире с микрофона или поток. Интегрируйте с Polyglot для создания публичной ссылки для транскрипции, которую пользователи могут читать на любом языке.
Транскрипция и презентация сеанса полиглота
Создать сеанс, который может быть использован для трансляции транскрипции в реальном времени через публичную ссылку для совместного использования. Пользователи могут читать транскрипции в реальном времени на выбранном ими языке, а также транскрипции прошлых сессий, когда вы неактивны.
Если вам нужно загрузить переводы, как только они станут доступны, то вы захотите прослушивать запрос на перевод асинхронно:
JavaScript
import { Transcriptions } from '@vocalstack/js-sdk'; const sdk = new Transcriptions({ apiKey: 'YOUR-API-KEY' }); const translation = await sdk.addTranslationAsync({ id: 'TRANSCRIPTION-ID', language: 'de', }); translation.onData((response) => { // 'waiting', 'processing', 'done', or 'error' console.log(response.status); // the translated timeline console.log(response.data?.timeline); });
Этот метод перевода просто отправляет запрос на перевод, но не ожидает ответа. Этот метод может быть полезен, если:
  • Вам не нужен перевод прямо сейчас, но вы хотите кэшировать его для быстрого доступа в будущем. (см. Кэширование производительности)
  • В живой сессии Polyglot есть транскрипция, которую вы уже отслеживаете в другом процессе, и вы просто хотите добавить новый перевод к этой транскрипции.
JavaScript
import { Transcriptions } from '@vocalstack/js-sdk'; const sdk = new Transcriptions({ apiKey: 'YOUR-API-KEY' }); // This is a synchronous request, so we cannot listen for the response sdk.addTranslation({ id: 'TRANSCRIPTION-ID', language: 'de' });
По мере выполнения переводов в бэкэнде, данные постоянных транскрипций обновляются, чтобы включить новые переводы. Постоянные транскрипции обновляются с каждым сегментом временной шкалы, поэтому API-вызовам, запрашивающим данные транскрипции, всегда будет возвращаться график объекты с самыми последними доступными переводами.
Это также означает, что вам нужно будет отправить только один запрос на перевод на каждый язык. (Дополнительные запросы не будут иметь никакого эффекта, так как переводы уже сохранены.)
Scroll Up