VocalStack Logo

Documentation

Примени податоци за транскрипција

Добиј податоци од чекање или завршени транскрипции

Препраќање на микрофонот или LiveStreamName

Пренесете говор во живо од микрофон или пренос во живо

Сесии за транскрипција

Набљудување и управување со транскрипција со сесии

Преведи транскрипција

Преведување на транскрибираниот текст на друг јазик

Пренесе аудио од URL

Преведување на говор од претходно снимен аудио во URL во обичен текст

Токени за клиентска автентикација

Креирај привремен токен за проверка на автентичноста за клиентски барања

Преведете и презентирајте сесија на ПолиглотName

Создадете сесија која може да се користи за емитување на транскрипција во живо преку јавна споделлива врска

Барање за транскрипција и одговор

Прегледај ја документацијата
Опции за заедничко барање и одговори за сите операции на транскрипција. Користете ги опциите за да ги конфигурирате поставувањата за транскрипција.
На пример, „en“ (англиски) или „ro“ (романски). Во случај на неуспех, софтверот ќе се обиде да го транскрибира текстот на сите јазици. Ова може да биде корисно за повеќејазичниот говор. Сепак, ако го знаете јазикот на говорот, обезбедувањето на оваа опција може да ја зголеми прецизноста на транскрипцијата.
  • languageТраењето, во секунди, на аудио- датотеката. Оваа опција се користи како заштита за да се осигура дека вашата транскрипција ќе се случи само ако должината на аудио- датотеката се совпаѓа со должината на опцијата. По подразбирање, оваа опција се игнорира, и транскрипциите ќе се обработуваат без оглед на нивната должина. Максималното времетраење што може да се транскрибира, во секунди.
  • duration_s Користете ја оваа опција ако сакате да го ограничите бројот на транскрибирани зборови. Поставете го ова на ако сакате да ја обработите целата транскрипција, без оглед на нејзиното траење (⚠️ користете внимателно). Стандардно, оваа опција е поставена на , осигурувајќи се дека само првите два часа од говорот се транскрибирани.
  • max_duration_sОдговор на транскрипцијаМожете асинхроно да ги следите податоците за транскрипција како што стануваат достапни со користење на. event handler кој обезбедува 0 -Не.7200Објектот за одговор
објектот ги има следниве својства:onData: Една од "чекање", "обработка", "свршено" или "грешка"response: Вредност помеѓу 0 и 1 што го означува процентот на напредок на транскрипцијата
: почетокот на сегментот за транскрипцијаresponse: крајно време на сегментот за транскрипција
  • status: дел од текстот во сегментот за транскрипција
  • data.progress: складиште со клучни вредности на кодови на јазици во ISO 639- 1 и преводи (ова својство е достапно само ако транскрипцијата има барем еден превод)
  • data.timelineПо- обработкаОткако транскрипцијата е завршена, ќе се случи пост-процесирање, во кој момент ќе се добие финалниот геном.
    • start ќе биде испратено на
    • end.Во финалниот одговор, статусот на транскрипцијата ќе биде "довршено", и овие нови својства ќе бидат вклучени во.
    • text: неколку клучни зборови кои ги претставуваат темите од транскрипцијата
    • translations: еден параграф резиме на целата транскрипција
Поддршка за TypeScriptresponseJavaScript SDK на VocalStack има целосна поддршка за TypeScript. На пример, onData објектот го има data Тип.
  • keywords:,:
  • summary:,:
  • paragraphs:,,
:,, response:,,:UrlTranscriptionResponse:,,:
TSTypeScript
import { UrlTranscription, UrlTranscriptionResponse } from '@vocalstack/js-sdk'; const sdk = new UrlTranscription({ apiKey: 'YOUR-API-KEY' }); const transcription = await sdk.start({ url: 'http://example.com/audio.mp3' }); transcription.onData((response: UrlTranscriptionResponse) => { console.log(response.data); });
Scroll Up