VocalStack Logo

Documentation

Получаване на данни за транскрипция

Получаване на данни от чакащи или завършени транскрипции

Преписване от микрофон или поток на живо

Преписвайте реч на живо от микрофон или поток на живо

Сесии за транскрипция

Наблюдавайте и управлявайте състоянието на транскрипцията със сесии

Превод на транскрипция

Превод на транскрибиран текст на друг език

Преписване на аудио от адрес

Транскрипция на реч от предварително записано аудио в URL към обикновен текст

Токени за удостоверяване от страна на клиента

Създаване на временен знак за удостоверяване за клиентски заявки

Преписване и представяне на сесия на полиглот

Създаване на сесия, която може да се използва за излъчване на транскрипция на живо чрез публична споделяща връзка

Заявка и отговор за транскрипция

Преглед на документацията
Общи опции за заявка и отговори за всички операции по транскрипция Използвайте опциите, за да конфигурирате настройките за транскрипция.
VocalStack ще се опита да транскрибира аудиото ви, използвайки разумни опции за конфигурация по подразбиране. Можете обаче да конфигурирате допълнително заявката си за транскрипция със следните опции:
  • languageISO 639-1 кодът на езика за речта. Например "en" (английски) или "ro" (румънски). По подразбиране, VocalStack ще се опита да транскрибира на всички езици, ако тази опция не е предоставена. Това може да бъде полезно за многоезична реч. Ако обаче знаете езика на речта, предоставянето на тази опция може да увеличи точността на транскрипцията. Продължителността в секунди на аудио файла.
  • duration_s Тази опция се използва като предпазна мярка, за да се гарантира, че транскрипцията се извършва само ако дължината на аудио файла съвпада с продължителността на опцията. По подразбиране тази опция се игнорира и транскрипциите ще се обработват независимо от дължината им. Максималната продължителност, която може да бъде записана, в секунди. Използвайте тази опция, ако искате да ограничите количеството на речта, която се транскрибира.
  • max_duration_s ако искате да обработите цялата транскрипция, независимо от продължителността й (⚠️ използвайте с повишено внимание). По подразбиране тази опция е настроена на. , като се гарантира, че само първите два часа от речта са транскрибирани.Отговор на транскрипцията0Можете да наблюдавате асинхронно данните за транскрипцията, тъй като те стават достъпни, като използвате. 7200 обработващ събитието, който осигурява
Обектът за отговорonData- Да. response обект има следните свойства:
: Стойност между 0 и 1, обозначаваща процента на напредъка на транскрипциятаresponse Ако статусът е "обработка" или "завършено", обектът на времевата линия ще бъде наличен, показвайки цялата транскрипция, налична до този момент. Времевата линия е масив от обекти, съдържащи тези свойства:
  • status: началното време на сегмента за транскрипция
  • data.progress: крайното време на сегмента за транскрипция
  • data.timeline: частта от текста в сегмента за транскрипция: хранилище на ключови стойности на езиковите кодове в ISO 639-1 и преводи (това свойство е налично само ако транскрипцията има поне един превод)
    • startПоследна обработка
    • endСлед като транскрипцията е завършена, ще се извърши последваща обработка, в който момент окончателният звук ще бъде записан.
    • text ще бъде изпратен до
    • translations.В крайния отговор, статусът на транскрипцията ще бъде "направено", и тези нови свойства ще бъдат включени в.
: един абзац резюме на цялата транскрипцияresponse: цялата транскрипция, групирана в параграфи, сегментирани по теми или чрез смислен преход към нова темаonDataПоддръжка на ТипскриптdataJavaScript SDK на VocalStack има пълна поддръжка на Например,.
  • keywords обектът има
  • summary Тип.
  • paragraphsPetició de transcripció
El codi ISO 639- 1 de la llengua per al discurs.response Per exemple, "en" (anglès), o "ro" (romanès). Per omissió, VocalStack intentarà transcriure en tots els idiomes si no s' ha proporcionat aquesta opció. Això pot ser útil per a la parla multilingüe. No obstant això, si coneixeu l'idioma del discurs, proporcionar aquesta opció pot augmentar la precisió de la transcripció. UrlTranscriptionResponseLa durada, en segons, del fitxer d' àudio.
TSTypeScript
import { UrlTranscription, UrlTranscriptionResponse } from '@vocalstack/js-sdk'; const sdk = new UrlTranscription({ apiKey: 'YOUR-API-KEY' }); const transcription = await sdk.start({ url: 'http://example.com/audio.mp3' }); transcription.onData((response: UrlTranscriptionResponse) => { console.log(response.data); });
Scroll Up