Documentation

Получаване на данни за транскрипция

Получаване на данни от чакащи или завършени транскрипции

Преписване от микрофон или поток на живо

Преписвайте реч на живо от микрофон или поток на живо

Сесии за транскрипция

Наблюдавайте и управлявайте състоянието на транскрипцията със сесии

Превод на транскрипция

Превод на транскрибиран текст на друг език

Преписване на аудио от адрес

Транскрипция на реч от предварително записано аудио в URL към обикновен текст

Токени за удостоверяване от страна на клиента

Създаване на временен знак за удостоверяване за клиентски заявки

Заявка и отговор за транскрипция

Преписване и представяне на сесия на полиглот

Създаване на сесия, която може да се използва за излъчване на транскрипция на живо чрез публична споделяща връзка

Заявка и отговор за транскрипция

Преглед на документацията

Общи опции за заявка и отговори за всички операции по транскрипция Използвайте опциите, за да конфигурирате настройките за транскрипция.

VocalStack ще се опита да транскрибира аудиото ви, използвайки разумни опции за конфигурация по подразбиране. Можете обаче да конфигурирате допълнително заявката си за транскрипция със следните опции:

languageISO 639-1 кодът на езика за речта. Например "en" (английски) или "ro" (румънски). По подразбиране, VocalStack ще се опита да транскрибира на всички езици, ако тази опция не е предоставена. Това може да бъде полезно за многоезична реч. Ако обаче знаете езика на речта, предоставянето на тази опция може да увеличи точността на транскрипцията. Продължителността в секунди на аудио файла.
duration_s Тази опция се използва като предпазна мярка, за да се гарантира, че транскрипцията се извършва само ако дължината на аудио файла съвпада с продължителността на опцията. По подразбиране тази опция се игнорира и транскрипциите ще се обработват независимо от дължината им. Максималната продължителност, която може да бъде записана, в секунди. Използвайте тази опция, ако искате да ограничите количеството на речта, която се транскрибира.
max_duration_s ако искате да обработите цялата транскрипция, независимо от продължителността й (⚠️ използвайте с повишено внимание). По подразбиране тази опция е настроена на. , като се гарантира, че само първите два часа от речта са транскрибирани.Отговор на транскрипцията0Можете да наблюдавате асинхронно данните за транскрипцията, тъй като те стават достъпни, като използвате. 7200 обработващ събитието, който осигурява

Възражение.

Обектът за отговорonData- Да. response обект има следните свойства:

: Едно от "очакване", "обработка", "направено" или "грешка"

: Стойност между 0 и 1, обозначаваща процента на напредъка на транскрипциятаresponse Ако статусът е "обработка" или "завършено", обектът на времевата линия ще бъде наличен, показвайки цялата транскрипция, налична до този момент. Времевата линия е масив от обекти, съдържащи тези свойства:

status: началното време на сегмента за транскрипция
data.progress: крайното време на сегмента за транскрипция
data.timeline: частта от текста в сегмента за транскрипция: хранилище на ключови стойности на езиковите кодове в ISO 639-1 и преводи (това свойство е налично само ако транскрипцията има поне един превод)
- startПоследна обработка
- endСлед като транскрипцията е завършена, ще се извърши последваща обработка, в който момент окончателният звук ще бъде записан.
- text ще бъде изпратен до
- translations.В крайния отговор, статусът на транскрипцията ще бъде "направено", и тези нови свойства ще бъдат включени в.

: няколко ключови думи, представящи теми от транскрипцията

: един абзац резюме на цялата транскрипцияresponse: цялата транскрипция, групирана в параграфи, сегментирани по теми или чрез смислен преход към нова темаonDataПоддръжка на ТипскриптdataJavaScript SDK на VocalStack има пълна поддръжка на Например,.

keywords обектът има
summary Тип.
paragraphsPetició de transcripció

VocalStack intentarà transcriure el vostre àudio usant les opcions de configuració per omissió. Tanmateix, podeu configurar més endavant la vostra petició de transcripció amb les següents opcions:

El codi ISO 639- 1 de la llengua per al discurs.response Per exemple, "en" (anglès), o "ro" (romanès). Per omissió, VocalStack intentarà transcriure en tots els idiomes si no s' ha proporcionat aquesta opció. Això pot ser útil per a la parla multilingüe. No obstant això, si coneixeu l'idioma del discurs, proporcionar aquesta opció pot augmentar la precisió de la transcripció. UrlTranscriptionResponseLa durada, en segons, del fitxer d' àudio.

TypeScript
import { UrlTranscription, UrlTranscriptionResponse } from '@vocalstack/js-sdk';

const sdk = new UrlTranscription({ apiKey: 'YOUR-API-KEY' });
const transcription = await sdk.start({ url: 'http://example.com/audio.mp3' });

transcription.onData((response: UrlTranscriptionResponse) => {
  console.log(response.data);
});

Scroll Up

Polyglot

Business

Отключете света с Полиглот Транскрипция!

Защо големите модели на изкуствен интелект имат значение при транскрипцията

Документация

Референтен номер на API

Documentation

Получаване на данни за транскрипция

Преписване от микрофон или поток на живо

Сесии за транскрипция

Превод на транскрипция

Преписване на аудио от адрес

Токени за удостоверяване от страна на клиента

Заявка и отговор за транскрипция

Преписване и представяне на сесия на полиглот

Заявка и отговор за транскрипция

Заявка за транскрипция

Възражение.

: Едно от "очакване", "обработка", "направено" или "грешка"

: няколко ключови думи, представящи теми от транскрипцията

VocalStack intentarà transcriure el vostre àudio usant les opcions de configuració per omissió. Tanmateix, podeu configurar més endavant la vostra petició de transcripció amb les següents opcions: