Documentation

Transkrypcja z mikrofonu lub LiveStream

Transkrypcja mowy na żywo z mikrofonu lub strumienia na żywo

Transkrypcja

Monitoruj i zarządzaj stanem transkrypcji z sesjami

Przetłumacz a Transscription

Przetłumacz transkrybowany tekst na inny język

Transkrypcja audio z URL

Transkrypcja mowy z nagranego dźwięku w URL do zwykłego tekstu

Tokeny uwierzytelniania po stronie klienta

Utwórz tymczasowy token uwierzytelniania dla żądań po stronie klienta

Żądanie transkrypcji i odpowiedź

Wspólne opcje żądania i odpowiedzi dla wszystkich operacji transkrypcji

Transkrypcja i prezentacja sesji poliglotycznej

Utwórz sesję, która może być użyta do transmisji transkrypcji na żywo za pośrednictwem publicznego łącza udostępniania

Pobierz dane transkrypcji

Przeglądaj dokumentację
Pobiera dane z oczekujących lub ukończonych transkrypcji. Obejmuje to oś czasu transkrypcji, słowa kluczowe, podsumowanie i segmenty akapitu.
Możesz użyć interfejsu VocalStack API, aby pobrać dane transkrypcji po rozpoczęciu transkrypcji dźwięku za pomocą dowolnej z następujących metod:
Transkrypcja audio z URL
Transkrypcja mowy z nagranego dźwięku w URL do zwykłego tekstu. Obsługiwane są główne formaty plików, w tym MP3, WAV, FLAC i OGG.
Transkrypcja z mikrofonu lub LiveStream
Transkrypcja mowy na żywo z mikrofonu lub strumienia na żywo. Zintegruj z Polyglot, aby utworzyć publiczny link do transkrypcji, który użytkownicy mogą przeczytać w dowolnym języku.
Transkrypcja i prezentacja sesji poliglotycznej
Utwórz sesję, która może być użyta do transmisji transkrypcji na żywo za pośrednictwem publicznego łącza udostępniania. Użytkownicy mogą czytać transkrypcje na żywo w preferowanym języku, a nawet transkrypcje z przeszłości, gdy sesja jest nieaktywna.
Uzyskanie wszystkich transkrypcji odbywa się za pomocą Transcriptions z VocalStack SDK:
JavaScript
import { Transcriptions } from '@vocalstack/js-sdk'; const sdk = new Transcriptions({ apiKey: 'YOUR-API-KEY' }); const transcriptions = await sdk.getAllTranscriptions(); transcriptions.data?.forEach((transcription) => { // the transcription ID (use this to get more details about the transcription) console.log(transcription.id); // 'waiting', 'processing', 'done', or 'error' console.log(transcription.status); // the time the transcription started console.log(transcription.start); // the time the transcription finalized console.log(transcription.end); // the keywords associated with the transcription console.log(transcription.keywords); // the length of the transcription in seconds console.log(transcription.duration); });
Aby uzyskać wszystkie dane dostępne do transkrypcji musimy użyć id z tej transkrypcji. id Jest zwracana za każdym razem, gdy proces transkrypcji jest po raz pierwszy zainicjowany. Jednakże, można go również uzyskać patrząc na wszystkie transkrypcje za pomocą powyższego API.
Aby uzyskać konkretną transkrypcję użyj Transcriptions z VocalStack SDK:
JavaScript
import { Transcriptions } from '@vocalstack/js-sdk'; const sdk = new Transcriptions({ apiKey: 'YOUR-API-KEY' }); const transcription = await sdk.getTranscription({ id: 'TRANSCRIPTION-ID' }); const data = transcription.data; if (data) { // the transcription ID (use this to get more details about the transcription) console.log(data.id); // 'waiting', 'processing', 'done', or 'error' console.log(data.status); // the time the transcription started console.log(data.start); // the time the transcription finalized console.log(data.end); // the keywords associated with the transcription console.log(data.keywords); // the length of the transcription in seconds console.log(data.duration); // an object with the transcription timeline console.log(data.timeline); // a summary of the transcription console.log(data.summary); // the entire transcription in paragraph form console.log(data.paragraphs); }
W większości scenariuszy będziesz zainteresowany uzyskaniem danych dla pojedynczej transkrypcji tylko wtedy, gdy transkrypcja ta zakończy przetwarzanie. Dzieje się tak dlatego, że transkrypcje są operacjami asynchronicznymi, które mogą mieć swój postęp monitorowany asynchronicznie, gdzie wykonujesz ten proces transkrypcji. Jeśli jednak zażądasz danych transkrypcji dla transkrypcji, która jest jeszcze w trakcie realizacji, nadal otrzymasz wszystkie dostępne dane dla tej transkrypcji, w tym najnowsze. timeline.
Gdy transkrypcja jest zakończona, została poddana przetwarzaniu końcowemu, a w tym przypadku dane transkrypcji będą również zawierały wartości dla keywords, summary and paragraphs.
Przejrzyj obiekt odpowiedzi zwracany z każdą transkrypcją:
Żądanie transkrypcji i odpowiedź
Wspólne opcje żądania i odpowiedzi dla wszystkich operacji transkrypcji. Użyj opcji, aby skonfigurować ustawienia transkrypcji.
Scroll Up