Documentation

Pobierz dane transkrypcji

Pobiera dane z oczekujących lub ukończonych transkrypcji

Transkrypcja z mikrofonu lub LiveStream

Transkrypcja mowy na żywo z mikrofonu lub strumienia na żywo

Transkrypcja

Monitoruj i zarządzaj stanem transkrypcji z sesjami

Przetłumacz a Transscription

Przetłumacz transkrybowany tekst na inny język

Transkrypcja audio z URL

Transkrypcja mowy z nagranego dźwięku w URL do zwykłego tekstu

Tokeny uwierzytelniania po stronie klienta

Utwórz tymczasowy token uwierzytelniania dla żądań po stronie klienta

Transkrypcja i prezentacja sesji poliglotycznej

Utwórz sesję, która może być użyta do transmisji transkrypcji na żywo za pośrednictwem publicznego łącza udostępniania

Żądanie transkrypcji i odpowiedź

Przeglądaj dokumentację
Wspólne opcje żądania i odpowiedzi dla wszystkich operacji transkrypcji. Użyj opcji, aby skonfigurować ustawienia transkrypcji.
Maksymalny czas trwania, który można przepisać, w sekundach.
  • language Użyj tej opcji, jeśli chcesz ograniczyć ilość mowy, która będzie transkrybowana. Jeśli chcesz przetworzyć całą transkrypcję, niezależnie od jej czasu trwania (⚠️ używaj z ostrożnością). Domyślnie ta opcja jest ustawiona na. , zapewniając, że tylko pierwsze dwie godziny przemówienia są transkrybowane.
  • duration_sOdpowiedź transkrypcyjnaMożesz asynchronicznie monitorować dane transkrypcji, gdy stają się dostępne, używając. obsługa zdarzeń, która zapewnia
  • max_duration_s Obiekt.Obiekt odpowiedziThe 0 obiekt ma następujące właściwości:7200:,
:, onData:,:response:,:
:, response:,
  • status: Jeden z "czekanie", "przetwarzanie", "gotowe" lub "błąd"
  • data.progress: Wartość pomiędzy 0 i 1 oznaczająca procentowy postęp transkrypcji
  • data.timeline Jeśli status jest "przetwarzanie" lub "gotowe", obiekt osi czasu będzie dostępny, pokazując całą transkrypcję dostępną do tego momentu. Oś czasu jest tablicą obiektów zawierających następujące właściwości:: czas rozpoczęcia segmentu transkrypcji
    • start: czas zakończenia segmentu transkrypcji
    • end: fragment tekstu w segmencie transkrypcji
    • text: magazyn klucz-wartość kodów języków w ISO 639-1 i tłumaczeń (ta właściwość jest dostępna tylko wtedy, gdy transkrypcja ma co najmniej jedno tłumaczenie)
    • translationsPost-processing
będzie wysłana do response.W końcowej odpowiedzi, status transkrypcji będzie "dokonano", a te nowe właściwości zostaną uwzględnione w. onData: kilka słów kluczowych reprezentujących tematy z transkrypcjidata: pojedynczy akapit podsumowania całej transkrypcji
  • keywords: cała transkrypcja pogrupowana w akapity, podzielona na tematy lub znaczące przejście do nowego tematu
  • summaryWsparcie dla Typescript
  • paragraphsVocalStack JavaScript SDK ma pełne wsparcie dla TypeScript. Na przykład
type. responsePedido de transcriçãoUrlTranscriptionResponseVocalStack tentará transcrever seu áudio usando opções de configuração padrão sensatas. No entanto, você pode configurar ainda mais sua solicitação de transcrição com as seguintes opções:
TSTypeScript
import { UrlTranscription, UrlTranscriptionResponse } from '@vocalstack/js-sdk'; const sdk = new UrlTranscription({ apiKey: 'YOUR-API-KEY' }); const transcription = await sdk.start({ url: 'http://example.com/audio.mp3' }); transcription.onData((response: UrlTranscriptionResponse) => { console.log(response.data); });
Scroll Up