VocalStack Logo

Documentation

Obtenir des données de transcription

Obtenez des données à partir de transcriptions en attente ou terminées

Transcrire à partir d'un microphone ou d'un LiveStream

Transcrire le discours en direct à partir d'un microphone ou d'un flux en direct

Sessions de transcription

Surveiller et gérer l'état de la transcription avec des sessions

Traduire une transcription

Traduire le texte transcrit dans une autre langue

Transcription audio à partir d'URL

Transcrire la parole d'un audio préenregistré dans une URL en texte brut

Jetons d'authentification côté client

Créer un jeton d'authentification temporaire pour les requêtes côté client

Transcrire et présenter une session polyglotte

Créer une session pouvant être utilisée pour diffuser une transcription en direct via un lien public partageable

Demande de transcription et réponse

Parcourir la documentation
Options et réponses de requête communes pour toutes les opérations de transcription. Utilisez les options pour configurer les paramètres de transcription.
Durée maximale pouvant être transcrite, en secondes.
  • language Utilisez cette option si vous souhaitez limiter la quantité de paroles transcrites. si vous souhaitez traiter la transcription entière, quelle que soit sa durée (⚠️ utiliser avec prudence). Par défaut, cette option est définie sur. , en veillant à ce que seules les deux premières heures du discours soient transcrites.
  • duration_sRéponse de transcriptionVous pouvez surveiller de manière asynchrone les données de transcription à mesure qu'elles deviennent disponibles en utilisant. gestionnaire d'événements qui fournit le
  • max_duration_s object.L'objet de réponseThe 0 objet a les propriétés suivantes:7200:,
:, onData:,:response:,:
:, response:,
  • status: Un de "attente", "traitement", "fait" ou "erreur"
  • data.progress: Une valeur entre 0 et 1 indiquant le pourcentage de progression de la transcription
  • data.timeline Si le statut est "en cours de traitement" ou "terminé", l'objet de la timeline sera disponible, montrant la transcription entière disponible jusqu'à ce moment. La timeline est un tableau d'objets contenant ces propriétés:: l'heure de début du segment de transcription
    • start: l'heure de fin du segment de transcription
    • end: le morceau de texte dans le segment de transcription
    • text: un stockage clé-valeur des codes de langue dans ISO 639-1 et des traductions (cette propriété n'est disponible que si la transcription a au moins une traduction)
    • translationsPost-traitement
sera envoyé à response.Dans la réponse finale, le statut de la transcription sera "fait", et ces nouvelles propriétés seront incluses dans le fichier. onData: quelques mots-clés représentant des sujets de la transcriptiondata: un résumé d'un seul paragraphe de la transcription entière
  • keywords: la transcription entière regroupée en paragraphes, segmentée par thèmes, ou par une transition significative vers un nouveau sujet
  • summarySupport de Typescript
  • paragraphsLe SDK JavaScript de VocalStack prend en charge TypeScript. Par exemple, le
Type. responsePedido de transcriciónUrlTranscriptionResponseVocalStack tentará transcreber o seu son empregando as opcións de configuración predeterminadas. Porén, pode configurar máis a súa petición de transcrición coas seguintes opcións:
TSTypeScript
import { UrlTranscription, UrlTranscriptionResponse } from '@vocalstack/js-sdk'; const sdk = new UrlTranscription({ apiKey: 'YOUR-API-KEY' }); const transcription = await sdk.start({ url: 'http://example.com/audio.mp3' }); transcription.onData((response: UrlTranscriptionResponse) => { console.log(response.data); });
Scroll Up