VocalStack Logo

Documentation

Hanki transkriptiotietoja

Hae tietoja odotettavissa olevista tai valmiista transkriptioista

Puhtaaksi kirjoittaminen mikrofonista tai LiveStream-palvelusta

Puhtaaksi kirjoita live-puhe mikrofonista tai live-suoratoisto

Transkriptio-istunnot

Valvo ja hallitse transkriptiotilan istuntoja

Käännä transkriptio

Käännä transkriptoitu teksti toiselle kielelle

Puhtaaksi kirjoittaa ääntä URL-osoitteesta

Puheen transkriptio URL-osoitteessa olevasta valmiiksi tallennetusta äänestä pelkäksi tekstiksi

Asiakaspuolen todennusmerkit

Luo väliaikainen todennustunnus asiakaspuolen pyyntöjä varten

Polyglot-istunnon transkriptio ja esittely

Luo istunto, jota voidaan käyttää lähettämään live-puhekirjotusta julkisesti jaettavan linkin kautta

Transkriptiopyyntö ja vastaus

Selaa dokumentaatiota
Kaikkien transkriptio-operaatioiden yhteiset pyyntöasetukset ja vastaukset. Määritä transkriptio-asetukset asetusten avulla.
VocalStack yrittää kirjoittaa äänesi käyttäen järkeviä oletusasetuksia. Voit kuitenkin määrittää transkriptiopyyntöäsi edelleen seuraavien asetusten avulla:
  • languagePuheen ISO 639-1-kielikoodi. Esimerkiksi "en" (englanti) tai "ro" (romania). Oletuksena VocalStack yrittää transkriptoida kaikilla kielillä, jos tätä vaihtoehtoa ei ole annettu. Tämä voi olla hyödyllistä monikielisen puheen aikana. Jos kuitenkin tunnet puheen kielen, tämän vaihtoehdon tarjoaminen voi parantaa puheen transkriptiotarkkuutta. Äänitiedoston kesto sekunteina.
  • duration_s Tätä asetusta käytetään vartijana, jotta varmistetaan, että transkriptio tapahtuu vain, jos äänitiedoston pituus vastaa asetuksen kestoa. Oletuksena tämä asetus jätetään huomiotta, ja transkriptiot käsitellään niiden pituudesta riippumatta. Puhtaaksi kirjoitettava enimmäiskesto sekunteina. Käytä tätä asetusta, jos haluat rajoittaa puheen määrää, joka on luettavissa. Aseta tämä arvoon
  • max_duration_s Jos haluat käsitellä koko transkriptin, riippumatta sen kestosta (⚠️ käytä varoen). Oletusarvoisesti tämä asetus on. , varmistaen, että vain puheen kahden ensimmäisen tunnin tekstit on kirjoitettu.Transkriptiovastaus0Voit seurata transkriptiotietoja asynkronisesti, kun ne tulevat saataville, käyttämällä. 7200 tapahtumankäsittelijä, joka tarjoaa
VastausobjektionDataThe. response ominaisuudella on seuraavat ominaisuudet:
: Arvo 0 ja 1 välillä, joka ilmaisee transkription edistymisen prosentteinaresponse Jos tila on "käsitellään" tai "valmis", aikajanaobjekti on käytettävissä ja näyttää koko siihen asti saatavilla olleen transkriptin. Aikajana on joukko objekteja, jotka sisältävät seuraavat ominaisuudet:
  • status: transkriptiosegmentin alkamisaika
  • data.progress: transkriptiosegmentin päättymisaika
  • data.timeline: transkriptiosegmentin tekstipala: ISO 639-1 -kielikoodien ja käännösten avain-arvo-säilytys (tämä ominaisuus on käytettävissä vain, jos transkriptiossa on vähintään yksi käännös)
    • startJälkikäsittely
    • endKun transkriptio on valmis, tapahtuu jälkikäsittely, jonka jälkeen lopullinen ääni on valmis.
    • text lähetetään osoitteeseen
    • translations.Lopullisessa vastauksessa transkription tila on "valmis", ja nämä uudet ominaisuudet sisällytetään.
: yhteenveto koko transkriptiosta yhdessä kappaleessaresponse: koko transkriptio ryhmitelty kappaleisiin, jotka on segmentoitu teemojen mukaan tai merkityksellisellä siirtymällä uuteen aiheeseenonDataTypescript-tukidataVocalStackin JavaScript SDK:lla on täysi TypeScript-tuki. Esimerkiksi
  • keywords objektilla on
  • summary tyyppi.
  • paragraphsDemande de transcription
Le code de langue ISO 639-1 pour le discours.response Par exemple "en" (anglais), ou "ro" (roumain). Par défaut, VocalStack tentera de transcrire dans toutes les langues si cette option n'est pas fournie. Cela peut être utile pour la parole multilingue. Cependant, si vous connaissez la langue du discours, cette option peut augmenter la précision de la transcription. UrlTranscriptionResponseLa durée, en secondes, du fichier audio.
TSTypeScript
import { UrlTranscription, UrlTranscriptionResponse } from '@vocalstack/js-sdk'; const sdk = new UrlTranscription({ apiKey: 'YOUR-API-KEY' }); const transcription = await sdk.start({ url: 'http://example.com/audio.mp3' }); transcription.onData((response: UrlTranscriptionResponse) => { console.log(response.data); });
Scroll Up