Proste ceny - najwyższa jakość

Transkrypcja mowy na tekst przy użyciu największych i najpotężniejszych modeli sztucznej inteligencji, w tym: OpenAI Whisper large-v3 LLM. Doskonała obsługa hałasu w tle, wielu akcentów lub mowy na żywo.

🎉   Witamy w wersji VocalStack Beta!

Bądź wczesnym użytkownikiem i otrzymuj dodatkowe darmowe godziny transkrypcji każdego miesiąca!

Hobby

$0

Brak kosztów cyklicznych

Pobierz ten plan
  • 8 godzin darmowych transkrypcji każdego miesiąca
  • Taka sama wysoka jakość transkrypcji jak w płatnych planach
  • Karta kredytowa nie jest wymagana do darmowych miesięcznych transkrypcji

Premium

$40

Cena za miesiąc

Rozliczane corocznie

Co rokuMiesięcznie
Co roku
Pobierz ten plan
  • 40 godzin darmowych transkrypcji każdego miesiąca
  • $0.35 za dodatkową godzinę nagranej transkrypcji
  • $0.80 za dodatkową godzinę transkrypcji na żywo
  • Nieograniczony dostęp do Polyglot
  • API dla dostępu programowego

Enterprise

Custom pricing
Porozmawiajmy
  • Nieograniczona liczba transkrypcji
  • Nieograniczona liczba jednoczesnych sesji
  • Dedykowane wsparcie IT
  • Custom SLA

Porównanie planów cenowych

Premium

Plan, który skaluje się zgodnie z Twoimi wymaganiami

Pobierz ten plan

$40

Cena za miesiąc

Rozliczane corocznie

Co rokuMiesięcznie
Co roku

Transkrypcja
Pierwsze 40 godzin jest bezpłatnych każdego miesiąca

Pre-recorded Transscriptions
$0.35 Cena za godzinę
Live Transscription
$0.80 Cena za godzinę

DeweloperzyZintegruj funkcjonalność VocalStack z istniejącą infrastrukturą za pomocą API lub JavaScript SDK.

API Access
Database Access
Usługi zarządzane
Limit szybkości transkrypcji
max 50 jednoczesnych sesji
Server Start
warm boot in non-peak times

DashboardGotowy do użycia natychmiast po założeniu konta. Nie wymaga umiejętności technicznych. Dostępne Z dowolnego urządzenia Za pomocą przeglądarki internetowej.

Transkrypcja audio z przesłanego pliku
Transkrypcja audio z URL
Transkrypcja dźwięku z mikrofonu
Eksportowanie napisów i plików
Przetłumacz Transkrypcje
Polyglot

PolyglotUdostępnianie transkrypcji na żywo za pośrednictwem publicznego linku oraz Widzowie mogą czytać w preferowanym języku.

Transkrypcja z mikrofonu
Transkrypcja z Live Stream
Transkrypcje w czasie rzeczywistym za pośrednictwem publicznego adresu URL
Tłumaczenia w czasie rzeczywistym za pośrednictwem publicznego adresu URL
Historyczne transkrypcje poprzez publiczny adres URL
Włącz ochronę hasłem
Zaplanowane transkrypcje Livestream

AI EnhancementsBez dodatkowych kosztów, VocalStack wykorzystuje różnorodną gamę modeli AI, aby znacznie poprawić jakość Każda transkrypcja.

Wsparcie językowe
57 języków plus dialekty i akcenty
Automatyczne wykrywanie języka
Segmentacja akapitu
Sumowanie
Word-Level Time Stamps
Word-Level Alignment
Diaryzacja głosu

Wsparcie

Pomoc & wsparcie
Wsparcie przez e-mail i czat na żywo
SLA

Kalkulator cen

HobbyPremium
Hobby
Co rokuMiesięcznie
Co roku
Pre-recordedLive
Pre-recorded
Hobby
Pre-recorded
Premium
Pre-recordedBilled Annually

Często zadawane pytania

VocalStack wykorzystuje duże modele językowe (LLM), aby uzyskać najlepszą możliwą jakość transkrypcji, nawet w najbardziej wymagających środowiskach audio. Obejmuje to Whisper, który służy jako podstawowy model dla platformy VocalStack. Duży model Whisper to najnowocześniejszy model sztucznej inteligencji, który został przeszkolony na podstawie ogromnej ilości danych, aby dokładnie rozumieć i transkrybować mowę.

Aby lepiej zrozumieć wpływ rozmiaru modelu AI, użyjmy różnych modeli Whisper do transkrypcji fikcyjnego fragmentu:

97%
RóżnicaRaw Text
Różnica
In a quaint little cafée near the Thames, Claire chuckled as Pierre ate eight eclairs all in one go. Anticipating gastroesophageal reflux, he said, "nNope, they're not worth it!". Later, they called a Lyft to drive them to the park, as Pierre thinks it's cheaper than Uber. As they walked under the glow of the noctilucent sky, they jumped when they'd seen a bear clothed only in his bare fur. Pierre cried out loud, "Mon Dieu!" They both leapt hastily into the river and swam for Chiswick Eyot. "Phew!"
Original Text
In a quaint little café near the Thames, Claire chuckled as Pierre ate eight eclairs all in one go. Anticipating gastroesophageal reflux, he said "nope, they're not worth it!" Later, they called a Lyft to drive them to the park, as Pierre thinks its cheaper than Uber. As they walked under the glow of the noctilucent sky, they jumped when they'd seen a bear clothed only in his bare fur. Pierre cried out loud, "Mon Dieu!" They both leapt hastily into the river and swam for Chiswick Eyot. Phew!

Nie, nie zostaniesz obciążony za całą godzinę. Nasze koszty rozliczeniowe są zawsze obliczane za sekundę transkrypcji audio, niezależnie od tego, czy transkrypcja jest nagrana wstępnie, czy na żywo. Oznacza to, że płacisz tylko za to, co musisz przetranskrybować. Jedynym wyjątkiem jest to, że dźwięk musi trwać co najmniej minutę. W przeciwnym razie zostanie naliczona opłata za całą minutę.

Aby jeszcze bardziej to uprościć, oto, ile będziesz płacić w ramach każdego planu za wstępnie nagraną transkrypcję (zakładając, że wykorzystałeś wszystkie bezpłatne godziny transkrypcji w danym miesiącu):

30 minutes
Hobby Plan Wstępnie nagrany koszt transkrypcji
$0.3500
Premium Plan Wstępnie nagrany koszt transkrypcji
$0.1750

Nie, nie ma żadnych ukrytych kosztów. Płacisz tylko za transkrypcję treści audio. (Innymi słowy, tylko za koszty wymienione w tabeli cenowej. ) Inne funkcje, takie jak automatyczne wykrywanie języka, tłumaczenia, podsumowania, segmentacja akapitu, wykrywanie słów kluczowych i znaczniki czasu są zawarte za darmo.

Co ważne, liczba tłumaczeń nie wpływa na koszt transkrypcji. Na przykład, jeśli dokonasz transkrypcji pliku audio w języku angielskim, a następnie przetłumaczysz go na język hiszpański, francuski i niemiecki, zostaniesz obciążony tylko za transkrypcję audio w języku angielskim. Dotyczy to również transkrypcji na żywo przy użyciu Polyglot. Możesz wykonać nieograniczoną liczbę tłumaczeń w dowolnym momencie bez żadnych dodatkowych opłat.

Wstępnie nagrana transkrypcja odnosi się do procesu transkrypcji dźwięku, który został wcześniej nagrany. Można go przesłać jako plik audio i transkrybować w późniejszym czasie, dzięki czemu nadaje się do podcastów, wywiadów, filmów i innych nagranych treści.

Transkrypcja na żywo odnosi się do procesu transkrypcji dźwięku w czasie rzeczywistym, gdy jest on mówiony. Jest to przydatne w przypadku transmisji na żywo, podcastów, wydarzeń, spotkań, wykładów i innych scenariuszy, w których wymagana jest natychmiastowa transkrypcja (i ewentualnie tłumaczenie)

Obsługa ponad 57 języków, w tym różnych dialektów i akcentów. Obsługiwane języki to: afrykanerski, arabski, ormiański, azerbejdżański, białoruski, bośniacki, bułgarski, kataloński, chiński, chorwacki, czeski, duński, holenderski, angielski, estoński, fiński, francuski, galicyjski, niemiecki, grecki, hebrajski, hindi, węgierski, islandzki, indonezyjski, włoski, japoński, kannada, kazachski, koreański, łotewski.