رونوشت گفتار به متن با استفاده از بزرگترین و قدرتمندترین مدلهای هوش مصنوعی موجود، از جمله: OpenAI Whisper large-v3 LLM. گاهی اوقات، صدای بلند، صدای بلند، صدای بلند، صدای بلند، صدای بلند، صدای بلند، صدای بلند.
از این رو، هر ماه یک بار، به صورت رایگان، کتابهای جدیدی را به چاپ میرساند.!
هیچ هزینهٔ تکراری
$40 هر ماه صورتحساب سالانه سالانهماهانه سالانه |
رونوشتهای پیشساخته | $0.35 هر ساعت |
---|---|
رونوشت زنده | $0.80 هر ساعت |
دسترسی API | |
---|---|
دسترسی به پایگاه داده | |
خدمات مدیریتشده | |
محدودیت نرخ رونوشت | بیشینه ۵۰ نشست همزمان |
آغاز کارساز | warm boot in non-peak times |
رونوشت صدا از پروندۀ بارگذاری شده | |
---|---|
رونوشت صدا از نشانی وب | |
رونوشت صدا از میکروفون | |
صادرات زیرنویسها و پروندهها | |
ترجمه | |
Polyglot |
رونوشت از میکروفون | |
---|---|
رونوشت از جریان زنده | |
رونوشتهای زمان واقعی از طریق نشانی وب عمومی | |
ترجمههای همزمان از طریق نشانی وب عمومی | |
فهرست شهرهای بریتانیا "Urban URLs" | |
فعالسازی محافظت گذرواژه | |
رونوشتهای جریان زنده برنامهریزی شده |
پشتیبانی زبان | ۵۷ زبان به علاوه لهجهها و لهجهها |
---|---|
تشخیص خودکار زبان | |
بخشبندی پاراگراف | |
خلاصه | |
مهرهای زمانی سطح کلمه | |
همتراز کردن سطح کلمه | |
شناسه گوینده |
کمک و پشتیبانی | پشتیبانی از ایمیل و گپ زنده |
---|---|
SLA |
VocalStack از مدلهای زبان بزرگ (LLMs) برای بدست آوردن بهترین کیفیت رونویسی ممکن، حتی در چالش برانگیزترین محیطهای صوتی استفاده میکند. این شامل Whisper است که به عنوان مدل اصلی برای پلتفرم VocalStack عمل میکند. مدل Whisper بزرگ یک مدل هوش مصنوعی پیشرفته است که بر روی مقدار زیادی از دادهها آموزش دیده است تا سخن را به درستی بفهمد و رونویسی کند.
برای درک بهتر تأثیر اندازه یک مدل هوش مصنوعی، بیایید از مدلهای گویای مختلف برای رونویسی یک قطعه تخیلی استفاده کنیم:
نه، براي تمام ساعت حسابي بهت نمي زنن. هزینههای ما همیشه بر اساس ثانیه رونوشت صوتی محاسبه میشود، بدون توجه به اینکه رونوشت صوتی از پیش ضبط شده یا صوتی زنده باشد. به اين معني که شما فقط براي چيزي که لازم داريد رونوشت کنيد حساب ميگيريد. تنها استثنا این است که صدا باید حداقل یک دقیقه طول بکشد. در غير اينصورت، تمام اين يک دقيقه رو حساب ميکنيم.
برای سادهتر کردن این موضوع، در هر برنامه برای یک رونوشت از پیش ضبط شده (با فرض اینکه شما تمام ساعتهای رونوشت رایگان خود را برای ماه استفاده کردهاید) اینگونه به شما صورتحساب داده میشود:
نه، هيچ هزينه پنهاني وجود نداره. شما فقط براي رونوشت محتواي صوتي خود پول مي دهيد. (به عبارت دیگر، فقط برای هزینههایی که در جدول قیمتگذاری ذکر شدهاند. ویژگیهای دیگر مانند تشخیص خودکار زبان، ترجمهها، خلاصهسازیها، بخشبندی پاراگراف، تشخیص کلمات کلیدی و مهرههای زمانی رایگان هستند.
مهم است که تعداد ترجمهها بر هزینه رونویسی تأثیر نمیگذارد. به عنوان مثال، اگر شما یک فایل صوتی را به انگلیسی رونوشت کنید و سپس آن را به اسپانیایی، فرانسوی و آلمانی ترجمه کنید، فقط برای رونوشت صدای انگلیسی مبلغی دریافت خواهید کرد. این امر همچنین در مورد رونویسی زنده با استفاده از Polyglot نیز صادق است. شما میتوانید تعداد نامحدود ترجمه را در هر زمان بدون هیچ هزینه اضافی انجام دهید.
رونویسی از پیش ضبط شده به فرایند رونویسی صدایی که قبلاً ضبط شده اشاره دارد. این میتواند به عنوان یک فایل صوتی بارگذاری شود و بعداً رونویسی شود، که برای پادکستها، مصاحبهها، ویدئوها و سایر محتواهای ضبط شده مناسب است.
رونویسی زنده (به انگلیسی: Live transcription) به فرایند رونویسی صدا در زمان واقعی همانطور که گفته میشود، اشاره دارد. این برای جریانهای زنده، پادکستها، رویدادها، جلسات، سخنرانیها و دیگر سناریوهایی که رونوشت فوری (و احتمالاً ترجمه) مورد نیاز است، مفید است