Transcríbalo a texto utilizando los modelos de IA más grandes y potentes disponibles, incluidos: OpenAI Whisper large-v3 LLM. Excelente manejo de ruido de fondo, múltiples acentos o habla en vivo.
¡Sea uno de los primeros en adoptar y reciba horas de transcripción gratis adicionales cada mes!
Sin costes recurrentes
$40 por mes Facturado anualmente AnualMensual Anual |
Transcripciones pre-grabadas | $0.35 por hora |
---|---|
Transcripción en vivo | $0.80 por hora |
Acceso a API | |
---|---|
Acceso a la base de datos | |
Servicios gestionados | |
Límite de tasa de transcripción | máximo 50 sesiones simultáneas |
Inicio del servidor | warm boot in non-peak times |
Transcribir audio desde el archivo subido | |
---|---|
Transcribir audio desde URL | |
Transcribir audio desde el micrófono | |
Exportar subtítulos y archivos | |
Traducir transcripciones de audio | |
Polyglot |
Transcribir desde el micrófono | |
---|---|
Transcribir desde Live Stream | |
Transcripciones en tiempo real a través de URL pública | |
Traducciones en tiempo real a través de URL pública | |
Transcripciones históricas vía URL pública | |
Habilitar protección por contraseña | |
Transcripciones programadas de Livestream |
Soporte de idiomas | 57 idiomas más dialectos y acentos |
---|---|
Detección automática de idioma | |
Segmentación de párrafos | |
Resumen | |
Marcas de tiempo a nivel de palabra | |
Alineación a nivel de palabra | |
Diarización de altavoces |
Ayuda & soporte | Soporte por correo electrónico y chat en vivo |
---|---|
SLA |
VocalStack utiliza grandes modelos de lenguaje (LLM) para obtener la mejor calidad de transcripción posible, incluso en los entornos de audio más desafiantes. Esto incluye Whisper, que sirve como el modelo central para la plataforma VocalStack. El gran modelo Whisper es un modelo de IA de última generación que ha sido entrenado en una gran cantidad de datos para comprender y transcribir el habla con precisión.
Para entender mejor el impacto del tamaño de un modelo de IA, usemos los diferentes modelos de Whisper para transcribir un extracto ficticio:
No, no se le cobrará por la hora completa. Nuestros costos de facturación siempre se calculan por segundo de audio transcrito, independientemente de si la transcripción es un audio pregrabado o en vivo. Esto significa que solo se le factura por lo que necesita transcribir. La única excepción es que el audio debe durar al menos un minuto. De lo contrario, se le facturará por todo el minuto.
Para simplificar esto aún más, esto es lo que se le facturará en cada plan por una transcripción pregrabada (suponiendo que haya utilizado todas sus horas de transcripción gratuitas para el mes):
No, no hay costos ocultos. Solo paga por la transcripción de su contenido de audio. (En otras palabras, solo para los costos enumerados en la tabla de precios. ) Otras características como la detección automática de idiomas, traducciones, resúmenes, segmentación de párrafos, detección de palabras clave y marcas de tiempo se incluyen de forma gratuita.
Es importante señalar que el número de traducciones no afecta el costo de la transcripción. Por ejemplo, si transcribe un archivo de audio en inglés y luego lo traduce al español, francés y alemán, solo se le facturará por la transcripción del audio en inglés. Esto también se aplica a las transcripciones en vivo utilizando Polyglot. Puede realizar un número ilimitado de traducciones en cualquier momento sin cargos adicionales.
La transcripción pregrabada se refiere al proceso de transcripción de audio que ha sido previamente grabado. Se puede cargar como un archivo de audio y transcribir en un momento posterior, por lo que es adecuado para podcasts, entrevistas, videos y otro contenido grabado.
La transcripción en vivo se refiere al proceso de transcripción de audio en tiempo real mientras se habla. Esto es útil para transmisiones en vivo, podcasts, eventos, reuniones, conferencias y otros escenarios donde se requiere transcripción inmediata (y posiblemente traducción)