VocalStack Logo

Prezos simples - Calidade superior

Transcreba voz a texto empregando os modelos de IA máis grandes e potentes dispoñibles, incluíndo: OpenAI Whisper large-v3 LLM. Excelente manexo do ruído de fondo, múltiples acentos ou voz en directo.

🎉   Benvido á versión beta de VocalStack!

Sexa un dos primeiros en adoptar o sistema e reciba horas de transcripción gratuítas cada mes!

Hobby

$0

Sen custos recorrentes

Obter este plan
  • 8 horas de transcrición gratuíta cada mes
  • A mesma transcrición de alta calidade que nos plans de pago
  • Non se precisa tarxeta de crédito para as transcricións mensais gratuítas

Premium

$40

por mes

Facturación anual

AnualMensual
Anual
Obter este plan
  • 40 horas de transcrición gratuíta cada mes
  • $0. 35 por hora adicional de transcripción pregrabada
  • $0.80 por hora adicional de transcrición en directo
  • Acceso ilimitado a Polyglot
  • API para acceso por programación

Enterprise

prezo personalizado
Falemos
  • Transcricións ilimitadas
  • Sesións simultáneas ilimitadas
  • Soporte dedicado de TI
  • SLA personalizado

Comparación de plans de prezos

Premium

Un plan que se adapta ás súas necesidades

Obter este plan

$40

por mes

Facturación anual

AnualMensual
Anual

Transcricións
as primeiras 40 horas son gratuítas cada mes

Transcricións pregrabadas
$0.35 por hora
Transcrición en directo
$0.80 por hora

DesenvolventesIntegre a funcionalidade de VocalStack na súa infraestrutura existente empregando o API ou JavaScript SDK.

Acceso á API
Acceso á base de datos
Servizos xestionados
Límite da taxa de transcrición
max 50 sesións simultáneas
Inicio do servidor
warm boot in non-peak times

DashboardListo para usar inmediatamente despois de rexistrarse nunha conta. Non se precisan habilidades técnicas. Accesibilidade desde calquera dispositivo con un navegador web.

Transcreba o son do ficheiro enviado
Transcreba o son desde o URL
Transcreba o son do micrófono
Exportar os subtítulos e ficheiros
Traducir as transcricións
Polyglot

PolyglotComparta a súa transcrición en directo mediante unha ligazón pública, e os espectadores poden ler na súa lingua preferida.

Transcrever desde o micrófono
Transcrever desde Live Stream
Transcricións en tempo real mediante URL público
Traducións en tempo real mediante URL público
Transcricións históricas a través de URL público
Activar a protección con contrasinal
Transcricións de transmisións en directo programadas

Melloras da IASen custo adicional, VocalStack aproveita unha ampla variedade de modelos de IA para mellorar significativamente a calidade de cada transcrición.

Soporte de linguaxe
57 linguas máis dialectos e acentos
Detección automática da lingua
Segmentación de parágrafos
Resumo
Marcas de hora a nivel de palabra
Aliñamento a Nivel de Palabra
Diarización do falante

Soporte

Axuda e soporte
Soporte de correo electrónico e conversa en directo
SLA

Calculadora de prezos

HobbyPremium
Hobby
AnualMensual
Anual
PregrabadoLive
Pregrabado
Hobby
Pre-recorded
Premium
Pre-recordedBilled Annually

Preguntas frecuentes

VocalStack emprega grandes modelos de linguaxe (LLMs) para obter a mellor calidade de transcrición posible, mesmo nos ambientes de son máis desafiantes. Isto inclúe Whisper, que serve como o modelo principal para a plataforma VocalStack. O gran modelo Whisper é un modelo de IA de última xeración que foi adestrado nunha gran cantidade de datos para entender e transcribir a fala con precisión.

Para entender mellor o impacto do tamaño dun modelo de IA, usemos os diferentes modelos Whisper para transcrever un extracto ficticio:

97%
DiferenzaTexto en bruto
Diferenza
In a quaint little cafée near the Thames, Claire chuckled as Pierre ate eight eclairs all in one go. Anticipating gastroesophageal reflux, he said, "nNope, they're not worth it!". Later, they called a Lyft to drive them to the park, as Pierre thinks it's cheaper than Uber. As they walked under the glow of the noctilucent sky, they jumped when they'd seen a bear clothed only in his bare fur. Pierre cried out loud, "Mon Dieu!" They both leapt hastily into the river and swam for Chiswick Eyot. "Phew!"
Original Text
In a quaint little café near the Thames, Claire chuckled as Pierre ate eight eclairs all in one go. Anticipating gastroesophageal reflux, he said "nope, they're not worth it!" Later, they called a Lyft to drive them to the park, as Pierre thinks its cheaper than Uber. As they walked under the glow of the noctilucent sky, they jumped when they'd seen a bear clothed only in his bare fur. Pierre cried out loud, "Mon Dieu!" They both leapt hastily into the river and swam for Chiswick Eyot. Phew!

Non, non se lle cobrará toda a hora. Os nosos custos de facturación son sempre calculados por segundo de audio transcrito, independentemente de que a transcrición sexa un audio pregrabado ou en directo. Isto significa que só se factura o que se precisa transcribir. A única excepción é que o audio debe durar polo menos un minuto. De non ser así, cobrarase o minuto enteiro.

Para simplificalo aínda máis, isto é o que se lle cobrará en cada plan por unha transcripción pregrabada (supoñendo que esgotou todas as horas de transcripción libres do mes):

30 minutes
Hobby Plan Custo da transcripción pregravada
$0.3500
Premium Plan Custo da transcripción pregravada
$0.1750

Non, non hai custos ocultos. Só paga pola transcrición do seu contido de audio. (Noutras palabras, só para os custos listados na táboa de prezos. ) Inclúense de balde outras funcionalidades como a detección automática da lingua, traducións, resumos, segmentación de parágrafos, detección de palabras clave e marcas de data/ hora.

É importante salientar que o número de traducións non afecta ao custo da transcrición. Por exemplo, se transcribe un ficheiro de audio en inglés e logo o traduce ao castelán, francés e alemán, só se lle cobrará pola transcrición do audio en inglés. Isto tamén se aplica ás transcricións en directo usando Polyglot. Pode realizar un número ilimitado de traducións en calquera momento sen ningún custo adicional.

A transcripción pregrabada refírese ao proceso de transcrición de audio que foi previamente gravado. Pode ser enviado como un ficheiro de audio e transcrito máis tarde, o que o fai adecuado para podcasts, entrevistas, vídeos e outros contidos gravados.

A transcrición en directo refírese ao proceso de transcrición de audio en tempo real mentres se fala. Isto é útil para retransmisións en directo, podcasts, eventos, reunións, conferencias e outros escenarios nos que se requira unha transcrición inmediata (e posiblemente tradución)

Soporte para máis de 57 idiomas, incluíndo diferentes dialectos e acentos. Os idiomas soportados son: Afrikaans, árabe, armenio, azarí, bielorruso, bosníaco, búlgaro, catalán, chinés, croata, checo, dinamarqués, holandés, inglés, estoniano, finlandés, francés, galego, alemán, grego, hebreo, hindi, húngaro, islandés, indonesio, italiano, xaponés, kannada, cazaco, coreano, letón, lituano, macedonio, malaio, marathi, maorí, nepalés, noruegués, persa, polaco, portugués, romanés, ruso, serbio, eslovaco, esloveno, español,.