Transcreba voz a texto empregando os modelos de IA máis grandes e potentes dispoñibles, incluíndo: OpenAI Whisper large-v3 LLM. Excelente manexo do ruído de fondo, múltiples acentos ou voz en directo.
Sexa un dos primeiros en adoptar o sistema e reciba horas de transcripción gratuítas cada mes!
Sen custos recorrentes
$40 por mes Facturación anual AnualMensual Anual |
Transcricións pregrabadas | $0.35 por hora |
---|---|
Transcrición en directo | $0.80 por hora |
Acceso á API | |
---|---|
Acceso á base de datos | |
Servizos xestionados | |
Límite da taxa de transcrición | max 50 sesións simultáneas |
Inicio do servidor | warm boot in non-peak times |
Transcreba o son do ficheiro enviado | |
---|---|
Transcreba o son desde o URL | |
Transcreba o son do micrófono | |
Exportar os subtítulos e ficheiros | |
Traducir as transcricións | |
Polyglot |
Transcrever desde o micrófono | |
---|---|
Transcrever desde Live Stream | |
Transcricións en tempo real mediante URL público | |
Traducións en tempo real mediante URL público | |
Transcricións históricas a través de URL público | |
Activar a protección con contrasinal | |
Transcricións de transmisións en directo programadas |
Soporte de linguaxe | 57 linguas máis dialectos e acentos |
---|---|
Detección automática da lingua | |
Segmentación de parágrafos | |
Resumo | |
Marcas de hora a nivel de palabra | |
Aliñamento a Nivel de Palabra | |
Diarización do falante |
Axuda e soporte | Soporte de correo electrónico e conversa en directo |
---|---|
SLA |
VocalStack emprega grandes modelos de linguaxe (LLMs) para obter a mellor calidade de transcrición posible, mesmo nos ambientes de son máis desafiantes. Isto inclúe Whisper, que serve como o modelo principal para a plataforma VocalStack. O gran modelo Whisper é un modelo de IA de última xeración que foi adestrado nunha gran cantidade de datos para entender e transcribir a fala con precisión.
Para entender mellor o impacto do tamaño dun modelo de IA, usemos os diferentes modelos Whisper para transcrever un extracto ficticio:
Non, non se lle cobrará toda a hora. Os nosos custos de facturación son sempre calculados por segundo de audio transcrito, independentemente de que a transcrición sexa un audio pregrabado ou en directo. Isto significa que só se factura o que se precisa transcribir. A única excepción é que o audio debe durar polo menos un minuto. De non ser así, cobrarase o minuto enteiro.
Para simplificalo aínda máis, isto é o que se lle cobrará en cada plan por unha transcripción pregrabada (supoñendo que esgotou todas as horas de transcripción libres do mes):
Non, non hai custos ocultos. Só paga pola transcrición do seu contido de audio. (Noutras palabras, só para os custos listados na táboa de prezos. ) Inclúense de balde outras funcionalidades como a detección automática da lingua, traducións, resumos, segmentación de parágrafos, detección de palabras clave e marcas de data/ hora.
É importante salientar que o número de traducións non afecta ao custo da transcrición. Por exemplo, se transcribe un ficheiro de audio en inglés e logo o traduce ao castelán, francés e alemán, só se lle cobrará pola transcrición do audio en inglés. Isto tamén se aplica ás transcricións en directo usando Polyglot. Pode realizar un número ilimitado de traducións en calquera momento sen ningún custo adicional.
A transcripción pregrabada refírese ao proceso de transcrición de audio que foi previamente gravado. Pode ser enviado como un ficheiro de audio e transcrito máis tarde, o que o fai adecuado para podcasts, entrevistas, vídeos e outros contidos gravados.
A transcrición en directo refírese ao proceso de transcrición de audio en tempo real mentres se fala. Isto é útil para retransmisións en directo, podcasts, eventos, reunións, conferencias e outros escenarios nos que se requira unha transcrición inmediata (e posiblemente tradución)