Transcreva fala para texto usando os maiores e mais poderosos modelos de IA disponíveis, incluindo: OpenAI Whisper large-v3 LLM. Excelente manuseio de ruído de fundo, vários sotaques ou fala ao vivo.
Seja um dos primeiros a adotar e receba horas de transcrição adicionais gratuitas a cada mês!
Sem custos recorrentes
$40 por mês Cobrança anual AnualmenteMensal Anualmente |
Transcrições pré-gravadas | $0.35 por hora |
---|---|
Transcrição ao vivo | $0.80 por hora |
Acesso à API | |
---|---|
Acesso ao banco de dados | |
Serviços gerenciados | |
Limite de taxa de transcrição | max 50 sessões simultâneas |
Servidor de Início | warm boot in non-peak times |
Transcrever áudio de arquivo carregado | |
---|---|
Transcrever áudio a partir de URL | |
Transcrever áudio a partir de microfone | |
Exportar legendas e arquivos | |
Traduzir Transcrições em Inglês | |
Polyglot |
Transcrever a partir de Microfone | |
---|---|
Transcrever a partir de Live Stream | |
Transcrições em tempo real via URL pública | |
Traduções em tempo real via URL público | |
Transcrições históricas via URL pública | |
Ativar proteção por senha | |
Transcrições de Livestream agendadas |
Suporte de idioma | 57 idiomas, mais dialetos e sotaques |
---|---|
Detecção automática de idioma | |
Segmentação de parágrafo | |
Resumo | |
Carimbos de tempo de nível de palavra | |
Alinhamento de nível de palavra | |
Speaker Diarization (em inglês) |
Ajuda & suporte | Suporte por e-mail e chat ao vivo |
---|---|
SLA |
VocalStack usa grandes modelos de linguagem (LLMs) para obter a melhor qualidade de transcrição possível, mesmo nos ambientes de áudio mais desafiadores. Isso inclui o Whisper, que serve como o modelo principal para a plataforma VocalStack. O grande modelo Whisper é um modelo de IA de última geração que foi treinado em uma vasta quantidade de dados para entender e transcrever a fala com precisão.
Para entender melhor o impacto do tamanho de um modelo de IA, vamos usar os diferentes modelos do Whisper para transcrever um trecho fictício:
Não, você não será cobrado pela hora inteira. Nossos custos de faturamento são sempre calculados por segundo de áudio transcrito, independentemente de a transcrição ser um áudio pré-gravado ou ao vivo. Isso significa que você só é cobrado pelo que precisa ser transcrito. A única exceção é que o áudio deve ter pelo menos um minuto. Caso contrário, você será cobrado pelo minuto inteiro.
Para simplificar ainda mais, aqui está o que você será cobrado em cada plano para uma transcrição pré-gravada (assumindo que você tenha usado todas as suas horas de transcrição gratuitas para o mês):
Não, não existem custos ocultos. Você só paga pela transcrição do seu conteúdo de áudio. (Em outras palavras, apenas para os custos listados na tabela de preços. ) Outros recursos como detecção automática de idioma, traduções, resumos, segmentação de parágrafos, detecção de palavras-chave e carimbos de data e hora estão incluídos gratuitamente.
É importante salientar que o número de traduções não afecta o custo da transcrição. Por exemplo, se você transcrever um arquivo de áudio em inglês e depois traduzi-lo para espanhol, francês e alemão, você só será cobrado pela transcrição do áudio em inglês. Isso também se aplica a transcrições ao vivo usando o Polyglot. Você pode realizar um número ilimitado de traduções a qualquer momento sem nenhum custo adicional.
A transcrição pré-gravada refere-se ao processo de transcrição de áudio que foi previamente gravado. Ele pode ser carregado como um arquivo de áudio e transcrito em um momento posterior, tornando-o adequado para podcasts, entrevistas, vídeos e outros conteúdos gravados.
A transcrição ao vivo refere-se ao processo de transcrição de áudio em tempo real à medida que é falado. Isso é útil para transmissões ao vivo, podcasts, eventos, reuniões, palestras e outros cenários em que a transcrição imediata (e possivelmente tradução) é necessária