VocalStack Logo

Preços simples - Qualidade superior

Transcreva fala para texto usando os maiores e mais poderosos modelos de IA disponíveis, incluindo: OpenAI Whisper large-v3 LLM. Excelente manuseio de ruído de fundo, vários sotaques ou fala ao vivo.

🎉   Bem-vindo ao lançamento do VocalStack Beta!

Seja um dos primeiros a adotar e receba horas de transcrição adicionais gratuitas a cada mês!

Hobby

$0

Sem custos recorrentes

Obtenha este plano
  • 8 horas de transcrições gratuitas por mês
  • A mesma transcrição de alta qualidade que nos planos pagos
  • Não é necessário cartão de crédito para as transcrições mensais gratuitas

Premium

$40

por mês

Cobrança anual

AnualmenteMensal
Anualmente
Obtenha este plano
  • 40 horas de transcrições gratuitas por mês
  • $0.35 por hora adicional de transcrição pré-gravada
  • $0.80 por hora adicional de transcrição ao vivo
  • Acesso ilimitado ao Polyglot
  • API para acesso programático

Enterprise

preços personalizados
Vamos falar
  • Transcrições ilimitadas
  • Sessões simultâneas ilimitadas
  • Suporte de TI dedicado
  • SLA personalizado

Comparação de planos de preços

Premium

Um plano que se adapta às suas necessidades

Obtenha este plano

$40

por mês

Cobrança anual

AnualmenteMensal
Anualmente

Transcrições
As primeiras 40 horas são gratuitas a cada mês

Transcrições pré-gravadas
$0.35 por hora
Transcrição ao vivo
$0.80 por hora

DesenvolvedoresIntegre a funcionalidade VocalStack em sua infraestrutura existente usando o API ou JavaScript SDK.

Acesso à API
Acesso ao banco de dados
Serviços gerenciados
Limite de taxa de transcrição
max 50 sessões simultâneas
Servidor de Início
warm boot in non-peak times

DashboardPronto para usar imediatamente após a inscrição para uma conta. Nenhuma habilidade técnica necessária. Acessível a partir de qualquer dispositivo com um navegador da web.

Transcrever áudio de arquivo carregado
Transcrever áudio a partir de URL
Transcrever áudio a partir de microfone
Exportar legendas e arquivos
Traduzir Transcrições em Inglês
Polyglot

PolyglotCompartilhe sua transcrição ao vivo por meio de um link público e os espectadores podem ler no idioma de sua preferência.

Transcrever a partir de Microfone
Transcrever a partir de Live Stream
Transcrições em tempo real via URL pública
Traduções em tempo real via URL público
Transcrições históricas via URL pública
Ativar proteção por senha
Transcrições de Livestream agendadas

Melhorias de AISem custo adicional, VocalStack aproveita uma gama diversificada de modelos de IA para melhorar significativamente a qualidade de cada transcrição.

Suporte de idioma
57 idiomas, mais dialetos e sotaques
Detecção automática de idioma
Segmentação de parágrafo
Resumo
Carimbos de tempo de nível de palavra
Alinhamento de nível de palavra
Speaker Diarization (em inglês)

Apoio

Ajuda & suporte
Suporte por e-mail e chat ao vivo
SLA

Calculadora de preços

HobbyPremium
Hobby
AnualmenteMensal
Anualmente
Pré-gravadoLive
Pré-gravado
Hobby
Pre-recorded
Premium
Pre-recordedBilled Annually

Perguntas mais frequentes

VocalStack usa grandes modelos de linguagem (LLMs) para obter a melhor qualidade de transcrição possível, mesmo nos ambientes de áudio mais desafiadores. Isso inclui o Whisper, que serve como o modelo principal para a plataforma VocalStack. O grande modelo Whisper é um modelo de IA de última geração que foi treinado em uma vasta quantidade de dados para entender e transcrever a fala com precisão.

Para entender melhor o impacto do tamanho de um modelo de IA, vamos usar os diferentes modelos do Whisper para transcrever um trecho fictício:

97%
DiferençaTexto bruto
Diferença
In a quaint little cafée near the Thames, Claire chuckled as Pierre ate eight eclairs all in one go. Anticipating gastroesophageal reflux, he said, "nNope, they're not worth it!". Later, they called a Lyft to drive them to the park, as Pierre thinks it's cheaper than Uber. As they walked under the glow of the noctilucent sky, they jumped when they'd seen a bear clothed only in his bare fur. Pierre cried out loud, "Mon Dieu!" They both leapt hastily into the river and swam for Chiswick Eyot. "Phew!"
Original Text
In a quaint little café near the Thames, Claire chuckled as Pierre ate eight eclairs all in one go. Anticipating gastroesophageal reflux, he said "nope, they're not worth it!" Later, they called a Lyft to drive them to the park, as Pierre thinks its cheaper than Uber. As they walked under the glow of the noctilucent sky, they jumped when they'd seen a bear clothed only in his bare fur. Pierre cried out loud, "Mon Dieu!" They both leapt hastily into the river and swam for Chiswick Eyot. Phew!

Não, você não será cobrado pela hora inteira. Nossos custos de faturamento são sempre calculados por segundo de áudio transcrito, independentemente de a transcrição ser um áudio pré-gravado ou ao vivo. Isso significa que você só é cobrado pelo que precisa ser transcrito. A única exceção é que o áudio deve ter pelo menos um minuto. Caso contrário, você será cobrado pelo minuto inteiro.

Para simplificar ainda mais, aqui está o que você será cobrado em cada plano para uma transcrição pré-gravada (assumindo que você tenha usado todas as suas horas de transcrição gratuitas para o mês):

30 minutes
Hobby Plan Custo da transcrição pré-gravada
$0.3500
Premium Plan Custo da transcrição pré-gravada
$0.1750

Não, não existem custos ocultos. Você só paga pela transcrição do seu conteúdo de áudio. (Em outras palavras, apenas para os custos listados na tabela de preços. ) Outros recursos como detecção automática de idioma, traduções, resumos, segmentação de parágrafos, detecção de palavras-chave e carimbos de data e hora estão incluídos gratuitamente.

É importante salientar que o número de traduções não afecta o custo da transcrição. Por exemplo, se você transcrever um arquivo de áudio em inglês e depois traduzi-lo para espanhol, francês e alemão, você só será cobrado pela transcrição do áudio em inglês. Isso também se aplica a transcrições ao vivo usando o Polyglot. Você pode realizar um número ilimitado de traduções a qualquer momento sem nenhum custo adicional.

A transcrição pré-gravada refere-se ao processo de transcrição de áudio que foi previamente gravado. Ele pode ser carregado como um arquivo de áudio e transcrito em um momento posterior, tornando-o adequado para podcasts, entrevistas, vídeos e outros conteúdos gravados.

A transcrição ao vivo refere-se ao processo de transcrição de áudio em tempo real à medida que é falado. Isso é útil para transmissões ao vivo, podcasts, eventos, reuniões, palestras e outros cenários em que a transcrição imediata (e possivelmente tradução) é necessária

Suporte para mais de 57 idiomas, incluindo diferentes dialetos e sotaques. Os idiomas suportados incluem: africâner, árabe, armênio, azerbaijanês, bielorrusso, bósnio, búlgaro, catalão, chinês, croata, checo, dinamarquês, holandês, inglês, estoniano, finlandês, francês, galego, alemão, grego, hebraico, hindi, húngaro, islandês, indonésio, italiano, japonês, kannada, cazaque, coreano, letão, lituano, macedônio, malaio, marathi, maori, nepalês, norueguês, persa,.