
IA da Krisp Converte Sotaques em Tempo Real para Comunicação Mais Clara
A Krisp, uma empresa de inovação em áudio, acaba de revelar uma nova funcionalidade fascinante: conversão de sotaque alimentada por IA. Imagine falar no seu sotaque nativo e tê-lo transformado perfeitamente para outro em tempo real durante as chamadas. É precisamente isso que a Krisp pretende alcançar, começando com sotaques de inglês indiano convertidos para inglês dos EUA.
De acordo com a Krisp, esta não é apenas uma mudança superficial; a IA troca cuidadosamente os fonemas para se alinhar com os sotaques americanos, preservando a voz única do falante. Esta tecnologia foi alegadamente testada em ambientes empresariais e, agora, uma versão beta está acessível através da aplicação desktop da Krisp. Os utilizadores têm a flexibilidade de ativar a funcionalidade sempre que precisarem, antes ou durante uma chamada.
A Origem do Conversor de Sotaque
Arto Minasyan, cofundador da Krisp, partilhou a motivação pessoal por trás deste desenvolvimento. Ele notou que o seu sotaque por vezes representava uma barreira para uma comunicação clara, mesmo quando falava inglês fluentemente. Isto inspirou a equipa a explorar a conversão de sotaque como uma potencial solução, levando a dois anos de trabalho dedicado e ao lançamento beta que vemos hoje.
Embora os testes iniciais por alguns repórteres tenham produzido resultados mistos – com sons não naturais ocasionais e palavras em falta – a Krisp atribui estes problemas à fase beta e garante aos utilizadores que o modelo de IA irá melhorar continuamente com mais dados e feedback dos utilizadores.
Resultados Promissores em Testes Empresariais
A Krisp destaca resultados impressionantes de testes empresariais, alegando um aumento de 26,1% nas taxas de conversão de vendas e um aumento de 14,8% na receita por reserva. A decisão de se concentrar inicialmente em sotaques indianos decorre da representação significativa de profissionais indianos em áreas STEM a nível mundial. A empresa também planeia expandir o suporte para incluir outros sotaques, como o filipino.
Outras empresas, como a Sanas, apoiada pela GV, também têm vindo a desenvolver tecnologia semelhante, implementando-a em grande escala em call centers. A Krisp treinou o seu modelo usando vastos conjuntos de dados de amostras de voz que abrangem diversos sotaques e dialetos, incorporando dados do seu assistente de reunião com o consentimento do utilizador.
Uma vantagem fundamental da abordagem da Krisp, de acordo com Minasyan, é que não requer pré-treino em vozes individuais. A IA cria um perfil de orador em tempo real, tornando-o instantaneamente utilizável.
Olhando para o futuro, a Krisp, que garantiu o último financiamento em 2021, pretende lançar aplicações iOS e Android este ano para facilitar reuniões presenciais. Além disso, uma nova extensão do Chrome está em desenvolvimento para melhorar a integração com o Google Meet.
Fonte: TechCrunch