A Cartesia acaba de lançar o Sonic-3, o seu novo modelo de Texto para Fala de destaque para conversação em tempo real O Sonic-3 oferece streaming de Texto para Fala com elementos prosódicos integrados, como risadas, bem como emoções como surpresa e curiosidade. O novo modelo suporta 42 idiomas, incluindo 9 idiomas indianos. O Sonic-3 utiliza uma arquitetura de Modelo de Espaço de Estado (SSM) como os lançamentos anteriores da Cartesia. A Cartesia tem sido uma líder no uso de SSMs, enquanto outros modelos normalmente utilizam arquiteturas baseadas em transformadores. Os SSMs são geralmente mais eficientes em termos de computação e memória, o que provavelmente contribui para a latência comparativamente impressionante do Sonic-3. A Cartesia oferece um modelo de preços por assinatura e créditos que varia de $0 por mês para uso pessoal, até $299 por mês para o seu pacote Scale. O Sonic-3 foi adicionado à Arena de Texto para Fala de Análise Artificial para votação de preferência de deficientes visuais. Ouça clipes de amostra abaixo 🎧