Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Cartesia vient de lancer Sonic-3, son nouveau modèle phare de synthèse vocale pour la conversation en temps réel
Sonic-3 offre un streaming de synthèse vocale avec des éléments prosodiques intégrés tels que le rire, ainsi que des émotions comme la surprise et la curiosité. Le nouveau modèle prend en charge 42 langues, y compris 9 langues indiennes.
Sonic-3 s'appuie sur une architecture de Modèle d'Espace d'État (SSM) comme les précédentes versions de Cartesia. Cartesia a été un leader dans l'utilisation des SSM, d'autres modèles utilisant généralement des architectures basées sur des transformateurs. Les SSM sont généralement plus efficaces en termes de calcul et de mémoire, ce qui contribue probablement à la latence relativement impressionnante de Sonic-3.
Cartesia propose un modèle de tarification par abonnement et crédits allant de 0 $ par mois pour un usage personnel, jusqu'à 299 $ par mois pour leur package Scale.
Sonic-3 a été ajouté à l'Arène de Synthèse Vocale d'Analyse Artificielle pour le vote de préférence des aveugles.
Écoutez des extraits ci-dessous 🎧
Meilleurs
Classement
Favoris

