DApp Store | Hub Web3 pour les événements et les jeux

Rubriques tendance

Cartesia vient de lancer Sonic-3, son nouveau modèle phare de synthèse vocale pour la conversation en temps réel Sonic-3 offre un streaming de synthèse vocale avec des éléments prosodiques intégrés tels que le rire, ainsi que des émotions comme la surprise et la curiosité. Le nouveau modèle prend en charge 42 langues, y compris 9 langues indiennes. Sonic-3 s'appuie sur une architecture de Modèle d'Espace d'État (SSM) comme les précédentes versions de Cartesia. Cartesia a été un leader dans l'utilisation des SSM, d'autres modèles utilisant généralement des architectures basées sur des transformateurs. Les SSM sont généralement plus efficaces en termes de calcul et de mémoire, ce qui contribue probablement à la latence relativement impressionnante de Sonic-3. Cartesia propose un modèle de tarification par abonnement et crédits allant de 0 $ par mois pour un usage personnel, jusqu'à 299 $ par mois pour leur package Scale. Sonic-3 a été ajouté à l'Arène de Synthèse Vocale d'Analyse Artificielle pour le vote de préférence des aveugles. Écoutez des extraits ci-dessous 🎧

Meilleurs

Classement

Favoris