La meilleure partie de cette sortie, c'est qu'il y a un modèle de streaming de 0,5 milliard et un modèle TTS de 7 milliards qui arrivent aussi 🤩
Vaibhav (VB) Srivastav
Vaibhav (VB) Srivastav26 août, 03:39
Microsoft vient de lancer VibeVoice - modèle de synthèse vocale SoTA 1,5B - sous licence MIT 🔥 > Il peut générer jusqu'à 90 minutes d'audio > Prend en charge la génération simultanée de plus de 4 locuteurs > Modèle de streaming et plus grand modèle de 7B à venir > Capable de synthèse croisée et de chant J'adore l'expressivité et le contrôle des émotions sur le modèle ! Bravo à Microsoft 🤗
26,56K