Basierend auf Qwen 2.5 1.5B - An diesem Punkt unterstützt @Alibaba_Qwen eine ganze Generation von Forschern und Aufgaben! Riesiges Lob! 💥
Vaibhav (VB) Srivastav
Vaibhav (VB) Srivastav26. Aug. 2025
Microsoft hat gerade VibeVoice veröffentlicht - 1,5 Milliarden SoTA Text-to-Speech-Modell - MIT-Lizenz 🔥 > Es kann bis zu 90 Minuten Audio generieren > Unterstützt die gleichzeitige Generierung von mehr als 4 Sprechern > Streaming und größeres 7B-Modell in Arbeit > Fähig zur sprachübergreifenden und Gesangssynthese Ich liebe die Ausdruckskraft und die emotionale Kontrolle des Modells! Kudos an Microsoft 🤗
19,2K