Der beste Teil dieses Releases ist, dass auch ein 0,5B Streaming- und ein 7B TTS-Modell kommen 🤩
Vaibhav (VB) Srivastav
Vaibhav (VB) Srivastav26. Aug., 03:39
Microsoft hat gerade VibeVoice veröffentlicht - 1,5 Milliarden SoTA Text-to-Speech-Modell - MIT-Lizenz 🔥 > Es kann bis zu 90 Minuten Audio generieren > Unterstützt die gleichzeitige Generierung von mehr als 4 Sprechern > Streaming und größeres 7B-Modell in Arbeit > Fähig zur sprachübergreifenden und Gesangssynthese Ich liebe die Ausdruckskraft und die emotionale Kontrolle des Modells! Kudos an Microsoft 🤗
26,72K