Cea mai bună parte a acestei versiuni este că există și 🤩 un model de streaming de 0,5 miliarde și un model TTS de 7 miliarde
Vaibhav (VB) Srivastav
Vaibhav (VB) Srivastav26 aug. 2025
Microsoft tocmai a lansat VibeVoice - 1.5B SoTA Text to Speech model - Licențiat 🔥 MIT > Poate genera până la 90 de minute de audio > Suportă generarea simultană de > 4 difuzoare > Streaming și model 7B mai mare în viitor > Capabil de sinteză interlingviscă și cântată Iubesc expresivitatea și controlul emoțiilor pe model! Felicitări Microsoft 🤗
26,76K