La mejor parte de esta versión es que también 🤩 hay un modelo de transmisión de 0.5B y un modelo TTS de 7B
Vaibhav (VB) Srivastav
Vaibhav (VB) Srivastav26 ago, 03:39
Microsoft acaba de lanzar VibeVoice - Modelo de texto a voz SoTA 1.5B - Licencia 🔥 MIT > Puede generar hasta 90 minutos de audio > Admite la generación simultánea de > 4 altavoces > Streaming y el modelo 7B más grande en camino > Capaz de síntesis multilingüe y de canto ¡Me encanta la expresividad y el control de las emociones en el modelo! Felicitaciones a Microsoft 🤗
26.66K