¡Basado en Qwen 2.5 1.5B - En este punto, @Alibaba_Qwen está apoyando a toda una generación de investigadores y tareas! ¡Masivos elogios! 💥
Vaibhav (VB) Srivastav
Vaibhav (VB) Srivastav26 ago, 03:39
Microsoft acaba de lanzar VibeVoice - modelo de texto a voz SoTA 1.5B - Licencia MIT 🔥 > Puede generar hasta 90 minutos de audio > Soporta la generación simultánea de más de 4 hablantes > Streaming y un modelo más grande de 7B en camino > Capaz de síntesis cruzada de idiomas y canto ¡Me encanta la expresividad y el control emocional en el modelo! ¡Felicitaciones a Microsoft 🤗
19,2K