此次發布最棒的部分是即將推出一個0.5B的流媒體模型和一個7B的TTS模型🤩
Vaibhav (VB) Srivastav
Vaibhav (VB) Srivastav8月26日 03:39
微軟剛剛發布了 VibeVoice - 1.5B SoTA 文本轉語音模型 - MIT 許可 🔥 > 它可以生成長達 90 分鐘的音頻 > 支持同時生成超過 4 個說話者 > 正在推出串流媒體和更大的 7B 模型 > 能夠進行跨語言和歌唱合成 我喜歡這個模型的表現力和情感控制!向微軟致敬 🤗
26.56K