微软刚刚发布了一个新的(开源!)语音模型 - VibeVoice 👇 它可以一次生成90分钟的对话,涉及四位说话者 🤯 其他一些功能: - 跨语言翻译 - 背景音乐 - 自发唱歌 + 情感
2.49K