我看到 3 一步生成視頻和音頻!創建角色對話的場景,準確的口型同步和符合氛圍的音效。 就像這樣 ↓
9K