Microsoft har nettopp lansert VibeVoice – 1,5 B SoTA-modell for tekst til tale – MIT-lisensiert 🔥 > Den kan generere opptil 90 minutter med lyd > Støtter samtidig generering av > 4 høyttalere > Streaming og større 7B-modell kommende > I stand til tverrspråklig og sangsyntese Elsker uttrykksfullheten og følelseskontrollen på modellen! Kudos til Microsoft 🤗
120,24K