A Microsoft acaba de lançar o VibeVoice - modelo de Texto para Fala SoTA 1.5B - Licença MIT 🔥 > Pode gerar até 90 minutos de áudio > Suporta geração simultânea de > 4 falantes > Streaming e modelo maior de 7B a caminho > Capaz de síntese cruzada de línguas e canto Adoro a expressividade e o controle emocional do modelo! Parabéns à Microsoft 🤗
123,27K