Alguém acabou de rodar quatro agentes OpenCode + subagentes de alto nível com batching contínuo mlx_lm.server e MiniMax M2.5 (6 bits). Cabe em um M3 Ultra de 512GB. A geração é rápida, mas o preenchimento ainda é lento contra servidores na nuvem. Enxames de agentes locais estão ficando viáveis.