Alguém acabou de executar quatro agentes OpenCode de alto nível + subagentes com mlx_lm.server em processamento contínuo e MiniMax M2.5 (6-bit). Cabe em um M3 Ultra de 512GB. A geração é rápida, mas o pré-preenchimento ainda é lento em comparação com os servidores em nuvem. As enxames de agentes locais estão se tornando viáveis.