Alguien acaba de ejecutar cuatro agentes de OpenCode de alto nivel + subagentes con batching continuo de mlx_lm.server y MiniMax M2.5 (6 bits). Se adapta a un M3 Ultra de 512GB. La generación es rápida, pero el prellenado sigue siendo lento en comparación con los servidores en la nube. Los enjambres de agentes locales están volviéndose viables.