Alguien acaba de ejecutar cuatro agentes OpenCode + subagentes de alto nivel con mlx_lm.server continuous batch y MiniMax M2.5 (6 bits). Cabe en un M3 Ultra de 512GB. La generación es rápida, pero el prellenado sigue siendo lento frente a los servidores en la nube. Los enjambres de agentes locales se están volviendo viables.