Quelqu'un vient de faire fonctionner quatre agents OpenCode de haut niveau + sous-agents avec le traitement par lots continu mlx_lm.server et MiniMax M2.5 (6 bits). Cela tient sur un M3 Ultra de 512 Go. La génération est rapide, mais le pré-remplissage reste lent par rapport aux serveurs cloud. Les essaims d'agents locaux deviennent viables.