Qualcuno ha appena eseguito quattro agenti OpenCode di alto livello + subagenti con batching continuo mlx_lm.server e MiniMax M2.5 (6-bit). Si adatta a un M3 Ultra da 512GB. La generazione è veloce, ma il prefill è ancora lento rispetto ai server cloud. Gli sciami di agenti locali stanno diventando praticabili.