有人剛剛運行了四個高級的 OpenCode 代理 + 子代理,使用 mlx_lm.server 進行持續批處理和 MiniMax M2.5(6 位元)。 適用於 512GB M3 Ultra。生成速度很快,但與雲伺服器相比,預填充仍然較慢。 本地代理群正在變得可行。