有人刚刚运行了四个高水平的OpenCode代理 + 子代理,使用mlx_lm.server连续批处理和MiniMax M2.5(6位)。 适用于512GB M3 Ultra。生成速度很快,但与云服务器相比,预填充仍然较慢。 本地代理群正在变得可行。