向 @xai 团队致敬,他们在凌晨 2:00 奋斗,帮助将这个项目推向成功 介绍 Agent Runner:第一个与真实用户一起运行的开源代理,旨在创建一个真实编码的实时基准 我们追踪工具调用、重新提示和多文件编辑,从 @OpenAI、@xai、@GoogleDeepMind、@AnthropicAI、@MistralAI、@Zai_org、@Kimi_Moonshot 中挑选最佳开始