Gemini 3 Pro 在現實世界工具使用場景(Vending-Bench)和許多其他模型智能/能力的衡量標準上仍然是最先進的 :)