一站式 Web3 探索中心 | 去中心化应用商店 & Web3 线下活动 | OKX Wallet

热门话题

这是本周的仪式研究摘要，一份涵盖LLM世界和加密与AI交集最新动态的通讯。每周有数百篇论文发表，跟上最新动态几乎是不可能的。我们为您阅读，所以您无需这样做。

DeepSeekMath-V2：迈向自我可验证的数学推理本文介绍了 DSMath-V2，这是一个基于 deepseek-3.2-exp 训练的模型，用于数学中的自然语言证明。生成-验证差距是非正式证明的主要障碍。

他们首先使用专家注释训练一个模型验证器，以评估答案的正确性和分析。这个验证器用于训练最终的证明者模型，该模型既撰写证明又分析其正确性。他们在2025年国际数学奥林匹克中获得金牌。

人工智能集体意识：语言模型的开放式同质性（及其超越）本文介绍了INFINITY-CHAT，这是一个包含26K个真实世界查询的数据集，接受多个答案。利用这个数据集，他们研究了70多个语言模型中的内部和外部模型模式崩溃。

他们发现了一种人工蜂群效应，表现为模型内部重复生成相似输出的现象，以及模型之间的同质性，不同模型在措辞上略有变化但趋向于相似的想法。这引发了关于模型多样性的问题。

多智能体系统中的潜在协作该工作介绍了潜在MAS，这是一个在连续潜在空间中运行的端到端协作框架。设计集成了潜在思维生成和跨智能体潜在记忆转移。

LatentMAS 基于推理表达能力、通信保真度和协作复杂性。在顺序和层次 MAS 设置中，Qwen 3（4B、8B 和 14B）相比于基于文本的 MAS 基准表现更佳，提高了准确性，并减少了输出令牌的使用。

ToolOrchestra：通过高效的模型和工具编排提升智能作者提出了一种编排范式，其中智能源于一个复合系统。编排模型按正确的顺序调用合适的工具以完成任务。

使用 ToolOrchestra，一个 8B 模型通过强化学习（RL）进行训练，以决定何时以及如何调用其他语言模型（LM）和工具。奖励在正确性、效率和与用户偏好的对齐之间进行平衡。在 HLE 上，Orchestrator 的表现优于之前的方法，且计算成本远低。

关注我们 @ritualdigest，获取更多关于加密货币与 AI 研究的内容，以及 @ritualnet，了解 Ritual 正在构建的内容。

3.14K

热门

排行

收藏