热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
这是本周的仪式研究摘要,一份涵盖LLM世界和加密与AI交集最新动态的通讯。
每周有数百篇论文发表,跟上最新动态几乎是不可能的。我们为您阅读,所以您无需这样做。

DeepSeekMath-V2:迈向自我可验证的数学推理
本文介绍了 DSMath-V2,这是一个基于 deepseek-3.2-exp 训练的模型,用于数学中的自然语言证明。生成-验证差距是非正式证明的主要障碍。

他们首先使用专家注释训练一个模型验证器,以评估答案的正确性和分析。
这个验证器用于训练最终的证明者模型,该模型既撰写证明又分析其正确性。
他们在2025年国际数学奥林匹克中获得金牌。
人工智能集体意识:语言模型的开放式同质性(及其超越)
本文介绍了INFINITY-CHAT,这是一个包含26K个真实世界查询的数据集,接受多个答案。利用这个数据集,他们研究了70多个语言模型中的内部和外部模型模式崩溃。

他们发现了一种人工蜂群效应,表现为模型内部重复生成相似输出的现象,以及模型之间的同质性,不同模型在措辞上略有变化但趋向于相似的想法。这引发了关于模型多样性的问题。

多智能体系统中的潜在协作
该工作介绍了潜在MAS,这是一个在连续潜在空间中运行的端到端协作框架。设计集成了潜在思维生成和跨智能体潜在记忆转移。

LatentMAS 基于推理表达能力、通信保真度和协作复杂性。在顺序和层次 MAS 设置中,Qwen 3(4B、8B 和 14B)相比于基于文本的 MAS 基准表现更佳,提高了准确性,并减少了输出令牌的使用。

ToolOrchestra:通过高效的模型和工具编排提升智能
作者提出了一种编排范式,其中智能源于一个复合系统。编排模型按正确的顺序调用合适的工具以完成任务。

使用 ToolOrchestra,一个 8B 模型通过强化学习(RL)进行训练,以决定何时以及如何调用其他语言模型(LM)和工具。奖励在正确性、效率和与用户偏好的对齐之间进行平衡。
在 HLE 上,Orchestrator 的表现优于之前的方法,且计算成本远低。

关注我们 @ritualdigest,获取更多关于加密货币与 AI 研究的内容,
以及 @ritualnet,了解 Ritual 正在构建的内容。
3.14K
热门
排行
收藏

