跳转至主要内容
行情
扫链
追踪
信号
跟单
兑换
资产
邀请计划
更多
产品
DeFi
市场
洞察中心
Eco Hub
安全中心
开发者中心
X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
Wallet API
探索 Wallet API
API 文档
API Key 管理
区块链浏览器
DApp 连接钱包
Boost
X Launch
参与 X Launch,抢先赚新币
X Campaign
参与活动,赢取丰厚奖励
奖励中心
领取奖励和空投
预警
语言
货币
颜色设置
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
Türkçe
返回
返回
学院
帮助中心
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
-18.69%
USELESS
-8.86%
IKUN
-12.5%
gib
-16.42%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
-4.24%
ALON
-10.21%
LAUNCHCOIN
+0.26%
GOONC
-7.69%
KLED
-5.77%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
+0.01%
Boopa
-2.16%
PORK
-2.87%
主页
Tina He
真理会让你自由
查看原文
Tina He
22 小时前
当代理人点击这个屏幕时,我为他们感到紧张。
1.09K
5
Tina He
12月5日 01:44
设备上的智能
225
Tina He
12月2日 07:16
“多智能体系统未能达到预期效果是因为它们的组织方式。” 听起来像是一群人类的团队
elvis
12月2日 02:00
为代理构建者提供的精彩论文。 多代理系统往往无法达到预期效果。问题不在于代理本身的构建,而在于它们的组织方式。 它们大多是用固定的链、树和图构建的,无法随着任务的演变而适应。 但如果系统能够学习自己的协调模式呢? 这项新研究介绍了Puppeteer,一个学习动态编排代理的框架,而不是依赖手工制作的拓扑结构。 调度器不是预先定义协作结构,而是根据不断变化的对话状态选择下一个发言的代理。该策略通过REINFORCE进行训练,直接优化任务成功率。 与其在复杂的图拓扑中搜索,他们将一切序列化为顺序代理选择。这种重新构建避免了组合复杂性。 出现的结果令人惊讶:紧凑的循环模式自然发展。不是庞大的图,而是2-3个代理处理大部分工作的紧密循环。 令人瞩目的是,系统能够自行发现效率。 结果: - 在GSM-Hard数学问题上:70%的准确率(相比基础模型的13.5%有所提升)。 - 在MMLU-Pro上:83%(相比76%的基线)。 - 在SRDD软件开发上:76.4%(相比60.6%的基线)。 这些提升伴随着减少的令牌消耗。论文显示,令牌成本在训练过程中持续下降,而性能则在提升。 他们还证明了代理选择过程满足马尔可夫性质,这意味着当前状态单独决定最佳下一个代理。无需跟踪完整历史。 这对AI开发者的重要性在于:学习的简单性胜过工程的复杂性。一个经过训练的路由器与少量专业代理相比,可以在减少计算开销的同时超越复杂的手工工作流程。
303
1
热门
排行
收藏