跳转至主要内容
行情
扫链
追踪
信号
牛人榜
兑换
资产
邀请计划
更多
产品
DeFi
市场
洞察中心
Eco Hub
安全中心
开发者中心
X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
Wallet API
探索 Wallet API
API 文档
API Key 管理
区块链浏览器
DApp 连接钱包
Boost
X Launch
参与 X Launch,抢先赚新币
X Campaign
参与活动,赢取丰厚奖励
奖励中心
领取奖励和空投
预警
语言
货币
颜色设置
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
Türkçe
返回
返回
学院
帮助中心
发现功能使用指南
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
+11.6%
USELESS
+0.66%
IKUN
+5.49%
gib
+15.32%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
-0.3%
ALON
+13.97%
LAUNCHCOIN
+17.05%
GOONC
+3.97%
KLED
+3.99%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
-0.25%
Boopa
+6.1%
PORK
0.00%
主页
Rimsha Bhardwaj
分享以实用方式为您和您的企业使用 AI 的见解 • 关注我学习和掌握 AI 和技术工具 • AI 教育家和作家@theprohumanai
查看原文
Rimsha Bhardwaj
12月8日 14:59
天哪……Meta 可能刚刚解决了自我改进的 AI 🤯 他们的新论文 SPICE(语料环境中的自我游戏)基本上将语言模型变成了自己的老师,没有人类,没有标签,没有数据集,只有互联网作为训练场。 这里有个转折:模型的一个副本成为挑战者,挖掘真实文档以创建困难的、基于事实的推理问题。另一个副本成为推理者,试图在没有访问源的情况下解决这些问题。 它们相互竞争、学习并共同进化,形成一个自动化的课程,具有现实世界的基础,因此它永远不会陷入幻觉。 结果令人震惊: 在推理基准上,Qwen3-4B 提高了 9.1% OctoThinker-8B 提高了 11.9% 并且它击败了所有之前的自我游戏方法,如 R-Zero 和 Absolute Zero。 这颠覆了 AI 自我改进的剧本。 SPICE 通过挖掘真实知识而不是循环合成垃圾来成长——一个封闭循环系统,具有开放世界的智能。 如果这能扩展,我们可能正在盯着自主、自我进化推理模型的蓝图。
27.94K
477
热门
排行
收藏