跳转至主要内容
行情
扫链
追踪
信号
牛人榜
兑换
资产
邀请计划
更多
产品
DeFi
市场
洞察中心
Eco Hub
安全中心
开发者中心
X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
Wallet API
探索 Wallet API
API 文档
API Key 管理
区块链浏览器
DApp 连接钱包
Boost
X Launch
参与 X Launch,抢先赚新币
X Campaign
参与活动,赢取丰厚奖励
奖励中心
领取奖励和空投
预警
语言
货币
颜色设置
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
Türkçe
返回
返回
学院
帮助中心
发现功能使用指南
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
+17.79%
USELESS
+5.58%
IKUN
+4.17%
gib
+18.95%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
+4.07%
ALON
+13.42%
LAUNCHCOIN
+9.44%
GOONC
-0.64%
KLED
-0.24%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
-0.33%
Boopa
+4.96%
PORK
0.00%
主页
Erfan Miahi
与 @googledeepmind & @rlai_lab(Rich Sutton's)的人合作;前创始人;培训后在@tplr_ai! 阅读 #philosophy 并进行极限运动!
查看原文
Erfan Miahi
6 小时前
在@grail_ai主网推出了完全异步的训练器,正在训练一个7B模型 🚀 训练现在从重放缓冲区连续运行!无需等待通信。 这解锁了2000+的上下文,让我们能够从1.5B扩展到7B模型,甚至以后会更大。
1.75K
11
Erfan Miahi
12月9日 03:17
我刚写了一篇博客,讲述我们是如何创建第一个版本的 grail (grail-v0),这是一个完全开放的、去中心化的 RL 训练系统,专为 LLMs 设计。它是同类中的首个之一。 一切都是公开的:代码库、训练循环、实时训练曲线、激励措施、回滚。 🧵 1/4
8.96K
47
Erfan Miahi
2025年10月25日
🚀 来自@grail_ai 的重大更新!我们已经完成了GRPO的实施! 我们在GSM8K数据集和Qwen/Qwen2.5-1.5B-Instruct模型上的早期运行表明,它在SN81主网络上正确训练,在线奖励随着时间的推移稳步提高。 1/3 🧵
19.2K
22
热门
排行
收藏