跳转至主要内容
行情
扫链
追踪
信号
牛人榜
兑换
资产
邀请计划
更多
产品
DeFi
市场
洞察中心
Eco Hub
安全中心
开发者中心
X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
Wallet API
探索 Wallet API
API 文档
API Key 管理
区块链浏览器
DApp 连接钱包
Boost
X Launch
参与 X Launch,抢先赚新币
X Campaign
参与活动,赢取丰厚奖励
奖励中心
领取奖励和空投
预警
语言
货币
颜色设置
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
Türkçe
返回
返回
学院
帮助中心
发现功能使用指南
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
-6.31%
USELESS
-6.42%
IKUN
-2.23%
gib
-5.27%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
-1.34%
ALON
-1.8%
LAUNCHCOIN
-8.65%
GOONC
-2.5%
KLED
-2.79%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
-1.08%
Boopa
+0.51%
PORK
+2.87%
主页
Akshay 🚀
为您简化 LLM、AI 代理、RAG 和机器学习!• 联合创始人 @dailydoseofds_• BITS Pilani • 3 项专利• 前 AI 工程师 @ LightningAI
查看原文
Akshay 🚀
12月8日 16:28
HuggingFace刚刚让微调变得简单10倍! 只需一行英文即可微调任何开源LLM。 他们发布了一种新的“技能”,您可以将其插入Claude或任何编码代理中。 它不仅编写训练脚本,还实际提交作业到云GPU,监控进度,并将完成的模型推送到Hub。 以下是它的工作原理: 您可以说类似于: “在open-r1/codeforces-cots数据集上微调Qwen3-0.6B” 然后Claude将: ↳ 验证您的数据集格式 ↳ 选择合适的GPU硬件 ↳ 将作业提交到Hugging Face Jobs ↳ 监控训练进度 ↳ 将完成的模型推送到Hub 模型在Hugging Face GPU上训练,而您可以做其他事情。当训练完成时,您的微调模型将出现在Hub上,随时可以使用。 这不是一个玩具演示。 该技能支持生产训练方法:SFT、DPO和GRPO。您可以训练从0.5B到70B参数的模型,将其转换为GGUF以进行本地部署,并运行多阶段管道。 在小模型上进行完整训练的费用仅约为$0.30。 下一条推文中有完整教程的链接!
37.44K
622
Akshay 🚀
12月7日 18:29
使用GRPO进行微调,视觉化解释:
Akshay 🚀
12月6日 20:37
你正在参加谷歌的研究科学家面试。 面试官:我们有一个基础的 LLM,但在数学方面表现糟糕。你会如何将其转变为一个数学和推理的强大工具? 你:我会标记一些问题并对模型进行微调。 面试结束。 你错过了以下内容:
24.4K
311
Akshay 🚀
12月6日 20:37
你正在参加谷歌的研究科学家面试。 面试官:我们有一个基础的 LLM,但在数学方面表现糟糕。你会如何将其转变为一个数学和推理的强大工具? 你:我会标记一些问题并对模型进行微调。 面试结束。 你错过了以下内容:
157.38K
624
热门
排行
收藏