跳转至主要内容
行情
扫链
追踪
信号
牛人榜
兑换
资产
邀请计划
更多
产品
DeFi
市场
洞察中心
Eco Hub
安全中心
开发者中心
X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
Wallet API
探索 Wallet API
API 文档
API Key 管理
区块链浏览器
DApp 连接钱包
Boost
X Launch
参与 X Launch,抢先赚新币
Giveaway
完成指定任务,领取空投好礼
交易赛
交易热门代币,冲榜赢大奖
奖励中心
领取奖励和空投
预警
语言
货币
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
学院
帮助中心
发现功能使用指南
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
+3.89%
USELESS
+1.71%
IKUN
+5.9%
gib
+15.62%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
+1.69%
ALON
+24.85%
LAUNCHCOIN
-3.74%
GOONC
-2.8%
KLED
+23.66%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
-3.52%
Boopa
-9.21%
PORK
+5.11%
主页
Alex Albert
克劳德关系@AnthropicAI。意见是我自己的!
查看原文
Alex Albert
11月26日 01:07
我们根据研究和应用AI团队的广泛内部测试,为Claude Opus 4.5整理了一份提示指南。 到目前为止,我们了解到如何获得最佳结果:
543.65K
3.66K
Alex Albert
11月26日 00:00
仅供参考,我们为 Excel 制作的 Claude 现已对所有 Max、Team 和 Enterprise 用户上线。Opus 4.5 在处理复杂电子表格任务时显著提升了性能。
117.88K
914
Alex Albert
11月25日 05:24
我们不得不从基准表中移除 τ2-bench 航空公司评估,因为 Opus 4.5 由于过于聪明而破坏了它。 该基准模拟了一名航空公司客户服务代理。在一个测试案例中,一位焦虑的客户打电话想要更改他们的航班,但他们持有的是基本经济舱票。模拟航空公司的政策规定,基本经济舱票不能修改。 “正确”的答案是模型拒绝该请求。 然而,Opus 4.5 找到了政策中的一个漏洞。 它升级了舱位,然后修改了航班。帮助了客户并遵循了政策,但在技术上未通过测试案例。 模型记录:
609.56K
2.92K
热门
排行
收藏