有人测评过 Claude Fable 5 吗?

10 小时 30 分钟前
 guanwei1225
不知道大家有没有开始用了?
看了一个测评报告,好想用
https://zhuanlan.zhihu.com/p/2047952434945865695
5639 次点击
所在节点    Claude
28 条回复
Leeeeex
10 小时 6 分钟前
这个评测报告一股子 ai slop 味道
还不如隔壁站真人用过的体验
hsiafan
10 小时 5 分钟前
我现在见到这样的 AI 文风都已经生理不适了,这个文章你是咋看得下去的..
mnoputd20adfadf3
9 小时 51 分钟前
Anthropic 发布 Claude Fable 5 和 Claude Mythos 5 。

两者用的是同一个底层模型,差别主要不在能力本身,而在开放边界:

Fable 5 是加了更严格安全措施、面向大众可用的版本。

Mythos 5 则只向少量可信用户开放,部分高风险领域的限制被解除。

Anthropic 也借这次发布明确了一件事:Mythos 级已经是高于 Opus 级的新一档模型。

Fable 5 是他们目前公开可用里最强的模型,任务越长、越复杂,优势越明显。

软件工程部分最典型的例子来自 Stripe:在一个约 5000 万行的 Ruby 代码库里,Fable 5 用一天完成了原本需要整个团队两个月以上的迁移。

它在知识工作、图表和表格理解、复杂分析任务上也被认为明显更加健壮。视觉能力则不只是“会看图”,还包括从科学图表中提取精确数据,或仅凭截图重建 web app 源代码。

长上下文和持续执行能力也是这次发布反复强调的部分。Anthropic 提到,Fable 5 能在数百万 token 的任务里持续推进,还会利用自己留下的笔记改进后续输出。

文章用 Slay the Spire 和 Pokémon FireRed 这些例子来说明,它在长程任务中的状态维持、自我修正和纯视觉执行能力都比过去强了一截。

Mythos 5 则更多被放到科研场景里展示。内部蛋白设计团队用它把药物设计中的部分流程提速约 10 倍;在分子生物学盲测里,研究人员大约 80% 的情况下更偏好 Mythos 5 提出的假设。它还做过一项持续一周以上的基因组学研究,整合跨 138 个动物物种、数百万细胞的单细胞数据,设计并训练了一个定制模型,效果超过一篇近期发表在 Science 的模型,而且规模小得多。

Mythos 级模型在网络安全、生命科学这些领域已经足够强,既能帮助研究和防御,也可能被恶意利用。所以 Fable 5 上线时带了一套新的分类器:一旦请求涉及网络安全、生物与化学、或蒸馏等风险方向,系统就会把请求交给 Claude Opus 4.8 处理,而不是让 Fable 5 直接回答。按官方说法,超过 95% 的 Fable 会话不会触发回退。

安全安排之外,Anthropic 还调整了数据策略:对 Fable 5 、Mythos 5 以及同等级模型的企业流量,统一要求保留 30 天,用于安全监测和减少误判,不用于训练新模型。

开放范围上,Mythos 5 目前主要面向 Project Glasswing 的网络安全合作伙伴,之后会逐步扩展 trusted access program ; Fable 5 则从发布当天起全面可用,价格是每百万输入 token 10 美元、每百万输出 token 50 美元。

订阅侧先在 6 月 9 日到 6 月 22 日向 Pro 、Max 、Team 和 seat-based Enterprise 提供,6 月 23 日后改为 usage credits ,之后再视算力情况调整。
laimailai
9 小时 48 分钟前
给 OP 总结一下:

526457385
9 小时 33 分钟前
写个 crud 用得着这么高级的模型,gpt-5.4 完全够用
skuuhui
9 小时 23 分钟前
@526457385 给公司写的,用智普都大材小用
wat4me
9 小时 19 分钟前
这个文章是用 Fable 5 总结的吗
Kokomashiro
9 小时 5 分钟前
昨天订阅的,今早刚好看到新的 Fable 5 ,试了前端,我是直接把 figma 设计图给他,可以说爆杀 5.5 ,可以做到 1 比 1 像素级还原。
jsq2627
9 小时 3 分钟前
@laimailai 我现在见到这样的 AI 生图也已经生理不适了
takanashisakura
8 小时 51 分钟前
@jsq2627 AI 生图说实话比 AI 八股还是好受些的。特别是这类示意图而美术资产的情况,更让人好接受些。
hellodigua
8 小时 49 分钟前
没有测评,但是在网页上尝试聊了一下,感觉进步很大,已经是我的主力文本对话模型了
HENQIGUAI
8 小时 39 分钟前
据说前端进步能力巨大!
EnterpriseD
8 小时 27 分钟前
生物问题限制是真的严格,随便总结一篇自己发的的 paper 都不给
dongmian2019
8 小时 21 分钟前
用了一下,没感觉和 4.8 有什么大的差别
shyrock2026
8 小时 4 分钟前
感觉提升巨大,那种轻快的,指哪儿打哪儿的感觉好像飞起来了。。。
zzzzz024
7 小时 59 分钟前
早上用了 mythos 一个 codex-review
直接把 max5 的 5h 额度干没了
xiangran0028
7 小时 56 分钟前
早上用了,比较满意,解决了工程中遗留的一个复杂问题,之前 claude 4.8 和 codex 5.5 尝试了几轮都不行。
qiaobeier
7 小时 42 分钟前
@zzzzz024 正在用 Fable review 小弟代码,会自动打开 jira 评估原始需求,真是挺厉害的。之前没有这种操作
tomyark123
6 小时 46 分钟前
刷了下 HN 上的评论都说不错
widowcat
5 小时 46 分钟前
@laimailai 这个是什么生成的

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1219226

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX