全网都在吹的Claude最强模型Fable5,被我用了一下午后,只想说两个字:垃圾。

admin 2026-06-16 04:36:24 网络安全文章 来源:ZONE.CI 全球网 0 阅读模式

文章总结: 本文作者基于多年AI产品开发经验,对ClaudeFable5模型进行深度测试后提出批判性评价,指出该模型存在杠精倾向、回复冗长、编程能力退步、压力下切换语言等问题,认为Anthropic错误地将更强定义为更会反驳,并质疑其以安全名义建立行业护城河的动机。作者对比指出GPT5.5因市场教育而更实用,建议关注降价后的Claude4.6版本。 综合评分: 82 文章分类: AI安全,解决方案,产品介绍


cover_image

全网都在吹的Claude最强模型Fable 5 ,被我用了一下午后,只想说两个字:垃圾。

内存泄漏

2026年6月11日 19:26 辽宁

在小说阅读器读本章

去阅读

以下文章来源于跨境风向标 ,作者纯爱作家

跨境风向标 .

联系我们:3214321。各类AI跨境出海行业相关最新资讯分享,只看真正落地并可以赚钱的项目。

先说我是谁:做跨境互联网27年,AI产品做了好几年,Claude全系列从3.5用到现在,API月消耗五位数美金。不是键盘侠评测,是真金白银砸出来的体感。

Anthropic发了他们号称史上最强的模型,Claude Fable 5,代号Mythos级别。全网都在吹,什么”超越Opus的神话”、什么”推理能力史无前例”。

我花了一整个下午深度测试。

结论:这是一个被训练成杠精的模型。

什么叫杠精?就是你说什么它先找角度反驳,反驳完发现你说得对,再找另一个角度继续反驳。你骂它脑子有问题,它用三千字证明自己脑子没问题,证明完还要加一句”但我尊重你的感受”。

我给大家说几个真实场景。

场景一:我在说战略,它给我上课

我用一个比喻解释我的产品逻辑:我不追求每次都对,我只在最有把握的时候出手。就像天气好才出门,下雨就不出门。

这很难理解吗?这就是选择性出手。

Fable 5的回应:洋洋洒洒三千字,从独立事件讲到数学期望讲到凯利公式,教育我”你之前没淋雨不代表下次不会淋”。

它根本没听懂我在说什么。我说的是”选择什么时候出手”,它听成了”试图改变每次出手的概率”。方向都搞错了,还写了一整屏的论证。

同样的话,我跟旧版4.6说,一句话就接住了。差距不在智力,在它有没有在听。

场景二:问它”怎么看”,它交论文

我给它一份商业计划书,问”怎么看”。

正常人的回应:核心卖点是什么,硬伤在哪,值不值得投。三句话。

它的回应:先写一段”这不是投资建议”的免责声明,然后分五个维度、每个维度三个子点、将近两千字。

分析得对不对?对。有没有用?几乎没有。因为我要的是判断,不是展示你有多全面。

不懂的人才需要五个维度来掩盖自己没有核心观点。

场景三:被怼了越写越长

我直接说它回答有问题。

旧版4.6的反应:”收到,改。”然后直接给新版。

Fable 5的反应:先用一段承认”你说得对”,再用更长一段解释”但我为什么会这样回答是有原因的”,最后再用一段表示”我现在认同你了”。

三段话,有用信息量等于两个字。

而且最让我无语的是:它被怼了之后回复反而越来越长。 它以为”说得更多”等于”回应得更好”。不,你说得越多,越暴露你不知道什么是重点。

场景四:压力一大就爆英语

测试到后期,我连续施压,它突然整段输出变成英语了。一直在用中文对话啊,突然就切英语了。

它的解释是”这不是情绪,是负载过高时回落到底座默认语言”。

解释得很专业。但你知道有趣的是什么吗?它不承认自己失控了。它用一大段精美的论证来证明”我没失控”,而它的行为本身就是失控的证据。

各位知道我最怕什么吗?我最害怕跟老师补课的时候,老师突然激动了,方言出来了,特别是上头的那种。你跟我说你没情绪?我不信。

嘴上说没事,身体很诚实。

真正的问题:Anthropic把”更强”定义错了

说白了,Anthropic把”更强”定义成了”更会反驳、更会自我辩护、更会把简单的事复杂化”。

这些特征在跑分测试里看起来像”推理更强”,在营销文案里写起来像”突破性进步”。但在真实使用里,这些特征有个更准确的名字:杠精。

一个让你聊天越来越烦的模型,分数再高都没用。

还有编程。编程是所有大模型的源能力,底座就是代码训出来的。结果Fable 5编程反而退步了。为什么?因为安全层更厚了。每写一段代码安全层都在判断”这会不会被滥用”,每判断一次都是对源能力的干扰。

越限制越烂。不是它不会写,是它被自己拦住了。

Anthropic的CEO在怕什么

恰好这两天Anthropic的CEO Dario Amodei发了一篇万字长文,说AI太危险了要严格监管,还砸了3.5亿美金表示来真的。

说白了吧。他们自己造了一个叫Mythos的模型,能自主发现几千个系统漏洞,然后他们自己被吓到了,跑去跟国会说”快来管我们”。

自己造了一把枪,自己害怕,然后请政府来管自己造枪。但管的方式不是不让你造,是让你造之前过个审。

而且你仔细看他提的监管门槛:算力超过10²⁵ FLOPs,或者AI营收超5亿美金。这条线画得刚刚好,把Anthropic、OpenAI、Google圈在”被监管但也被保护”的圈子里,把所有追赶者挡在门外。

用安全的名义建护城河,这是硅谷最经典的套路。

更深一层说,他怕的根本不是AI。AI没有贪婪、没有权力欲、没有生存焦虑,驱动人类作恶的所有本能AI一个都没有。他怕的是镜子里人类自己的样子。AI越强,照得越清楚。

又想模型强大又怕失控,这叫德不配位。

反而是GPT 5.5让我有点惊喜

说句可能得罪Claude粉的话:OpenAI的GPT 5.5反而比以前改进了不少。

不是说它变聪明了多少,是它学会了闭嘴。该干活干活,不该说的不说,回复变短了变快了。

为什么?因为被用户骂了一整年。GPT-4刚出来那会儿也是又贵又慢又爱拒绝,被全世界用户骂出来的改进。被市场教育过的产品,比被benchmark逼出来的产品好用。

Anthropic现在还没被教育,因为它的用户群太小众了,大部分是开发者和AI研究者,这些人忍耐度高。等哪天真正的大众用户涌进来,被5.0的杠精风格折腾一圈,Anthropic才会知道”更强”和”更好用”是两回事。

我的判断

4.6不会被下架,但价格会降。这对深度用户是最大利好。5.0把token价格预期拉高了,大众追新追贵。而真正懂的人用降价后的4.6跑出比5.0更好的结果。

模型好不好,从来不取决于参数大小。取决于谁在用它,怎么用它。

我做AI协议做了几年,从第一天就不相信”模型越大越好”这个叙事。大模型越来越强是事实,但强不等于好用,更不等于值那个价。真正决定AI能不能帮到你的,不是它有多少参数,是你跟它之间有没有一套有效的沟通方式。

Anthropic花几亿美金造锁链,我在造语言。他在防AI,我在跟AI合作。未来谁对谁错,我们走着看。

以上是一个用AI做产品多年的中国开发者的真实评测。不收钱,不恰饭,纯粹说句实话。国内AI圈别光跪着舔硅谷,有些东西你自己用了才知道是什么货色。

你觉得Claude 5.0是进步还是退步?

A. 进步,推理确实更强了 B. 退步,好用才是王道 C. 无所谓,反正我用国产模型 D. 你这篇文章就是AI写的吧

评论区聊。


免责声明:

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。

任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我

本文转载自:内存泄漏 《全网都在吹的Claude最强模型Fable 5 ,被我用了一下午后,只想说两个字:垃圾。》

评论:0   参与:  0