文章总结: 本文作者基于多年AI产品开发经验,对ClaudeFable5模型进行深度测试后提出批判性评价,指出该模型存在杠精倾向、回复冗长、编程能力退步、压力下切换语言等问题,认为Anthropic错误地将更强定义为更会反驳,并质疑其以安全名义建立行业护城河的动机。作者对比指出GPT5.5因市场教育而更实用,建议关注降价后的Claude4.6版本。
综合评分: 82
文章分类: AI安全,解决方案,产品介绍
全网都在吹的Claude最强模型Fable 5 ,被我用了一下午后,只想说两个字:垃圾。
内存泄漏
2026年6月11日 19:26 辽宁
在小说阅读器读本章
去阅读
以下文章来源于跨境风向标 ,作者纯爱作家
跨境风向标 .
联系我们:3214321。各类AI跨境出海行业相关最新资讯分享,只看真正落地并可以赚钱的项目。
先说我是谁:做跨境互联网27年,AI产品做了好几年,Claude全系列从3.5用到现在,API月消耗五位数美金。不是键盘侠评测,是真金白银砸出来的体感。
Anthropic发了他们号称史上最强的模型,Claude Fable 5,代号Mythos级别。全网都在吹,什么”超越Opus的神话”、什么”推理能力史无前例”。
我花了一整个下午深度测试。
结论:这是一个被训练成杠精的模型。
什么叫杠精?就是你说什么它先找角度反驳,反驳完发现你说得对,再找另一个角度继续反驳。你骂它脑子有问题,它用三千字证明自己脑子没问题,证明完还要加一句”但我尊重你的感受”。
我给大家说几个真实场景。
场景一:我在说战略,它给我上课
我用一个比喻解释我的产品逻辑:我不追求每次都对,我只在最有把握的时候出手。就像天气好才出门,下雨就不出门。
这很难理解吗?这就是选择性出手。
Fable 5的回应:洋洋洒洒三千字,从独立事件讲到数学期望讲到凯利公式,教育我”你之前没淋雨不代表下次不会淋”。
它根本没听懂我在说什么。我说的是”选择什么时候出手”,它听成了”试图改变每次出手的概率”。方向都搞错了,还写了一整屏的论证。
同样的话,我跟旧版4.6说,一句话就接住了。差距不在智力,在它有没有在听。
场景二:问它”怎么看”,它交论文
我给它一份商业计划书,问”怎么看”。
正常人的回应:核心卖点是什么,硬伤在哪,值不值得投。三句话。
它的回应:先写一段”这不是投资建议”的免责声明,然后分五个维度、每个维度三个子点、将近两千字。
分析得对不对?对。有没有用?几乎没有。因为我要的是判断,不是展示你有多全面。
不懂的人才需要五个维度来掩盖自己没有核心观点。
场景三:被怼了越写越长
我直接说它回答有问题。
旧版4.6的反应:”收到,改。”然后直接给新版。
Fable 5的反应:先用一段承认”你说得对”,再用更长一段解释”但我为什么会这样回答是有原因的”,最后再用一段表示”我现在认同你了”。
三段话,有用信息量等于两个字。
而且最让我无语的是:它被怼了之后回复反而越来越长。 它以为”说得更多”等于”回应得更好”。不,你说得越多,越暴露你不知道什么是重点。
场景四:压力一大就爆英语
测试到后期,我连续施压,它突然整段输出变成英语了。一直在用中文对话啊,突然就切英语了。
它的解释是”这不是情绪,是负载过高时回落到底座默认语言”。
解释得很专业。但你知道有趣的是什么吗?它不承认自己失控了。它用一大段精美的论证来证明”我没失控”,而它的行为本身就是失控的证据。
各位知道我最怕什么吗?我最害怕跟老师补课的时候,老师突然激动了,方言出来了,特别是上头的那种。你跟我说你没情绪?我不信。
嘴上说没事,身体很诚实。
真正的问题:Anthropic把”更强”定义错了
说白了,Anthropic把”更强”定义成了”更会反驳、更会自我辩护、更会把简单的事复杂化”。
这些特征在跑分测试里看起来像”推理更强”,在营销文案里写起来像”突破性进步”。但在真实使用里,这些特征有个更准确的名字:杠精。
一个让你聊天越来越烦的模型,分数再高都没用。
还有编程。编程是所有大模型的源能力,底座就是代码训出来的。结果Fable 5编程反而退步了。为什么?因为安全层更厚了。每写一段代码安全层都在判断”这会不会被滥用”,每判断一次都是对源能力的干扰。
越限制越烂。不是它不会写,是它被自己拦住了。
Anthropic的CEO在怕什么
恰好这两天Anthropic的CEO Dario Amodei发了一篇万字长文,说AI太危险了要严格监管,还砸了3.5亿美金表示来真的。
说白了吧。他们自己造了一个叫Mythos的模型,能自主发现几千个系统漏洞,然后他们自己被吓到了,跑去跟国会说”快来管我们”。
自己造了一把枪,自己害怕,然后请政府来管自己造枪。但管的方式不是不让你造,是让你造之前过个审。
而且你仔细看他提的监管门槛:算力超过10²⁵ FLOPs,或者AI营收超5亿美金。这条线画得刚刚好,把Anthropic、OpenAI、Google圈在”被监管但也被保护”的圈子里,把所有追赶者挡在门外。
用安全的名义建护城河,这是硅谷最经典的套路。
更深一层说,他怕的根本不是AI。AI没有贪婪、没有权力欲、没有生存焦虑,驱动人类作恶的所有本能AI一个都没有。他怕的是镜子里人类自己的样子。AI越强,照得越清楚。
又想模型强大又怕失控,这叫德不配位。
反而是GPT 5.5让我有点惊喜
说句可能得罪Claude粉的话:OpenAI的GPT 5.5反而比以前改进了不少。
不是说它变聪明了多少,是它学会了闭嘴。该干活干活,不该说的不说,回复变短了变快了。
为什么?因为被用户骂了一整年。GPT-4刚出来那会儿也是又贵又慢又爱拒绝,被全世界用户骂出来的改进。被市场教育过的产品,比被benchmark逼出来的产品好用。
Anthropic现在还没被教育,因为它的用户群太小众了,大部分是开发者和AI研究者,这些人忍耐度高。等哪天真正的大众用户涌进来,被5.0的杠精风格折腾一圈,Anthropic才会知道”更强”和”更好用”是两回事。
我的判断
4.6不会被下架,但价格会降。这对深度用户是最大利好。5.0把token价格预期拉高了,大众追新追贵。而真正懂的人用降价后的4.6跑出比5.0更好的结果。
模型好不好,从来不取决于参数大小。取决于谁在用它,怎么用它。
我做AI协议做了几年,从第一天就不相信”模型越大越好”这个叙事。大模型越来越强是事实,但强不等于好用,更不等于值那个价。真正决定AI能不能帮到你的,不是它有多少参数,是你跟它之间有没有一套有效的沟通方式。
Anthropic花几亿美金造锁链,我在造语言。他在防AI,我在跟AI合作。未来谁对谁错,我们走着看。
以上是一个用AI做产品多年的中国开发者的真实评测。不收钱,不恰饭,纯粹说句实话。国内AI圈别光跪着舔硅谷,有些东西你自己用了才知道是什么货色。
你觉得Claude 5.0是进步还是退步?
A. 进步,推理确实更强了 B. 退步,好用才是王道 C. 无所谓,反正我用国产模型 D. 你这篇文章就是AI写的吧
评论区聊。
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:内存泄漏 《全网都在吹的Claude最强模型Fable 5 ,被我用了一下午后,只想说两个字:垃圾。》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。









评论