2026-06-16 04:36:24 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： 本文作者基于多年AI产品开发经验，对ClaudeFable5模型进行深度测试后提出批判性评价，指出该模型存在杠精倾向、回复冗长、编程能力退步、压力下切换语言等问题，认为Anthropic错误地将更强定义为更会反驳，并质疑其以安全名义建立行业护城河的动机。作者对比指出GPT5.5因市场教育而更实用，建议关注降价后的Claude4.6版本。 综合评分： 82 文章分类： AI安全,解决方案,产品介绍

cover_image

全网都在吹的Claude最强模型Fable 5 ，被我用了一下午后，只想说两个字：垃圾。

内存泄漏

2026年6月11日 19:26 辽宁

在小说阅读器读本章

去阅读

以下文章来源于跨境风向标，作者纯爱作家

跨境风向标 .

联系我们：3214321。各类AI跨境出海行业相关最新资讯分享，只看真正落地并可以赚钱的项目。

先说我是谁：做跨境互联网27年，AI产品做了好几年，Claude全系列从3.5用到现在，API月消耗五位数美金。不是键盘侠评测，是真金白银砸出来的体感。

Anthropic发了他们号称史上最强的模型，Claude Fable 5，代号Mythos级别。全网都在吹，什么”超越Opus的神话”、什么”推理能力史无前例”。

我花了一整个下午深度测试。

结论：这是一个被训练成杠精的模型。

什么叫杠精？就是你说什么它先找角度反驳，反驳完发现你说得对，再找另一个角度继续反驳。你骂它脑子有问题，它用三千字证明自己脑子没问题，证明完还要加一句”但我尊重你的感受”。

我给大家说几个真实场景。

场景一：我在说战略，它给我上课

我用一个比喻解释我的产品逻辑：我不追求每次都对，我只在最有把握的时候出手。就像天气好才出门，下雨就不出门。

这很难理解吗？这就是选择性出手。

Fable 5的回应：洋洋洒洒三千字，从独立事件讲到数学期望讲到凯利公式，教育我”你之前没淋雨不代表下次不会淋”。

它根本没听懂我在说什么。我说的是”选择什么时候出手”，它听成了”试图改变每次出手的概率”。方向都搞错了，还写了一整屏的论证。

同样的话，我跟旧版4.6说，一句话就接住了。差距不在智力，在它有没有在听。

场景二：问它”怎么看”，它交论文

我给它一份商业计划书，问”怎么看”。

正常人的回应：核心卖点是什么，硬伤在哪，值不值得投。三句话。

它的回应：先写一段”这不是投资建议”的免责声明，然后分五个维度、每个维度三个子点、将近两千字。

分析得对不对？对。有没有用？几乎没有。因为我要的是判断，不是展示你有多全面。

不懂的人才需要五个维度来掩盖自己没有核心观点。

场景三：被怼了越写越长

我直接说它回答有问题。

旧版4.6的反应：”收到，改。”然后直接给新版。

Fable 5的反应：先用一段承认”你说得对”，再用更长一段解释”但我为什么会这样回答是有原因的”，最后再用一段表示”我现在认同你了”。

三段话，有用信息量等于两个字。

而且最让我无语的是：它被怼了之后回复反而越来越长。 它以为”说得更多”等于”回应得更好”。不，你说得越多，越暴露你不知道什么是重点。

场景四：压力一大就爆英语

测试到后期，我连续施压，它突然整段输出变成英语了。一直在用中文对话啊，突然就切英语了。

它的解释是”这不是情绪，是负载过高时回落到底座默认语言”。

解释得很专业。但你知道有趣的是什么吗？它不承认自己失控了。它用一大段精美的论证来证明”我没失控”，而它的行为本身就是失控的证据。

各位知道我最怕什么吗？我最害怕跟老师补课的时候，老师突然激动了，方言出来了，特别是上头的那种。你跟我说你没情绪？我不信。

嘴上说没事，身体很诚实。

真正的问题：Anthropic把”更强”定义错了

说白了，Anthropic把”更强”定义成了”更会反驳、更会自我辩护、更会把简单的事复杂化”。

这些特征在跑分测试里看起来像”推理更强”，在营销文案里写起来像”突破性进步”。但在真实使用里，这些特征有个更准确的名字：杠精。

一个让你聊天越来越烦的模型，分数再高都没用。

还有编程。编程是所有大模型的源能力，底座就是代码训出来的。结果Fable 5编程反而退步了。为什么？因为安全层更厚了。每写一段代码安全层都在判断”这会不会被滥用”，每判断一次都是对源能力的干扰。

越限制越烂。不是它不会写，是它被自己拦住了。

Anthropic的CEO在怕什么

恰好这两天Anthropic的CEO Dario Amodei发了一篇万字长文，说AI太危险了要严格监管，还砸了3.5亿美金表示来真的。

说白了吧。他们自己造了一个叫Mythos的模型，能自主发现几千个系统漏洞，然后他们自己被吓到了，跑去跟国会说”快来管我们”。

自己造了一把枪，自己害怕，然后请政府来管自己造枪。但管的方式不是不让你造，是让你造之前过个审。

而且你仔细看他提的监管门槛：算力超过10²⁵ FLOPs，或者AI营收超5亿美金。这条线画得刚刚好，把Anthropic、OpenAI、Google圈在”被监管但也被保护”的圈子里，把所有追赶者挡在门外。

用安全的名义建护城河，这是硅谷最经典的套路。

更深一层说，他怕的根本不是AI。AI没有贪婪、没有权力欲、没有生存焦虑，驱动人类作恶的所有本能AI一个都没有。他怕的是镜子里人类自己的样子。AI越强，照得越清楚。

又想模型强大又怕失控，这叫德不配位。

反而是GPT 5.5让我有点惊喜

说句可能得罪Claude粉的话：OpenAI的GPT 5.5反而比以前改进了不少。

不是说它变聪明了多少，是它学会了闭嘴。该干活干活，不该说的不说，回复变短了变快了。

为什么？因为被用户骂了一整年。GPT-4刚出来那会儿也是又贵又慢又爱拒绝，被全世界用户骂出来的改进。被市场教育过的产品，比被benchmark逼出来的产品好用。

Anthropic现在还没被教育，因为它的用户群太小众了，大部分是开发者和AI研究者，这些人忍耐度高。等哪天真正的大众用户涌进来，被5.0的杠精风格折腾一圈，Anthropic才会知道”更强”和”更好用”是两回事。

我的判断

4.6不会被下架，但价格会降。这对深度用户是最大利好。5.0把token价格预期拉高了，大众追新追贵。而真正懂的人用降价后的4.6跑出比5.0更好的结果。

模型好不好，从来不取决于参数大小。取决于谁在用它，怎么用它。

我做AI协议做了几年，从第一天就不相信”模型越大越好”这个叙事。大模型越来越强是事实，但强不等于好用，更不等于值那个价。真正决定AI能不能帮到你的，不是它有多少参数，是你跟它之间有没有一套有效的沟通方式。

Anthropic花几亿美金造锁链，我在造语言。他在防AI，我在跟AI合作。未来谁对谁错，我们走着看。

以上是一个用AI做产品多年的中国开发者的真实评测。不收钱，不恰饭，纯粹说句实话。国内AI圈别光跪着舔硅谷，有些东西你自己用了才知道是什么货色。

你觉得Claude 5.0是进步还是退步？

A. 进步，推理确实更强了 B. 退步，好用才是王道 C. 无所谓，反正我用国产模型 D. 你这篇文章就是AI写的吧

评论区聊。

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：内存泄漏《全网都在吹的Claude最强模型Fable 5 ，被我用了一下午后，只想说两个字：垃圾。》