2026-03-03 08:09:31 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： 本文探讨了AIAgent（特别是Anthropic的ClaudeCode）对网络安全行业带来的降维打击趋势。作者认为，AI凭借泛化能力、目标遵循和多轮交互，能迁移黑客技能并发现漏洞，但当前能力存在营销夸大，实际更多依赖代码提交记录而非纯静态分析。行业价值正转向结果交付，而国内因硬件成本与市场环境差异，转型会较慢。作者强调竞争焦点已转向跨领域思维、哲学化产品设计及反共识创新，而非单一技术专长。 综合评分： 65 文章分类： AI安全,网络安全,安全工具,安全建设,其他

cover_image

我关于网络安全行业被降维打击的一些解读

xsser xsser

xsser的博客

2026年2月21日 21:31 浙江

不是要10个人都下岗才叫替代，5个人下岗就很恐怖了。

今天看到了anthropic的新的产品，一个做代码扫描的agent。然后看到各大国外的安全公司股票都暴跌。网络安全行业面临重大的危机和重组。

我想讲解一些我自己的观点。

趋势

首先是承认这个事实：网络安全行业下降肯定是趋势，并且一直会持续进行。并且遵循scaling law。

以cc和codex为代表的agent实现的复杂的agent能极大的解决问题很多，这些agent架构是多轮对话的agent,前身就是langchain react agent，然后ai通过训练langchain react agent轨迹，结合目标遵循、tool callng、rlvr训练，变成天然的reat agent，这些agent的能力就得到了极大的提升，当然这些模型公司的目标并不是网络安全，而是编程，必经网络安全只是编程产生的一部分问题。

安全行业是怎么被降维打击的呢？答案就是llm本身的泛化能力。大模型本身有reward hacking，因为早期的llm是通过rlhf训练的，早就学会了钻控制，而黑客行为本身就是一种钻控制，所以在泛化能力的加持下就很容易实现黑客能力的迁移。然后结合agent的目标遵循、多轮交互以及前沿的记忆能力的提升，就实现了1M上下文的黑客能力。

题外话：1M记忆够吗？我觉得够，因为人类思考的时候也是这样的。

事实上的安全的能力到底如何

在https://www.anthropic.com/news/claude-code-security

链接里，anthropic说他们发现的是500多个漏洞，并且其中有一些是几十年没发现，并且他们丢出来了下划线的链接https://red.anthropic.com/2026/zero-days/

在这个链接里他们给出来了claude code发现漏洞的解释过程。

作为安全领域的人，我先下结论：anthropic夸大了这个能力，营销成本占比70%。

为什么呢？因为这个claude code运行轨迹里包含了ai发现的“边界检查”，这就好比有程序提交了pr“对orm里的service数据库查询做了预编译”，正常的安全人员就会理解“哦！说明之前没预编译，可能就有sql注入了”，然后发现了有一条数据流从某个controller到了这个service产生了sql注入。比如一共有10个来源调用了这个service，实际上修复了9个，有一个来源没有修复，导致了sql注入，但是这个不能被算做具备了静态代码扫描的能力，因为没有静态代码扫描的安全专家是每天盯着commit记录来审计代码的，并且commit的记录表示之前至少已经有开发意识到这里有漏洞了，并且提交修复了，这个叫做1day，而不是0day，也只是复现能力。我们最多只能说这个agent具备了一些分析能力，但是不够专家级别。如果他是通过自己的分析而不是commit能力发现的漏洞。那么我会认为这个agent具备了专家的能力。而一篇公开的pr的文章只能提到用commit记录来发现漏洞，我会怀疑他们的能力还没到所谓的完全靠阅读代码来实现的能力，或者有夸大成分在里面，保持一定的怀疑，不过趋势的确是这个趋势。

我想说，下次营销如果想证明说服力完全可以拿apache基金开刀。

人类总是对权威有崇拜，anthropic说的永远是对的，包括之前的mcp协议，我都不理解一个api swagger封装到模型里可以被调用有什么可以崇拜的。

所以从动机上来看，之前的cowork和网络安全行业的产品，我有合理的理由怀疑anthropic是为了赶紧冲击融资的话语权，cowork的市场替代，让市场解读这部分软件的价值将转移到anthropic和openai，从而推高估值，可以为接下来的融资提升话语权和潜在的能力的展示。

价值的改变

以cc为代表的产品以及降维打击了除了安全领域的很多领域，之前我只看到能被低成本形式化的领域可以被替代，但是实际上，情感领域也可以，关键是如何低成本的获得这些数据和反馈信号。在编程领域基本上替代了很多前端，被替代的行业剩下的都是专家能力还没被攻克，但是也要不了多久时间，因为随着llm推理算力爆发，未来推理数据会不断增加，而我们知道，数据的增加意味着涌现能力会就爆发，专家的灵光一闪并不是护城河。我还是倾向于认为只要agent运行和实现的场景足够多，最后都会超越人类，不断涌现出人类叹为观止的能力，所以底层还是需要足够多的“小草”、“微生物”来维持整个系统。

在安全领域，价值的交付就直接掉到为结果交付。而发现漏洞的从来都不是目的，而是修复漏洞。单纯一个产品只能发现漏洞本身已经没任何的价值了。企业只计算roi，当一个产品只能做有限的事情，从cso角度来说roi就很低很低。

我之前说当下，一个员工是否>=claude code，采购的产品能力是否>=claude code就成为要思考的重点了。

所以价值的传递发生改变，甲乙方必然面临组织架构、合作方式、组织方式整个的改变。我有的时候觉得很多行业目前的公司，如果ceo有魄力，应该紧急思考然后刹车，让公司紧急退回A轮或者是B轮。

在中国，这些会略微有点不一样，关注我的大部分都是技术人员，而技术人员和客户以及同行的一些交道以及前端的交道比较少。虽然我目前跑的也很少客户，但我了解到的信息如下：

目前的国产比如qwen32b thinking级别的模型，推理能力在30-50万之间的华为显卡的情况下，是30-40token/s的生成速度，而一个claude code，运算的推理速度是70-80otoken/s的速度，并且这个是1个并发的请求速度。这点就很难受。一个产品买来就给1个用户用？这还是32b的模型智商，而模型大小和智力成正比。

我们可以通过学习主流的claude code ，antigravity的产品来更好的了解主流是如何架构agent的，他们会部署多个模型用于不同任务，这样就会导致显存需求要上升，如果要部署一些前沿的，比如智谱的模型。

硬件采购成本（按市场现货价估算并且是给5个人以内用）：

根据国内非公开渠道，H100 80GB 8卡服务器现货价约为 ¥240-250万/台。这是2024年底数据，2025-2026年GPU整体降价后实际价格会有所下调，预计目前市场价约 ¥180-220万/台。

一套完整的 GLM-5 私有化部署方案，需要的完整配置和成本估算如下：

计算层方面，最低配置是 1台 8x H100 80GB 服务器（FP8部署），约 ¥180-220万；如果想要生产级高可用（支持多并发、有冗余），推荐2台，约 ¥360-440万。存储层方面，高速 NVMe SSD 阵列（存放模型权重744GB + 数据），约 ¥10-20万。网络层方面，万兆交换机、InfiniBand 互联（多节点必须），约 ¥10-15万。加上 IDC 托管费用（机柜、电力、冷却、带宽），约 ¥5-10万/年。

一次性硬件采购合计，最低可用方案（单台8x H100）约 ¥200-250万，生产级双节点方案约 ¥380-480万。后续年度运维含IDC和人力约 ¥20-40万/年。

所以，在中国这方面的进展会慢点，安全行业还有一些空间，毕竟国情完全不一样。就算你有顶级的ai，你也不一定能中标。

agent设计

我最近写了一个反代，在这个过程中分析和学习了agent的设计，了解了很多有意思的地方。

比如claude code验证一个置信度是从确定性的外部验证 > 行为验证 > 表征层信号 > 推理链质量来判断的，相对比直接看cot会好很多，相对的准确率也会高很多。

因为llm是概率驱动的，在这个过程中，我觉得相比这些，作为开发者，人的态度和思维的改变更重要，过去的各种形式逻辑的思维太重了，初中科学课上老师讲的“只要举出一个反例，这个结论就不成立”，这种思维放到llm时代来设计agent就很容易形成孤立、静态、片面的心理和态度，认为只要agent不能做到100%，就是垃圾设计，但是agent时代，只要设计有优化空间在不断进步就是好的。其实我有很多时间是在思考这种元思考的事情，我认为思考的过程的本身比思考事情更重要了，未来都是ai执行，那么竞争链/面显然转移到思考过程和性格本身了。

什么前端不会被替代，因为总要有一个人做前端设计的。这种观点就是孤立、静止、片面的，把概念本身放的很重要，而放弃思考被淘汰的90%的人，放弃趋势的发展和演变，完全给忽略了。这种思维本身是很难改变的，这样的人才和ai时代企业竞争的人才品质是完全冲突的。

之前谈到了react agent，但是大家可能没人关注antigravity，他是一个pdca方法论的实例化，和react agent不一样。这就反应出来不同的agent设计针对的场景不一样，这或者就是未来垂直领域的竞争面之一。从记忆、缓存、工具调用、轨迹采样、蒸馏到渐进式的agent设计。

还有就是拿skill作为记忆的设计的进步，比如openviking，字节的。

所以，根据前沿的sota公司的发展，我觉得竞争面完全迁移了，人才更多是要跨领域，而不是只会一个领域，比如只懂网络安全，你还需要有审美能力，需要学习艺术，才会诞生天马行空的idea，有新的idea才会有更好的产品产生降维打击。我有一个istj朋友，很焦虑，我其实能共情他的焦虑，因为他的思维方式是别人做一个，我也学一下，然后学会这个过程，他的思维永远是复制别人，在思维上是在别人的下游。

我还调研了sota llm的mbti：

三个技术路线正在分化：

1. 灵魂派 (Anthropic)：招哲学家 → 训练价值观 → 研究 AI 意识 → 终点是”AI 作为道德主体”。模型 MBTI 从 T→F，从工具走向主体。

2. 工程派 (Google, xAI)：不招哲学家 → 用技术手段解决安全 → 模型始终是工具。MBTI 固定在 INTJ/ENTJ，不会出现 F 维度偏移。

3. 矫正派 (OpenAI, DeepSeek)：被市场反馈（谄媚危机/用户满意度）推着走 → 从 E→I，从 J→P，模型变得更”谦虚”和”不确定”。不是主动选择，而是被动适应。

为什么调研这个呢？因为我一般发呆的时候会思考mbti也就是人格对agent效果的影响，和思维模式对结果的影响以及场景。

anthropic之前公开说过自己有哲学家。

一个公司不会无缘无故这样的，因为我从不同的agent架构设计看到了一个点：都在思考哲学。

前沿公司都在思考哲学，然后设计一套或者是发现一套接近道的哲学体系，再实例化成一套方法论，最后设计在一个产品上。

我最终的有一个隐隐约约的想法：每跨时代牛逼的人物是那个时代社会集体意识的反面，如果用榫卯结构来描述社会，就是一个榫卯的反面结构，刚好作用在一个社会集体意识上，社会意识是一个球体。

在这个社会转型的时代也是遵循这个原理，一个很牛逼的产品设计一定是反共识的，是和集体意识的形状完全相反，并且是集体意识所需要的。

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：xsser的博客 xsser xsser《我关于网络安全行业被降维打击的一些解读》