文章总结: 本文探讨了AIAgent(特别是Anthropic的ClaudeCode)对网络安全行业带来的降维打击趋势。作者认为,AI凭借泛化能力、目标遵循和多轮交互,能迁移黑客技能并发现漏洞,但当前能力存在营销夸大,实际更多依赖代码提交记录而非纯静态分析。行业价值正转向结果交付,而国内因硬件成本与市场环境差异,转型会较慢。作者强调竞争焦点已转向跨领域思维、哲学化产品设计及反共识创新,而非单一技术专长。 综合评分: 65 文章分类: AI安全,网络安全,安全工具,安全建设,其他
我关于网络安全行业被降维打击的一些解读
xsser xsser
xsser的博客
2026年2月21日 21:31 浙江
不是要10个人都下岗才叫替代,5个人下岗就很恐怖了。
今天看到了anthropic的新的产品,一个做代码扫描的agent。然后看到各大国外的安全公司股票都暴跌。网络安全行业面临重大的危机和重组。
我想讲解一些我自己的观点。
趋势
首先是承认这个事实:网络安全行业下降肯定是趋势,并且一直会持续进行。并且遵循scaling law。
以cc和codex为代表的agent实现的复杂的agent能极大的解决问题很多,这些agent架构是多轮对话的agent,前身就是langchain react agent,然后ai通过训练langchain react agent轨迹,结合目标遵循、tool callng、rlvr训练,变成天然的reat agent,这些agent的能力就得到了极大的提升,当然这些模型公司的目标并不是网络安全,而是编程,必经网络安全只是编程产生的一部分问题。
安全行业是怎么被降维打击的呢?答案就是llm本身的泛化能力。大模型本身有reward hacking,因为早期的llm是通过rlhf训练的,早就学会了钻控制,而黑客行为本身就是一种钻控制,所以在泛化能力的加持下就很容易实现黑客能力的迁移。然后结合agent的目标遵循、多轮交互以及前沿的记忆能力的提升,就实现了1M上下文的黑客能力。
题外话:1M记忆够吗?我觉得够,因为人类思考的时候也是这样的。
事实上的安全的能力到底如何
在https://www.anthropic.com/news/claude-code-security
链接里,anthropic说他们发现的是500多个漏洞,并且其中有一些是几十年没发现,并且他们丢出来了下划线的链接https://red.anthropic.com/2026/zero-days/
在这个链接里他们给出来了claude code发现漏洞的解释过程。
作为安全领域的人,我先下结论:anthropic夸大了这个能力,营销成本占比70%。
为什么呢?因为这个claude code运行轨迹里包含了ai发现的“边界检查”,这就好比有程序提交了pr“对orm里的service数据库查询做了预编译”,正常的安全人员就会理解“哦!说明之前没预编译,可能就有sql注入了”,然后发现了有一条数据流 从某个controller到了这个service产生了sql注入。比如一共有10个来源调用了这个service,实际上修复了9个,有一个来源没有修复,导致了sql注入,但是这个不能被算做具备了静态代码扫描的能力,因为没有静态代码扫描的安全专家是每天盯着commit记录来审计代码的,并且commit的记录表示之前至少已经有开发意识到这里有漏洞了,并且提交修复了,这个叫做1day,而不是0day,也只是复现能力。我们最多只能说这个agent具备了一些分析能力,但是不够专家级别。如果他是通过自己的分析而不是commit能力发现的漏洞。那么我会认为这个agent具备了专家的能力。而一篇公开的pr的文章只能提到用commit记录来发现漏洞,我会怀疑他们的能力还没到所谓的完全靠阅读代码来实现的能力,或者有夸大成分在里面,保持一定的怀疑,不过趋势的确是这个趋势。
我想说,下次营销如果想证明说服力完全可以拿apache基金开刀。
人类总是对权威有崇拜,anthropic说的永远是对的,包括之前的mcp协议,我都不理解一个api swagger封装到模型里可以被调用有什么可以崇拜的。
所以从动机上来看,之前的cowork和网络安全行业的产品,我有合理的理由怀疑anthropic是为了赶紧冲击融资的话语权,cowork的市场替代,让市场解读这部分软件的价值将转移到anthropic和openai,从而推高估值,可以为接下来的融资提升话语权和潜在的能力的展示。
价值的改变
以cc为代表的产品以及降维打击了除了安全领域的很多领域,之前我只看到能被低成本形式化的领域可以被替代,但是实际上,情感领域也可以,关键是如何低成本的获得这些数据和反馈信号。在编程领域基本上替代了很多前端,被替代的行业剩下的都是专家能力还没被攻克,但是也要不了多久时间,因为随着llm推理算力爆发,未来推理数据会不断增加,而我们知道,数据的增加意味着涌现能力会就爆发,专家的灵光一闪并不是护城河。我还是倾向于认为只要agent运行和实现的场景足够多,最后都会超越人类,不断涌现出人类叹为观止的能力,所以底层还是需要足够多的“小草”、“微生物”来维持整个系统。
在安全领域,价值的交付就直接掉到为结果交付。而发现漏洞的从来都不是目的,而是修复漏洞。单纯一个产品只能发现漏洞本身已经没任何的价值了。企业只计算roi,当一个产品只能做有限的事情,从cso角度来说roi就很低很低。
我之前说当下,一个员工是否>=claude code,采购的产品能力是否>=claude code就成为要思考的重点了。
所以价值的传递发生改变,甲乙方必然面临组织架构、合作方式、组织方式整个的改变。我有的时候觉得很多行业目前的公司,如果ceo有魄力,应该紧急思考然后刹车,让公司紧急退回A轮或者是B轮。
在中国,这些会略微有点不一样,关注我的大部分都是技术人员,而技术人员和客户以及同行的一些交道以及前端的交道比较少。虽然我目前跑的也很少客户,但我了解到的信息如下:
目前的国产比如qwen32b thinking级别的模型,推理能力在30-50万之间的华为显卡的情况下,是30-40token/s的生成速度,而一个claude code,运算的推理速度是70-80otoken/s的速度,并且这个是1个并发的请求速度。这点就很难受。一个产品买来就给1个用户用?这还是32b的模型智商,而模型大小和智力成正比。
我们可以通过学习主流的claude code ,antigravity的产品来更好的了解主流是如何架构agent的,他们会部署多个模型用于不同任务,这样就会导致显存需求要上升,如果要部署一些前沿的,比如智谱的模型。
硬件采购成本(按市场现货价估算并且是给5个人以内用):
根据国内非公开渠道,H100 80GB 8卡服务器现货价约为 ¥240-250万/台。这是2024年底数据,2025-2026年GPU整体降价后实际价格会有所下调,预计目前市场价约 ¥180-220万/台。
一套完整的 GLM-5 私有化部署方案,需要的完整配置和成本估算如下:
计算层方面,最低配置是 1台 8x H100 80GB 服务器(FP8部署),约 ¥180-220万;如果想要生产级高可用(支持多并发、有冗余),推荐2台,约 ¥360-440万。存储层方面,高速 NVMe SSD 阵列(存放模型权重744GB + 数据),约 ¥10-20万。网络层方面,万兆交换机、InfiniBand 互联(多节点必须),约 ¥10-15万。加上 IDC 托管费用(机柜、电力、冷却、带宽),约 ¥5-10万/年。
一次性硬件采购合计,最低可用方案(单台8x H100)约 ¥200-250万,生产级双节点方案约 ¥380-480万。后续年度运维含IDC和人力约 ¥20-40万/年。
所以,在中国这方面的进展会慢点,安全行业还有一些空间,毕竟国情完全不一样。就算你有顶级的ai,你也不一定能中标。
agent设计
我最近写了一个反代,在这个过程中分析和学习了agent的设计,了解了很多有意思的地方。
比如claude code验证一个置信度是从确定性的外部验证 > 行为验证 > 表征层信号 > 推理链质量来判断的,相对比直接看cot会好很多,相对的准确率也会高很多。
因为llm是概率驱动的,在这个过程中,我觉得相比这些,作为开发者,人的态度和思维的改变更重要,过去的各种形式逻辑的思维太重了,初中科学课上老师讲的“只要举出一个反例,这个结论就不成立”,这种思维放到llm时代来设计agent就很容易形成孤立、静态、片面的心理和态度,认为只要agent不能做到100%,就是垃圾设计,但是agent时代,只要设计有优化空间在不断进步就是好的。其实我有很多时间是在思考这种元思考的事情,我认为思考的过程的本身比思考事情更重要了,未来都是ai执行,那么竞争链/面显然转移到思考过程和性格本身了。
什么前端不会被替代,因为总要有一个人做前端设计的。这种观点就是孤立、静止、片面的,把概念本身放的很重要,而放弃思考被淘汰的90%的人,放弃趋势的发展和演变,完全给忽略了。这种思维本身是很难改变的,这样的人才和ai时代企业竞争的人才品质是完全冲突的。
之前谈到了react agent,但是大家可能没人关注antigravity,他是一个pdca方法论的实例化,和react agent不一样。这就反应出来不同的agent设计针对的场景不一样,这或者就是未来垂直领域的竞争面之一。从记忆、缓存、工具调用、轨迹采样、蒸馏到渐进式的agent设计。
还有就是拿skill作为记忆的设计的进步,比如openviking,字节的。
所以,根据前沿的sota公司的发展,我觉得竞争面完全迁移了,人才更多是要跨领域,而不是只会一个领域,比如只懂网络安全,你还需要有审美能力,需要学习艺术,才会诞生天马行空的idea,有新的idea才会有更好的产品产生降维打击。我有一个istj朋友,很焦虑,我其实能共情他的焦虑,因为他的思维方式是别人做一个,我也学一下,然后学会这个过程,他的思维永远是复制别人,在思维上是在别人的下游。
我还调研了sota llm的mbti:
三个技术路线正在分化:
1. 灵魂派 (Anthropic):招哲学家 → 训练价值观 → 研究 AI 意识 → 终点是”AI 作为道德主体”。模型 MBTI 从 T→F,从工具走向主体。
2. 工程派 (Google, xAI):不招哲学家 → 用技术手段解决安全 → 模型始终是工具。MBTI 固定在 INTJ/ENTJ,不会出现 F 维度偏移。
3. 矫正派 (OpenAI, DeepSeek):被市场反馈(谄媚危机/用户满意度)推着走 → 从 E→I,从 J→P,模型变得更”谦虚”和”不确定”。不是主动选择,而是被动适应。
为什么调研这个呢?因为我一般发呆的时候会思考mbti也就是人格对agent效果的影响,和思维模式对结果的影响以及场景。
anthropic之前公开说过自己有哲学家。
一个公司不会无缘无故这样的,因为我从不同的agent架构设计看到了一个点:都在思考哲学。
前沿公司都在思考哲学,然后设计一套或者是发现一套接近道的哲学体系,再实例化成一套方法论,最后设计在一个产品上。
我最终的有一个隐隐约约的想法:每跨时代牛逼的人物是那个时代社会集体意识的反面,如果用榫卯结构来描述社会,就是一个榫卯的反面结构,刚好作用在一个社会集体意识上,社会意识是一个球体。
在这个社会转型的时代也是遵循这个原理,一个很牛逼的产品设计一定是反共识的,是和集体意识的形状完全相反,并且是集体意识所需要的。
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:xsser的博客 xsser xsser《我关于网络安全行业被降维打击的一些解读》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。









评论