2026-03-11 03:38:16 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： 文章客观分析了OpenAICodexSecurity在代码审计中的优势与局限。指出AI虽擅长规模化扫描与模式识别，但缺乏业务逻辑理解与未知威胁发现能力。建议安全人员理性看待技术变革，将AI作为提效工具，专注于业务理解与风险决策，实现从漏洞筛选者向风险决策者的转型。 综合评分： 88 文章分类： AI安全,代码审计,安全建设

cover_image

OpenAI Codex Security对于思考当下安全人员价值的意义

原创

千里千里

东方隐侠安全团队

2026年3月10日 06:25 江苏

前言

2026年3月，OpenAI发布了Codex Security。

这是一个专门做应用安全的AI工具，官方说法是：30天扫描了120万次代码提交，发现了792个关键漏洞，10561个高危问题。

消息出来之后，朋友圈各种文章都来了：

“AI将取代安全工程师”

“Codex Security：安全行业的game changer”

“有了AI，安全漏洞将不再是问题”

我的看法：这些说法，要么过度乐观，要么过度悲观。

不如先让子弹飞一会儿。

先看数据

根据公开信息，有几个数字值得关注：

120万次代码提交
792个关键漏洞
10561个高危问题
关键漏洞占比不到0.1%

这个”不到0.1%”很有意思。

如果真的能精准识别到0.1%，那确实很强。但我想问几个问题：

这10561个高危，是”真高危”还是”AI认为高危”？
扫的是什么代码？开源仓库？企业内部？
792个关键漏洞，有多少是真正的0day？
误报率是多少？有没有公开数据？

目前没有看到完整的公开报告，所以我们没必要过分的兴奋或者恐慌。

几个事实

先说说Codex Security确实能做到的事：

规模化扫描

这是AI的核心优势。120万次提交，人工审查可能需要几个月，AI可以在短时间内完成初筛。

模式识别

对于已知的漏洞模式，AI可以快速识别。SQL注入、命令执行、硬编码密码这些，AI做得很快。

上下文理解

根据那篇安全客的文章，Codex Security不是简单的规则匹配，而是先理解业务上下文。它会先建立威胁模型，然后做风险评估。

沙箱验证

文章提到一个关键能力：AI会自己在沙箱里执行PoC，验证漏洞是不是真的能打。这个能力确实往前走了一步。

修复建议

AI可以生成修复方案，这个对开发团队快速理解漏洞并决策修复方式有帮助。

AI不能做什么

但另一方面，AI有很多局限性：

理解业务逻辑

这是最大的局限。

代码只是系统的表层呈现。为什么要这样写？产品为什么这样设计？团队的安全规范是什么？AI看不到这些。

举几个例子：

某个API没有鉴权。AI说这是漏洞。但实际上这是一个内部查询接口，不需要鉴权。
某个地方用了明文存储。AI说危险。但实际上这是测试环境，生产环境用的是加密存储。
某个功能有越权风险。AI不知道这个功能是给内部员工用的，有物理隔离。

AI不知道”为什么”，它只能看到”是什么”。

发现未知威胁

AI只能识别”见过”的漏洞模式。对于全新的攻击手法、AI从未见过的漏洞类型，它是识别不出来的。

这和学生考试一样：课本上的题会做，课本上没有的题就不会。

判断实际影响

发现漏洞和判断漏洞的严重性，是两回事。

同样一个API未鉴权：

在内部测试系统里，可能没什么影响
在暴露公网的核心系统里，可能是灾难

AI不知道这个系统部署在哪里、有什么防护、跑着什么业务。

绕过防护的思维

人类会思考：”这里有WAF，能不能绕过？”

AI不会主动Bypass，AI只会检查已知的坏味道。真正的黑客思维是”能不能突破”，AI目前不具备这种主动思考能力。

价值观判断

有些代码从技术上没有问题，但从伦理上、隐私上、合规上有问题。

比如收集用户GPS位置用于广告推送——技术上没有漏洞，但可能违反隐私法规。

目前所掌握的情况看，AI的这种价值判断能力可能偏弱。

当下的局限性

具体说说当前AI代码审计的几个问题：

知识截止

所有的AI模型都有知识截止日期。GPT-4的能力受限于训练数据，之后出现的新漏洞、新攻击手法，AI是不知道的。

这不是AI的错，是技术现状。

Codex Security再强，它的能力也受限于训练数据。

上下文缺失

AI可以分析一段代码，但它看不到：

整个系统的架构设计
团队的安全基线和规范
线上环境的实际配置
业务逻辑和产品需求

盲人摸象的故事：AI看到了腿，但不知道整头大象长什么样。

误报率问题

这是实际应用中的大问题。

文章说”不到0.1%”，但这是开源项目的数据。企业内部代码库可能更复杂，误报率可能更高。

大量的误报会导致：

安全工程师疲于奔命
真正的问题被淹没
团队对警报失去敏感度

筛选和验证，仍然需要人。

无法验证

AI说”这里有SQL注入”，但它不会真的去尝试注入一下。它只能根据模式猜测。

真正的安全专家会：”让我打一下试试能不能进去。”

验证能力，是人和AI的重要分界线。

当然，这不是解决不了的问题，但存在问题可以得到解决的可能性，恰恰又回归到人类安全专家的价值本身。

业界观点

看了些讨论，整理一下各方观点：

乐观派

“AI将让安全工程师从繁琐工作中解放出来”

“AI不会取代安全工程师，但会用AI的会取代不会用的”

“Codex Security是DevSecOps的里程碑”

谨慎派

“AI能发现技术漏洞，发现不了设计缺陷”

“误报率是实际应用的大问题”

“AI缺乏业务上下文理解，短期内无法解决”

悲观派（较少）

“初级安全工程师需求会大幅减少”

“安全工程师将变成AI的审核员”

我的观点：我没有太偏向的情绪，这是技术发展的必然，我们应该积极面对一切改变。

怎么做

基于实际经验，给同行一些建议：

别慌

每次新技术出来，总有人喊”要失业”。

汽车出现了，马车夫失业了吗？一部分失业了，但更多转型成了司机。

计算机出现了，打字员失业了吗？最后变成了程序员。

AI是工具，是增强你能力的工具，不是替代你的敌人。

历史上每次新技术都这样喊，最后该干嘛还是干嘛。

拥抱工具

学会用AI工具提升效率。具体怎么做：

把AI当作”第一道筛子”
用AI做大规模扫描
用AI做重复性劳动
用AI生成修复建议

不会用AI工具的安全工程师，可能会落后。

专注人擅长的

AI不擅长的，就是你该专注的：

业务理解 —— 理解产品逻辑，判断漏洞真实影响
风险优先级 —— 不是所有漏洞都要修，优先级需要人来判断
沟通协调 —— 和开发团队、产品团队对接修复方案
架构设计 —— 从系统层面设计安全方案
未知威胁 —— 发现AI没见过的漏洞

这些是AI做不了的。

保持学习

AI在进化，你也要进化。

关注最新的漏洞和攻击手法
学习AI安全工具的使用
提升业务理解能力
培养系统性安全思维

最简单的逻辑：AI会的东西，你可以不用学；AI不会的，才是你的价值。

最佳实践模式

最靠谱的工作模式：

AI扫描 → AI验证 → AI建议 → 人复核 → 人决策 → 人优化

第一阶段：AI扫描

大规模扫描代码仓库，发现所有可疑的地方。

第二阶段：AI验证

像Codex Security那样，在沙箱里验证漏洞是不是真的能打。

第三阶段：AI建议

生成修复方案，给出优先级建议。

第四阶段：人复核

安全工程师确认AI的判断，去除误报。

第五阶段：人决策

判断漏洞要不要修、何时修、怎么修。

第六阶段：人优化

从发现的问题中总结规律，优化AI的扫描规则。

我的思考

做了这么多年安全，见过太多”革命性技术”。

从SAST到DAST，从WAF到RASP，每次都有人说要改变行业。最后发现，该做的事还是一样做。

AI确实很强，但没那么神。

看到一篇报道Openai Codex Security的文章说：”它不会替代安全专家，但一定会成为安全从业者手中最强大的武器。”

我支持这个观点，有能力转变的安全工程师将从漏洞筛选者向风险决策者演进——这是我对安全工程师未来价值的判断。

结论

最后用一句话总结：

“理性看待AI，不要神化，不要恐慌，做好拥抱的准备。”

AI很强，但没那么神。安全工程师的价值，不会因为一个工具的出现而消失。

最好的安全团队，是会把AI当工具用的团队。

最好的安全工程师，一定在调教AI方面也有独到之处。

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：东方隐侠安全团队千里千里《OpenAI Codex Security对于思考当下安全人员价值的意义》