文章总结: 文章客观分析了OpenAICodexSecurity在代码审计中的优势与局限。指出AI虽擅长规模化扫描与模式识别,但缺乏业务逻辑理解与未知威胁发现能力。建议安全人员理性看待技术变革,将AI作为提效工具,专注于业务理解与风险决策,实现从漏洞筛选者向风险决策者的转型。 综合评分: 88 文章分类: AI安全,代码审计,安全建设
OpenAI Codex Security对于思考当下安全人员价值的意义
原创
千里 千里
东方隐侠安全团队
2026年3月10日 06:25 江苏
01
前言
2026年3月,OpenAI发布了Codex Security。
这是一个专门做应用安全的AI工具,官方说法是:30天扫描了120万次代码提交,发现了792个关键漏洞,10561个高危问题。
消息出来之后,朋友圈各种文章都来了:
“AI将取代安全工程师”
“Codex Security:安全行业的game changer”
“有了AI,安全漏洞将不再是问题”
我的看法:这些说法,要么过度乐观,要么过度悲观。
不如先让子弹飞一会儿。
02
先看数据
根据公开信息,有几个数字值得关注:
-
120万次代码提交
-
792个关键漏洞
-
10561个高危问题
-
关键漏洞占比不到0.1%
这个”不到0.1%”很有意思。
如果真的能精准识别到0.1%,那确实很强。但我想问几个问题:
-
这10561个高危,是”真高危”还是”AI认为高危”?
-
扫的是什么代码?开源仓库?企业内部?
-
792个关键漏洞,有多少是真正的0day?
-
误报率是多少?有没有公开数据?
目前没有看到完整的公开报告,所以我们没必要过分的兴奋或者恐慌。
03
几个事实
先说说Codex Security确实能做到的事:
规模化扫描
这是AI的核心优势。120万次提交,人工审查可能需要几个月,AI可以在短时间内完成初筛。
模式识别
对于已知的漏洞模式,AI可以快速识别。SQL注入、命令执行、硬编码密码这些,AI做得很快。
上下文理解
根据那篇安全客的文章,Codex Security不是简单的规则匹配,而是先理解业务上下文。它会先建立威胁模型,然后做风险评估。
沙箱验证
文章提到一个关键能力:AI会自己在沙箱里执行PoC,验证漏洞是不是真的能打。这个能力确实往前走了一步。
修复建议
AI可以生成修复方案,这个对开发团队快速理解漏洞并决策修复方式有帮助。
04
AI不能做什么
但另一方面,AI有很多局限性:
理解业务逻辑
这是最大的局限。
代码只是系统的表层呈现。为什么要这样写?产品为什么这样设计?团队的安全规范是什么?AI看不到这些。
举几个例子:
-
某个API没有鉴权。AI说这是漏洞。但实际上这是一个内部查询接口,不需要鉴权。
-
某个地方用了明文存储。AI说危险。但实际上这是测试环境,生产环境用的是加密存储。
-
某个功能有越权风险。AI不知道这个功能是给内部员工用的,有物理隔离。
AI不知道”为什么”,它只能看到”是什么”。
发现未知威胁
AI只能识别”见过”的漏洞模式。对于全新的攻击手法、AI从未见过的漏洞类型,它是识别不出来的。
这和学生考试一样:课本上的题会做,课本上没有的题就不会。
判断实际影响
发现漏洞和判断漏洞的严重性,是两回事。
同样一个API未鉴权:
-
在内部测试系统里,可能没什么影响
-
在暴露公网的核心系统里,可能是灾难
AI不知道这个系统部署在哪里、有什么防护、跑着什么业务。
绕过防护的思维
人类会思考:”这里有WAF,能不能绕过?”
AI不会主动Bypass,AI只会检查已知的坏味道。真正的黑客思维是”能不能突破”,AI目前不具备这种主动思考能力。
价值观判断
有些代码从技术上没有问题,但从伦理上、隐私上、合规上有问题。
比如收集用户GPS位置用于广告推送——技术上没有漏洞,但可能违反隐私法规。
目前所掌握的情况看,AI的这种价值判断能力可能偏弱。
05
当下的局限性
具体说说当前AI代码审计的几个问题:
- 知识截止
所有的AI模型都有知识截止日期。GPT-4的能力受限于训练数据,之后出现的新漏洞、新攻击手法,AI是不知道的。
这不是AI的错,是技术现状。
Codex Security再强,它的能力也受限于训练数据。
- 上下文缺失
AI可以分析一段代码,但它看不到:
-
整个系统的架构设计
-
团队的安全基线和规范
-
线上环境的实际配置
-
业务逻辑和产品需求
盲人摸象的故事:AI看到了腿,但不知道整头大象长什么样。
- 误报率问题
这是实际应用中的大问题。
文章说”不到0.1%”,但这是开源项目的数据。企业内部代码库可能更复杂,误报率可能更高。
大量的误报会导致:
-
安全工程师疲于奔命
-
真正的问题被淹没
-
团队对警报失去敏感度
筛选和验证,仍然需要人。
- 无法验证
AI说”这里有SQL注入”,但它不会真的去尝试注入一下。它只能根据模式猜测。
真正的安全专家会:”让我打一下试试能不能进去。”
验证能力,是人和AI的重要分界线。
当然,这不是解决不了的问题,但存在问题可以得到解决的可能性,恰恰又回归到人类安全专家的价值本身。
06
业界观点
看了些讨论,整理一下各方观点:
乐观派
“AI将让安全工程师从繁琐工作中解放出来”
“AI不会取代安全工程师,但会用AI的会取代不会用的”
“Codex Security是DevSecOps的里程碑”
谨慎派
“AI能发现技术漏洞,发现不了设计缺陷”
“误报率是实际应用的大问题”
“AI缺乏业务上下文理解,短期内无法解决”
悲观派(较少)
“初级安全工程师需求会大幅减少”
“安全工程师将变成AI的审核员”
我的观点:我没有太偏向的情绪,这是技术发展的必然,我们应该积极面对一切改变。
07
怎么做
基于实际经验,给同行一些建议:
- 别慌
每次新技术出来,总有人喊”要失业”。
汽车出现了,马车夫失业了吗?一部分失业了,但更多转型成了司机。
计算机出现了,打字员失业了吗?最后变成了程序员。
AI是工具,是增强你能力的工具,不是替代你的敌人。
历史上每次新技术都这样喊,最后该干嘛还是干嘛。
- 拥抱工具
学会用AI工具提升效率。具体怎么做:
-
把AI当作”第一道筛子”
-
用AI做大规模扫描
-
用AI做重复性劳动
-
用AI生成修复建议
不会用AI工具的安全工程师,可能会落后。
- 专注人擅长的
AI不擅长的,就是你该专注的:
-
业务理解 —— 理解产品逻辑,判断漏洞真实影响
-
风险优先级 —— 不是所有漏洞都要修,优先级需要人来判断
-
沟通协调 —— 和开发团队、产品团队对接修复方案
-
架构设计 —— 从系统层面设计安全方案
-
未知威胁 —— 发现AI没见过的漏洞
这些是AI做不了的。
- 保持学习
AI在进化,你也要进化。
-
关注最新的漏洞和攻击手法
-
学习AI安全工具的使用
-
提升业务理解能力
-
培养系统性安全思维
最简单的逻辑:AI会的东西,你可以不用学;AI不会的,才是你的价值。
08
最佳实践模式
最靠谱的工作模式:
AI扫描 → AI验证 → AI建议 → 人复核 → 人决策 → 人优化
第一阶段:AI扫描
大规模扫描代码仓库,发现所有可疑的地方。
第二阶段:AI验证
像Codex Security那样,在沙箱里验证漏洞是不是真的能打。
第三阶段:AI建议
生成修复方案,给出优先级建议。
第四阶段:人复核
安全工程师确认AI的判断,去除误报。
第五阶段:人决策
判断漏洞要不要修、何时修、怎么修。
第六阶段:人优化
从发现的问题中总结规律,优化AI的扫描规则。
09
我的思考
做了这么多年安全,见过太多”革命性技术”。
从SAST到DAST,从WAF到RASP,每次都有人说要改变行业。最后发现,该做的事还是一样做。
AI确实很强,但没那么神。
看到一篇报道Openai Codex Security的文章说:”它不会替代安全专家,但一定会成为安全从业者手中最强大的武器。”
我支持这个观点,有能力转变的安全工程师将从漏洞筛选者向风险决策者演进——这是我对安全工程师未来价值的判断。
10
结论
最后用一句话总结:
“理性看待AI,不要神化,不要恐慌,做好拥抱的准备。”
AI很强,但没那么神。安全工程师的价值,不会因为一个工具的出现而消失。
最好的安全团队,是会把AI当工具用的团队。
最好的安全工程师,一定在调教AI方面也有独到之处。
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:东方隐侠安全团队 千里 千里《OpenAI Codex Security对于思考当下安全人员价值的意义》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。










评论