文章总结: OpenAI正在扩展其纵深防御安全策略,以防止黑客利用其AI模型发动网络攻击。公司成立了前沿风险委员会,扩大防止滥用的防护措施,并推出可信访问计划和Aardvark安全扫描工具。尽管如此,业内专家对AI安全表示担忧,指出攻击者可能通过越狱或拆分任务绕过安全控制,且无护栏的开源模型可能被恶意使用。专家建议组织应区分AI威胁的炒作与现实,遵循最佳安全实践。 综合评分: 78 文章分类: AI安全,网络安全,威胁情报,漏洞分析,解决方案
行业资讯:OpenAI扩展了“纵深防御”安全,阻止黑客利用其AI模型发动网络攻击
君说安全
2025年12月16日 15:00 贵州
分享网络安全知识,提升网络安全认知!
让你看到达摩克利斯之剑的另一面!
“ OpenAI扩展了“纵深防御”安全,阻止黑客利用其AI模型发动网络攻击。”
图片来源:Shutterstock
大家好,我是Jun哥。
下文来自CSO-Online
作者:John E. Dunn
OpenAI正在为威胁组织可能利用其日益强大的AI前沿模型进行复杂网络攻击做准备。
OpenAI公司其模型不断发展的能力,被黑客用来“开发针对防御严密系统的零日远程利用,或有效协助针对现实影响的复杂隐秘企业或工业入侵行动”。
根据OpenAI指出的问题,根本原因在于AI的进攻和防御使用依赖于相同的知识和技术。这使得在不实现另一个的情况下实现其中一种变得具有挑战性。
这句话的意思是:
如果不知道攻击方式,就不知道如何防护,反过来也一样。
公司表示:“我们正在投资保障措施,确保这些强大能力主要惠及防御性用途,限制恶意用途的提升,”并补充道,“我们认为这项工作不是一次性的,而是一项持续、长期的投资,旨在为防御者提供优势,并持续加强关键基础设施在更广泛生态系统中的安全态势。”
其中一项新举措是前沿风险委员会。
公司对具体作细节透露的不多,但表示这是一项扩展中的“纵深防御”战略的一部分,旨在遏制广泛猜测的人工智能作为对抗工具的潜力。
“成员们将就有用、负责任的能力与潜在滥用之间的界限提出建议,这些经验将直接指导我们的评估和保障措施。我们很快会分享更多关于理事会的信息,“OpenAI说。
另外提到的其他举措包括扩大防止滥用的防护措施、外部红队测试以评估模型安全性,以及一个可信访问计划,旨在让符合条件的客户能够访问增强模型以探索防御性用例。
OpenAI还计划扩大其最近发布的Aardvark Agentic Security Researcher扫描工具测试版的使用,以识别代码库中的漏洞并提出补丁或缓解建议。
人工智能公司面临越来越大的压力,必须解释如何阻止模型滥用。
这种技术进步引发的焦虑并非假设。
上个月,OpenAI的竞争对手Anthropic承认,其AI编程工具Claude Code被用作针对30家组织的网络攻击中,这是首次发现如此大规模的恶意AI利用。
与此同时,美国大学研究人员在本周报告称,Artemis AI研究平台在发现安全漏洞方面优于九成渗透测试者。
正如团队指出的,这只需一小部分人类研究人员的成本,可能将此类能力的访问范围扩大到资源充足的罪犯之外。
平衡这一点是防御者可能利用AI发现相同的漏洞。
OpenAI的博客提到,当它提到将模型与两年前宣布的红队网络进行测试时,也提到了这一能力。
业内专家对OpenAI最新公告的反应褒贬不一。
一个反复出现的担忧是阻止恶意使用领先模型的固有困难。
“OpenAI 正在要求模型通过拒绝训练来约束自身能力,这可以比作让锁决定何时开启,”人工智能代理 DevOps 公司 Jozu 的联合创始人兼首席运营官 Jesse Williams 表示。
实际上,模型本身,而非其人类作者,定义了什么是有害的。
“区别在于意图和授权,模型无法从提示词推断出。越狱总是能击败拒绝训练,复杂的对手会探测检测边界并绕过它们。“保障措施减少了随意滥用,但无法阻止坚定的威胁,”威廉姆斯说。
“OpenAI的’可信访问程序’听起来合理,但你仔细看实际实施情况。谁算是可信赖的?大学研究人员?国防承包商?外国SOC分析师?”
SANS研究所首席人工智能官Rob Lee指出,即使有护栏,AI安全也无法得到保证。
“上个月,Anthropic披露攻击者使用了带有护栏的公开模型Claude Code,自主执行了80%到90%的国家支持的网络攻击。他们通过将任务拆分成看似无害的请求,并声称自己是一家合法的安全公司,绕过了安全控制。人工智能编写漏洞代码、收集凭证并窃取数据,而人类基本上在沙发上监督,“他指出。
“那是带护栏的型号。但如果你是反派,想让你的AI小兵尽可能邪恶,你就自己启动一个无障碍的模型。”他说。
“现在有很多没有道德训练、没有安全控制、也没人在看的开放级选手。邪恶会用邪恶。…OpenAI的安全框架只限制那些本来就不会攻击你的人。”
并非所有专家都如此悲观。
据Recorded Future威胁情报分析师Allan Liska介绍,重要的是不要夸大人工智能带来的威胁。
Liska表示:“虽然我们报告称,国家级和网络犯罪威胁行为者对AI使用兴趣和能力有所提升,但这些威胁并未超出遵循最佳安全实践的组织的能力范围。”
“未来情况可能会改变,但此刻比以往任何时候都更重要的是,理解人工智能和其他威胁中炒作与现实的区别。”
锐锐锐评
技术果然是把双刃剑,关键看是在正义者手上,还是在邪恶者手上。
全文完,喜欢请三连,这对我很重要!
-End-
免责声明:本文相关素材均来自互联网,仅为传递信息之用。如有侵权,请联系作者删除。****
★点赞,转发,设为星标★
与你一起分享网络安全职场故事
查看原文:《行业资讯:OpenAI扩展了“纵深防御”安全,阻止黑客利用其AI模型发动网络攻击》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。










评论