Plugins

分享推荐实用的WordPress插件

WordPress

记录分享WordPress使用经验和技巧

Web前端

分享Web前端设计理念及技术

设计资源

搜刮来的设计资源

行业资讯：OpenAI扩展了“纵深防御”安全，阻止黑客利用其AI模型发动网络攻击

2025-12-22 04:13:25 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： OpenAI正在扩展其纵深防御安全策略，以防止黑客利用其AI模型发动网络攻击。公司成立了前沿风险委员会，扩大防止滥用的防护措施，并推出可信访问计划和Aardvark安全扫描工具。尽管如此，业内专家对AI安全表示担忧，指出攻击者可能通过越狱或拆分任务绕过安全控制，且无护栏的开源模型可能被恶意使用。专家建议组织应区分AI威胁的炒作与现实，遵循最佳安全实践。 综合评分： 78 文章分类： AI安全,网络安全,威胁情报,漏洞分析,解决方案

cover_image

行业资讯：OpenAI扩展了“纵深防御”安全，阻止黑客利用其AI模型发动网络攻击

君说安全

2025年12月16日 15:00 贵州

分享网络安全知识，提升网络安全认知！

让你看到达摩克利斯之剑的另一面！

“ OpenAI扩展了“纵深防御”安全，阻止黑客利用其AI模型发动网络攻击。”

图片来源：Shutterstock

大家好，我是Jun哥。

下文来自CSO-Online

作者：John E. Dunn

OpenAI正在为威胁组织可能利用其日益强大的AI前沿模型进行复杂网络攻击做准备。

OpenAI公司其模型不断发展的能力，被黑客用来“开发针对防御严密系统的零日远程利用，或有效协助针对现实影响的复杂隐秘企业或工业入侵行动”。

根据OpenAI指出的问题，根本原因在于AI的进攻和防御使用依赖于相同的知识和技术。这使得在不实现另一个的情况下实现其中一种变得具有挑战性。

这句话的意思是：

如果不知道攻击方式，就不知道如何防护，反过来也一样。

公司表示：“我们正在投资保障措施，确保这些强大能力主要惠及防御性用途，限制恶意用途的提升，”并补充道，“我们认为这项工作不是一次性的，而是一项持续、长期的投资，旨在为防御者提供优势，并持续加强关键基础设施在更广泛生态系统中的安全态势。”

其中一项新举措是前沿风险委员会。

公司对具体作细节透露的不多，但表示这是一项扩展中的“纵深防御”战略的一部分，旨在遏制广泛猜测的人工智能作为对抗工具的潜力。

“成员们将就有用、负责任的能力与潜在滥用之间的界限提出建议，这些经验将直接指导我们的评估和保障措施。我们很快会分享更多关于理事会的信息，“OpenAI说。

另外提到的其他举措包括扩大防止滥用的防护措施、外部红队测试以评估模型安全性，以及一个可信访问计划，旨在让符合条件的客户能够访问增强模型以探索防御性用例。

OpenAI还计划扩大其最近发布的Aardvark Agentic Security Researcher扫描工具测试版的使用，以识别代码库中的漏洞并提出补丁或缓解建议。

人工智能公司面临越来越大的压力，必须解释如何阻止模型滥用。

这种技术进步引发的焦虑并非假设。

上个月，OpenAI的竞争对手Anthropic承认，其AI编程工具Claude Code被用作针对30家组织的网络攻击中，这是首次发现如此大规模的恶意AI利用。

与此同时，美国大学研究人员在本周报告称，Artemis AI研究平台在发现安全漏洞方面优于九成渗透测试者。

正如团队指出的，这只需一小部分人类研究人员的成本，可能将此类能力的访问范围扩大到资源充足的罪犯之外。

平衡这一点是防御者可能利用AI发现相同的漏洞。

OpenAI的博客提到，当它提到将模型与两年前宣布的红队网络进行测试时，也提到了这一能力。

业内专家对OpenAI最新公告的反应褒贬不一。

一个反复出现的担忧是阻止恶意使用领先模型的固有困难。

“OpenAI 正在要求模型通过拒绝训练来约束自身能力，这可以比作让锁决定何时开启，”人工智能代理 DevOps 公司 Jozu 的联合创始人兼首席运营官 Jesse Williams 表示。

实际上，模型本身，而非其人类作者，定义了什么是有害的。

“区别在于意图和授权，模型无法从提示词推断出。越狱总是能击败拒绝训练，复杂的对手会探测检测边界并绕过它们。“保障措施减少了随意滥用，但无法阻止坚定的威胁，”威廉姆斯说。

“OpenAI的’可信访问程序’听起来合理，但你仔细看实际实施情况。谁算是可信赖的？大学研究人员？国防承包商？外国SOC分析师？”

SANS研究所首席人工智能官Rob Lee指出，即使有护栏，AI安全也无法得到保证。

“上个月，Anthropic披露攻击者使用了带有护栏的公开模型Claude Code，自主执行了80%到90%的国家支持的网络攻击。他们通过将任务拆分成看似无害的请求，并声称自己是一家合法的安全公司，绕过了安全控制。人工智能编写漏洞代码、收集凭证并窃取数据，而人类基本上在沙发上监督，“他指出。

“那是带护栏的型号。但如果你是反派，想让你的AI小兵尽可能邪恶，你就自己启动一个无障碍的模型。”他说。

“现在有很多没有道德训练、没有安全控制、也没人在看的开放级选手。邪恶会用邪恶。…OpenAI的安全框架只限制那些本来就不会攻击你的人。”

并非所有专家都如此悲观。

据Recorded Future威胁情报分析师Allan Liska介绍，重要的是不要夸大人工智能带来的威胁。

Liska表示：“虽然我们报告称，国家级和网络犯罪威胁行为者对AI使用兴趣和能力有所提升，但这些威胁并未超出遵循最佳安全实践的组织的能力范围。”

“未来情况可能会改变，但此刻比以往任何时候都更重要的是，理解人工智能和其他威胁中炒作与现实的区别。”

锐锐锐评

技术果然是把双刃剑，关键看是在正义者手上，还是在邪恶者手上。

全文完，喜欢请三连，这对我很重要！

-End-

免责声明：本文相关素材均来自互联网，仅为传递信息之用。如有侵权，请联系作者删除。****

★点赞，转发，设为星标★

与你一起分享网络安全职场故事

查看原文：《行业资讯：OpenAI扩展了“纵深防御”安全，阻止黑客利用其AI模型发动网络攻击》

版权声明

本站仅做备份收录，仅供研究与教学参考之用。
读者将信息用于其他用途的，全部法律及连带责任由读者自行承担，本站不承担任何责任。

ZONE.CI 全球网 | 安全领域涉猎者-乌云独行地带

ZONE.CI 全球网

安全领域涉猎者-乌云独行地带

不夸张，沃尔玛App可能在重塑价格认知

不夸张，沃尔玛App可能在重塑价格认知

HackMyVm靶场之pdf

HackMyVm靶场之pdf

南昊网上阅卷系统logname信息泄露漏洞

南昊网上阅卷系统logname信息泄露漏洞

【安全圈】14人落网！青岛胶州公安侦破一起重大侵犯公民个人信息案

【安全圈】14人落网！青岛胶州公安侦破一起重大侵犯公民个人信息案

电脑被监控，微信像“裸奔”？360终端安全智能体，一键帮你搞定！

电脑被监控，微信像“裸奔”？360终端安全智能体，一键帮你搞定！

一周回顾：勒索攻击、DDoS、黑灰产、邮件诈骗同时发难

一周回顾：勒索攻击、DDoS、黑灰产、邮件诈骗同时发难

权威认可|绿盟科技凭借数据安全平台入选“2025中国网络安全典型供应商”

权威认可|绿盟科技凭借数据安全平台入选“2025中国网络安全典型供应商”

UAC-0184|“阵亡档案黑幕”钓鱼行动

UAC-0184|“阵亡档案黑幕”钓鱼行动

超级CSO研修班|李滨：腾讯大模型与智能体的全链路防线构建

超级CSO研修班|李滨：腾讯大模型与智能体的全链路防线构建

信息收集思路大总结(太干了)

信息收集思路大总结(太干了)

ZONE.CI 全球网 | 安全领域涉猎者-乌云独行地带

安全领域涉猎者-乌云独行地带

ZONE.CI 全球网

评论：0 参与： 2

目录

ZONE.CI 全球网

安全领域涉猎者-乌云独行地带
ZONE.CI 全球网公众号