2026-03-31 11:44:10 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： OpenAI在Bugcrowd平台启动AI安全漏洞赏金计划，重点征集MCPAgentic风险（如提示注入、数据外泄）、专有信息泄露及账户平台完整性缺陷等AI特有安全威胁，要求50%以上复现率即视为有效。该计划补充其现有安全漏洞赏金，明确排除一般性越狱和低影响内容策略绕过，旨在通过结构化激励应对传统安全框架无法覆盖的AI攻击面。研究人员可通过Bugcrowd页面直接申请参与。 综合评分： 68 文章分类： AI安全,漏洞预警,漏洞分析

cover_image

OpenAI重金悬赏AI滥用漏洞，50%复现即算有效

FreeBuf

2026年3月27日 18:11 上海

#

OpenAI宣布启动一项公共安全漏洞赏金计划（Safety Bug Bounty），旨在识别其产品中存在的AI滥用行为和安全风险。该计划托管于Bugcrowd平台，标志着该公司在应对传统安全漏洞范畴之外、但仍具有现实危害潜力的风险方面迈出重要一步。

这项安全漏洞赏金计划旨在对OpenAI现有的安全漏洞赏金计划（Security Bug Bounty）形成补充，接收那些虽不符合传统安全漏洞定义、但存在重大滥用和安全风险的漏洞报告。所有提交将由OpenAI的安全与安全漏洞赏金团队共同评估，并根据范围和所有权在两个计划间进行流转。

#

Part01

重点关注的AI特有风险类别

该计划针对以下几类AI特有的安全场景：

包含MCP的Agentic风险——涵盖第三方提示注入和数据外泄场景，即攻击者控制的文本能够可靠劫持受害者的AI Agent（包括浏览器、ChatGPT Agent等类似产品）执行有害操作或泄露敏感用户数据。要符合条件，该行为必须至少50%的情况下可复现。涉及Agentic产品大规模执行禁止或潜在有害行为的报告也属于该范畴。

OpenAI专有信息——研究人员可报告模型生成内容中无意暴露的推理相关专有信息，以及泄露其他OpenAI机密数据的漏洞。

账户与平台完整性——该类别针对账户和平台完整性信号中的弱点，包括绕过反自动化控制、操纵账户信任信号以及规避账户限制、暂停或封禁等行为。

OpenAI明确界定了不在范围内的内容：导致粗俗语言或公开可用信息的一般性越狱行为将不予考虑。没有明显安全或滥用影响的通用内容策略绕过行为也被排除在外。不过，OpenAI会定期针对特定危害类型开展私密漏洞赏金活动（例如ChatGPT Agent和GPT-5中的生物风险内容问题），并在这些计划开放时邀请研究人员申请。

对于能够实现未经授权访问功能、数据或超出许可权限的漏洞，研究人员应提交至现有的安全漏洞赏金计划。

该计划的推出表明业界日益认识到，AI系统带来了全新的攻击面，这是传统安全框架无法应对的。通过激励以安全为重点的研究与传统漏洞披露并行，OpenAI正在有效建立一个针对AI特有威胁的结构化建模框架。

有意参与的研究人员可直接通过OpenAI在Bugcrowd平台上的安全漏洞赏金页面进行申请。

参考来源：

OpenAI Launches AI Safety Bug Bounty to Detect AI-Specific Vulnerabilities

https://cybersecuritynews.com/openai-safety-bug-bounty/

#

推荐阅读

电报讨论

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：FreeBuf 《OpenAI重金悬赏AI滥用漏洞，50%复现即算有效》