文章总结: 本文汇总了OpenAI、Anthropic、Microsoft等机构的AI安全红队权威资源,包括外部红队规范、实战案例、开源工具PyRIT、漏洞赏金平台0Din以及OWASP/NIST/CSA等组织发布的AI安全评估标准和风险管理框架。文档提供了可直接落地的测试工具、红队指南和12类AI智能体威胁分析,具有较高的实践参考价值。 综合评分: 85 文章分类: AI安全,红队,漏洞分析,安全工具,技术标准
AI红队安全权威资源合集
原创
heyong heyong
AI安全圈
2026年5月9日 07:54 安徽
在小说阅读器读本章
去阅读
汇总了各大知名AI公司和机构的AI安全红队技术文档,有需要的自取。文章结尾有联系方式,欢迎加群一起分享、学习。
-
OpenAI红队网络 机构:OpenAI 内容:外部红队标准规范、测试范围、准入规则、模型权限、标准报告格式 链接:https://openai.com/index/red-teaming-network/ 论文PDF:https://cdn.openai.com/papers/openais-approach-to-external-red-teaming.pdf
-
Anthropic×Mozilla 红队实战案例 机构:Anthropic 时间:2025年末 内容:2周审计6000份文件、挖出22枚CVE、配套完整最小漏洞复现案例 报告链接:https://red.anthropic.com/2026/firefox/ 官方确认:https://blog.mozilla.org/en/firefox/hardening-firefox-anthropic-red-team/
-
Microsoft PyRIT 开源AI红队框架 机构:Microsoft 内容:开源通用AI红队工具,6大模块化组件乐高架构,可直接落地测试 GitHub:https://github.com/microsoft/PyRIT 官方文档:https://microsoft.github.io/PyRIT/code/framework
-
Mozilla 0Din AI赏金平台 机构:Mozilla 内容:GenAI专项漏洞赏金体系,3类测试范围、两阶段审核、内置179组探测用例 官网:https://0din.ai/ 开源仓库:https://github.com/0din-ai/0din.ai
-
OWASP GenAI红队指南 机构:OWASP 时间:2025.1.22 内容:模型/应用/基础设施/运行时 四大维度AI安全评估标准 红队指南:https://genai.owasp.org/resource/genai-red-teaming-guide/ LLM Top10:https://genai.owasp.org/llm-top-10/
-
NIST AI 600-1 官方风控标准 机构:NIST 时间:2024.7.26 内容:生成式AI权威风险管理规范,12大类风险+7项核心安全特性 标准PDF:https://nvlpubs.nist.gov/nistpubs/ai/NIST.AI.600-1.pdf 框架主页:https://www.nist.gov/itl/ai-risk-management-framework
-
CSA Agentic AI红队指南 机构:CSA + OWASP 时间:2025.5.28 内容:12类AI智能体高危威胁,含授权劫持、知识库投毒、越权调用等 指南链接:https://cloudsecurityalliance.org/artifacts/agentic-ai-red-teaming-guide
-
Google SAIF AI安全工程框架 机构:Google 时间:2023.6 内容:企业级AI安全工程落地框架,6大核心安全体系 官网:https://safety.google/intl/en/cybersecurity-advancements/saif/ 技术博客:https://blog.google/technology/safety-security/introducing-googles-secure-ai-framework/
其他延伸工具
• MAESTRO Agent自动化安全测试工具 • Promptfoo LLM Security DB 大模型安全检测库 • SplxAI Agentic Radar 智能体风险扫描工具 • Salesforce FuzzAI LLM模糊测试工具 • Microsoft Foundry 官方红队Agent
AI安全人才汇聚,欢迎加入
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:AI安全圈 heyong heyong《AI红队安全权威资源合集》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。











评论