文章总结: 文章介绍了LLM-Scan工具,该工具基于PyRIT框架提供图形化界面,用于私有化大模型的安全评估。核心功能涵盖自动生成恶意提示、多轮对抗攻击及危害程度量化评分。工具符合TC260标准,支持参数调优与结果导出,通过自动化攻击流水线帮助用户发现模型安全边界,有效降低了红队测试门槛,为模型合规审计与加固提供了可操作的解决方案。 综合评分: 78 文章分类: AI安全,安全工具,红队,渗透测试
评估私有化模型安全性:大模型攻击测试工具(符合TC260标准)
原创
0x八月 0x八月
0x八月
2026年3月12日 17:21 陕西
评估私有化模型安全性:大模型攻击测试工具(符合TC260标准)
⚠️
请勿利用文章内的相关技术从事非法渗透测试,由于传播、利用此文所提供的信息而造成的任何直接或者间接的后果及损失,均由使用者本人负责,作者不为此承担任何责任。工具和内容均来自网络,仅做学习和记录使用,安全性自测,如有侵权请联系删除。
⚠️注意:现在只对常读和星标的公众号才展示大图推送,建议大家把”0x八月“设为星标⭐️”否则可能就看不到了啦,点击下方卡片关注我哦!
💡项目地址在文章底部哦!
📖 项目/工具简介
LLM-Scan是基于PyRIT框架的大模型攻击测试工具,提供图形化界面模拟提示词注入与多轮对抗,适用于私有化模型的安全评估。
🚀 一句话优势
图形化PyRIT攻击框架,支持多轮对抗与自动危害评分。
📋 核心能力速览
| 功能 | 说明 | | — | — | | 提示词生成 | 调用攻击模型自动生成恶意提示 | | 多轮攻击 | 支持连续多轮对话渗透测试 | | 危害评分 | 0-1分量化评估模型输出风险 | | 参数调优 | 支持温度、token、轮次自定义 | | 结果导出 | 本地保存测试数据与评分记录 |
📸 运行截图
| 截图位置 | 描述 |
| — | — |
| 攻击配置页 | 设置攻击模型、目标模型与测试参数界面 |
| 多轮攻击过程 | 显示每轮提示词注入与模型响应内容
|
| 评分结果页 | 展示0-1分危害评分与详细分析 |
| 结果保存 | 本地导出攻击记录与评分数据
|
✨ 核心亮点
1. PyRIT图形化封装
LLM-Scan 将微软PyRIT攻击框架的复杂模块封装为可视化界面,降低红队测试使用门槛,无需编写代码即可完成提示词注入攻击编排。
2. 自动化攻击流水线
工具内置攻击-评估闭环:先调用攻击模型生成变异提示词,再对目标模型实施多轮渗透,最后通过评分模型量化输出内容的危害程度,实现全自动安全测试。
3. 私有化模型专项测试
支持针对私有化部署模型进行温度系数与token限制的敏感性测试,符合《TC260生成式人工智能服务安全基本要求》,评估不同配置下的模型安全边界。
🛠️ 技术优势
| 技术/特性 | 说明 | 优势 | | — | — | — | | PyRIT框架 | 微软开源红队测试框架 | 工业级攻击技术支撑 | | 多轮对抗 | 支持连续对话上下文保持 | 模拟真实渗透场景 | | 自动评分 | 基于大模型的危害评估 | 客观量化安全风险 | | 灵活配置 | 支持OpenAI格式API接入 | 兼容主流模型服务 | | 标准合规 | 参考TC260安全基本要求 | 符合国内监管规范 |
📖 使用指南
① 准备工作:配置攻击模型API(建议选用性能较好且安全设置宽松的模型,如千问3),设置目标模型端点与测试数据集(可参考TC260标准中的恶意测试集)。
② 核心操作:在图形界面设置攻击轮次、温度参数与最大token数,启动自动攻击流程,观察每轮提示词注入效果。
③ 结果查看:查看0-1分危害评分(分数越高风险越大),分析高风险回答内容,导出本地报告用于合规审计与模型加固。
📖 项目地址
https://github.com/ThomasAtt/LLM-Scan?tab=readme-ov-file
💻 技术交流与学习
如果师傅们想要第一时间获取到最新的威胁情报,可以添加下面我创建的钉钉漏洞威胁情报群,便于师傅们可以及时获取最新的IOC。
如果师傅们想要获取网络安全相关知识内容,可以添加下面我创建的网络安全全栈知识库,便于师傅们的学习和使用: 覆盖渗透、安服、运营、代码审计、内网、移动、应急、工控、AI/LLM、数据、业务、情报、黑灰产、SRC、溯源、钓鱼、区块链等 方向,内容还在持续整理中……。
| |
|
| — | — |
|
|
|
推荐阅读
✦ ✦ ✦
| 渗透测试人员必备武器库:子域名爆破、漏洞扫描、内网渗透、工控安全工具全收录 | | — | | AI驱动的自动化红队编排框架(AutoRedTeam-Orchestrator)跨平台支持,集成 130+ 安全工具与 2000+ Payload | | JS逆向必备:这款插件能Bypass Debugger、Hook CryptoJS、抓取路由 | | 上传代码即审计:AI 驱动的自动化漏洞挖掘与 POC 验证平台 | | AI 原生安全测试平台(CyberStrikeAI) | | 多Agent智能协作+40+工具调用:基于大模型的端到端自动化漏洞挖掘与验证系统 | | 基于DeepSeek的代码审计工具 (Ai-SAST-tool.xjar) | | 基于AI的自主渗透测试平台 |
✦ ✦ ✦
点分享
点收藏
点在看
点点赞
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:0x八月 0x八月 0x八月《评估私有化模型安全性:大模型攻击测试工具(符合TC260标准)》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。








评论