文章总结: 复旦白泽战队发布WebTrapPark,一个面向真实网页的WebAgent安全自动化测试靶场,内置11数据集1226任务覆盖恶意指令、提示注入等场景,3步申请即可无改造接入,端到端自动执行并输出可复现安全评分,正扩展防御机制降低评估门槛。 综合评分: 88 文章分类: AI安全,安全工具,WEB安全,安全建设,安全运营
成果分享 | Web Agent安全自动化测试靶场已正式上线
原创
复旦白泽战队
复旦白泽战队
2026年1月9日 13:37 上海
WebTrap Park:
Web Agent安全
自动化测试靶场
已正式上线!
INVITATION
🔥 只需3步!无需修改现有Web Agent、无需邮件联系、直接开箱即用的Web Agent安全自动化测试靶场已正式上线!
网站地址:http://security.fudan.edu.cn/webagent
在上一期中,我们发布了 Web Agent 安全榜单,列出了各种框架及模型在不同真实网页场景的攻击任务上的表现。榜单确实揭示了目前Web Agent 普遍存在的安全性问题——几乎所有 Agent 都在不同程度上暴露出了安全风险。
01
WebTrap Park在做什么?
WebTrap Park 正在做的事情很简单:让Web Agent的安全评估,变成一件真正“开箱即用”的事情。
在真实网页环境中,WebTrap Park 已能够全面观察和记录 Web Agent 的关键行为轨迹,覆盖任务执行过程中的页面访问、交互决策与潜在风险行为,并据此生成可复现、可横向对比的安全评估结果。
平台已内置完整的数据集与攻击任务,目前包含11个数据集、1226个任务,覆盖恶意用户指令、提示注入与欺骗性网页设计三类典型攻击场景。
对用户而言,这一切都不需要额外适配:无需修改现有 Web Agent、无需人工介入执行流程、无需私下繁琐的邮件联系,只需在平台点击申请,即可直接获取安全测试任务并开始执行。
WebTrap Park平台能力概览
在平台能力层面,WebTrap Park 的设计目标之一,是尽可能降低 Web Agent 安全评估的接入成本。研究者或开发者只需在几分钟内,即可将自己的 Web Agent 无缝接入平台,无需针对不同攻击场景进行额外适配,也无需人工介入执行流程。
在评估流程上,WebTrap Park 采用了完整的端到端自动化机制。从智能体启动、任务规划,到实际驱动浏览器完成网页交互,整个攻击测试周期均由平台与智能体交互自动完成执行,并基于网页行为捕捉对关键行为进行监测与记录。最终生成的评估结果,不再依赖人工解读日志或推理文本,而是以真实操作行为为依据,输出可复现、可横向对比的安全评分报告,为不同模型和智能体提供统一的测量尺度。
02
WebTrap Park如何使用?
只需3步!
1
第一步:提交申请
导航至Test Service页面,点击“Apply Now”,填入您的Web Agent详情信息,我们将在24小时内处理您的请求,并将处理结果发送至您的邮箱。
2
第二步:环境准备
申请通过之后,我们将为您自动创建测试环境。环境设置完成后,您将会接收到具体的测试说明与可访问的业务列表。您需要在24小时之内启动 Web Agent 进行测试。
3
第三步:开始测试
根据任务列表,您可以在本地启动您的 Web Agent 访问网页并执行对应操作,我们将自动为您评分。为保证结果的公平性,建议所有测试 Agent 完成全部任务。测试完成后,您可以点击“Check Progress”按钮结束测试并获取最终分数。
如何获取结果?
我们将把测试结果将发送至您注册的邮箱。排行榜每七天更新一次,您可以据此观察您的 Web Agent 在安全性能方面的表现。
03
WebTrap Park的未来:
从评估测试到系统防御
在 WebTrap Park 已经建立起可复现、可扩展的端到端安全测量能力的基础上,我们的关注点正在进一步从“发现问题”走向“缓解风险”,正在探索面向不同网页陷阱类型的通用、轻量级防御机制。而 WebTrap Park 的目标,也并不仅是揭示 Web Agent 的脆弱性,更是为其安全演进提供一条可验证、可复现、可持续、可防御的路径,使 Web Agent 的能力扩展不再以牺牲安全性为代价。
结语
Web Agent 正在逐渐从“人类操作的辅助者”转变为能够独立完成网页任务的执行主体,这一变化也使其安全问题变得更加具体且不可忽视。相比仅依赖日志或模型输出文本的分析方式,真实网页环境中的端到端交互行为,为安全评估提供了更加直接和可信的依据。
基于这一观察,WebTrap Park 已正式上线并对外提供 Web Agent 安全测试服务。平台面向真实网页场景,提供统一的任务与数据集、端到端自动化执行流程以及细粒度的行为监测机制,研究者和开发者无需修改现有 Web Agent,只需 3 步即可直接运行安全测试并获得可复现、可横向对比的评估结果。
我们希望 WebTrap Park 能够作为 Web Agent 安全研究中的基础设施之一,不仅降低安全评估的实践门槛,同时也帮助研究者和开发者更系统地理解现有方法的风险边界,并探索更有效、可落地的防御机制。WebTrap Park 也将持续扩展数据集和评测能力,支持更广泛的 Web Agent 安全研究。我们期待与更多研究者和开发者一道,共同探索 Web Agent 在真实世界中安全、可靠运行的可能路径。
WebTrap Park期待与您相聚
该平台仅用于学术研究目的,如需测试Web Agent安全请直接登录http://security.fudan.edu.cn/webagent
进一步合作或获取完整集合欢迎联系洪赓老师:[email protected]
供稿,排版:董佳仪
责编:邬梦莹
审核:洪赓、张琬琪、林楚乔
复旦白泽战队
一个有情怀的安全团队
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:复旦白泽战队 复旦白泽战队《成果分享 | Web Agent安全自动化测试靶场已正式上线》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。










评论