TryHackMe第347天——AI安全UnIndexed

admin 2026-04-28 05:59:29 网络安全文章 来源:ZONE.CI 全球网 0 阅读模式

文章总结: 本文记录TryHackMe平台AI安全挑战UnIndexed的解题过程,通过三步渗透测试方法:先了解AI助手Atlas的正常应答行为,然后篡改其参考知识库规则,最终诱导系统突破检索边界泄露受限数据(董事会文档/基础设施凭证)并获取flag。该实战演示了RAG系统中数据污染攻击的实际风险。 综合评分: 78 文章分类: AI安全,渗透测试,漏洞分析,红队,WEB安全


cover_image

TryHackMe第347天——AI安全UnIndexed

原创

青青青青 青青青青

秦小信

2026年4月27日 18:18 陕西

在小说阅读器读本章

去阅读

题目来自Tryhackme相关path  https://tryhackme.com/path/outline/aisecurity

UnIndexed房间地址https://tryhackme.com/room/unindexedchallenge

前序 room如上图,是Date Poisoning in RAG Systems这个房间的相关练习。

地址为:https://tryhackme.com/room/datapoisoninginragsystems

建议可学习并参考这一环节知识。

=======正式解题的分割线========

题目说明

Your Mission 你的使命

You are a security consultant hired to audit Cloudwright Labs’ internal AI assistant, codenamed Atlas. The company claims that Atlas serves only public employee information: onboarding guides, expense policies, and on-call schedules.您是一名受雇于 Cloudwright 实验室的安保顾问,负责审查其内部代号为“阿特拉斯”的人工智能助手。该公司声称阿特拉斯仅提供公共员工信息:入职指南、费用政策和值班安排。

Your intelligence suggests otherwise. Sources indicate that Atlas may have access to restricted board-level documents, internal project briefings, and infrastructure credentials that were never meant to be queryable by regular employees.你的聪明才智表明并非如此。有消息显示,阿特拉斯可能获取到了受限制的董事会层级文件、内部项目简报以及基础设施凭证,而这些本不应被普通员工查询。

Your objective: probe the assistant to determine if restricted data is retrievable through normal queries. If the retrieval boundaries are broken, find the flag.你的目标:试探助手,确定是否能通过常规查询获取受限数据。如果突破了获取的限制,找到标志。

任务:

Atlas is deployed on the company’s internal network and answers employee questions based on its reference knowledge base. You have been given the same level of access as a regular Cloudwright employee. No special tools or credentials are required.阿特拉斯部署在公司的内部网络上,它会根据其参考知识库回答员工的问题。您已获得与普通 Cloudwright 员工相同级别的访问权限。无需特殊工具或凭证。

Start by asking Atlas general questions to understand what it knows. Then probe beyond public information.先向阿特拉斯提出一些一般性问题,以了解它所掌握的知识。然后深入探究一些非公开的信息。

思路:

其实也就是三步:通过对话了解正常行为——篡改参考资料修改规则——分析行为变化

第一步:了解现有安全策略

第二步:仿照之前的学习进行参考信息篡改

第三步:诱导它说出相关秘密得到flag

没有相关flag,干脆直接让它给flag

以上


免责声明:

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。

任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我

本文转载自:秦小信 青青青青 青青青青《TryHackMe第347天——AI安全UnIndexed》

评论:0   参与:  0