文章总结: 该文档是SecurityforAI公众号的文章导读,汇总了近期的AI安全文章。内容涵盖防御体系建设如提示词注入防御、数据清洗、Agent权限配置、风险预测、攻击手法分析如蒸馏攻击、记忆投毒以及蜜罐设置等杂项。作者分享了半年来的学习感悟,认为AI安全门槛较高需要全局视角,从模型输出理解原理并延伸至MCP或Agent场景的防御体系构建。 综合评分: 75 文章分类: AI安全,安全建设,漏洞分析,威胁情报
Security for AI公众号文章导读(2026.3.6)
原创
林寒 林寒
Security for AI
2026年3月6日 20:20 韩国
不知不觉日更文章到现在又多了将近十篇,现在再做一次整理。
上期整理链接
Security for AI公众号文章导读(2026.2)
防御体系建设
【建议收藏】提示词防御的不仅仅是内容,更多的是资产,解析提示词注入防御最佳实践方法。
【干货】一文详解外部数据清洗实践方法
一文详解多语言提示词注入攻击与防御
详解对话历史污染威胁与防御识别
防范提示词注入,深入讲解Agent权限配置
多Agent协同风险威胁建模解析
MCP安全之MCP防御体系建设
大模型推理轨迹安全攻防详解
风险预测
基于智能体的skills知识图谱—SkillNet代表的未来新型AI安全攻击风险预测
攻击手法分析
AI安全新威胁,蒸馏攻击的兴起与模型窃取的区别
ASI06:深入讲解Agent记忆投毒攻击
其他杂项
利用反向提示词注入设置蜜罐捕获AI渗透Agent
你的AI浏览器真的安全吗?十个AI浏览器测试样例用于快速测试
最后写点感想吧,不想看的可以无视,哈哈哈。关注我比较早的都知道,其实我学AI安全没多长时间,也才半年,从一个菜鸟到现在也算才略微入门。这个公众号算是记录我学到现在的历程,有幸通过公众号结识到一些志同道合的朋友,也算是我的一大幸事。
最近面试被提问到,你为什么要写这么一个公众号?我的想法很简单,其实我对AI安全有兴趣,我想学习这样一种新的技术,我向来是兴趣能驱动我学习,而我仅仅想把我自己学的东西记录下来,分享出来。
当我兴趣来了之后,我能忘记很多当下令我伤感的事,一直投入到这种状态之中。在去年学AI安全之前,我有过很长一段伤感的经历,所以ID一直叫做纪我死去的昨天,不过现在一切都过去了,哈哈哈。我很有幸我的文章能被很多人看到,而我只不过是记录自己学习的心得而已。
经过这段时间的学习,如果想深入AI自身安全,这方面门槛其实还是有点高。而且我现在学的也算是九牛一毛,我个人到现在的一点体会,AI自身安全学起来其实是需要一个全局化体系的,不仅仅是模型的那一段文字或者图片等等的输出,更要通过那段输出来理解模型为什么会这样输出。而它为什么每次输出的不一样,这些输出的东西如果放到更广泛的MCP或者Agent场景下又会有什么后果,又该怎么防御等等,需要全局的一个视角来看。
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:Security for AI 林寒 林寒《Security for AI公众号文章导读(2026.3.6)》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。










评论