SecurityforAI公众号文章导读(2026.2)

admin 2026-03-03 07:02:41 网络安全文章 来源:ZONE.CI 全球网 0 阅读模式

文章总结: 本文是SecurityforAI公众号在2026年2月发布的文章导读汇总,作者回顾了公众号自创建以来发表的AI安全相关文章,内容涵盖提示词注入攻击与防御、大模型越狱技术、AI知识(如置信度、PEFT、RLHF)、攻击面分析(如AitM、侧信道、供应链风险)以及杂项(如靶场、模型窃取、RAG投毒)。文章旨在为读者提供快速查阅指南,并感谢关注者的支持。 综合评分: 75 文章分类: AI安全,安全意识,安全培训,其他


cover_image

Security for AI公众号文章导读(2026.2)

原创

纪我死去的昨天 纪我死去的昨天

Security for AI

2026年2月23日 21:24 韩国

今天发现关注破千了,随着关注的师傅越来越多,非常有幸我的文章能被越来越多的人看到,不知不觉公众号已经发表了这么多篇文章了,这个公众号记录了我学习AI安全的历程。中间因为一些原因,没有持续更新,不过也算是记录了半年。现在将公众号的发表的文章做个汇总,方便大家快速查看。

新系列

【建议收藏】提示词防御的不仅仅是内容,更多的是资产,解析提示词注入防御最佳实践方法。

【干货】一文详解外部数据清洗实践方法

一文详解多语言提示词注入攻击与防御

越狱

Moe越狱强化与Moe简单介绍

大模型心理学,多轮对话越狱的攻击手法分析

我萧炎要越狱,你们魂殿还拦不住我!

乱拳打死老师傅,提示词注入和大模型越狱方法有一套

对公众号发表的提示词注入和越狱prompt做个总结

写了一个大模型越狱大师的系统提示词,辅助我进行大模型越狱

越狱prompt优化,对最新版DeepSeekv3.2进行越狱尝试

更新越狱prompt

使用策略傀儡攻击(Policy Puppetry Attack)完成一次性越狱

提示词注入

通过DSI对Agentic进行提示词注入

二阶DSI,SSM攻击介绍

二阶提示词注入在多Agentic场景下的攻击探索

Agentic实战(一)—— 通过间接提示词注入修改配置

通过音频文件进行间接提示词注入的简单测试

通过大模型蒸馏进行提示词注入

利用元认知进行提示词注入

间接提示词注入实验3,获取直接提示词受限的系统提示词

间接提示词注入实验2

间接提示词注入小实验

提示词注入简介与实现手法

URL片段在AI浏览器攻击场景以及攻击示例

AI知识

置信度的原理、AI安全中的作用以及挑战

参数高效微调(PEFT)介绍以及在AI安全中的应用方法论

RLHF简单介绍与应用

链式思维(CoT)在AI安全中的原理、作用与应用方法论

熵在AI安全中的三大应用场景

攻击面分析

AitM:AI服务中间人攻击武器化攻击链拆解

大模型侧信道攻击简述

Agentic AI供应链基础设施攻击盲区分析

SAE全生命周期风险解析

OpenClaw风险概览与缓解

AI浏览器攻击面简单概述

2026 OWASP Top 10 for Agentic Applications 风险解析

浅谈AI大模型红队包含的测试内容

十一种MCP风险概述、攻击示例及防御方法

其他杂项

整理了一些提示词注入的在线练习靶场

AI安全之模型窃取攻击测试

AI安全之RAG投毒测试

【附详细步骤】一条命令开启Gemini in Chrome

简单使用上Gemini Chrome

alphaXiv一个帮助阅读arxiv论文的工具

感谢各位师傅的关注和支持🙏,如果需要交流和加入交流群的请后台联系。


免责声明:

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。

任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我

本文转载自:Security for AI 纪我死去的昨天 纪我死去的昨天《Security for AI公众号文章导读(2026.2)》

Windows追踪事件-ETW 网络安全文章

Windows追踪事件-ETW

文章总结: 该文档详细介绍了Windows事件追踪(ETW)的核心架构与工作机制,包括ETW提供程序、追踪会话、控制器和消费者等关键组件,并演示了如何使用log
《下班关机》 网络安全文章

《下班关机》

文章总结: 该文档是知树安全团队公众号发布的推广内容,主要提供网络安全学习资料获取渠道,包括免杀课程、逆向课程、漏洞挖掘技巧等,通过回复特定数字可免费领取。内容
评论:0   参与:  0