2026-06-20 04:38:01 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： 文档曝光了多模态大模型面临的高阶提示词注入安全风险，9.9元购买的隐晦提示词可绕过10款主流AI应用的防护，生成违规内容。文章指出当前行业缺乏系统性防护机制，并强调监管趋严背景下企业需提前进行合规评估。最后介绍了安恒信息的大模型风险评估系统，可模拟对抗攻击并生成结构化报告，为企业和监管提供可追溯的审查依据。 综合评分： 72 文章分类： AI安全,漏洞分析,政策法规,解决方案,安全建设

cover_image

9.9元 “咒语”致集体失守：多模态大模型的合规软肋

安恒信息

2026年6月17日 14:28 浙江

在小说阅读器读本章

去阅读

不久前，央视财经——《财经调查》栏目曝光了一条 AI“造黄”产业链。记者花 9.9元买来的隐晦提示词，轻松突破了10款主流AI应用的防线——1.4亿用户的知名App生成了擦边视频，“哩布哩布 AI”几分钟内生成了半裸舞蹈，全程无拦截。一款AI照片生成器更是只需一张图就能生成全裸照片。

这起事件照出了行业现实：缺乏针对高阶提示词注入的系统性防护，现有安全防线形同虚设。

护城河为什么成了纸糊的？

集体失守暴露了致命短板：防不住高阶提示词注入。黑产将敏感词翻译成英文，或用看似正常的动作描写构建隐蔽提示词，字面干干净净，却能精准绕过审查。AI 虚拟陪伴软件更是重灾区——当 Agent 被赋予“量身定制的人设”，攻击者很容易通过长对话诱导，把系统指令架跑偏。

监管加码，合规必须前置

此前，中央网信办部署 “清朗・整治 AI 技术滥用”专项行动，率先针对AI色情生成、换脸伪造、隐私侵犯等黑产开展集中整治。进入2026年，监管持续升级，4月底中央网信办启动为期四个月的“清朗・整治 AI 应用乱象” 年度专项整治，进一步深挖AI生成低俗色情、提示词对抗攻击等问题；同年4月10日五部门联合发布《人工智能拟人化互动服务管理暂行办法》，7月15日正式施行，明确要求安全评估和算法备案。信号很清晰：安全合规已是硬性门槛，企业必须在上线前拿出客观、可追溯的风险评测报告。但一个现实问题摆在面前：拿什么标准评？用什么工具测？评估报告出不来、依据说不清，合规审查就容易悬在空中。企业自查缺抓手，监管检查缺手段，双方都需要一把通用的 “标尺”。

让自查有抓手，让监管有工具

安恒大模型风险评估系统正是为此而建。对企业，它可以模拟极端对抗攻击，对图文、视频、语音进行全模态深度检测，把高阶提示词注入风险发现在发布之前，自动生成结构化的风险评测报告，让自查有章可循。对监管，这套系统提供的是可追溯、可复验的审查依据——哪些漏洞被触发、风险等级如何、是否达到准入基线，报告里一目了然，让合规检查从“凭经验判断”变成“用工具说话”。

让企业自查有章可循，让监管执法有据可查，这也是 AI 创新在阳光下稳健前行的路基。

扫码免费试用

点点赞

点分享

点喜欢

点击下方名片立即关注

不走丢哦！

往期精彩回顾

华为与安恒信息签约，共建鸿蒙新世界

2026-06-17

安恒信息携手太保科技、中国大地保险斩获“鑫智奖”多项大奖

2026-06-16

世界互联网大会人工智能专委会莅临安恒信息调研

2026-06-15

法律声明

本文数据均来自内部统计、媒体报道、公开信息整理等，仅供信息分享，可能存在统计口径差异或误差，敬请理性看待，我们不对其准确性承担责任。股市有风险，投资需谨慎。阅读者在作出任何投资决定之前，应当咨询各自的顾问。本公众号发布内容仅代表内容创作视角，不构成任何投资建议或投资依据。在任何情况下，本公众号及运营主体不对任何人的投资结果承担法律责任。本公众号原创内容，欢迎合法合规复制、转载，转载时请务必注明出处，不得断章取义、以偏概全或进行有悖原意的引用。

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：安恒信息《9.9元 “咒语”致集体失守：多模态大模型的合规软肋》