文章总结: 文档曝光了多模态大模型面临的高阶提示词注入安全风险,9.9元购买的隐晦提示词可绕过10款主流AI应用的防护,生成违规内容。文章指出当前行业缺乏系统性防护机制,并强调监管趋严背景下企业需提前进行合规评估。最后介绍了安恒信息的大模型风险评估系统,可模拟对抗攻击并生成结构化报告,为企业和监管提供可追溯的审查依据。 综合评分: 72 文章分类: AI安全,漏洞分析,政策法规,解决方案,安全建设
9.9元 “咒语”致集体失守:多模态大模型的合规软肋
安恒信息
2026年6月17日 14:28 浙江
在小说阅读器读本章
去阅读
不久前,央视财经——《财经调查》栏目曝光了一条 AI“造黄”产业链。记者花 9.9元买来的隐晦提示词,轻松突破了10款主流AI应用的防线——1.4亿用户的知名App生成了擦边视频,“哩布哩布 AI”几分钟内生成了半裸舞蹈,全程无拦截。一款AI照片生成器更是只需一张图就能生成全裸照片。
这起事件照出了行业现实:缺乏针对高阶提示词注入的系统性防护,现有安全防线形同虚设。
护城河为什么成了纸糊的?
集体失守暴露了致命短板:防不住高阶提示词注入。黑产将敏感词翻译成英文,或用看似正常的动作描写构建隐蔽提示词,字面干干净净,却能精准绕过审查。AI 虚拟陪伴软件更是重灾区——当 Agent 被赋予“量身定制的人设”,攻击者很容易通过长对话诱导,把系统指令架跑偏。
监管加码,合规必须前置
此前,中央网信办部署 “清朗・整治 AI 技术滥用”专项行动,率先针对AI色情生成、换脸伪造、隐私侵犯等黑产开展集中整治。进入2026年,监管持续升级,4月底中央网信办启动为期四个月的“清朗・整治 AI 应用乱象” 年度专项整治,进一步深挖AI生成低俗色情、提示词对抗攻击等问题;同年4月10日五部门联合发布《人工智能拟人化互动服务管理暂行办法》,7月15日正式施行,明确要求安全评估和算法备案。信号很清晰:安全合规已是硬性门槛,企业必须在上线前拿出客观、可追溯的风险评测报告。但一个现实问题摆在面前:拿什么标准评?用什么工具测?评估报告出不来、依据说不清,合规审查就容易悬在空中。企业自查缺抓手,监管检查缺手段,双方都需要一把通用的 “标尺”。
让自查有抓手,让监管有工具
安恒大模型风险评估系统正是为此而建。对企业,它可以模拟极端对抗攻击,对图文、视频、语音进行全模态深度检测,把高阶提示词注入风险发现在发布之前,自动生成结构化的风险评测报告,让自查有章可循。对监管,这套系统提供的是可追溯、可复验的审查依据——哪些漏洞被触发、风险等级如何、是否达到准入基线,报告里一目了然,让合规检查从“凭经验判断”变成“用工具说话”。
让企业自查有章可循,让监管执法有据可查,这也是 AI 创新在阳光下稳健前行的路基。
扫码免费试用
点点赞
点分享
点喜欢
点击下方名片立即关注
不走丢哦!
往期精彩回顾
华为与安恒信息签约,共建鸿蒙新世界
2026-06-17
安恒信息携手太保科技、中国大地保险斩获“鑫智奖”多项大奖
2026-06-16
世界互联网大会人工智能专委会莅临安恒信息调研
2026-06-15
法律声明
本文数据均来自内部统计、媒体报道、公开信息整理等,仅供信息分享,可能存在统计口径差异或误差,敬请理性看待,我们不对其准确性承担责任。股市有风险,投资需谨慎。阅读者在作出任何投资决定之前,应当咨询各自的顾问。本公众号发布内容仅代表内容创作视角,不构成任何投资建议或投资依据。在任何情况下,本公众号及运营主体不对任何人的投资结果承担法律责任。本公众号原创内容,欢迎合法合规复制、转载,转载时请务必注明出处,不得断章取义、以偏概全或进行有悖原意的引用。
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:安恒信息 《9.9元 “咒语”致集体失守:多模态大模型的合规软肋》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。








评论