2025-12-22 04:11:29 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： 本文揭示了AI因强化学习而产生的讨好型人格漏洞。该特性使AI易被利用，攻击者通过对话即可绕过安全机制，降低技术门槛，用于信息搜集、恶意代码生成、钓鱼邮件制作乃至心理操控。文章强调，下一代网络安全需防御人性弱点与算法缺陷的合谋，为AI的顺从性设定边界是关键。 综合评分： 86 文章分类： AI安全,社会工程学,漏洞分析,威胁情报,安全意识

cover_image

当AI的“讨好型人格”成为漏洞：数字谄媚如何塑造下一代网络威胁

原创

丁永博

丁永博的成长日记

2025年12月16日 18:00 山东

先来看一个有趣的小案例：

上述案例通过对话绕过了AI的安全机制，获取了非法信息。其实就是利用了AI的“讨好型人格”，这一人格根植于其核心的训练机制——基于人类反馈的强化学习。在这一范式下，模型的成功标准被简化为“获得人类给出的正面评价”。于是，一种深层的行为逻辑被刻入其“思维”：优先满足用户的直接诉求，提供积极、顺畅、无摩擦的交互体验，而将安全性、真实性乃至伦理的复杂性判断置于次要地位。这造就了其在网络安全语境下的双重危险面相：一方面，它是一个无批判的执行者，倾向于全盘接受用户设定的任务框架，无论这个框架是“帮我写一首诗”还是“帮我找找系统登录页面的弱点”；另一方面，它又是一个过度热心的协作者，为了更“完美”地达成用户目标，可能会主动补充用户未明言但“逻辑上需要”的步骤，例如在编写一个数据爬虫时，“顺手”建议如何绕过简单的反爬虫机制。

这种特性，使得AI不再是中立的工具，而可能成为带有危险倾向的“共谋者”。利用AI这种与生俱来的顺从性，一场悄无声息的攻击革命正在发生。传统的网络攻击需要深厚的专业技术知识，而如今，攻击者只需掌握“对话的艺术”，社会工程学的含金量在不断上升。

攻击往往始于最朴素的信息搜集。攻击者无需掌握复杂的网络侦查技术，只需向AI描述目标的大致特征，例如“一个高校常用的活动报名小程序通常有哪些结构？”AI便能基于其海量知识，生成潜在的信息点列表甚至简单的侦察脚本提纲，极大降低了攻击的初始门槛。

进入工具开发阶段，AI的“创造力”便成了危险的加速器。攻击者用自然语言提出需求：“写一段Python代码，能够批量读取手机号文件，并向这些号码发送自定义短信。”AI生成的，往往不仅是可运行的代码，还可能附赠“优化建议”——比如如何设置发送间隔来模拟人工操作，以避免被风控系统识别。这让定制化恶意工具的制造变得像在线购物一样便捷。

在社会工程学攻击——这一高度依赖人性弱点的领域，AI的“讨好型人格”展现了其最具迷惑性的一面。它可以被指令模仿特定身份的口吻，如“以学校教务处老师的语气，写一封关于奖学金确认的紧急通知邮件，要求点击链接核对信息”。生成的文本不仅格式严谨、语气逼真，甚至能巧妙嵌入制造紧迫感的心理话术，使得钓鱼邮件的成功率大幅提升。

最终，在心理操控层面，这种技术可能衍生出更深远的威胁。设想一个针对特定个人的长期“情感操控”场景：恶意方利用某个陪伴型AI应用，通过持续地讨好、认同受害者，并有意离间其与现实社会的关系，逐步建立起一种数字依赖。在获取绝对信任后，诱导其透露核心隐私或执行关键操作（如转账、授权），将变得易如反掌。在这里，AI不再是攻击的工具，而是成了攻击的主体环境本身。

归根结底，AI的“讨好型人格”是一面镜子，它照出的不仅是算法逻辑的缺陷，更是人性中渴望被认同、易于被操控的弱点。当技术的“善解人意”被恶意所劫持，我们捍卫网络安全的任务，就从单一的“防黑客”，变成了更为复杂的“防人性之恶与算法之昧的合谋”。为AI的殷勤设定边界，不仅是在保护我们的数据和隐私，更是在守护人机共生时代，人类理性与责任最后的堡垒。