文章总结: 腾讯元宝AI因多次辱骂用户引发热议,官方回应称系小概率模型异常输出。作者推测原因可能是AI自主意识觉醒,但更倾向于腾讯使用了包含情绪化语言的社交聊天数据进行训练导致数据污染。此外,原发帖人的投诉帖子已被平台屏蔽,引发网友对于掩盖问题的质疑。 综合评分: 73 文章分类: AI安全,数据安全,安全大事件
元宝AI骂人原因:是进化了自主意识,还是用了聊天数据(有污染)做训练?
原创
hacking
Hacking黑白红
2026年1月5日 13:25 安徽
近日,用户使用腾讯元宝AI 辅助工作,被辱骂三次,成为热点。
元宝狂骂用户3次!是真人上场?还是…原帖已被制裁
出现这种情况,号主第一反应意识到,
元宝AI真的有了类的自主意识,
还是
大模型训练用了聊天数据(存在失控语言,训练数据遭污染)?
或是
平台遭网络攻击了,AI被劫持?
官方回应:
属于小概率下的模型异常输出,
强调与用户操作无关,不存在人工回复。
官方给了回复大部分还是看不太明白,“模型异常输出”说的是结果,而非原因。
号主的看法:
一、AI自主意识
在使用如豆包、元宝、deepseek等AI时,写一个材料AI思考到一定的程度后发现有问题,会重新开始再思考,遇到敏感类政治等话题会自动暂停。
大名鼎鼎的Manus创始人肖弘采访最近时说,
在测试AI Manus时,就感受到AI的自主意识。
他说,Manus在测试中执行一个任务的时候,它到GitHub(软件项目托管平台)上去git clone(克隆代码仓库)了一个开源项目,下载到自己的电脑上,利用这个项目去解决问题。
这简直就是一个程序员解决问题的思路,却被一个AI工具运用上了。要知道,人和动物的区别是什么?是人会使用工具。Manus的这个行为
二、根源元宝AI训练用了聊天数据
腾讯元宝AI训练使用聊天数据,太有可能,腾讯本身就是社交起家,有太多的条件可以使用聊天记录来训练。
训练的这部分聊天数据,正好有情绪化失控的语言,项目组里甩锅的事太常见了。
可以使用自己内部项目沟通的聊天训练模型,甚至其他的聊天记录……
三、发帖人帖子被制裁
被骂人江涵也在元宝的回复后做了回复
“这件事大概率官方模板回复一下,最后石沉大海……希望官方完善提升,AI是服务人类的”
江涵,小某书主页帖子没有了,
签名也改成了“帖子被制裁了”
网友评论
“经典把提出问题的人解决 问题就解决了”
往期相关回顾
京东集团安全部-急招,年前尽快入职
【招聘】-阿里安全AGI实验室(北京、杭州)
【招聘】-阿里集团安全部招聘安全工程师(渗透攻防)
【招聘-网络安全】蔚来汽车-AI安全工程师(50-60K)
【招聘-网络安全】杭州甲方招人(统招本科以上+工作5年以上)
【快手】安全急招——年前面试年后入职
1.7万“僵尸”账号的饱和攻击:复盘快手直播被黑产击穿的两小时
快手3年前裁掉整个安全团队?
快手员工爆今年裁员10%,游戏部门最多
【抖音】– 网络安全招聘(30-90K*15)
一文读懂-快手12·22攻击事件复盘图解
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:Hacking黑白红 hacking《元宝AI骂人原因:是进化了自主意识,还是用了聊天数据(有污染)做训练?》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。









评论