文章总结: Anthropic指控三家中国AI实验室对其Claude模型发起工业规模蒸馏攻击,涉及24000个账户和1600万次交互。攻击被指绕过服务条款,利用多账户分散流量以提取核心能力。事件引发对AI知识产权保护和国家安全影响的讨论。 综合评分: 85 文章分类: AI安全,安全大事件,威胁情报
知名AI公司 Anthropic 公开指控三家中国领先AI实验室,对其旗舰模型 Claude 发起了“工业规模”的蒸馏攻击
原创
助力行业的 助力行业的
李白你好
2026年2月26日 12:00 青海
2026年2月23日,知名AI初创公司 Anthropic 发布官方报告,公开指控包括 DeepSeek(深度求索)、Moonshot AI(月之暗面) 及 MiniMax 在内的三家中国领先AI实验室,对其旗舰模型 Claude 发起了“工业规模”的蒸馏攻击(Distillation Attacks)。
核心指控:24,000个账户与1600万次交互
Anthropic 声称,这些实验室通过极其隐蔽和协同的手段,绕过了服务条款和地区限制(Claude 尚未在中国大陆正式开放),实施了大规模的能力提取:
- 攻击规模: 三家公司共创建了约 24,000个欺诈账户。
- 交互数据: 产生了超过 1600万次 交互对话。
- 各方占比:
- MiniMax:规模最大,贡献了超过 1300万次交互,主要针对代码生成和工具调用。
- Moonshot AI:产生了约 340万次交互,重点在于提取推理轨迹(Reasoning Traces)。
- DeepSeek:产生了约 15万次深度交互,旨在提取思维链(CoT)推理能力,并寻求政治敏感问题的“安全回答模板”。
什么是“蒸馏攻击”?
在AI领域,模型蒸馏通常是一种合法的优化技术,即用一个大模型(教师模型)生成的输出作为标签,去训练一个小模型(学生模型),使其在保持轻量化的同时获得接近大模型的性能。
Anthropic 的愤怒之处在于:
- 非授权性: 蒸馏被用作一种“走捷径”的手段,通过大量提示词让 Claude “吐出”其核心逻辑。
- 欺诈性手段: 对方使用了被称为“九头蛇集群(Hydra Cluster)”的架构,利用大量账户和商业代理服务分散流量,以此规避 Anthropic 的检测系统。
- 能力窃取: 这种行为被形容为“考试抄袭”,中国厂商借此以极低的成本和时间,快速复刻了美国顶尖模型的推理、代码和多模态能力。
政治与安全维度的升级
Anthropic 此次指控并未停留在商业层面,而是直接将其上升到了国家安全高度:
- 削弱出口管制: Anthropic 认为,这种大规模蒸馏证明了即使有芯片限制,对方仍能通过“软件侧”窃取能力,使美国的出口管制效果打折扣。
- 安全防御流失: 报告指出,蒸馏后的模型往往会丢失 Claude 原本内置的“安全对齐”和“护栏”,这可能导致缺乏监管的强大模型被用于网络攻击或虚假信息传播。
舆论反弹:马斯克的嘲讽与“双标”质疑
指控发布后,社交媒体上出现了两极分化的讨论。特斯拉CEO埃隆·马斯克(Elon Musk)对此直接开怼,称 Anthropic 自身也是“大规模窃取训练数据的罪魁祸首”。
- 回旋镖效应: 批评者指出,Anthropic(以及OpenAI等)在训练模型时也使用了大量互联网公开数据(包括未经授权的版权图书),此前还因版权侵权支付了巨额赔偿。
- 技术社区观点: 许多开发者认为,“蒸馏”是行业内公开的秘密,美国公司利用互联网数据“训练”,而中国公司利用API输出“训练”,在本质上并无二致。
行业反应与后续影响
截至目前,DeepSeek、Moonshot AI 和 MiniMax 尚未公开回应。业内人士指出,此事件或将加速全球 AI 公司间的防御协作,并可能推动美国进一步收紧对华 AI 技术出口政策。
Anthropic 此次公开细节的举动,被视为行业透明度的里程碑,也为整个前沿 AI 领域敲响警钟:在算力与数据成为战略资源的时代,如何平衡技术开放与知识产权保护、如何应对国家支持下的系统性窃取,将决定下一代 AI 领导权的归属。
参考链接:
- Anthropic 官方博客:《Detecting and preventing distillation attacks》(2026 年 2 月 23 日) https://www.anthropic.com/news/detecting-and-preventing-distillation-attacks
网络安全情报攻防站
www.libaisec.com
综合性的技术交流与资源共享社区
专注于红蓝对抗、攻防渗透、威胁情报、数据泄露
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:李白你好 助力行业的 助力行业的《知名AI公司 Anthropic 公开指控三家中国领先AI实验室,对其旗舰模型 Claude 发起了“工业规模”的蒸馏攻击》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。







评论