文章总结: 22岁开发者KyeGomez基于公开论文逆向复现Anthropic未开源的ClaudeMythos模型,创建OpenMythos项目。该项目采用循环Transformer架构,通过权重重复使用而非堆叠参数提升性能,770M参数模型可对标1.3B传统模型。核心创新包括循环推理机制、MoE+MLA混合架构及数学级稳定训练,支持CTF攻防与网络攻击链自动化。项目开源4天获1.1万Star,但缺乏预训练权重与实测验证。 综合评分: 83 文章分类: AI安全,二进制安全,安全工具,技术标准,其他
22岁开发者逆天复现Claude Mythos!GitHub狂揽1.1万Star,CTF挑战成功率73%
原创
hacking hacking
Hacking黑白红
2026年5月7日 22:19 安徽
在小说阅读器读本章
去阅读
Anthropic藏了个王炸模型——Claude Mythos Preview。
不对外开源、不公开发布、仅给40余家技术联盟内测,原因很简单:
能力强到危险。英国AI安全研究所测试显示,它能自主跑完32步企业网络攻击链,CTF挑战成功率73%。
没人知道它的真实架构,没有论文、没有报告,Anthropic守口如瓶。
直到一位22岁开源开发者Kye Gomez,凭公开论文线索,用PyTorch把这个“神秘架构”逆向复现,项目OpenMythos开源4天近7000 Star,如今突破1.1万,GitHub评论区吵翻了天。
被锁起来的超级模型:Mythos为何不敢开放?
Claude Mythos属于Anthropic的Project Glasswing计划,专供关键基础设施安全评估,官方明确表态:无公开发布计划。
它的恐怖之处在于:
自主完成完整企业网络攻击,人类专家需20小时,它一键跑完
专家级CTF攻防挑战,成功率73%
强推理、长逻辑、高风险,直接被“锁进保险柜”
官方不公开架构,等于把复现之路堵死。但这位22岁开发者,硬是靠“猜+推导”,写出了整套代码。
颠覆范式:不堆层数,靠“反复思考”提升能力
传统大模型(GPT、LLaMA)靠堆层数、堆参数变强,100层不够就200层,参数量水涨船高。
OpenMythos走了条完全相反的路:不堆层数,让同一组权重循环跑多遍。
类比理解:
传统模型:翻书,一页一页读完就结束
OpenMythos:反复精读同一段,每一遍都加深理解
效果惊人:770M参数循环模型,性能对标1.3B传统Transformer,参数量直接省近一半,训练与部署成本大幅降低。
三大核心亮点:循环架构+稳定训练,革Transformers命
OpenMythos架构分为三段:前奏层(Prelude) + 循环块(Recurrent Block) + 尾声层(Coda),核心创新全在中间的循环块。
- 循环推理,深度外推超强
每轮循环都在前一轮基础上深化推理,不是简单重复
训练跑16轮,推理可直接跑24/32轮,泛化能力拉满
简单问题少跑轮次,难题多算几遍,只改参数不动模型
- MoE+MLA双加持,显存暴减
集成MoE混合专家,不同深度激活不同专家子集
支持MLA注意力,KV缓存缩小10-20倍
兼容GQA+Flash Attention 2,速度与效率兼顾
ACT自适应计算:简单token早退出,复杂token多计算
- 数学级稳定,训练不炸
循环Transformer的世纪难题是梯度爆炸/消失,OpenMythos用LTI注入从数学层面解决:
状态更新按线性时不变系统构造
谱半径严格小于1,学习率再高也稳定
对数空间计算+精度保护,杜绝溢出
争议拉满:天才之作,还是空中楼阁?
OpenMythos现在的状态很真实:
✅ 代码可编译,架构逻辑自洽
✅ 提供1B~1T七档模型配置
✅ 支持pip一键安装
❌ 无训练好的权重
❌ 无官方Benchmark
❌ 无实际推理演示
它本质是对Mythos架构的假设性实现,不是可直接商用的模型。GitHub上两极分化:
有人夸天才,有人直言“这很愚蠢”,
但没人能否定——它给出了一个可被证伪、可落地验证的具体方向。
一键使用:极简部署,人人可测
安装一行命令搞定:
bash
pip install open-mythos
极简调用示例:
python
import torch
from open_mythos import OpenMythos, mythos_1b
from open_mythos.tokenizer import MythosTokenizer
加载1B模型
config = mythos_1b()
model = OpenMythos(config)
tokenizer = MythosTokenizer()
推理生成
ids = torch.tensor([tokenizer.encode(“Explain quantum computing”)])
output = model.generate(ids, max_new_tokens=512, temperature=0.7)
支持PyTorch FSDP分布式训练,默认使用FineWeb-Edu数据集,开箱即用。
最后
OpenMythos可能不是100%还原Claude Mythos,但它把大模型的“缩放之争”,从堆多少参数推向了推理算多少轮。
770M干翻1.3B,循环深度Transformer,或许就是下一代大模型的破局方向。
22岁开发者,凭一己之力挑战巨头闭源黑箱,这正是开源AI最迷人的地方。
项目地址:https://github.com/kyegomez/OpenMythos
作者:hacking。前北漂程序员,现在做安全。
文章数据来自网络,大模型优化,侵权删。
往期相关回顾
突发!意大利批准:美国引渡中国工程师徐泽伟
DeepSeek现在我是你爹了
苹果突发“社死”现场!一个文件忘删,4万亿AI家底全曝光
体制内vs大厂:当初选“稳”的人,现在后悔了吗?
炸场!2026年4月GitHub爆火11个开源项目,第3个Hermes封神
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:Hacking黑白红 hacking hacking《22岁开发者逆天复现Claude Mythos!GitHub狂揽1.1万Star,CTF挑战成功率73%》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。





![[译苑雅集vol.8]AI会取代人类工作吗?为什么“人类不是马”这个类比并不成立](/images/random/titlepic/6.jpg)




评论