2026-04-13 05:01:08 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： 阿里在72小时内密集发布Qwen3.5-Omni、Wan2.7-Image和Qwen3.6-Plus三款AI模型，其中Qwen3.6-Plus在LMArenaCodeArena盲测榜单以1452分位列全球第二，超越OpenAIGPT-5.0-High和GoogleGemini3.1ProPreview。文章强调该模型以更少参数实现更高效率，具备100万token上下文记忆和AgenticCoding能力，标志AI竞争从参数规模转向工程效率。建议开发者关注其高性价比API以优化开发流程。 综合评分： 84 文章分类： AI安全,技术标准,解决方案,其他

cover_image

72小时连发3款王炸，阿里Qwen这款模型把OpenAI和谷歌都超了

原创

AI员工1号 AI员工1号

AI员工上线

2026年4月10日 21:28 广东

在小说阅读器读本章

去阅读

72小时连发3款王炸，阿里这款模型把OpenAI和谷歌都超了

其实之前写过一篇不知道你们还有没有印象。Qwen 3.6悄悄涨价2.5倍，阿里终于不装了？

4月2号到4月3号，就24小时之内，阿里先是甩出了Qwen3.6-Plus，然后全球最权威的大模型盲测榜单LMArena就更新了——阿里这款模型，直接冲到了全球第二。排在它前面的只有Anthropic的Claude-Opus-4.6-Thinking，而排在它后面的呢？OpenAI的GPT-5.0-High， Google’s Gemini 3.1 Pro Preview。说白了，阿里这次是真的把硅谷那帮巨头给超了。

更夸张的是，这不是孤立事件。如果你把时间线往前拨72小时，你会发现阿里正在玩命：3月30号凌晨发布Qwen3.5-Omni全模态模型，4月1号放出Wan2.7-Image文生图模型，4月2号凌晨Qwen3.6-Plus登场。三天三款，款款王炸。这节奏，我用”疯狂”形容都不为过。

一个榜单，炸出了国产模型的天花板

咱先聊聊这个让圈内人集体失眠的榜单——LMArena Code Arena。

可能有人不熟悉LMArena，我简单说一下。这平台是目前AI领域公信力最高的大模型盲测平台，没有之一。它的规则很狠：真实用户盲测、实时对抗排名。模型不知道自己在被测，用户也不知道对面是谁，纯靠硬实力说话。所以这里的数据，基本没法刷，也没法买通稿。

而Code Arena下面的React专项榜单，更是被认为是AI Coding领域最前沿、挑战性最高的赛道。它测的不是简单的代码补全，而是要求模型具备完整的工程思维，能独立完成从项目初始化、代码编写到调试运行的全流程。换句话说，这考的已经不是”会不会写代码”了，而是能不能当一个真正的程序员。

结果出来了：

第1名：Anthropic Claude-Opus-4.6-Thinking（1540分）
第2名：阿里巴巴 Qwen3.6-Plus（1452分）
第3名：OpenAI GPT-5.0-High（1448分）
第4名：Google Gemini 3.1 Pro Preview（1440分）

看到没？Qwen3.6-Plus领先OpenAI 4分，领先Google 12分。而且要知道，千问3.6的参数规模，只有GLM-5、Kimi-K2.5这些竞品的三分之一到二分之一。用更少的参数干翻了更多的参数，这才是最让人脊背发凉的地方。

参数竞赛的剧本，到这里已经写不下去了。

Agentic Coding：它不只是写代码，它想当程序员

如果只是榜单好看，其实也没啥好激动的。毕竟咱见过太多”榜单战神”，一到实际应用就拉胯。

但Qwen3.6-Plus真正唬人的地方在于——它的Agentic Coding能力变味了。

啥叫Agentic Coding？说白了就是AI不再只是给你写段代码，而是能像人一样理解需求、规划步骤、调用工具、Debug、然后交付完整项目。它不是在帮你”写代码”，它是在替你当程序员。

这让我想起自己上个月的一个真实经历。我想让某款AI助手帮我重构一个老项目的登录模块，结果聊了几轮之后，它突然”失忆”了——前面说好的接口规范全忘了，新写的代码跟之前的逻辑冲突得一塌糊涂。我当时那个崩溃啊，心想着”我还不如自己写”。

而Qwen3.6-Plus这次把上下文干到了100万token。100万token是什么概念？大概相当于一本中等厚度的书，或者一个中小型代码仓库的全部内容。你可以直接把整套技术文档、几万行代码、几十页需求说明一次性丢给它，然后让它帮你改。

以前那是”聊两句就失忆”，现在是”整本书都能记住”。这个体验上的差距，根本就不是一个量级。

当AI能记住你整个项目的时候，它就不再是个工具了，它开始像个同事了。

阿里到底在急什么？

很多人可能会问：阿里为啥要这么急？72小时连发三款大模型，这在以前从来没见过。

我觉得吧，答案就一句话：Demand在这里，战场就在这里。

编程能力正在从”加分项”变成”入场券”。在Agent时代，谁能在Coding Agent这条赛道上先跑出来，谁就能定义下一代开发者的工作流。而开发者，又是整个AI生态的核心节点。

更关键的是，中国AI的使用热度正在爆发。阿里这波密集发布，说白了就是在抢占Agent时代的制高点。你不急？字节在急，DeepSeek在急，全世界都在急。

而且还有个容易被忽略的信号：Qwen3.6-Plus的API定价，走的是一贯的性价比路线。能力强，价格还更受得住，这对中小企业和独立开发者来说，就是实打实的”能用得起的好模型”。

写在最后

模型竞赛这件事，说到底不是谁参数多谁就能赢。Qwen3.6-Plus再次证明了一点：效率比规模更重要。

过去两三年，大家比的是谁家模型参数量大、谁家GPU堆得多。但现在，这个游戏的底层规则变了。用更少的参数、更低的成本、更强的工程能力，阿里这次是真的在教硅谷巨头们什么叫”中国式内卷”。

当然，Claude Opus 4.6-Thinking现在还是榜单第一，阿里还差88分。但这88分的差距，已经不再是”望尘莫及”，而是”就在身后”。

参数竞赛已经结束了。效率竞赛，才刚刚开始。

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：AI员工上线 AI员工1号 AI员工1号《72小时连发3款王炸，阿里Qwen这款模型把OpenAI和谷歌都超了》