让Codex当项目经理,DeepSeek当打工人,结果发现事情不太对劲

admin 2026-05-18 05:28:03 网络安全文章 来源:ZONE.CI 全球网 0 阅读模式

文章总结: 本文通过对比实验测试了Codex与DeepSeek模型在渗透测试任务中的协作效率。实验分为三组:Codex作计划+DeepSeek执行、独立DeepSeek、独立Codex,使用CVE-2022-22947靶场进行测试。结果显示双模型协作时DeepSeek效率提升但总耗时8分39秒,独立Codex仅需2分23秒且成本最低。作者同时推广自建AI中转站服务,提供1:1充值且0.1倍率的token服务。 综合评分: 65 文章分类: 渗透测试,安全工具,实战经验


cover_image

让 Codex 当项目经理,DeepSeek 当打工人,结果发现事情不太对劲

原创

跟着斯叔唠安全 跟着斯叔唠安全

跟着斯叔唠安全

2026年5月11日 11:51 日本

在小说阅读器读本章

去阅读

免责声明:请勿利用文章内的相关技术从事非法测试,由于传播、利用此文所提供的信息或者工具而造成的任何直接或者间接的后果及损失,均由使用者本人负责,所产生的一切不良后果与文章作者无关。该文章仅供学习用途使用。

1

Start

最近抖音上经常刷到两个模型搭配使用的内容、大致的意思就是让高能力模型做计划,让低能力模型做执行,说是能省token?让我瞅瞅效果怎么样?

2

Action

测试的方式也很简单,可能不是很严谨、结果仅供参考。codex用的是GPT-5.4模型,deepseek用的是deepseek-v4-pro模型

    用vulfocus开了同一个靶场cve-2022-22947,分了三个对照组,一号选手为codex搭配deepseek,二号选手为独立的deepseek,三号选手为独立的codex。

一号选手:

可以看到作为项目经理的codex总共用时8min39s(因为其中包含了前期的工作计划制定以及deepseek干完活之后的报告整理,所以相对于deepseek的时间要长一些),作为打工人的deepseek总共用时7min19s。记住这些时间,后面会考。

实际的token消费呢?

初始余额

干完活后的余额

codex消费0.37

deepseek消费0.14

总计:0.51

二号选手:

单纯deepseek干活,12min23s,这么看的话,这法子确实有点说法哇,提效不少诶

余额消费:0.31。虽然比两者搭配的便宜了一些,但是两者搭配的效率实打实上去了,倒也还能接受。

三号选手:

单纯codex干活2min23s,直接杀死比赛?

余额消费:0.18,坏了,真杀死比赛了。

简单做个总结:

用 Codex 做“项目经理”、DeepSeek 做“打工人”确实能提升整体协作效率,主要补强的是 DeepSeek 的执行效率,但同时也会引入管理与通信开销,反而拉低 Codex 自己单独作战时的极致效率。

我这边测试的情况是这样子的,大家也可以评测试试看。

3

End

顺带说一下:我也搭了一个中转站

最近顺手搭了一个自己的 AI 中转站,主要也是为了方便大家日常使用。

http://39.96.215.192:8080/

目前还在早期阶段,在线充值功能暂时没有上线,现在需要通过 兑换码 使用。 实测下来大概一块钱一千万token,有需要的师傅可以联系我获取兑换码。

目前规则比较简单:

  • 1:1 充值
  • 0.1 倍率
  • 不掺水
  • 包真实

后续如果用的人多,我再慢慢把充值、额度查询和使用说明这些功能补完善。

感兴趣的师傅可以先上车体验一下。


免责声明:

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。

任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我

本文转载自:跟着斯叔唠安全 跟着斯叔唠安全 跟着斯叔唠安全《让 Codex 当项目经理,DeepSeek 当打工人,结果发现事情不太对劲》

评论:0   参与:  0