2026-06-09 04:32:14 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： 文档探讨开源邮件安全检测系统在企业中的应用前景，重点评估基于小模型的AI威胁检测方案。核心发现包括：采用轻量级模型可降低计算成本，但需与传统邮件网关互补使用；针对内部邮箱盗用问题，建议结合多因子认证、权限收敛和内容检测等多层防护策略。 综合评分： 75 文章分类： 应用安全,AI安全,解决方案,安全工具,安全运营

cover_image

开源邮件安全检测与内部邮箱盗用防护：小模型方案评估及群发拦截策略｜总第313周

原创

群秘群秘

君哥的体历

2026年6月8日 08:00 山东

在小说阅读器读本章

去阅读

0x1本周话题

话题一：各位老师，请教一下邮件安全在本公司或者单位商用产品买的多吗？大家对开源邮件安全检测系统接纳度高不高呢？

A1:禁用了，未授权不可以安装应用。

A2:如果有一款开源的基于AI的邮件威胁检测系统，支持MTA和旁路镜像，你觉得本公司会采用吗？

A3:llm是公有云的吧，如果安全要求那么高，能接受公有云么？

A4:不是大模型而是专有模型呢，CPU就能跑。

A5:理论上肯定可以，但公司不会采用，选型逻辑是一样的，不歧视开源。比如选型要防垃圾，防钓鱼，防木马，然后AI防垃圾效果胜出产品，没有沙箱没有情报没有信誉库，没有电子邮件签名检查，也可以给他缺什么补什么，对小公司可以为了省钱，对大公司可以为了自主可控，对中型公司投入的成本还不如买产品，把AI当补充而不是完全替代。

A6:cpu就能跑，说的可能是机器学习检测算法比如svm或者深度学习rnn这种？再轻量的模型也得需要gpu吧？除非int4/8。如果有一款开源产品所有能力都达到了，那没什么不可以的，只是我现在没看到。

A7:实际上从目前效果来说，只要参数不是特别大，对于目前的响应能做到300ms以内，当然这个看邮件量，如果对于时延有特别的要求那必定要有更多的投入，但是小模型在专有领域感觉并不需要更大的模型。

A8:不太了解具体项目，如果是开源项目可以发一下？我最近也在开发llm的邮件网关，可以交流一下。如果是作为一个补充，镜像后是完全可以接受的，不影响业务流程，旁路不在意就没所谓了。

A9:是我写的一个项目，Rust+React技术栈，目前已经在上线测试截断了。实际上我认为对于垃圾邮件这种完全是一个悖论，邮件网关我们公司也用的某行业知名产品，我个人认为垃圾邮件是一个伪命题，真正的企业邮件对于欺诈、钓鱼、木马病毒需要更多的检测能力。

商业产品我司引入了两家，我感觉排除了本身自身的沙箱之类得特点，威胁情报也有，对于检测以及拦截的思路还停留在上世纪水平。

A10:产品防垃圾理解不了语义，人工维护关键词工作量大还效果差，确实AI效果好只不过还有其它能力要求AI目前做不到所以我觉得是要串行补充，邮件网关顶在最前面减少进入AI识别的量。我们已经把AI检测串进去了，AI认为可疑的需要用户确认放行，AI认为是钓鱼的通知用户但不允许自己放误报还是有的。

A11:邮件数量撑的住？

A12:邮件的时效要求又不高，晚5分钟没事，当然实际不会增加这么多时延。

A13:是我写的一个项目，并不是llm引入，而是引入对于邮件的专有模型监测。模型来自于HuggingFace零样本模型

MoritzLaurer/mDeBERTa-v3-base-xnli-multilingual-nli-2mil7以及计划进行微调，技术栈是Rust+React，调用HuggingFace CPU模型，参数量很小但是可以在CPU服务器上跑，效果凑活。

写这个的目的是解决，为什么我们用了两款主流邮件安全网关还有那么多漏报真的难以接受，以及如果有真的攻击邮件发入邮件服务器了还不知道等场景。

所以想要一种区别于现有邮件安全网关的解决方案。目前已经在准备开源筹备了，所以想问问各位老师这个前景怎么样，是否值得开源。

A14:对方一个邮件发出，原本要对方DLP审，我方网关审，我方沙箱审，路上已经要几分钟了，加几分钟应该感知不到才对。

A15:可能我们确实没有一分钟数百封的场景，问题还很多。但是思路确实和传统商业邮件安全网关不太一样，也有一些比较hack的手段，就比如没有沙箱怎么做附件威胁检测等解决手段。所以想向各位老师深度调研一下痛点以及可行性，烦请各位老师不吝赐教。

A16:没沙箱怎么做，我们是让AI去调沙箱结果再分析。如果不判定附件，只判定邮件头和正文内容也是可行的，放在商业邮件网关后面就行。

A17:这个确实是一个痛点问题，当然我感觉还有更好的手段。目前手段是硬查，目前，就搞国外Vir***tal的无限试用版类似(其实蛮稳定)，当然是比较hack的手段，就是目前还没深度思考到怎么工程化解决威胁附件这一步，不过钓鱼、补贴、垃圾邮件（基于语义）效果很不错了，误报率也比较低，并且能够自识别ioc(类似于从接收到的历史邮件学习ioc指标)。

A18:有两个case可以讨论一下

HuggingFace零样本模型

MoritzLaurer/mDeBERTa-v3-base-xnli-multilingual-nli-2mil7

看了模型卡，这好像在复杂语言处理不太好，模型卡里中文XNLI 准确率大约 0.803，在 ANLI 测试上只有约 0.497，实际体验检测结果如何。
Hugging Face的 zero-shot pipeline 机制，计算复杂度随着候选标签多，线性增长放，这个真实场景中大概有多少标签，在 CPU 上做高并发邮件流量，真实生产环境感觉容易在吞吐、延迟和成本上有瓶颈，这个已经实际跑起来了吗。

A19:首先我觉得这里有一个常见的误区——不是模型越强、参数越多，放在邮件威胁检测这个场景里就一定好使。换句话说，在这个领域里卷大模型，并不能保证检测率就高。

我不看好这个方向。因为邮件威胁检测的核心目标是发现潜在异常、放大异常信号。这本质上是一个综合异常建模的问题——不是让 LLM帮你读一封邮件然后告诉你”这是钓鱼”，而是从十几个维度去观察、提取信号，然后用数学方法把这些信号融合起来。

说白了，这是一个数学模型的场景，不是大模型的场景。对于我们的开源方案来说，思路很明确：轻量、够用就行。我不依赖任何单一模型的能力好不好——甚至往后我想推的是经过微调的商业化版本。

Claude、OpenAI、DeepSeek、Kimi模型以后越来越强当然是好事，但成本也会越来越大。所以系统架构上已经做了外挂 API接口，想接什么模型就接什么模型，但核心检测能力不绑定在上面。

现实一点讲，在测试阶段就没有算力，长远来看也不会有多少生产算力专门投到邮件威胁检测这种事上——对于大多数企业来说这是边缘场景，不可能给你堆 GPU。这个时候如果你的方案强依赖某个大模型，瓶颈马上就暴露了，强依赖关键字也是，强依赖威胁情报也是，这也是目前商用产品的通病。

目前来看：

mDeBERTa-v3-base-xnli-multilingual-nli-2mil7轻度推理够用，误报率很高，误报率在20%左右，但是并不是模型的推理结果决定邮件是否威胁结果，甚至我还想往下换模型。CPU场景的话这台实验机器配置其实蛮低的，1s在10封左右，但是取决于邮件长度以及是否包含附件。

A20:如果是用小模型，提取特征，我觉得不会比商业产品做得更高效。

A21:思路是用小模型做传统机器学习的事？

A22:是在LLM层上构建了一个更大的模型层，这就是方向问题了我认为。我觉得是降低大模型用于钓鱼检测的成本的一个好选择，但与传统邮件网关不是替代关系。传统网关的域名识别，spf ，信誉，是垃圾邮件过滤的第一道墙，概率类判定与规则类判定应该是互补

A23:没错是这样的，LLM是另一个 SPF 信誉可以这么认为，但是也会有人觉得以后未来的发展一定就是AI取代人类。但是我比较悲观。

《程序员岗位暴增11%，华尔街研报击碎失业恐慌：你的饭碗比想象安全》

A24:1930年，经济学家凯恩斯曾做出一个著名的预测：因为生产率大幅提升，到21世纪初，人类每周只需要工作15个小时。但人类并没有把每周的工作时间缩减到15小时，因为人类的欲望是拥有无限弹性的。当生产率提升降低了商品成本后，人们并没有选择停止工作，而是把增加的财富用来追求更高质量的商品和从前根本想象不到的新型服务。历史重演罢了。

话题二：请教一下，如果企业内部邮箱被盗，如何防止被盗邮箱向内部大面积发送不良邮件或者钓鱼邮件呢？

A1:能屏蔽指定邮箱吧。有的银行会禁止普通员工发全员邮件(相关收件人只允许指定人发)，限制每封邮件收件人数量。

A2:目前有这几个想法，第一：不让被盗；多因子登录第二：1.邮件异常登录检测 2.员工邮件权限收敛 3.发送邮件内容检测（同类型邮件多发，钓鱼邮件识别等）进行告警，拦截。

A3:我们目前想的方案是全员群发做白名单，然后是把群发收件人超过50的往网关送检再出来，不过有一点就是用户体验不太好，而且要长期去维护白名单。

A4:不能默认都过网关吗？

A5:我觉得两件事要分开来看，你没被盗也可以造谣行长恋情什么的，这个有领导决策就做呗。给一个申请流程就完了，反正这么做挺常见的。

A6:邮件会很慢，是有这个潜在风险，邮件本来也不是实时性业务。被盗是被盗的事，不要以被盗为假设前提，那你防止被盗去，不要假设防不住而限制发邮件，那会被骂。没被盗，公司也要管控，就骂不到你这了。

A7:针对可发送范围分个级，全公司可以搞个白名单。事前事后都做肯定效果最好，邮件是一方面。一般情况终端被控，及时通讯也被控制了。

0x2 群友分享

【安全管理】

《OpenClaw全员应用：百度安全如何打造极致体验与防护？》

《企业微信正式开源CLI ，AI可调用7大能力》

《OpenClaw-Observability：基于 DuckDB 构建 OpenClaw 的全链路可观测体系》

【法规解读】

关于印发《网络安全标识管理办法》的通知

【行业思考】

《小龙虾为什么凉得这么快》

《Apifox 供应链投毒事件分析》

【安全资讯】

《暴跌的“网络安全板块”》

《AI+网络安全的四个领域》

《中央网信办、工业和信息化部、公安部关于开展2026年个人信息保护系列专项行动的公告》

《史上最强 Claude 发布：聪明到不敢开放，还会突破权限掩盖操作痕迹》

《LiteLLM 在 PyPI 上遭到入侵：追踪 2026 年 3 月 TeamPCP 供应链攻击活动》

《从4.8亿下载量的 LiteLLM投毒事件，看 AI 基础设施安全攻与防》

《9500万次下载的AI工具被投毒：你的核心密钥可能已经泄露｜教科书级别的供应链攻击》

《ClawHub漏洞可操纵排名，恶意skill登顶引发供应链攻击》

《当前Agent skill的风险水位到底有多高？我们该如何判断skill是否“恶意”？》

《Google提前至2029年部署抗量子加密，行业迁移压力加剧》

《借码行凶 | Claude Code 源码泄露引爆供应链投毒，窃密木马暗度陈仓》

《人工智能加持的新型钓鱼即服务平台EvilTokens》

《攻击已持续5个月！黑客利用PDF让Adobe Reader执行恶意操作》

《【CVE-2026-26123】微软身份认证器 DeepLink 漏洞》

《2026年网络与信息安全行业全景图》及产品名录正式发布！

《Claude Code源码「换壳」反杀，全网疯狂克隆！Anthropic封杀失败》

【金融业企业安全建设实践群】和【企业安全建设实践群】每周讨论的精华话题会同步在本公众号推送（每周）。根据话题整理的群周报完整版——每个话题甲方朋友们的展开讨论内容——每周会上传知识星球，方便大家查阅。****

往期群周报：

OpenClaw的风险隔离与管控应对，以及渗透测试的报备合规探讨｜总第312周

从终端沙箱到AI Agent：安全隔离的演进与安全角色的重塑｜总第311周

大模型业务隔离与公共WiFi安全合规挑战｜总第310周

如何进群？

如何下载群周报完整版？

请见下图：

‍

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：君哥的体历群秘群秘《开源邮件安全检测与内部邮箱盗用防护：小模型方案评估及群发拦截策略｜总第313周》