我对流量安全风险感知的思考和实践

admin 2025-12-22 04:40:25 网络安全文章 来源:ZONE.CI 全球网 0 阅读模式

文章总结: 文章提出流量安全风险感知的统一框架,以机器流量为切入点识别非人性与超人性特征,以流量可信为目标需满足一致性校验和历史基线假设,结合大模型作为加速器通过Agent融合多维度数据进行行为分析,建议建立全链路数据采集体系并实施流量注意力机制。 综合评分: 88 文章分类: 网络安全,安全建设,数据安全,AI安全,应用安全


cover_image

我对流量安全风险感知的思考和实践

原创

404 Not F0und

404 Not F0und

2025年12月14日 12:01 浙江

现实与理想的差距

回顾过去几年的流量安全实践,从网络安全威胁感知、到数据泄漏与业务滥用威胁感知、再到如今探索资金安全风险感知。正向的价值点是逐步深入到业务中去解决业务里层的安全问题,和现实妥协的点是case by case的烟囱式解决问题。因为流量里的安全问题太复杂,只好拆分分别解决其中当下的痛点问题,也即是确定性的问题。好处自然是投入和产出成正比例线性关系,符合人性的贪心算法,努力就有收获。但这同时也是一剂慢性毒药,容易让人停留在浅层的原地踏步中,却仿佛感觉一直在成长。

正如物理学家分别发现引力、电磁力、强相互作用力和弱相互作用力等四大作用力,然后前仆后继去一统其中2种、3种甚至是4种作用力,事物发展的理想趋势,可能是逐步建立大一统理论去解释所有现象,因为世界如此精密,必然有底层规律。

我理想中的流量安全风险感知应该是一统网络安全、数据安全、业务安全、资金安全、内容安全等。这和“安全没有银弹”并不矛盾,反而很契合。没有银弹是指在复杂的软件系统中,没有单一的技术方法或工具可以一劳永逸的解决所有安全问题。要做到理想的点,根据能量守恒定律,必然意味着解决方案的复杂度和难度成几何上升。但我想这也是我对流量安全的终极目标。

理想的答案

统一流量安全几大安全问题的“模型”,现阶段我找到的答案分别是机器流量、流量可信与大模型。这三者之间的关系,机器流量是切入点,无论是网络安全、数据安全还是业务安全都会涉及到机器流量,而机器流量也是其中能造成大规模危害的重要手段。但流量不止有机器流量,非机器流量也可能造成严重影响,因此才有了第二点的流量可信。流量可信是目标,是流量最终的安全形态,只要不是业务系统预期内的行为,都是异常行为,异常中会涉及业务安全、资金安全、内容安全等子风险类型。而大模型是加速器,每一个工作流的每一个节点,都可以用大模型来替代甚至做的更好。所以理论上来说,机器流量是部分统一了流量安全几大风险类型的“标准模型”,流量可信是“万物理论”,万物都可可信,而大模型技术是流量安全界的“杨-米尔斯理论”,提供了最强大的统一支持工具。每一块内容我们都做了比较多的实践,限于篇幅,主要讲下我个人觉得相对关键的点。

“标准模型”:机器流量

我们的思路是实际风险水位->抽样预估实际风险水位(以召回率为目标的用户无感策略+用户有感策略)->定目标和评价指标->感知->研判(以准确率为目标的用户无感策略+用户有感策略)->防控。其中抽样评估水位方面,我们做了比较多的工作,终态目标是像钓鱼佬钓鱼先打窝一样,我们期望所有的机器流量和设备都落在我们的无感策略圈定的范围当中。

无论是水位评估还是感知研判,核心点是图灵测试,即如果一台机器的表现和行为让人无法区分它是机器还是人类,那么我们就可以认为这台机器具有了智能。更何况是在如今的大模型时代,在很多情况下,大模型比人表现的更好。

除了使用传统的基于机器设备惯用的rook、hook等底层风险、无障碍服务之外,我们的核心思路是寻找“非人性”与“超人性”的痕迹。因为机器的本质是算法和数据,因此它的表现会同时存在低于人类的缺陷(非人性)和高于人类的能力(超人性)。

就像判断一篇文章是否是人写的,看文章中有没有错别字,如果有就是人类写的,如果没有就是大模型写的,这即是“高于人类的能力”。再比如问一个问题,3.1415926后面的第1000位是什么数字,大模型会秒答且正确,而绝大多数人类却不知道。这即是“反图灵测试”

但是对于反图灵测试,必然存在绕过的问题,因为对于低于人类能力的机器,很难伪装成人类,但是对于高于人类能力的机器,是可以向下兼容伪装成人类的,至于伪装的有多像,这个问题就落入持续的动态攻防对抗层面了。

“万物理论”:流量可信

流量可信解决问题的理想范畴和程度大于机器流量,根据事物发展的客观规律,流量可信远比机器流量的复杂度和难度要高。

以往的工作方式是一种方法解决一种风险,流量可信期望用一种解法解决多种风险,那么这个“一种解法”的复杂度和成本自然更高,而且投入应该集中在开始的打地基阶段,短期内效果可能不会太明显。具体的挑战有2点,一是建模复杂度急剧上升,数量级从对个位数到万位数的恶意用户,切换到对日活千万用户甚至是亿级用户建模,而且每个用户都是一个独立的个体,每时每刻都有自己的思想和不同的行为。二是运营复杂度急剧上升,上线可信策略必然会产出大量的异常告警,对异常的定性,光靠人工运营肯定不可持续。

对于第一点,理论上来说,对于一个预期复杂度较高的问题和解决方案来说,可以按照某个维度进行拆分成子问题,从而降低复杂度,比如按照应用系统维度拆分。实际上要去拟合上千万的人,必然也需要依赖大量的维度的数据。降低问题复杂度一靠拆分,二靠高成熟度的假设或先验知识作为输入,思路是找到预期内不变的点。

流量可信要拆成哪些子部分,需要有哪些先验知识或高成熟度的假设?

我们首先参考信息安全领域较为成熟的应用可信(RASP),核心点包括网络访问行为、系统命令执行、文件访问行为、反序列化行为等几个关键维度的可信。同时也跨领域参考风控领域思路,发现风控在可信方面的实践可以追溯到很多年前,其中包括(账户,设备)的可信关系、(设备,环境,主动方账户,卡号,被动方维度)的可信数据资产、依据端上行为数据做盗用、欺诈、虚假交易等可信实践。说句题外话,为什么参考风控领域的做法,一是因为风控和信息安全的目标一致,都是控制风险,二是对比信息安全领域,由于风控和钱直接相关,对资损的强烈厌恶,可能推动解决方案对于风险控制理解的更深刻,实践走的更远。

流量可信基座:关键要素和原则

回到流量安全领域,要得到流量可信的关键组成部分,首先回归底层问题,一条流量是如何产生的?从头到尾经过了哪些环节?

物理世界用户点击某个APP产生的一条普通流量,背后其实是世界-用户-设备-APP多个复杂系统之间交互的系统性工程。首先用户处在一个现实的物理环境中,使用一台物理设备,物理设备同时处在现实物理环境和虚拟网络环境中,物理设备上安装有很多APP,其中有某个APP,当用户(大多数用手)产生物理动作点击界面的那一刻,会产生一些流量。在整个过程中,围绕原始的数据,还产生很多安全衍生类数据,例如终端安全分析产生设备风险数据等。越拆分,拆分的越细,越能得到大量的维度,因此全链路涉及到数据类型也是个复杂工程:端设备侧的网络环境和物理环境数据、端设备风险标签、端设备上APP风险标签、端上交互式手势动作数据、端上埋点行为日志、服务端流量行为日志以及安全类衍生数据(RDS/蓝鉴/WAF/WAD)、风控事件行为日志(riskinsight平台)、业务系统上下游访问日志(linkd云图)等等。而流量可信的完整组成部分也即是这所有的数据要素。

大模型认为一条流量被认为是可信的,需满足以下全方位的可信条件:

  1. 来源身份真实、设备可信、网络环境安全;
  2. 行为模式符合历史基线和业务逻辑;
  3. 请求内容合法、参数无异常、响应无泄露;
  4. 上下文状态一致、时间窗口合理;
  5. 未命中任何威胁情报或规则引擎中的高风险特征;
  6. 动态评分高于设定的可信阈值。

我们认为一条流量是否可信,需要满足2个假设:一是要满足一致性校验 = 设备/账号/环境/行为 等要素逻辑自洽,任一矛盾即异常。例如从逻辑上来说,物理环境和网络环境逻辑要对应,前端点击动作和后端流量行为相互对应,如果只有后端行为而全然没有前端行为,则不符合逻辑预期。二是要满足 历史基线(和自己比) + 业务场景(和预期业务场景比) + 同类用户聚类(和群体用户比),三者缺一即异常。例如请求和响应参数可信,我们发现大多数人在部分接口上请求参数和响应参数的模式都是相对固定的,如果用户和多数人行为不一致,则不可信。从大的逻辑不可信,到小的参数不可信,基于2个前提假设可以衍生出或基于实际数据分析得到很多高成熟度的先验知识并转化为可信策略。

流量可信AI研判:跨域行为序列Agent实践

对于流量可信的第二点挑战,假设地基已经打的很好的情况下,依然产生大量的异常告警,人力不可及,大模型我想是最可能的解法。

横看成岭侧成峰,远近高低各不同。一切的数据、属性、知识,都可以从不同角度解释访问行为。所以最开始的设计思路其实很朴素,就是融合一切数据,发挥大模型大力出奇迹的优势,从多维度(空间)+时序(时间)可信刻画访问行为。

Agent的输入是流量可信策略检出的某个主体在一段时间的在多个站点的所有流量行为及其附加属性,而不是单条行为。缺乏上下文,就算单条行为的维度再丰富,也很难准确判断行为的具体意图。

附加属性是指设备、账号、前端埋点、业务风控日志等等。这是因为其实绝大多数时候,正常和异常最大的区别点是最朴素的次数。次数是攻击者“多劳多得”提升收益的成本最低的方式只是挑战在于1次和100次好区分。那1次和5次,光从次数上还好区分吗?没有其他信息的情况下,一般不好区分。那么解法自然是引入其他信息,例如接口功能信息、入参信息。

但这样融合一切数据很明显是有问题的,仅仅是某一个主体在某个时间段的原始流量行为数据的长度,就超过了大模型的token限制,所以想直接大力出奇迹还是不太现实的。因此我们实践了流量注意力机制,即通过全局原始流量行为数据,首先得到全局统计信息,再让大模型将注意力集中到关键动作的原始流量行为数据。最终输入的数据=全局统计数据+局部原始数据。

实践融合一切数据的思路过程中,我们也发现另一点误报问题。并不是数据融合越多越好,而取决于数据质量。例如前端埋点点击和访问行为数据,因为覆盖面不全,导致有些页面没有埋点日志上报,这就造成前端埋点行为数据和后端流量行为数据的逻辑层面的冲突,而大模型分析的逻辑很严谨每次都基于正确的数据分析出正确的但不是我们想要的结果:绕过前端直接请求后端的机器行为。目前解决方式是剪枝,在数据源层面剪掉,宁缺毋滥。

解决了很多挑战,又遇到了更多更难的挑战,例如数据还是不够用(支持研判定性)咋办?也即是无先验知识情况、数据链缺失情况下,如何由因到果,以点概面,推理意图?比如单单从“查看限额管理页面”较难推断是电诈,我们目前想到了几种思路:

  1. 增加能增加的数据维度。【较易】
  2. 等和联想,等下一个能串起来的特征,再联想到一起【较易】。然而对于跨多天的行为序列【较难】。
  3. 打草惊蛇,和用户交互,做个处置动作,套取到更多行为数据。【较易】

再比如一次搜索某个主体一周的流量数据,容易出现注意力无法集中到关键接口上,真就大海捞针。对于这个问题,我们目前还没有很好的解法,还在持续实践中,也欢迎大家如果有好的思路可以相互交流。


查看原文:《我对流量安全风险感知的思考和实践》

评论:0   参与:  2