2025-12-22 00:36:45 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： 2025年中国大模型发展从跟跑到领跑，经历了学术萌芽、产业破冰、规模扩张和应用深耕四个阶段，在制造、能源、金融等行业实现深度应用，但仍面临算力不均衡、数据质量参差、场景深度不足三大挑战。作者MicroPest全年发布74篇文章，涵盖AI应用、安全工具开发、漏洞分析等领域，体现了AI技术与安全实践的深度融合，展现了从模型中心向应用中心转变的趋势。 综合评分： 85 文章分类： AI安全,安全工具,漏洞分析,安全开发,应用安全

cover_image

2025，收官

原创

MicroPest

2025年12月21日 15:43 安徽

2025，渐行渐远。一年时间，恍如梦境。

翻看2024收官语，今年同语：回忆一年的最大的感受，就是AI的蓬勃发展，一日千里，从紧跟潮流到茫然四望，如烟如海，无所适从。发展太快了，前所未有地快，高山仰止的感觉铺天盖般涌来。

一、中国大模型的发展历程

（这章节由kimi撰写，主要作掌握了解）

中国大模型从“跟跑”到“并跑”，再到局部“领跑”，只用了不到七年。其演进可大致分为“学术萌芽—产业破冰—规模扩张—应用深耕”四个波段，每一波都伴随技术范式、政策环境与商业闭环的同步跃迁。

学术萌芽期（2018-2020）

• 起点：2018 年前后，中科院自动化所、清华等高校率先开展预训练模型研究，当时参数规模普遍在亿级。

• 标志性事件：2020 年华为启动盘古、北京智源启动“悟道”项目，首次把国产模型推到“千亿参数”门槛；悟道 1.0 以 1.75 万亿参数创下当时全球纪录。

• 特征：研究导向、资源分散，侧重自然语言理解任务，与海外 GPT-3 仍有代差。

产业破冰期（2021-2022）

• 大厂入局：2021 年 4 月华为发布盘古、6 月智源发布悟道 2.0，阿里达摩院推出 M6；2022 年百度“文心 ERNIE 3.0”、腾讯“混元”陆续上线。

• 差异化路线：盘古强调“行业小样本落地”，ERNIE 引入 100 TB 知识图谱，在医疗问答等场景提升 32% 准确率。

• 政策配套：2021 年《新一代人工智能标准体系建设指南》首次把“超大规模预训练模型”写入部委文件，为后续算力、数据基建铺路。

规模扩张期（2023-2024）

• 参数与模态双爆发：2023 年“百模大战”，国产大模型数量半年内突破 200 个；2024 年阿里 Qwen-VL、商汤 InternVL 把视觉-语言对齐做到 GPT-4V 水平，训练数据量迈入 EB 级。

• 成本革命：DeepSeek-V2 采用 MoE+强化学习，训练成本降至国际同级 1/10，推理延迟<50 ms，验证“算法工程化”可抵消算力劣势。

• 开源生态：2024 年阿里先后开源 Qwen-7B/14B、Qwen2-Omni；智源 FlagOpen、百度 PaddleNLP 提供全套工具链，形成“基础模型+国产框架+国产算力”闭环。

应用深耕期（2025 至今）

• 政策全面落地：2025 年政府工作报告首次写入“支持大模型广泛应用”，全国除港澳台外 31 省市均出台专项政策，北京、上海各自发布近 20 项配套文件。

• 行业纵深：

– 制造：一汽、上汽产线 AI 质检缺陷识别率 ≥99.5%，人工成本降 40%；

– 能源：国家能源集团风光储调度弃电率降 70%，碳足迹追踪到工序级；

– 金融：蚂蚁、工行基于国产大模型构建风控智能体，单据审核时效从小时级缩到秒级。

• 技术方向跃迁：

– 多模态统一：Qwen2-Omni 实现文本/图像/语音/视频统一编解码，向“原生多模态”演进；

– 推理密度：DeepSeek-R1 在数学竞赛任务准确率从 13% 提至 83%，验证“后训练>预训练”的新范式；

– 端侧部署：华为昇腾 910B、寒武纪思元 590 通过 FP8 量化+MoE 动态路由，把 7B 模型压缩到手机端 3 GB 以内运行。

仍待翻越的三座山

1). 算力不均衡：东数西算节点 GPU 利用率差异高达 3 倍，高端芯片禁运导致单卡成本仍比海外高 30%。

2). 数据质量参差：中文公开语料仅占全球高质量数据集 8%，垂直行业数据孤岛现象突出，联邦学习“可用不可见”尚未规模化。

3). 场景深度不足：目前大模型项目 70% 停留在“助手”级应用，能够闭环重构业务流程的比例不足 20%，ROI 难量化。

下一步共识：从“模型中心”走向“应用中心”

• 技术主线：多模态具身智能、长文本-长思维链统一、RISC-V+Chiplet 异构算力、LLM-as-Judge 数据自增强。

• 产业主线：央国企“AI+”专项行动要求 3 年内掌握 5 项根技术专利、模型性能对标 GPT-4 的 90%，把大模型从“科技秀”变成“生产力”。

• 全球化主线：借“一带一路”打包输出“AI+基建”整体方案，在欧美通过合资公司模式规避合规风险，实现双循环。

从 2018 年几篇论文到 2025 年上千个行业智能体，中国大模型用七年走完了“学术—工程—商业”三级跳，下一阶段的核心命题不再是“有没有”，而是“好不好、用得深不深”。谁能把模型能力真正嵌入千行百业的成本中心、利润中心，谁就能在下一场竞赛中抢先撞线。

二、2025年，小虫的盘点

全年写下74篇/13万余字。

| | | | — | — | | 361 | 2025，如期而至 | | 362 | windows下直接使用kali(二) | | 363 | 通过代码研究空字节和无文件方式注册表隐藏技术 | | 364 | 日本书《图解密码技术》中的“数字签名” | | 365 | Pycharm接入DeepSeek-Coder | | 366 | 《天堂之门》技术 | | 367 | 三个小技巧（二） | | 368 | 用DeepSeek训练私有数据 | | 369 | 离线部署DeepSeek/QWen大模型 | | 370 | 汉字之韵，文化之光 | | 371 | 内网部署WPS+DeepSeek的通用方法 | | 372 | 为Cherry Studio修改数据目录 | | 373 | Ragflow知识库的解析过程 | | 374 | 对DogsVsCats例子的调优模型训练过程（一） | | 375 | 对DogsVsCats例子的调优模型训练过程（二） | | 376 | MiniMax-Text-01：超长上下文的多项效果与效率大模型 | | 377 | 提示词优化器 | | 378 | 利用Claude3.7 sonnet逆向二进制程序 | | 379 | 利用Claude3.7分析wireshark流量包 | | 380 | 用Claude3.7辅助3D建模 | | 381 | 开发wireshark过程中的困惑 | | 382 | 为Cherry Studio修改数据目录（二） | | 383 | 智能体分析wireshark流量包 | | 384 | 利用Claude3.7调用kali进行渗透测试 | | 385 | Claude解决“开发WireShark插件过程中的困惑” | | 386 | Claude Opus 4 优化 wireshark插件代码 | | 387 | 找寻Ragflow的AI-Reranker的心酸历程 | | 388 | Claude Opus 4 对《利用Claude3.7逆向二进制程序》中程序的再分析 | | 389 | PandaWiki搭建过程（一） | | 390 | PandaWiki搭建过程（二） | | 391 | PandaWiki搭建过程（三） | | 392 | CVE-2025-33053 Poc复现研究细节 | | 393 | 我的WireShark分析实战手册 | | 394 | MCP中的SSEStdio通讯传输 | | 395 | winrar:CVE-2025-6218 Poc复现及1Day研究 | | 396 | 利用claude4调用x64dbg逆向二进制程序 | | 397 | 我的AI站点MCP(一) | | 398 | AI来做流量题（一） | | 399 | AI来做流量题（二） | | 400 | 我的AI应用工具，推荐给你！ | | 401 | 我用AI修正Waf检测规则+日志分析 | | 402 | MCP中的StreamableHTTP通讯传输 | | 403 | 利用AI逆向栈溢出ctf程序 | | 404 | 利用AI逆向栈溢出ctf程序（二）：花絮 | | 405 | 知识库的再体会 | | 406 | AI-SQL，革命来了 | | 407 | 我的WireShark分析实战手册（二） | | 408 | .library-ms 文件及 Poc | | 409 | 利用AI分析 windows evtx日志 | | 410 | AI在工业互联网的应用一瞥 | | 411 | 基于NEU-DET数据集构建Faster R-CNN的钢材表面缺陷检测系统 | | 412 | 基于人工智能生成合成图片的检测探索 | | 413 | 当模型文件变成木马，HDF5 格式 AI 模型的逆向、投毒与防御 | | 414 | 开发“恶意URL-AI检测系统” | | 415 | 开发“Web日志异常-AI检测系统” | | 416 | 开发“恶意URL-AI检测系统”（二） | | 417 | 试用“Web日志异常-AI检测系统”（二） | | 418 | “Web日志异常-AI检测系统”（三） | | 419 | “Web日志异常-AI检测系统”（四） | | 420 | “恶意URL-AI检测系统”(三) | | 421 | 试用”Evtx Web Analysiser系统” | | 422 | 打造 ”基于浏览器的逆向工具“ | | 423 | Evtx Web Analysiser实战案例（二） | | 424 | Evtx Web Analysiser实战案例（三） | | 425 | “Web日志异常-AI检测系统”（五） | | 426 | 四维空间的你我 | | 427 | 打造 ”基于浏览器的逆向工具“（二） | | 428 | 打造ctf-Pwn自动化利用框架的Pwn灵境 | | 429 | 搜寻VC/TC容器文件的进一步研究 | | 430 | Evtx Web Analysiser实战案例（四） | | 431 | 试用”Evtx Web Analysiser系统”（二） | | 432 | “Web日志异常-AI检测系统”（六）（检测案例） | | 433 | 打造ctf-Pwn自动化利用框架的Pwn灵境（二）（案例说明） | | 434 | CVE-2025-55182复现学习 | | 435 | 2025，收官 |

2025是学习大模型的一年，从伊始的“慒懂”（