文章总结: 2025年中国大模型发展从跟跑到领跑,经历了学术萌芽、产业破冰、规模扩张和应用深耕四个阶段,在制造、能源、金融等行业实现深度应用,但仍面临算力不均衡、数据质量参差、场景深度不足三大挑战。作者MicroPest全年发布74篇文章,涵盖AI应用、安全工具开发、漏洞分析等领域,体现了AI技术与安全实践的深度融合,展现了从模型中心向应用中心转变的趋势。 综合评分: 85 文章分类: AI安全,安全工具,漏洞分析,安全开发,应用安全
2025,收官
原创
MicroPest
MicroPest
2025年12月21日 15:43 安徽
2025,渐行渐远。一年时间,恍如梦境。
翻看2024收官语,今年同语:回忆一年的最大的感受,就是AI的蓬勃发展,一日千里,从紧跟潮流到茫然四望,如烟如海,无所适从。发展太快了,前所未有地快,高山仰止的感觉铺天盖般涌来。
一、中国大模型的发展历程
(这章节由kimi撰写,主要作掌握了解)
中国大模型从“跟跑”到“并跑”,再到局部“领跑”,只用了不到七年。其演进可大致分为“学术萌芽—产业破冰—规模扩张—应用深耕”四个波段,每一波都伴随技术范式、政策环境与商业闭环的同步跃迁。
- 学术萌芽期(2018-2020)
• 起点:2018 年前后,中科院自动化所、清华等高校率先开展预训练模型研究,当时参数规模普遍在亿级。
• 标志性事件:2020 年华为启动盘古、北京智源启动“悟道”项目,首次把国产模型推到“千亿参数”门槛;悟道 1.0 以 1.75 万亿参数创下当时全球纪录。
• 特征:研究导向、资源分散,侧重自然语言理解任务,与海外 GPT-3 仍有代差。
- 产业破冰期(2021-2022)
• 大厂入局:2021 年 4 月华为发布盘古、6 月智源发布悟道 2.0,阿里达摩院推出 M6;2022 年百度“文心 ERNIE 3.0”、腾讯“混元”陆续上线。
• 差异化路线:盘古强调“行业小样本落地”,ERNIE 引入 100 TB 知识图谱,在医疗问答等场景提升 32% 准确率。
• 政策配套:2021 年《新一代人工智能标准体系建设指南》首次把“超大规模预训练模型”写入部委文件,为后续算力、数据基建铺路。
- 规模扩张期(2023-2024)
• 参数与模态双爆发:2023 年“百模大战”,国产大模型数量半年内突破 200 个;2024 年阿里 Qwen-VL、商汤 InternVL 把视觉-语言对齐做到 GPT-4V 水平,训练数据量迈入 EB 级。
• 成本革命:DeepSeek-V2 采用 MoE+强化学习,训练成本降至国际同级 1/10,推理延迟<50 ms,验证“算法工程化”可抵消算力劣势。
• 开源生态:2024 年阿里先后开源 Qwen-7B/14B、Qwen2-Omni;智源 FlagOpen、百度 PaddleNLP 提供全套工具链,形成“基础模型+国产框架+国产算力”闭环。
- 应用深耕期(2025 至今)
• 政策全面落地:2025 年政府工作报告首次写入“支持大模型广泛应用”,全国除港澳台外 31 省市均出台专项政策,北京、上海各自发布近 20 项配套文件。
• 行业纵深:
– 制造:一汽、上汽产线 AI 质检缺陷识别率 ≥99.5%,人工成本降 40%;
– 能源:国家能源集团风光储调度弃电率降 70%,碳足迹追踪到工序级;
– 金融:蚂蚁、工行基于国产大模型构建风控智能体,单据审核时效从小时级缩到秒级。
• 技术方向跃迁:
– 多模态统一:Qwen2-Omni 实现文本/图像/语音/视频统一编解码,向“原生多模态”演进;
– 推理密度:DeepSeek-R1 在数学竞赛任务准确率从 13% 提至 83%,验证“后训练>预训练”的新范式;
– 端侧部署:华为昇腾 910B、寒武纪思元 590 通过 FP8 量化+MoE 动态路由,把 7B 模型压缩到手机端 3 GB 以内运行。
- 仍待翻越的三座山
1). 算力不均衡:东数西算节点 GPU 利用率差异高达 3 倍,高端芯片禁运导致单卡成本仍比海外高 30%。
2). 数据质量参差:中文公开语料仅占全球高质量数据集 8%,垂直行业数据孤岛现象突出,联邦学习“可用不可见”尚未规模化。
3). 场景深度不足:目前大模型项目 70% 停留在“助手”级应用,能够闭环重构业务流程的比例不足 20%,ROI 难量化。
- 下一步共识:从“模型中心”走向“应用中心”
• 技术主线:多模态具身智能、长文本-长思维链统一、RISC-V+Chiplet 异构算力、LLM-as-Judge 数据自增强。
• 产业主线:央国企“AI+”专项行动要求 3 年内掌握 5 项根技术专利、模型性能对标 GPT-4 的 90%,把大模型从“科技秀”变成“生产力”。
• 全球化主线:借“一带一路”打包输出“AI+基建”整体方案,在欧美通过合资公司模式规避合规风险,实现双循环。
从 2018 年几篇论文到 2025 年上千个行业智能体,中国大模型用七年走完了“学术—工程—商业”三级跳,下一阶段的核心命题不再是“有没有”,而是“好不好、用得深不深”。谁能把模型能力真正嵌入千行百业的成本中心、利润中心,谁就能在下一场竞赛中抢先撞线。
二、2025年,小虫的盘点
全年写下74篇/13万余字。
| | | | — | — | | 361 | 2025,如期而至 | | 362 | windows下直接使用kali(二) | | 363 | 通过代码研究空字节和无文件方式注册表隐藏技术 | | 364 | 日本书《图解密码技术》中的“数字签名” | | 365 | Pycharm接入DeepSeek-Coder | | 366 | 《天堂之门》技术 | | 367 | 三个小技巧(二) | | 368 | 用DeepSeek训练私有数据 | | 369 | 离线部署DeepSeek/QWen大模型 | | 370 | 汉字之韵,文化之光 | | 371 | 内网部署WPS+DeepSeek的通用方法 | | 372 | 为Cherry Studio修改数据目录 | | 373 | Ragflow知识库的解析过程 | | 374 | 对DogsVsCats例子的调优模型训练过程(一) | | 375 | 对DogsVsCats例子的调优模型训练过程(二) | | 376 | MiniMax-Text-01:超长上下文的多项效果与效率大模型 | | 377 | 提示词优化器 | | 378 | 利用Claude3.7 sonnet逆向二进制程序 | | 379 | 利用Claude3.7分析wireshark流量包 | | 380 | 用Claude3.7辅助3D建模 | | 381 | 开发wireshark过程中的困惑 | | 382 | 为Cherry Studio修改数据目录(二) | | 383 | 智能体分析wireshark流量包 | | 384 | 利用Claude3.7调用kali进行渗透测试 | | 385 | Claude解决“开发WireShark插件过程中的困惑” | | 386 | Claude Opus 4 优化 wireshark插件代码 | | 387 | 找寻Ragflow的AI-Reranker的心酸历程 | | 388 | Claude Opus 4 对《利用Claude3.7逆向二进制程序》中程序的再分析 | | 389 | PandaWiki搭建过程(一) | | 390 | PandaWiki搭建过程(二) | | 391 | PandaWiki搭建过程(三) | | 392 | CVE-2025-33053 Poc复现研究细节 | | 393 | 我的WireShark分析实战手册 | | 394 | MCP中的SSEStdio通讯传输 | | 395 | winrar:CVE-2025-6218 Poc复现及1Day研究 | | 396 | 利用claude4调用x64dbg逆向二进制程序 | | 397 | 我的AI站点MCP(一) | | 398 | AI来做流量题(一) | | 399 | AI来做流量题(二) | | 400 | 我的AI应用工具,推荐给你! | | 401 | 我用AI修正Waf检测规则+日志分析 | | 402 | MCP中的StreamableHTTP通讯传输 | | 403 | 利用AI逆向栈溢出ctf程序 | | 404 | 利用AI逆向栈溢出ctf程序(二):花絮 | | 405 | 知识库的再体会 | | 406 | AI-SQL,革命来了 | | 407 | 我的WireShark分析实战手册(二) | | 408 | .library-ms 文件及 Poc | | 409 | 利用AI分析 windows evtx日志 | | 410 | AI在工业互联网的应用一瞥 | | 411 | 基于NEU-DET数据集构建Faster R-CNN的钢材表面缺陷检测系统 | | 412 | 基于人工智能生成合成图片的检测探索 | | 413 | 当模型文件变成木马,HDF5 格式 AI 模型的逆向、投毒与防御 | | 414 | 开发“恶意URL-AI检测系统” | | 415 | 开发“Web日志异常-AI检测系统” | | 416 | 开发“恶意URL-AI检测系统”(二) | | 417 | 试用“Web日志异常-AI检测系统”(二) | | 418 | “Web日志异常-AI检测系统”(三) | | 419 | “Web日志异常-AI检测系统”(四) | | 420 | “恶意URL-AI检测系统”(三) | | 421 | 试用”Evtx Web Analysiser系统” | | 422 | 打造 ”基于浏览器的逆向工具“ | | 423 | Evtx Web Analysiser实战案例(二) | | 424 | Evtx Web Analysiser实战案例(三) | | 425 | “Web日志异常-AI检测系统”(五) | | 426 | 四维空间的你我 | | 427 | 打造 ”基于浏览器的逆向工具“(二) | | 428 | 打造ctf-Pwn自动化利用框架的Pwn灵境 | | 429 | 搜寻VC/TC容器文件的进一步研究 | | 430 | Evtx Web Analysiser实战案例(四) | | 431 | 试用”Evtx Web Analysiser系统”(二) | | 432 | “Web日志异常-AI检测系统”(六)(检测案例) | | 433 | 打造ctf-Pwn自动化利用框架的Pwn灵境(二)(案例说明) | | 434 | CVE-2025-55182复现学习 | | 435 | 2025,收官 |
2025是学习大模型的一年,从伊始的“慒懂”(
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。










评论