2026-03-03 05:59:42 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： 智谱GLM-5是744B参数的开源大模型，采用DSA稀疏注意力技术，在推理、编码及智能体任务上达开源顶尖水平，性能逼近闭源前沿模型。支持长上下文、多格式文档生成及国产芯片部署。文章详述其技术规格、性能基准、部署指南及应用场景，展现了其在软件工程与数据分析等领域的强大能力与开源价值。 综合评分： 85 文章分类： 产品介绍,AI安全,安全开发

cover_image

【人工智能】智谱 GLM-5 工具介绍

原创

利刃信安利刃信安

利刃信安

2026年2月25日 14:00 北京

智谱 GLM-5 工具介绍

1. 产品概述

GLM-5 是智谱 AI 推出的最新大型语言模型，针对复杂系统工程和长周期智能体任务进行了优化。它通过大规模参数扩展和先进的训练技术，实现了在推理、编码和智能体任务上的最佳性能，是当前开源模型中的佼佼者。

2. 技术规格

2.1 模型规模

• 参数数量：744B 参数（40B 活跃）
• 训练数据：28.5T tokens
• 上下文长度：支持长上下文处理
• 技术创新：集成 DeepSeek Sparse Attention (DSA)，显著降低部署成本

2.2 训练技术

• 稀疏注意力：DeepSeek Sparse Attention (DSA) 技术
• 异步 RL 基础设施：开发 slime 异步 RL 基础设施，提高训练吞吐量和效率
• 预训练优化：优化预训练流程，提高模型性能
• 后训练迭代：支持更精细的后训练迭代

3. 性能表现

GLM-5 在广泛的学术基准测试中表现优异，在推理、编码和智能体任务上达到世界开源模型中的最佳水平，缩小了与前沿模型的差距。

3.1 推理能力

| 测试基准 | GLM-5 (Thinking) | GLM-4.7 (Thinking) | DeepSeek-V3.2 (Thinking) | Kimi K2.5 (Thinking) | Claude Opus 4.5 (Extend Thinking) | Gemini 3.0 Pro (High Thinking Level) | GPT-5.2 (xhigh) | | — | — | — | — | — | — | — | — | | Humanity’s Last Exam | 30.5 | 24.8 | 25.1 | 31.5 | 28.4 | 37.2 | 35.4 | | Humanity’s Last Exam w/ Tools | 50.4 | 42.8 | 40.8 | 51.8 | 43.4* | 45.8* | 45.5* | | AIME 2026 I | 92.7 | 92.9 | 92.7 | 92.5 | 93.3 | 90.6 | – | | HMMT Nov. 2025 | 96.9 | 93.5 | 90.2 | 91.1 | 91.7 | 93.0 | 97.1 | | IMOAnswerBench | 82.5 | 82.0 | 78.3 | 81.8 | 78.5 | 83.3 | 86.3 | | GPQA-Diamond | 86.0 | 85.7 | 82.4 | 87.6 | 87.0 | 91.9 | 92.4 |

3.2 编码能力

| 测试基准 | GLM-5 (Thinking) | GLM-4.7 (Thinking) | DeepSeek-V3.2 (Thinking) | Kimi K2.5 (Thinking) | Claude Opus 4.5 (Extend Thinking) | Gemini 3.0 Pro (High Thinking Level) | GPT-5.2 (xhigh) | | — | — | — | — | — | — | — | — | | SWE-bench Verified | 77.8 | 73.8 | 73.1 | 76.8 | 80.9 | 76.2 | 80.0 | | SWE-bench Multilingual | 73.3 | 66.7 | 70.2 | 73.0 | 77.5 | 65.0 | 72.0 | | Terminal-Bench 2.0 Terminus-2 | 56.2 / 60.7† | 41.0 | 39.3 | 50.8 | 59.3 | 54.2 | 54.0 | | Terminal-Bench 2.0 Claude Code | 56.2 / 61.1† | 32.8 | 46.4 | – | 57.9 | – | – | | CyberGym | 43.2 | 23.5 | 17.3 | 41.3 | 50.6 | 39.9 | – |

3.3 智能体能力

| 测试基准 | GLM-5 (Thinking) | GLM-4.7 (Thinking) | DeepSeek-V3.2 (Thinking) | Kimi K2.5 (Thinking) | Claude Opus 4.5 (Extend Thinking) | Gemini 3.0 Pro (High Thinking Level) | GPT-5.2 (xhigh) | | — | — | — | — | — | — | — | — | | BrowseComp | 62.0 | 52.0 | 51.4 | 60.6 | 37.0 | 37.8 | – | | BrowseComp w/ Context Manage | 75.9 | 67.5 | 67.6 | 74.9 | 67.8 | 59.2 | 65.8 | | BrowseComp-Zh | 72.7 | 66.6 | 65.0 | 62.3 | 62.4 | 66.8 | 76.1 | | τ²-Bench | 89.7 | 87.4 | 85.3 | 80.2 | 91.6 | 90.7 | 85.5 | | MCP-Atlas Public Set | 67.8 | 52.0 | 62.2 | 63.8 | 65.2 | 66.6 | 68.0 | | Tool-Decathlon | 39.2 | 23.8 | 35.2 | 27.8 | 43.5 | 36.4 | 46.3 | | Vending Bench 2 | $4,432.12 | $2,376.82 | $1,034.00 | $1,198.46 | $4,967.06 | $5,478.16 | $3,591.33 |

*: 指完整集合的分数 †: 修复了一些模糊指令的 Terminal-Bench 2.0 验证版本

4. 核心特性

4.1 复杂系统工程

• 长上下文理解：支持处理长上下文，理解复杂系统
• 多步骤推理：能够进行多步骤、多层次的推理
• 代码理解与生成：深入理解代码结构和逻辑，生成高质量代码
• 系统设计能力：能够设计和优化复杂系统架构

4.2 长周期智能体任务

• 长期规划：在 Vending Bench 2 中表现优异，展示了强大的长期规划能力
• 资源管理：有效管理资源，实现长期目标
• 多任务协调：能够协调多个任务，实现复杂目标
• 环境适应：能够适应环境变化，调整策略

4.3 文档生成能力

• 多格式支持：直接生成 .docx、.pdf、.xlsx 文件
• 专业文档：生成 PRD、教案、考试、电子表格、财务报告等
• 端到端交付：从文本或源材料直接生成可用文档
• 多轮协作：支持多轮协作，不断完善文档

4.4 多平台支持

• 开源发布：在 Hugging Face 和 ModelScope 上开源
• API 访问：通过 api.z.ai 和 BigModel.cn 提供 API 访问
• 本地部署：支持本地部署，包括非 NVIDIA 芯片
• 框架支持：支持 vLLM 和 SGLang 等推理框架

4.5 兼容性

• Claude Code：与 Claude Code 兼容
• OpenClaw：支持 OpenClaw 框架
• 编码代理：支持多种编码代理，如 Claude Code、OpenCode、Kilo Code 等
• Z.ai：在 Z.ai 平台上可用

5. 系统要求

5.1 硬件要求

• GPU：推荐 NVIDIA A100 或更高性能的 GPU
• 内存：至少 64GB RAM
• 存储：足够的存储空间用于模型权重
• CPU：多核 CPU

5.2 软件要求

• 操作系统：Linux、Windows、macOS
• Python：3.8 或更高版本
• 推理框架：vLLM、SGLang 等
• 依赖项：通过 pip 安装所需依赖

5.3 非 NVIDIA 芯片支持

• 华为 Ascend
• 摩尔线程
• 寒武纪
• 昆仑芯片
• MetaX
• 燧原
• 海光

6. 安装与配置

6.1 本地部署

1. 下载模型权重：从 Hugging Face 或 ModelScope 下载模型权重
2. 安装依赖：

   pip install vllm
   # 或
   pip install sglang

3. 配置推理服务：根据所选框架配置推理服务
4. 启动服务：启动推理服务

6.2 API 访问

1. 注册账号：在 api.z.ai 或 BigModel.cn 注册账号
2. 获取 API Key：获取 API Key
3. 调用 API：使用 API Key 调用 GLM-5 API

6.3 Z.ai 平台

1. 访问 Z.ai：打开 Z.ai 网站
2. 选择模型：在模型选项中选择 GLM-5
3. 开始使用：开始使用 GLM-5 进行对话或智能体任务

7. 使用方法

7.1 编码代理

• GLM Coding Plan：订阅 GLM Coding Plan，在编码代理中使用 GLM-5
• 配置方法：更新模型名称为 “GLM-5″（例如在 ~/.claude/settings.json 中）
• 支持的编码代理：Claude Code、OpenCode、Kilo Code、Roo Code、Cline、Droid 等

7.2 OpenClaw 框架

• 安装 OpenClaw：OpenClaw 包含在 GLM Coding Plan 中
• 配置指南：按照官方指南配置 OpenClaw
• 使用场景：将 GLM-5 转变为跨应用和设备操作的个人助手

7.3 Z.ai 平台

• Chat 模式：即时响应，交互式聊天，轻量级交付
• Agent 模式：多种工具，多样化技能，直接交付结果
• 模型选择：手动将模型选项更改为 GLM-5

7.4 提示词工程

• 具体任务描述：明确分析目标和期望结果
• 专业术语：使用专业领域术语
• 步骤指导：提供清晰的步骤建议
• 输出格式：指定详细的输出格式要求

8. 应用场景

8.1 软件开发

• 代码生成：生成高质量代码
• 代码审查：审查代码质量和安全性
• 架构设计：设计系统架构
• 文档生成：生成技术文档和API文档

8.2 数据科学

• 数据分析：分析复杂数据集
• 模型训练：辅助模型训练和调优
• 可视化：生成数据可视化
• 报告生成：生成数据分析报告

8.3 研究与教育

• 文献综述：生成文献综述
• 论文写作：辅助论文写作
• 课程设计：设计课程内容
• 教学辅助：辅助教学过程

8.4 商业应用

• 市场分析：分析市场趋势
• 商业计划：制定商业计划
• 财务分析：分析财务数据
• 营销策略：制定营销策略

8.5 逆向工程

• 代码分析：分析复杂代码
• 算法识别：识别加密和压缩算法
• 漏洞分析：分析软件漏洞
• 恶意软件分析：分析恶意软件行为

9. 优势与价值

9.1 性能优势

• 最佳开源模型：在推理、编码和智能体任务上达到世界开源模型最佳水平
• 长周期任务：在 Vending Bench 2 中排名开源模型第一
• 接近前沿模型：缩小了与 Claude Opus 4.5 等前沿模型的差距
• 多语言支持：支持多种语言，包括中文

9.2 技术创新

• 稀疏注意力：DeepSeek Sparse Attention (DSA) 技术，降低部署成本
• 异步 RL：slime 异步 RL 基础设施，提高训练效率
• 大规模参数：744B 参数，提供强大的表达能力
• 丰富训练数据：28.5T tokens，涵盖广泛知识

9.3 应用价值

• 提高效率：自动化处理复杂任务，提高工作效率
• 降低门槛：使非专业人员也能完成复杂任务
• 创新能力：提供新的解决方案和思路
• 多领域适用：适用于软件开发、数据科学、研究教育等多个领域

9.4 开源贡献

• MIT 许可证：模型权重以 MIT 许可证发布
• 社区支持：支持社区贡献和改进
• 开放生态：构建开放的 AI 生态系统
• 知识共享：促进 AI 知识的共享和传播

10. 总结

GLM-5 作为智谱 AI 的最新大型语言模型，代表了 AI 技术的重要进步。它通过大规模参数扩展、先进的训练技术和创新的稀疏注意力机制，在推理、编码和智能体任务上达到了世界开源模型的最佳水平。

GLM-5 不仅在学术基准测试中表现优异，在实际应用场景中也展现出强大的能力。它能够处理复杂系统工程和长周期智能体任务，生成高质量的文档和代码，为各个领域的工作带来效率提升。

随着 GLM-5 的开源和广泛应用，它将为 AI 领域的发展做出重要贡献，推动 AI 技术在更多领域的应用和创新。

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：利刃信安利刃信安利刃信安《【人工智能】智谱 GLM-5 工具介绍》