2026-06-17 04:43:49 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： 本文系统介绍如何将提示词经验沉淀为可复用的Codex工作流技能。核心内容包括技能设计原则（可重复性、有界性、可测试性）、技能结构（SKILL.md蓝图、渐进式披露）、工作流设计方法及部署策略。文档提供了详细的技能构建模式、决策矩阵和实际案例，指导用户从本地迭代到团队分发的完整流程。 综合评分： 78 文章分类： 安全开发,技术标准,安全工具,安全运营,其他

cover_image

Codex Skills 指南：如何把提示词经验沉淀为可复用工作流

原创

JavaEdge JavaEdge

JavaEdge

2026年6月11日 23:11 上海

在小说阅读器读本章

去阅读

点击下方“JavaEdge”，选择“设为星标”

第一时间关注技术干货！

本文已收录在Github，关注我，紧跟本系列专栏文章，咱们下篇再续！

🚀 魔都架构师 | 全网30W技术追随者
🔧 大厂分布式系统/数据中台实战专家
🏆 主导交易系统百万级流量调优 & 车联网平台架构
🧠 AIGC应用开发先行者 | 区块链落地实践者
🌍 以技术驱动创新，我们的征途是改变世界！
👉 实战干货：编程严选网

将客户知识转化为可重复使用的 Codex 工作流。

第一章指导原则

在编写文件之前，先确定工作方向。

核心理念

skill不是最终结果，采用的工作流才是结果。

当 Codex skill能够将重复的人工提示转化为一致的、可测试的流程时，它才是有用的。工作始于识别真实的工作流、其所有者、源系统、审批流程和完成定义。

1. 可重复性

工作流发生的频率足够高，使得可重用的指令变得重要。

2. 有界性

预期的输入、输出和审查标准是已知的。

3. 可测试性

工作流可以通过提示、输出、追踪或脚本进行检查。

执行摘要

Codex skills打包可重复的专业知识。

Codex skill是可重用的工作流指令。一个skill将 SKILL.md 文件与可选的脚本、参考资料和资源打包在一起，使 Codex 能够遵循流程，而无需用户每次重新解释。

当团队有标准方法时使用skill。示例包括客户简报、发布审查、实施计划、报告生成、仓库清单和工具连接的操作工作流。

| 概念 | 说明 | | — | — | | skill | 教授流程：步骤、参考资料、脚本、验证、输出格式。 | | 插件 | 打包和分发skill、应用映射、MCP 配置、钩子和元数据。 | | 治理 | 使用文档化的控制进行审批、沙箱、托管配置和审查。 |

核心心智模型

能力栈

使用此模型来决定需求所属的位置。将工作流指令、工具访问、包分发和策略控制分开。

| 概念 | 用途 | | — | — | | MCP 或应用 | Codex 可以访问什么。 | | skill | Codex 应该如何使用这些访问权限。 | | 插件 | 能力如何打包和分发。 | | 托管控制 | 审批、访问和约束的策略边界。 |

决策矩阵

选择适合发布范围的最小表面。

不要过早过度打包。从本地或仓库skill开始。当工作流稳定、可重用且需要分发或捆绑集成时，再打包为插件。

第二章 skill结构

围绕渐进式披露构建skill。

skill构建原则

保持触发器简洁，工作流清晰，参考资料可选。

Codex 最初只看到skill名称、描述和路径。它只在选择使用skill时才读取完整指令。因此，描述是第一道质量门。

skill剖析

一个 Codex skill是一个包含一个必需文件的文件夹。

customer-brief/
├── SKILL.md &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;# 必需
├── scripts/
│ &nbsp; └── validate_brief.py
├── references/
│ &nbsp; ├──&nbsp;source-map.md
│ &nbsp; └── brief-rubric.md
├── assets/
│ &nbsp; └── brief-template.md
└── agents/
&nbsp; &nbsp; └── openai.yaml

SKILL.md – 必需的前置元数据和 Markdown 指令。

scripts/ – 确定性检查、转换、渲染器或辅助命令。

references/ – 仅在需要时加载的详细文档：模式、评分标准、API 说明、策略。

assets/ 和 agents/openai.yaml – 模板、图像、UI 元数据、调用策略和工具依赖。

SKILL.MD 蓝图

必需文件应简洁且具有操作性。

---
name: customer-brief
description: 根据批准的源材料准备客户账户简报。当用户要求账户简报、客户摘要、利益相关者准备、续约准备或会议简报时使用。
---

# Customer Brief

## Workflow
1.&nbsp;确定客户、会议目的和可用的源材料。
2.&nbsp;在起草前阅读批准的来源。
3.&nbsp;区分事实、决策、风险和未解决的问题。
4.&nbsp;使用必需的结构生成简报。
5.&nbsp;在回复前运行最终清单。

好的skill主体做四件事：

定义工作流适用的情况
描述必需的输入和输出
给出有序的工作流
命名验证和故障处理规则

将细节放在主体之外。将长源映射、评分标准、样式指导、模式和示例移到 references/ 中，并从工作流中链接到它们。

渐进式披露

描述是触发表面。

设计含义：Codex 文档描述了初始skill列表预算。如果安装了许多skill，描述可能会缩短或从初始列表中省略。将用例和触发词放在前面。

名称 – 简短、稳定且具体，足以识别。
描述 – 结果、触发短语和边界。
SKILL.md – 当 Codex 选择skill时加载。
参考资料 – 仅在对任务有用时加载。
脚本 – 当确定性行为很重要时执行或检查。

描述模式

像路由规则一样编写描述。

可重用模式： [结果]。当用户要求 [特定触发短语、工件、工作流或文件类型] 时使用。不要用于 [附近但无关的任务]。

强描述：为软件项目准备实施就绪审查。当用户要求启动就绪、发布审查、部署清单、发布风险或 go/no-go 准备时使用。不要用于一般代码审查。

为什么有效：结果、触发短语和边界都很明确。

弱描述：帮助处理项目工作。

为什么失败：没有结果、没有触发语言、没有范围边界。

指令主体

大多数skill使用一种格式。

# skill名称

## 何时使用
使用此skill当...

## 输入
必需：
-&nbsp;...

可选：
-&nbsp;...

## 工作流
1.&nbsp;...
2.&nbsp;...
3.&nbsp;...

## 质量检查
-&nbsp;...

## 输出格式
返回...

## 失败模式
-&nbsp;如果...，则...

从要完成的工作开始。使用命令式步骤。定义输入和输出。将关键检查放在顶部。

第三章工作流设计

在打包之前设计客户工作流。

工作流优先设计

先确定操作流程，然后选择 Codex 表面。

一个好的skill候选具有明确的所有者、源系统、预期输出、审批点和成功指标。没有这些，打包只会隐藏歧义。

工作流收集

在编写skill之前使用此模板。

工作流名称：
业务结果：
主要用户：
当前触发器：
当前输入：
源系统：
Codex 应该采取的行动：
需要人工批准的行动：
预期输出：
完成定义：
质量检查：
失败模式：
采用指标：
所有者：
审查节奏：

好的候选：

反复发生
使用稳定的来源
具有标准输出格式
可以用提示测试
节省时间或减少返工

差的候选：

需要未定义的判断
依赖无法访问的系统
每次都发生根本性变化
没有所有者
需要高影响行动但没有审批

用例模式

当工作重复时，提示变成skill。

skill阈值：当相同的工作流将重复发生、来源和输出格式稳定、团队需要护栏或测试以使结果可重复时，将提示转换为skill。

调用与发现

使入口点明确。

不要模糊语法。在skill特定部分使用 $skill 示例。在插件部分使用 @plugin 示例。

skill位置

Codex 从多个作用域读取skill。

skill与 AGENTS.md：使用 AGENTS.md 进行持久项目指令。使用skill进行可重用任务工作流。当项目指导应该指向工作流特定skill时，两者都使用。

第四章插件与部署

仅在工作流稳定后打包。

插件与部署

插件是分发单元，不是工作流设计的替代品。

当skill应该被安装、共享、在市场中策划或与应用集成、MCP 配置、钩子或元数据捆绑时，构建插件。

插件结构

插件是可安装的捆绑包。

my-plugin/
├── .codex-plugin/
│ &nbsp; └── plugin.json &nbsp; &nbsp;# 必需
├── skills/
│ &nbsp; └── my-skill/
│ &nbsp; &nbsp; &nbsp; └── SKILL.md
├── .app.json
├── .mcp.json
├── hooks/
│ &nbsp; └── hooks.json
└── assets/

{
&nbsp;&nbsp;"name":&nbsp;"customer-workflows",
&nbsp;&nbsp;"version":&nbsp;"0.1.0",
&nbsp;&nbsp;"description":&nbsp;"Reusable customer workflow skills for Codex.",
&nbsp;&nbsp;"skills":&nbsp;"./skills/"
}

路径规则：保持清单路径相对于插件根目录，路径以 ./ 开头，并且只在 .codex-plugin/ 中保留 plugin.json。

插件市场

使用文档化的市场模式进行团队发布。

{
&nbsp;&nbsp;"name":&nbsp;"local-workflows",
"interface": {
&nbsp; &nbsp;&nbsp;"displayName":&nbsp;"Local Workflows"
&nbsp; },
"plugins": [
&nbsp; &nbsp; {
&nbsp; &nbsp; &nbsp;&nbsp;"name":&nbsp;"customer-workflows",
&nbsp; &nbsp; &nbsp;&nbsp;"source": {
&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;"source":&nbsp;"local",
&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;"path":&nbsp;"./plugins/customer-workflows"
&nbsp; &nbsp; &nbsp; },
&nbsp; &nbsp; &nbsp;&nbsp;"policy": {
&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;"installation":&nbsp;"AVAILABLE",
&nbsp; &nbsp; &nbsp; &nbsp;&nbsp;"authentication":&nbsp;"ON_INSTALL"
&nbsp; &nbsp; &nbsp; },
&nbsp; &nbsp; &nbsp;&nbsp;"category":&nbsp;"Productivity"
&nbsp; &nbsp; }
&nbsp; ]
}

文档化位置：

官方策划的插件目录
仓库市场：$REPO_ROOT/.agents/plugins/marketplace.json
个人市场：~/.agents/plugins/marketplace.json

安装策略值：AVAILABLE、INSTALLED_BY_DEFAULT 和 NOT_AVAILABLE 在市场示例中有文档记录。

发布与版本控制

使用文档化的原语进行受控发布。

文档化原语：

插件清单版本
已安装插件缓存路径包含市场、插件和版本
Git 支持的市场条目可以使用 ref 或 sha
企业控制包括 Codex 访问、策略、RBAC、托管配置和可观测性

不要暗示：

用于自定义插件发布渠道的企业管理控制台
每个插件或插件版本的 RBAC
托管自定义插件推广工作流
官方插件目录的公开自助发布

推荐发布语言：对于团队发布，使用文档化模式：仓库skill、管理员安装skill、仓库/个人/Git 支持的市场、插件清单版本、Git ref/sha 固定和企业托管配置。

部署模式

将发布范围与控制表面匹配。

01 本地迭代在 $HOME/.agents/skills 中创建skill，测试提示，仅在需要时打包。

02 项目共享存储在 .agents/skills 下，从仓库指南引用，并像代码一样审查更改。

03 分发捆绑包打包稳定skill与插件元数据、市场条目和集成设置说明。

04 使其可发现使用文档化的市场模式，必要时用 ref 或 sha 固定 Git 支持的条目。

05 治理访问对支持的策略约束使用托管配置和审批控制。

API skill部署是独立的：当产品或托管代理需要版本化捆绑包时使用 API skill。将skill说明视为用户提供的工作流输入，而不是更高优先级的策略控制。

API SKILLS

适用于代理环境的版本化捆绑包。

API Skills 支持托管和本地 shell 环境、版本指针、默认版本和显式引用。保持此表面与本地 Codex skill发现区分开。

第五章评估

测试工作流，而不仅仅是文件。

评估原则

好的skill通过触发行为、工作流完成度和输出质量来衡量。

测试应显示skill是否在应该触发时触发，避免无关任务，完成工作流，并相对于基线提高一致性、质量或速度。

测试策略

在发布前使用四项检查。

01 触发测试

明显提示、转述提示、上下文提示和负向控制

02 功能测试

源读取成功、工具调用成功、输出结构匹配、处理缺失数据

03 跟踪测试

使用 --json 标志进行非交互式运行并检查 JSON 事件

04 质量测试

首先应用确定性检查，然后在结构不足时使用评分标准检查

应触发：

为明天的续约会议准备客户简报
从这些笔记构建利益相关者准备摘要
在高管检查前总结账户风险

不应触发：

写一封通用感谢信
审查这个拉取请求
解释什么是客户成功计划

评估循环

使回归测试轻量化。

{
&nbsp;&nbsp;"id":&nbsp;"brief-obvious-001",
&nbsp;&nbsp;"prompt":&nbsp;"Prepare a customer brief for the Acme renewal meeting using the provided notes.",
&nbsp;&nbsp;"should_trigger":&nbsp;true,
&nbsp;&nbsp;"required_checks": [
&nbsp; &nbsp;&nbsp;"has_risks",
&nbsp; &nbsp;&nbsp;"has_open_questions",
&nbsp; &nbsp;&nbsp;"separates_fact_from_inference"
&nbsp; ]
}

01 定义用例创建带有预期触发行为和必需检查的提示 fixtures。

02 运行 Codex使用非交互模式并捕获换行符分隔的 JSON 事件。

03 评分从确定性检查开始。仅在需要时添加评分标准检查。

度量

在编写skill之前定义成功标准。

触发准确性、误报率、工作流完成率、用户更正、生成可用输出的时间和输出评分标准分数是比”skill存在”更好的衡量标准。

第六章治理

将skill作为特权工作流指令进行治理。

治理原则

审查捆绑包、约束操作、明确所有权。

skill可以影响代理读取、写入、运行和生成的内容。在广泛发布之前，它们需要审查、批准边界和运营所有权。

安全与治理

在部署前审查skill：

SKILL.md 说明
脚本和命令入口点
参考资料和源材料
生成输出中使用的资源
插件清单
MCP 和应用配置
生命周期钩子
审批门和策略检查

不要将skill用作策略控制：将skill说明视为工作流输入。对安全和治理要求使用明确的产品、平台和企业控制。

优先使用最小权限：将skill映射到有限的工作流。避免任意不受信任的skill目录。将敏感凭据排除在skill和资源之外。

附录

工作坊模板

在实施之前捕获工作流。

会话目标：团队：工作流候选：为什么现在：当前流程：痛点：输入：记录系统：预期输出：决策点：需要人工批准：风险：合规约束：好的结果是什么样的：我们将如何测试：试点用户：发布路径：所有者：

发现提示：

用户反复要求 Codex 做什么？
哪些输出因用户提示方式不同而有所差异？
哪些工作流每次都需要相同的源检查？
哪些手动步骤容易忘记？
哪些操作需要在 Codex 继续之前获得批准？
什么会使这个工作流足够可信以供日常使用？

就绪检查清单

在试点skill之前使用。

工作流有明确的所有者和审查节奏
触发语言、输入和输出已知
源系统和批准点已记录
成功指标在实施前已定义
描述包括结果、触发条件和边界
SKILL.md 简洁且参考资料链接清晰
仅在添加可靠性时包含脚本
明显、转述和负向控制提示通过
工具或 MCP 设置已验证
高影响操作需要批准
选择了正确的发布范围
反馈循环已到位

故障排除

反模式

避免这些失败模式：

01 过大范围：试图覆盖整个部门的巨型skill变得难以触发、测试和维护。

02 通用描述：”帮助运营”给 Codex 没有可靠的路由信号。

03 隐藏策略声明：仓库指南和skill说明不能替代托管策略控制。

04 过早打包：在工作流测试之前打包为插件会创建没有证据的分发。

05 不安全写入：高影响操作需要明确的批准门和策略检查。

06 夸大发布声明：仅通过目标环境文档化的功能描述自定义插件部署。

编程严选网：http://www.javaedge.cn/

专注分享AI时代下软件开发全场景最新最佳实践~

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：JavaEdge JavaEdge JavaEdge《Codex Skills 指南：如何把提示词经验沉淀为可复用工作流》