# Agent Skills开放标准：从Rules到Skill的Agent工程化演进

> **发布时间**：2025年12月18日（Anthropic）\
> **调研时间**：2026年1月24日\
> **生态状态**：开放标准发布，工程化实践探索期\
> **来源**：[货拉拉技术团队实践](https://juejin.cn/post/7597776334065516596)

***

## 📋 执行摘要

**核心发现**：

* Agent Skills 是 Anthropic 发布的**开放标准**，定义"能力"而非"工具"
* 从 Rules → Commands → Skills 的演进路径，标志着 Agent 工程化的标准化进程
* 与 MCP（工具协议）、A2A（协作协议）形成**三足鼎立**的 Agent 生态标准
* **渐进式披露**机制解决 Token 浪费和上下文干扰问题
* 从单体架构到微服务，从过程式脚本到组件化框架的转型

**关键洞察**：

1. **能力 vs 工具**：Skills 定义"能力"，MCP 提供"工具"，A2A 实现"协作"
2. **工程化转型**：从巨石应用到包管理器的范式转变
3. **渐进式加载**：技能信息量无上限，只在需要时加载，完美解决上下文窗口限制
4. **代码优先**：确定性任务交给传统代码执行，LLM 专注非确定性推理

***

## 🕐 历史演进：Agent 工程化的标准化路径

### 时间线：从 Rules 到 Skills 的演进

```
2024年初 → Rules（规则系统）
  └─ 静态规则配置，上下文全量加载
  └─ 问题：Token 浪费、上下文干扰

2024年中 → Commands（命令系统）
  └─ 可执行命令封装
  └─ 问题：仍需要全量上下文

2024年11月 → MCP（Model Context Protocol）
  └─ 工具标准化协议
  └─ 价值：工具解耦、可复用

2025年12月 → Agent Skills（开放标准）
  └─ 能力标准化协议
  └─ 价值：渐进式披露、能力组合、代码优先
```

### 演进逻辑

**第一阶段：静态规则时代**

* **特征**：所有规则一次性加载到上下文
* **问题**：Token 消耗巨大，上下文窗口被无关信息污染
* **局限**：无法动态扩展，维护成本高

**第二阶段：命令封装时代**

* **特征**：将操作封装为可执行命令
* **改进**：部分解耦，但仍需全量上下文
* **局限**：命令与上下文强耦合

**第三阶段：工具协议时代（MCP）**

* **特征**：工具标准化，一次封装到处使用
* **价值**：工具与 AI 解耦，生态可扩展
* **局限**：仍聚焦"工具"层面，未解决"能力"组合问题

**第四阶段：能力标准时代（Agent Skills）**

* **特征**：能力标准化，渐进式加载，代码优先
* **价值**：解决 Token 浪费、上下文干扰、能力组合三大核心问题
* **意义**：标志着 Agent 工程化从"巨石应用"到"包管理器"的范式转变

***

## 🎯 设计目标与哲学：Agent 工程化的顶层思考

### 核心设计目标

**1. 解决 Token 浪费问题**

* **痛点**：传统方式需要将所有技能信息一次性加载到上下文窗口
* **方案**：渐进式披露（Progressive Disclosure），只在需要时加载对应信息
* **效果**：一个 Agent 可装备 1000+ 技能，只占用极少的上下文

**2. 解决上下文干扰问题**

* **痛点**：大量无关信息污染上下文，影响 AI 判断
* **方案**：按需加载，AI 只在执行特定任务时才读取相关技能内容
* **效果**：上下文窗口专注当前任务，提升决策质量

**3. 解决能力组合问题**

* **痛点**：每个业务场景需要定制化 Agent，无法复用能力
* **方案**：将流程性知识打包成可组合、可复用的技能
* **效果**：动态加载技能，无需再造 Agent

### 设计哲学：LLM 不是万能的

**核心观点**：

> 大语言模型虽然擅长处理多种任务，但有些操作还是**交给传统代码来执行**更合适。

**设计原则**：

1. **确定性任务 → 代码执行**
   * 排序、计算、数据查询等确定性操作
   * 效率更高：直接运行算法 vs 逐词生成
   * 可靠性更强：代码保证确定性结果
2. **非确定性任务 → LLM 推理**
   * 意图理解、决策判断、自然语言生成
   * LLM 的优势领域
3. **执行时触发，无需上下文加载**
   * Claude 可以运行脚本，而无需将脚本或 PDF 加载到上下文
   * 技能通过系统提示符在上下文窗口中触发

### 与 MCP、A2A 的关系定位

**三足鼎立的 Agent 生态标准**：

| 标准               | 定位     | 类比     | 核心价值           |
| ---------------- | ------ | ------ | -------------- |
| **Agent Skills** | 定义"能力" | 专业员工   | 完成特定任务的完整方法和流程 |
| **MCP**          | 提供"工具" | 后勤工具库  | 统一工具接口，无需再造    |
| **A2A**          | 实现"协作" | 协作通讯协议 | 多智能体沟通、同步、交付   |

**关系模型**：

```
智能体公司架构：
├─ Agent Skills（专业员工）
│  └─ 财务分析技能、数据查询技能、指标归因技能...
├─ MCP（后勤工具库）
│  └─ 数据库工具、API 工具、文件系统工具...
└─ A2A（协作协议）
   └─ 多智能体沟通、任务分配、结果同步...
```

***

## 🧠 思维路线梗概：从问题到解决方案

### 问题识别

**传统 Agent 开发的三大痛点**：

1. **Token 浪费**
   * 所有技能信息一次性加载
   * 上下文窗口被大量无关信息占用
   * 成本高、效率低
2. **上下文干扰**
   * 无关技能信息影响 AI 判断
   * 难以专注当前任务
   * 决策质量下降
3. **能力无法复用**
   * 每个业务场景需要定制 Agent
   * 重复开发，维护成本高
   * 无法形成能力生态

### 解决方案设计

**渐进式披露机制**：

* 技能信息按需加载，而非全量加载
* 技能描述（SKILL.md）作为"目录"，详细内容在执行时读取
* 信息量无上限，但上下文占用最小

**代码优先原则**：

* 确定性任务用代码执行（scripts/）
* LLM 专注非确定性推理
* 执行时触发，无需加载到上下文

**能力标准化**：

* SKILL.md 定义技能接口（name、description）
* 结构化组织（instructions、scripts、resources）
* 可组合、可复用

### 实现路径

**技能结构**：

```
skill-name/
├─ SKILL.md          # 必需：技能描述和接口定义
├─ instructions/     # 可选：详细指令
├─ scripts/         # 可选：可执行脚本
└─ resources/        # 可选：资源文件
```

**核心字段**：

* `name`：技能名字（小写字母、数字、下划线）
* `description`：技能功能和使用场景描述，帮助 AI 判断何时使用

***

## 📊 速查表：Agent Skills 核心要点

### 核心概念

| 概念               | 定义                             | 关键点         |
| ---------------- | ------------------------------ | ----------- |
| **Agent Skills** | 组织化的指令、脚本和资源文件夹，Agent 可动态发现和加载 | 定义"能力"      |
| **渐进式披露**        | 只在需要时加载对应信息，而非一次性全量加载          | 解决 Token 浪费 |
| **代码优先**         | 确定性任务交给传统代码执行，LLM 专注推理         | 效率+可靠性      |
| **能力组合**         | 将流程性知识打包成可组合、可复用的技能            | 无需再造 Agent  |

### 与 MCP、A2A 对比

| 维度        | Agent Skills   | MCP       | A2A    |
| --------- | -------------- | --------- | ------ |
| **定位**    | 能力定义           | 工具提供      | 协作实现   |
| **类比**    | 专业员工           | 工具库       | 通讯协议   |
| **核心价值**  | 能力标准化、可组合      | 工具标准化、可复用 | 多智能体协作 |
| **解决的问题** | Token 浪费、上下文干扰 | 工具集成复杂度   | 多智能体协调 |

### 技能结构

```
skill-name/
├─ SKILL.md          # 必需：name + description
├─ instructions/     # 详细指令（按需加载）
├─ scripts/          # 可执行脚本（代码优先）
└─ resources/        # 资源文件（按需加载）
```

### 实战案例

**案例一：自然语言查数**

* 流程：理解意图 → 加载领域知识 → 生成 SQL → 执行查询
* 价值：财务 Agent 和 A/B 实验 Agent 可复用同一技能
* 效果：只需维护领域知识，无需定制查数能力

**案例二：指标归因分析**

* 流程：理解意图 → 加载知识 → 解析 scripts → 判断是否继续
* 价值：业务经验抽象为可复用技能
* 效果：降低业务经验注入大模型的技术复杂度

### 关键洞察

1. **从巨石应用到包管理器**：未来竞争从"单体模型性能"转向"Skill 生态丰富度"
2. **操作系统层定义**：Skill 规范尝试为 AI 世界定义"操作系统层"和"包管理协议"
3. **业务经验抽象质量决定上限**：技能设计质量直接影响 Agent 能力上限
4. **Scripts 是双刃剑**：扩展能力边界的同时带来安全隐患，需谨慎使用

***

## 💡 核心构建思想：专注价值与洞察

### 范式转变：从单体到生态

**传统思维**：

* 问题：你的单体模型性能多强？
* 局限：巨石应用，难以扩展和维护

**新范式**：

* 问题：你的"包管理器"（Skill 生态）有多丰富、可靠和高效？
* 价值：可组合、可复用、可扩展的能力生态

**类比**：

> 拥有最强大模型，但缺乏易用、标准化能力接口的公司，可能会像拥有最强单核 CPU 但缺乏操作系统和软件生态的厂商一样，在真正的应用战场中失势。

### 工程化价值

**1. 降低技术复杂度**

* 业务经验抽象为技能，降低注入大模型的技术复杂度
* 无需为每个场景定制 Agent，动态加载技能即可

**2. 提升可维护性**

* 技能独立维护，互不干扰
* 更新技能不影响其他能力
* 更容易治理和迭代

**3. 形成能力生态**

* 技能可组合、可复用
* 社区可贡献技能，形成生态
* 从"造轮子"到"用轮子"的转变

### 风险与挑战

**1. 安全风险**

* Scripts 带来安全隐患，需谨慎使用外部 Skills
* 需要建立技能审核和信任机制

**2. 技能设计质量**

* 业务经验抽象的质量决定 Agent 能力上限
* 需要领域专家参与技能设计

**3. 生态建设**

* 需要建立技能标准、审核机制、分发平台
* 社区参与度和质量是关键

***

## 🎯 实践建议

### 技能设计原则

1. **专注单一能力**：每个技能专注解决一个特定问题
2. **渐进式披露**：详细内容放在 instructions/，而非 SKILL.md
3. **代码优先**：确定性任务用 scripts/ 实现
4. **清晰描述**：description 字段要清晰，帮助 AI 判断何时使用

### 技能组织建议

1. **按领域分类**：财务、数据分析、代码生成等
2. **可组合设计**：技能之间可衔接，形成完整流程
3. **资源分离**：大文件放在 resources/，按需加载

### 安全建议

1. **谨慎使用外部 Skills**：特别是包含 scripts 的技能
2. **代码审查**：scripts/ 中的代码需要严格审查
3. **权限控制**：限制技能可访问的资源范围

***

## 📚 参考资料

* [Anthropic 官方工程博客：Equipping agents for the real world with Agent Skills](https://www.anthropic.com/engineering/equipping-agents-for-the-real-world-with-agent-skills)
* [货拉拉技术团队实践：Agent Skills在货拉拉AI应用尝试](https://juejin.cn/post/7597776334065516596)
* MCP 生态全景调研

***

**总结**：Agent Skills 标志着 Agent 工程化从"巨石应用"到"包管理器"的范式转变，通过渐进式披露、代码优先、能力标准化三大机制，解决了 Token 浪费、上下文干扰、能力无法复用三大核心问题。与 MCP、A2A 形成三足鼎立的 Agent 生态标准，为 AI 世界的"操作系统层"和"包管理协议"奠定基础。
