Anthropic官方教你如何构建Claude Skills-虎嗅网

本文来自微信公众号：Draco正在VibeCoding，作者：DracoVibeCoding，原文标题：《万字译文：Anthropic官方发布的Claude Skills构建指南完整版！》，题图来自：AI生成

Anthropic近期官方发布了33页的Claude Skills构建指南，下面是全文中文译版，pls enjoy。

简介

技能（Skill）其实就是一套指令——打包成一个简单的文件夹——用来教 Claude 怎么处理特定任务或工作流程。这是你自定义 Claude 最有力的方式之一。

你有没有遇到过这种情况：每次跟 Claude 对话，都要重新解释你的偏好、流程和专业背景？有了技能，你只需要教一次，以后每次都能直接用上。

什么时候用技能最合适？就是当你有可以重复执行的工作流程时，比如：

根据设计稿生成前端界面
用固定的方法论做研究调查
按照团队风格指南写文档
协调多个步骤的复杂流程

技能跟 Claude 的内置功能（比如执行代码、创建文档）搭配起来效果很好。如果你在做 MCP 集成，技能还能帮你把原始的工具访问能力，变成可靠、顺畅的工作流程。

读完这份指南，你会学到：

技能的技术要求和最佳实践
独立技能和 MCP 增强型工作流的设计模式
我们观察到的那些真正有效的做法
怎么测试、迭代、发布你的技能

这份指南适合谁读？

想让 Claude 按固定流程工作的开发者
想让 Claude 遵循自己习惯的高级用户
想在团队/组织内统一 Claude 使用方式的管理者

两条阅读路径：

只做独立技能？重点看“基础知识”和“规划与设计”部分。

想在 MCP 上叠加技能？“技能 + MCP”和第五章的设计模式更适合你。

两条路径用的是同样的技术规范，按自己的需求选就好。

预计投入：读完这份指南后，配合 skill-creator 工具，通常 15-30 分钟就能做出你第一个能用的技能。

第一章：基础知识

技能到底是什么？

技能就是一个文件夹，里面放着：

三个核心设计理念

1. 渐进式披露（Progressive Disclosure）

技能用三层结构来组织内容：

第一层（YAML 前置信息）：每次都会加载到 Claude 的系统提示里。内容要精简——让 Claude 知道"这个技能是做什么的、什么时候该用它"就够了，不需要把所有东西都塞进来。

第二层（SKILL.md 正文）：当 Claude 觉得当前任务跟这个技能有关，才会加载完整指令。

第三层（链接文件）：放在技能文件夹里的其他文件，Claude 可以按需查阅。

这种分层设计的好处：既省 token，又能保留足够的专业深度。

2. 可组合性（Composability）

Claude 可以同时加载多个技能。你的技能要能跟其他技能和平共处，别假设自己是唯一被启用的那个。

3. 可移植性（Portability）

在 Claude.ai、Claude Code 和 API 里，技能的工作方式完全一样。写一次，到处能用——前提是运行环境支持技能所需的依赖。

面向 MCP 开发者：用技能增强 MCP

只做独立技能、不涉及 MCP？可以直接跳到第二章，随时回来看这节。

如果你已经有了运行中的 MCP 服务器，最难的部分其实已经搞定了。技能就是在上面加一层“知识层”——把你已经知道的工作流程和最佳实践固化下来，让 Claude 能够一致地应用它们。

这两者怎么配合？

没有技能时，用户可能遇到的问题：

连上了 MCP，但不知道下一步该咋办
不断发来“怎么用你的集成做 X”的支持提问
每次对话从头开始，结果每次都不一样
用户会把问题归咎于你的 MCP 连接器，但根本原因其实是缺少工作流程指引

有了技能之后：

预置的工作流程在需要时自动激活
工具调用稳定可靠
最佳实践内嵌在每次交互里
新用户的学习成本大幅降低

第二章：规划与设计

第一步：从用例出发

在写任何代码之前，先想清楚你的技能要解决的2-3个具体场景。

一个好的用例定义长这样：

问自己这几个问题：

用户想达成什么目标？
这需要哪些多步骤的工作流程？
需要哪些工具（Claude 内置的，还是 MCP 的）？
需要嵌入哪些领域知识或最佳实践？

三类常见用例

Anthropic 观察到三种最常见的技能使用场景：

第 1 类：文档和素材创建

适合场景：创建一致的高质量输出，比如文档、演示文稿、应用、设计、代码等。

真实案例：frontend-design技能（另见 docx、pptx、xlsx 相关技能）

关键做法：

嵌入风格指南和品牌规范
用模板结构保证输出一致
最终确认前做质量清单检查
不需要外部工具——用 Claude 的内置能力就够

第 2 类：工作流程自动化

适合场景：多步骤流程，需要一致的执行方式，可能跨多个 MCP 服务器协调。

真实案例：skill-creator技能

关键做法：

带验证节点的分步工作流
常见结构的模板
内置审查和改进建议
迭代优化循环

第 3 类：MCP 增强

适合场景：为 MCP 服务器的工具访问能力加上工作流程引导。

真实案例：来自 Sentry 的sentry-code-review技能

关键做法：

按顺序协调多个 MCP 调用
嵌入领域专业知识
提供用户本来需要手动指定的上下文
处理常见 MCP 问题

第二步：定义成功标准

怎么知道你的技能跑通了？

先说清楚：下面这些是参考目标，不是死板的门槛——测试时还是需要一定的感性判断。Anthropic 正在开发更完善的量化评估工具。

量化指标：

技能在 90% 的相关查询中触发

怎么测：跑 10-20 个应该触发技能的测试问题，记录自动加载的次数

工作流程在 X 次工具调用内完成

怎么测：有无技能各跑一次相同任务，对比工具调用次数和 token 消耗

每个工作流程 0 次 API 调用失败

怎么测：测试期间监控 MCP 服务器日志，追踪重试率和错误码

定性指标：

用户不需要提示 Claude 下一步该做什么
工作流程无需用户纠正就能跑完
跨会话结果保持一致

技术要求

文件夹结构

几条必须遵守的规则

SKILL.md 命名：

必须精确写成SKILL.md（区分大小写）
任何变体都不行：SKILL.MD、skill.md都不能用

技能文件夹命名：

√ 用 kebab-case（短横线连接小写）：notion-project-setup
×不能有空格：Notion Project Setup
× 不能用下划线：notion_project_setup
×不能有大写：NotionProjectSetup

不要放 README.md：

技能文件夹内别放 README.md
所有文档放在 SKILL.md 或 references/ 里
注意：通过 GitHub 发布时，仓库根目录仍然需要 README 供人类查阅——这和技能文件夹是两回事

YAML 前置信息：最关键的部分

YAML 前置信息是 Claude 决定要不要加载你的技能的依据，务必写对。

最简格式（够用了）：

各字段说明：

name（必填）：

只能用 kebab-case
没有空格，没有大写
最好和文件夹名一致

description（必填）：

必须同时包含：
这个技能能做什么
什么时候该用（触发条件）
最多 1024 个字符
不能含 XML 标签（<或>）
要包含用户可能实际说出的话
如果涉及特定文件类型，要提到

license（可选）：

开源才需要填
常见选项：MIT、Apache-2.0

compatibility（可选）：

1-500 个字符
说明运行环境要求，比如：目标产品、需要的系统包、是否需要网络访问等

metadata（可选）：

任意键值对
推荐写上：author、version、mcp-server

安全限制：

禁止用 XML 尖括号（<>）
技能名称不能以 "claude" 或 "anthropic" 开头（保留词）
原因：前置信息会进入 Claude 的系统提示，恶意内容可能被用来注入指令

写好 description 字段

Anthropic 工程博客说过：“这段元数据……提供了恰好足够让 Claude 知道该用哪个技能的信息，而不需要把所有内容都加载到上下文里。”这就是渐进式披露的第一层。

格式模板：[能做什么] + [什么时候用] + [主要功能]

好的写法：

不好的写法：

写主体指令

过了 YAML 前置信息，就用 Markdown 写具体的指令。

推荐结构：

写指令的最佳实践：

要具体，要说清楚怎么操作：

别含糊其词：

要包含错误处理：

要用渐进式引用：

SKILL.md 要保持聚焦：核心指令放在 SKILL.md，详细文档移到references/里，通过链接引用。

第三章：测试与迭代

你可以根据需要选择不同严格程度的测试方式：

在 Claude.ai 里手动测试——直接跑查询，看行为。迭代快，零配置。
在 Claude Code 里用脚本测试——自动化测试用例，每次改完都能跑一遍验证。
通过技能 API 程序化测试——构建系统化的评估套件，针对预定义测试集运行。

按实际需要选。个人用的小技能和面向数千企业用户的技能，测试严格程度自然不一样。

专业技巧：先把一个难题跑通，再推广

我们发现，最高效的做法是：先针对一个最具挑战的任务反复迭代，直到 Claude 成功搞定，再把这个成功方案提炼成技能。这样能充分利用 Claude 的上下文学习能力，比广撒网测试更快得到有效反馈。有了可运行的基础后，再扩展到多个测试用例来验证覆盖面。

用 skill-creator 工具

skill-creator 是一个特殊的技能，内置于 Claude.ai，也可以下载用于 Claude Code。

它能帮你：

创建技能：

从自然语言描述生成技能
自动产生格式正确的 SKILL.md
建议触发词和结构

审查技能：

标出常见问题：描述太模糊、缺少触发条件、结构有问题
识别过度/不足触发的风险
根据技能目的建议测试用例

迭代改进：

遇到边缘案例或失败后，把问题带回 skill-creator，让它帮你改进

使用方法：

注意：skill-creator 帮你设计和打磨技能，但不会跑自动化测试套件，也不会生成量化评估结果。

根据反馈持续迭代

技能是“活文档”，要根据实际使用情况不断调整。

触发不足的信号：

技能该自动加载时没加载
用户手动开启它
有人问“什么时候用这个技能”

→ 解决办法：在 description 里加更多细节和关键词（包括专业术语）

触发过度的信号：

技能在不相关的查询里也触发了
用户禁用了它
用户搞不清它的用途

→ 解决办法：添加负触发词，让描述更具体

执行问题的信号：

结果不一致
API 调用失败
需要用户帮忙纠正

→ 解决办法：改进指令，加上错误处理

第四章：发布与分享

技能能让你的 MCP 集成更完整。当用户在比较不同集成方案时，有技能的产品能更快展现价值，比单纯的 MCP 更有竞争力。

当前分发方式（2026 年 1 月）

个人用户怎么获取技能：

1. 下载技能文件夹

2. 压缩成 zip

3. 通过 Claude.ai 的设置 > 功能 > 技能上传

4. 或放到 Claude Code 的技能目录里

组织级技能：

管理员可以在工作区范围内部署技能（2025 年 12 月 18 日已上线）
支持自动更新和集中管理

开放标准

Anthropic 已将 Agent Skills 作为开放标准发布。和 MCP 一样，技能应该能跨工具和平台使用——同一个技能不管在 Claude 还是其他 AI 平台上都能用。当然，有些技能可能专门利用了特定平台的能力；作者可以在compatibility字段里注明这一点。

通过 API 使用技能

如果你需要用程序来调用技能（比如构建应用、AI 代理或自动化工作流）：

用/v1/skills接口管理技能
在 Messages API 的container.skills参数里添加技能
在 Claude Console 里做版本控制和管理
配合 Claude Agent SDK 构建自定义代理

API 和 Claude.ai 怎么选？

API 中使用技能需要 Code Execution Tool（代码执行工具）测试版，它为技能运行提供安全环境。

今天就能做的事

第一步：托管到 GitHub

开源技能用公开仓库
写清楚 README（供人类查看——这个放仓库根目录，不是技能文件夹里）
附上使用示例和截图

第二步：在 MCP 文档里说明

链接到技能
解释 MCP + 技能一起用的价值
提供快速上手指南

安装指南参考模板：

怎么介绍你的技能

你描述技能的方式，很大程度上决定了用户愿不愿意用它。

聚焦结果，而非功能：

好的写法：

不好的写法：

讲清楚 MCP + 技能的组合故事：

第五章：模式与故障排查

下面这些模式来自早期采用者和内部团队的真实经验，是我们观察到真正有效的常见做法——不是固定模板，可以灵活用。

选你的出发点：问题优先 vs. 工具优先

想象一下去建材超市。你可能带着问题来——“我需要修厨柜”——店员帮你找合适的工具。或者你拿了个新电钻，再想怎么用它完成你的活儿。

技能也是同样的逻辑：

问题优先：“我需要设置项目工作区” → 技能按正确顺序协调 MCP 调用。用户说目标，技能搞定工具。

工具优先：“我已经连上了 Notion MCP” → 技能教 Claude 最佳工作流程和实践。用户有访问权限，技能提供专业知识。

大多数技能会偏向其中一个方向。搞清楚哪种框架适合你的用例，能帮你选对下面的模式。

模式一：顺序工作流编排

适合场景：用户需要按特定顺序执行多个步骤。

关键技术：步骤顺序要明确、步骤间依赖关系要写清楚、每个阶段要有验证、失败时要有回滚指令。

模式二：多 MCP 协调

适合场景：工作流需要跨多个服务。

关键技术：阶段分隔要清晰、MCP 间的数据传递要明确、进下一阶段前要验证、错误处理要集中。

模式三：迭代式优化

适合场景：输出质量需要通过多轮迭代来提升。

关键技术：质量标准要明确、迭代改进要有节奏、验证脚本要好用、要知道什么时候停。

进阶技巧：对于关键验证步骤，可以考虑打包一个脚本来做程序化检查，而不是靠自然语言描述。代码的执行是确定的，语言的理解不是。参考 Office 技能系列的示例。

模式四：情境感知工具选择

适合场景：同一个目标，根据上下文要选不同的工具。

关键技术：决策标准要清晰、要有备用选项、选择理由要透明。

模式五：特定领域智能

适合场景：你的技能在工具访问之外还需要提供专业知识。

关键技术：领域专业知识要嵌入逻辑、行动前要合规检查、记录要完整、治理边界要清晰。

故障排查

技能上传失败

错误："Could not find SKILL.md in uploaded folder"

原因：文件名不是精确的 SKILL.md

解决：重命名，用ls -la验证确实叫 SKILL.md

错误："Invalid frontmatter"

原因：YAML 格式有问题

错误："Invalid skill name"

原因：名称有空格或大写

技能不触发

症状：技能从来不自动加载

解决：修改 description 字段（参考前面的好/坏示例）

自查清单：

描述是不是太笼统？（“帮助处理项目”不够用）
有没有用户可能实际说的触发词？
如果涉及文件类型，有没有提到？

调试技巧：问 Claude：“你什么时候会用 [技能名] 这个技能？”Claude 会引用 description 里的内容。根据缺失的部分来调整。

技能触发太频繁

症状：技能在不相关的查询里也出现了

解决方法：

1. 加负触发词：

2. 描述更具体：

3. 明确使用范围：

MCP 连接问题

症状：技能加载了，但 MCP 调用失败。

检查清单：

1. 确认 MCP 服务器已连接

Claude.ai：设置 > 扩展 > [你的服务]
应显示"已连接"

2. 检查身份验证

API 密钥是否有效、是否过期
权限/范围是否正确
OAuth 令牌是否已刷新

3. 单独测试 MCP（不用技能）

直接让 Claude 调用 MCP：“用 [服务] MCP 获取我的项目”
如果这个也失败，问题在 MCP，不在技能

4. 核对工具名称

技能里引用的 MCP 工具名称是否正确
工具名称区分大小写，一个字母都不能错

指令没有被遵守

症状：技能加载了，但 Claude 没按指令执行。

常见原因及解决方法：

1. 指令太冗长

保持简洁
多用列表和编号
详细参考文档移到单独文件

2. 关键指令被埋没

重要内容放在最前面
用## 重要或## 关键这样的标题
关键点可以重复

3. 语言模糊

进阶技巧：对于关键验证步骤，考虑打包脚本来程序化执行检查，而不是依赖自然语言指令。代码执行是确定的，语言理解不是。参考 Office 技能系列的示例。

4. 模型“偷懒”——加上明确的激励说明：

注意：这段加在用户提示里比加在 SKILL.md 里效果更好。

上下文太大导致响应变慢或质量下降

原因：

SKILL.md 内容太多
同时启用的技能太多
所有内容都加载了，没有用渐进式披露

解决方法：

1. 精简 SKILL.md

详细文档移到references/
用链接引用而非内联
SKILL.md 尽量控制在 5，000 个词以内

2. 减少同时启用的技能数量

超过 20-50 个同时启用的技能就要考虑精简了
建议按需选择性启用
相关功能可以打包成技能“组合包”

第六章：资源与参考

如果你是第一次做技能，建议先看最佳实践指南，再根据需要查阅 API 文档。

官方文档

Anthropic 官方资源：

Best Practices Guide（最佳实践指南）
Skills Documentation（技能文档）
API Reference（API 参考）
MCP Documentation（MCP 文档）

官方博客文章：

Introducing Agent Skills
Engineering Blog: Equipping Agents for the Real World
Skills Explained
How to Create Skills for Claude
Building Skills for Claude Code
Improving Frontend Design through Skills

示例技能

公开技能仓库：

GitHub： anthropics/skills
包含 Anthropic 创建的技能，可以直接自定义用

工具和实用程序

skill-creator 技能：

内置于 Claude.ai，也可用于 Claude Code
可以从描述生成技能
提供审查和改进建议
使用方法："用 skill-creator 帮我构建一个技能"

验证与评审：

skill-creator 也可以评估已有的技能
问法："请审查这个技能，并给出改进建议"

获取支持

技术问题：

社区论坛 / Claude Developers Discord

Bug 报告：

GitHub Issues：anthropics/skills/issues
提交时请包含：技能名称、错误信息、复现步骤

附录A：快速检查清单

上传技能前后，用这个清单验证一遍。想快点开始的话，可以先用 skill-creator 生成初稿，再过一遍这个清单。

开始之前

确定了 2-3 个具体用例
确定了所需工具（内置还是 MCP）
看过这份指南和示例技能
规划好了文件夹结构

开发过程中

文件夹用了 kebab-case 命名
SKILL.md文件存在（精确拼写，区分大小写）
YAML 前置信息有---分隔符
name字段：kebab-case、无空格、无大写
description同时写了“做什么”和“什么时候用”
没有 XML 标签（<>）
指令清晰、可操作
包含了错误处理
提供了示例
参考资料有清晰的链接

上传前

测试了明显任务的触发
测试了换一种说法的触发
确认不会在不相关主题上触发
功能测试通过
工具集成正常（如果有）
压缩成了 .zip 文件

上传后

在真实对话里测试过
观察了过度/不足触发的情况
收集了用户反馈
根据反馈迭代了 description 和指令
更新了 metadata 里的版本号

附录B：YAML 前置信息参考

必填字段

所有可选字段

安全说明

允许的：

标准 YAML 类型（字符串、数字、布尔值、列表、对象）
自定义 metadata 字段
较长的 description（最多 1024 个字符）

禁止的：

XML 尖括号（<>）——安全限制
YAML 中执行代码（用的是安全 YAML 解析）
以 "claude" 或 "anthropic" 开头的技能名（保留词）

附录C：完整技能示例

想看展示本指南中各种模式的完整、可生产用的技能？这里有：

Document Skills——PDF、DOCX、PPTX、XLSX 创建
Example Skills——各种工作流程模式
Partner Skills Directory——Asana、Atlassian、Canva、Figma、Sentry、Zapier 等合作伙伴的技能

这些仓库持续更新，示例比本文更丰富。克隆下来，按你的需求改，用作模板。

本文来自微信公众号：Draco正在VibeCoding，作者：DracoVibeCoding

本内容由作者授权发布，观点仅代表作者本人，不代表虎嗅立场。
如对本稿件有异议或投诉，请联系 tougao@huxiu.com。

Anthropic官方教你如何构建Claude Skills

目录

简介

第一章：基础知识

技能到底是什么？

三个核心设计理念

面向 MCP 开发者：用技能增强 MCP

第二章：规划与设计

第一步：从用例出发

三类常见用例

第二步：定义成功标准

技术要求

YAML 前置信息：最关键的部分

写好 description 字段

写主体指令

第三章：测试与迭代

推荐测试方法

用 skill-creator 工具

根据反馈持续迭代

第四章：发布与分享

当前分发方式（2026 年 1 月）

开放标准

今天就能做的事

怎么介绍你的技能

第五章：模式与故障排查

选你的出发点：问题优先 vs. 工具优先

模式一：顺序工作流编排

模式二：多 MCP 协调

模式三：迭代式优化

模式四：情境感知工具选择

模式五：特定领域智能

故障排查

第六章：资源与参考

官方文档

示例技能

工具和实用程序

获取支持

附录A：快速检查清单

附录B：YAML 前置信息参考

附录C：完整技能示例

大 家 都 在 搜

大家都在搜