Claude刚刚推出了Agent Skills,官方定义是:所谓 Agent Skills,是指可供Agent 动态识别、按需加载的一组结构化指令、脚本和资源目录。通过技能的打包,Claude 能按需转变为满足各类场景需求的“定制专家”,显著提升处理专用场景的效率。对 Claude 而言,安装一个技能就如同一位新员工获得了详实的入职手册。用户无需为每一个具体需求开发高度碎片化的定制Agent,而是可通过捕捉和共享流程知识,以可组合形式动态赋能。
Agent Skills 实质包含了两个部分:自动化的上下文工程(推荐阅读:没有prompt,一切都是上下文?)、自定义工具。 上下文工程主要体现为领域知识,自定义工具既包括了自己开发的脚本、结构化指令,也包括Anthropic预置的、开箱即用的Skill技能包。可以确定的是,很快会有更多官方和第三方开源的Skills技能包可以复用,但需注意安全问题。
Agent Skills 是一种模块化的能力单元,旨在扩展 Claude 的功能边界。每一项 Skill 都如同一个预先封装的“专业知识包”,其中包含了指令、元数据以及可选的脚本和资源。当用户提出相关请求时,Claude 能够自动发现并调用这些 Skill,从而精准、可靠地完成任务。
为何需要 Skills?
传统的提示工程(Prompt Engineering)在处理一次性任务时非常有效,但面对需要多步骤、遵循特定流程且需反复执行的复杂任务时,其局限性便显现出来。我们无法在每次对话中都塞入冗长的操作手册,这不仅效率低下,也极大地消耗了宝贵的上下文窗口。
Skills 的诞生正是为了解决这一根本性挑战。它将可复用的、基于文件系统的资源与 Claude 的执行能力相结合,为 Claude 注入领域专家的知识,从而将一个通用型 Agent 转变为能够应对真实世界挑战的专家。
其核心优势包括:
- • 专精化 Claude:将领域知识(如工作流程、品牌指南、分析方法)固化,为特定任务深度定制 Claude 的能力。
- • 减少重复:一次创建,自动复用。避免在不同对话中反复提供相同的指导。
- • 组合能力:融合多种 Skill,构建从数据提取、分析到报告生成的端到端复杂工作流。
- • 提升可靠性:通过将确定性操作封装为代码,极大降低了 AI 的不确定性,确保任务执行的高保真度。
Agent Skills 结构详解
以实际案例为例,Claude 最近新增的文档编辑能力即由技能机制提供支持。尽管 Claude 能理解 PDF,但在表单处理等任务上仍面临局限。通过PDF 技能,Claude 获得了直接处理 PDF 表单的能力。
最基础的技能,仅需包含一个 SKILL.md 文件。该文件必须以 YAML 格式元数据开头,标明 name(名称)和 description(描述)。在初始化时,所有已安装技能的元数据会被自动加载进 Claude 的系统提示。元数据构成了**渐进式披露(progressive disclosure)**的第一层——即仅用以判断是否应激活本技能,无需将技能正文通通加载进上下文。
若当前任务相关,该技能的主文件正文(第二层信息)才会被完整读入。当技能规模日益扩大,仅用 SKILL.md 已难以承载所有上下文,或部分内容仅在特定场景需要时,可将文件进一步拆分,并在主文件中引用。这些被引用的内容(第三层或更高)会由 Claude 在需要时按需检索调用。
以 PDF 技能为例,其 SKILL.md 会引用 reference.md 与 forms.md。将表单指南分离至 forms.md,既令技能核心保持精炼,也能让 Claude 只在必要时读取相关细节。如此一来,技能可容纳丰富的上下文知识,由 Claude 在需要时主动取用。
渐进式披露设计让 Skills 实现了极高的可扩展性,类似优秀的知识手册,从目录到章节再到附件层层递进。Claude 可每次只加载所需信息,显著减少上下文窗口压力。只要智能体具备文件系统和代码执行工具,技能的打包理论上没有上限。
技能与上下文窗口
流程如下:
- • 初始阶段,Claude 仅含系统提示、全部技能元数据,以及用户初始请求信息;
- • Claude 通过 Bash 工具检索 pdf/SKILL.md,激活 PDF 技能;
- • Claude 判断任务需求,进一步读取 forms.md;
- • 所有相关指令加载完毕后,Claude 开始执行具体任务。
如何使用 Skills
无论是 Anthropic 官方提供的预置 Skills,还是您自己创建的自定义 Skills,使用方式都非常简单。Claude 会根据您的请求自动判断并调用最相关的 Skill。
- • 预置 Agent Skills:Anthropic 提供了一系列开箱即用的 Skill,用于处理 PowerPoint (
pptx)、Excel (xlsx)、Word (docx) 和 PDF (pdf) 等常见任务。所有用户均可在 claude.ai 和 Claude API 中直接使用。 - • 自定义 Skills:您可以将自己组织内部的工作流程、品牌规范或专业知识封装成自定义 Skill。这是实现企业级 AI 自动化的核心。
Skills 的工作机制
Skills 的强大能力根植于其独特的架构——“渐进式披露”(Progressive Disclosure)。这一机制的核心思想是:将文件系统(Filesystem)视为上下文窗口的无限延伸。
Claude 在一个具备文件系统访问权限的虚拟机(VM)环境中运行,Skill 以目录形式存在。Claude 不会在任务开始前就“预读”所有信息,而是像一位人类专家查阅资料一样,按需、分阶段地加载所需内容。
三类 Skill 内容,三级加载机制
一个 Skill 的内容被划分为三个层级,在不同时机被加载,实现了效率与能力的完美平衡。
第一级:元数据 (始终加载)
- • 内容类型:指令。Skill 的 YAML 前置数据是它的“名片”,提供了供 Claude 发现和理解其用途的信息。—
name:PDFProcessing
description:ExtracttextandtablesfromPDFfiles,fillforms,mergedocuments.UsewhenworkingwithPDFfilesorwhentheusermentionsPDFs,forms,ordocumentextraction.
-–
Claude 启动时会加载所有已安装 Skill 的元数据,成本极低(每个约 100 tokens),从而构建一个“能力索引”,知道自己“会什么”以及“何时该用”。
第二级:指令 (触发时加载)
- • 内容类型:指令。当用户的请求与某个 Skill 的描述匹配时,Claude 会通过
bash命令从文件系统中读取SKILL.md文件的正文。这里存放着程序性知识,如工作流程、最佳实践和操作指南。# PDF Processing
## Quick start
Use pdfplumber to extract text from PDFs:
…
For advanced form filling, see [FORMS.md](FORMS.md).
只有在 Skill 被激活时,这部分内容才会进入上下文窗口,作为任务执行的主要依据。
第三级:资源与代码 (按需加载)
- • 内容类型:指令、代码和资源。Skill 可以捆绑额外的材料,如可执行脚本、数据模板、API 文档等。pdf-skill/
├── SKILL.md (main instructions)
├── FORMS.md (form-filling guide)
└── scripts/
└── fill_form.py (utility script)
当指令引用到这些文件时(例如,执行python scripts/fill_form.py),Claude 会通过bash调用它们。关键在于,脚本代码本身永远不会进入上下文窗口,只有脚本的输出结果会返回给 Claude。这使得运行复杂代码的成本极低。
| 级别 | 加载时机 | Token 成本 | 内容 |
| 元数据 | 始终 (启动时) | 每个 Skill 约 100 tokens | name 和 description |
| 指令 | Skill 被触发时 | 通常低于 5k tokens | SKILL.md 的正文,包含指南 |
| 资源与代码 | 按需 | 几乎无限制 | 通过 bash 执行的捆绑文件,其内容不被加载到上下文中 |
Skills 的架构与适用平台
Skills 在一个代码执行环境中运行。Claude 通过 bash 命令与作为文件目录存在的 Skill 进行交互,读取指令、执行脚本。
Skills 可在 Claude 的主要产品中使用,但共享模式和管理方式有所不同:
| 平台 | 支持类型 | 管理与共享 |
| Claude API | 预置 & 自定义 | 自定义 Skill 通过 API 上传,在组织工作区内共享。 |
| Claude Code | 仅自定义 | Skill 作为文件系统目录存在,可以是个人或项目级别,无需 API 上传。 |
| Claude.ai | 预置 & 自定义 | 自定义 Skill 通过设置页面上传 zip 文件,归属于单个用户,不共享。 |
API 集成要点
要在 API 中使用 Skills,您必须在请求头中启用特定的 beta 标志。
|
|
- •
code-execution-2025-08-25: 启用代码执行环境。 - •
files-api-2025-04-14: 授权使用文件上传/下载 API。 - •
skills-2025-10-02: 显式启用 Skills 功能。
当 Skill 生成文件后,您需要使用 Files API 来下载这些文件。这是实现端到端自动化的关键环节。
Skill 的结构与构建
每个 Skill 都必须包含一个 SKILL.md 文件,并带有 YAML 前置数据。
|
|
- •
name: 最多64个字符。 - •
description: 最多1024个字符,应清晰描述 Skill 的功能和适用场景。
要获取完整的创作指南和最佳实践,请参阅最佳实践指南和 Skills Cookbook 中的示例。
安全考量
官方强烈建议只使用来源可信的 Skill(由自己或 Anthropic 创建)。由于 Skill 拥有执行代码的能力,一个恶意的 Skill 可能会引导 Claude 执行非预期的操作,带来数据泄露或系统安全风险。在使用任何第三方 Skill 前,请务必对其包含的所有文件进行彻底审计。
局限与约束
-
• 跨平台可用性: 自定义 Skills 不会在 Claude.ai, API, 和 Claude Code 之间自动同步,您需要在每个希望使用它们的平台上单独管理。
-
• 运行环境限制:
-
• 无网络访问权限:Skill 无法进行外部 API 调用或访问互联网。
-
• 无法在运行时安装包:只能使用预装的软件包。可用软件包列表请参阅代码执行工具的文档。
更多优质信息,请关注!
🔥推荐阅读
对AI的技术乐观与恰当恐惧
只有5%的AI Agent生产可用?
英伟达的AI帝国:投资100+家顶级初创企业
Agents 2.0:从浅循环到深度 Agent
有了AI,你还思考吗?
Workflow vs Agent 构建器,LangChain创始人的思考
OpenAI官方Sora 2 提示词指南
AI:我们时代的信息塑料
gpt-5-codex超越Claude成为最强编程模型
验证的不对称性与验证器法则
「可验证性」是AI编程的极限所在
OpenAI Codex 团队关于AI编程的洞见分享
没有银弹:软件工程的本质与偶然
选择大模型的三个最关键因素
TML:破解LLM推理中的不确定性
以「可读性」框架理解大型软件公司的怪现象
使用AI的术与道
AI入侵文化,人类的想象力将归于何处?
Cline是如何思考上下文工程的?
“心智模型”是人类工程师无法被替代的壁垒
核心员工对OpenAI的思考
我所了解的优秀系统设计(译)
YC创始人:做那些无法规模化的事
什么编程语言更适合Vibe Coding?
AI浏览器的5个使用技巧,效果绝佳
Manus的上下文工程:从构建AI Agent中学到的教训
AK最新演讲:我们处于软件3.0时代
“AI-Ready”是AI提效和转型的前提
Anthropic:多Agent系统比单Agent得分高90%
OpenAI山姆·奥特曼:AI奇点已至
AI原生时代,GUI转向“文本优先”的技术必然性
OpenAI关于人机关系的思考与实践
不要刻舟求剑,关于Vibe Coding的几点感想
写作即思考,YC创始人对“好文笔”的思考
AI的下半场:从解决问题到定义问题
谷歌:欢迎来到AI的经验时代
没有prompt,一切都是上下文?
如何用好AI大模型:苏格拉底式提问法
#AI #大模型 #Agent #智能体 #openai #anthropic #codex #claude
- 原文作者:知识铺
- 原文链接:https://index.zshipu.com/geek002/post/202510/Claude%E6%8E%A8%E5%87%BAAgent-Skills-%E4%B8%8A%E4%B8%8B%E6%96%87%E5%B7%A5%E7%A8%8B%E7%9A%84%E4%BC%98%E9%9B%85%E5%AE%9E%E8%B7%B5-%E7%9F%A5%E4%B9%8E/
- 版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议进行许可,非商业转载请注明出处(作者,原文链接),商业转载请联系作者获得授权。
- 免责声明:本页面内容均来源于站内编辑发布,部分信息来源互联网,并不意味着本站赞同其观点或者证实其内容的真实性,如涉及版权等问题,请立即联系客服进行更改或删除,保证您的合法权益。转载请注明来源,欢迎对文章中的引用来源进行考证,欢迎指出任何有错误或不够清晰的表达。也可以邮件至 sblig@126.com