| 知识铺的博客

Claude刚刚推出了Agent Skills，官方定义是：所谓 Agent Skills，是指可供Agent 动态识别、按需加载的一组结构化指令、脚本和资源目录。通过技能的打包，Claude 能按需转变为满足各类场景需求的“定制专家”，显著提升处理专用场景的效率。对 Claude 而言，安装一个技能就如同一位新员工获得了详实的入职手册。用户无需为每一个具体需求开发高度碎片化的定制Agent，而是可通过捕捉和共享流程知识，以可组合形式动态赋能。

Agent Skills 实质包含了两个部分：自动化的上下文工程（推荐阅读：没有prompt，一切都是上下文？）、自定义工具。 上下文工程主要体现为领域知识，自定义工具既包括了自己开发的脚本、结构化指令，也包括Anthropic预置的、开箱即用的Skill技能包。可以确定的是，很快会有更多官方和第三方开源的Skills技能包可以复用，但需注意安全问题。

Agent Skills 是一种模块化的能力单元，旨在扩展 Claude 的功能边界。每一项 Skill 都如同一个预先封装的“专业知识包”，其中包含了指令、元数据以及可选的脚本和资源。当用户提出相关请求时，Claude 能够自动发现并调用这些 Skill，从而精准、可靠地完成任务。

为何需要 Skills？

传统的提示工程（Prompt Engineering）在处理一次性任务时非常有效，但面对需要多步骤、遵循特定流程且需反复执行的复杂任务时，其局限性便显现出来。我们无法在每次对话中都塞入冗长的操作手册，这不仅效率低下，也极大地消耗了宝贵的上下文窗口。

Skills 的诞生正是为了解决这一根本性挑战。它将可复用的、基于文件系统的资源与 Claude 的执行能力相结合，为 Claude 注入领域专家的知识，从而将一个通用型 Agent 转变为能够应对真实世界挑战的专家。

其核心优势包括：

• 专精化 Claude：将领域知识（如工作流程、品牌指南、分析方法）固化，为特定任务深度定制 Claude 的能力。
• 减少重复：一次创建，自动复用。避免在不同对话中反复提供相同的指导。
• 组合能力：融合多种 Skill，构建从数据提取、分析到报告生成的端到端复杂工作流。
• 提升可靠性：通过将确定性操作封装为代码，极大降低了 AI 的不确定性，确保任务执行的高保真度。

Agent Skills 结构详解

以实际案例为例，Claude 最近新增的文档编辑能力即由技能机制提供支持。尽管 Claude 能理解 PDF，但在表单处理等任务上仍面临局限。通过PDF 技能，Claude 获得了直接处理 PDF 表单的能力。

最基础的技能，仅需包含一个 SKILL.md 文件。该文件必须以 YAML 格式元数据开头，标明 name（名称）和 description（描述）。在初始化时，所有已安装技能的元数据会被自动加载进 Claude 的系统提示。元数据构成了**渐进式披露（progressive disclosure）**的第一层——即仅用以判断是否应激活本技能，无需将技能正文通通加载进上下文。

若当前任务相关，该技能的主文件正文（第二层信息）才会被完整读入。当技能规模日益扩大，仅用 SKILL.md 已难以承载所有上下文，或部分内容仅在特定场景需要时，可将文件进一步拆分，并在主文件中引用。这些被引用的内容（第三层或更高）会由 Claude 在需要时按需检索调用。

以 PDF 技能为例，其 SKILL.md 会引用 reference.md 与 forms.md。将表单指南分离至 forms.md，既令技能核心保持精炼，也能让 Claude 只在必要时读取相关细节。如此一来，技能可容纳丰富的上下文知识，由 Claude 在需要时主动取用。

渐进式披露设计让 Skills 实现了极高的可扩展性，类似优秀的知识手册，从目录到章节再到附件层层递进。Claude 可每次只加载所需信息，显著减少上下文窗口压力。只要智能体具备文件系统和代码执行工具，技能的打包理论上没有上限。

技能与上下文窗口

流程如下：

• 初始阶段，Claude 仅含系统提示、全部技能元数据，以及用户初始请求信息；
• Claude 通过 Bash 工具检索 pdf/SKILL.md，激活 PDF 技能；
• Claude 判断任务需求，进一步读取 forms.md；
• 所有相关指令加载完毕后，Claude 开始执行具体任务。

如何使用 Skills

无论是 Anthropic 官方提供的预置 Skills，还是您自己创建的自定义 Skills，使用方式都非常简单。Claude 会根据您的请求自动判断并调用最相关的 Skill。

• 预置 Agent Skills：Anthropic 提供了一系列开箱即用的 Skill，用于处理 PowerPoint (pptx)、Excel (xlsx)、Word (docx) 和 PDF (pdf) 等常见任务。所有用户均可在 claude.ai 和 Claude API 中直接使用。
• 自定义 Skills：您可以将自己组织内部的工作流程、品牌规范或专业知识封装成自定义 Skill。这是实现企业级 AI 自动化的核心。

Skills 的工作机制

Skills 的强大能力根植于其独特的架构——“渐进式披露”（Progressive Disclosure）。这一机制的核心思想是：将文件系统（Filesystem）视为上下文窗口的无限延伸。

Claude 在一个具备文件系统访问权限的虚拟机（VM）环境中运行，Skill 以目录形式存在。Claude 不会在任务开始前就“预读”所有信息，而是像一位人类专家查阅资料一样，按需、分阶段地加载所需内容。

三类 Skill 内容，三级加载机制

一个 Skill 的内容被划分为三个层级，在不同时机被加载，实现了效率与能力的完美平衡。

第一级：元数据 (始终加载)

• 内容类型：指令。Skill 的 YAML 前置数据是它的“名片”，提供了供 Claude 发现和理解其用途的信息。—
name:PDFProcessing
description:ExtracttextandtablesfromPDFfiles,fillforms,mergedocuments.UsewhenworkingwithPDFfilesorwhentheusermentionsPDFs,forms,ordocumentextraction.
-–
Claude 启动时会加载所有已安装 Skill 的元数据，成本极低（每个约 100 tokens），从而构建一个“能力索引”，知道自己“会什么”以及“何时该用”。

第二级：指令 (触发时加载)

• 内容类型：指令。当用户的请求与某个 Skill 的描述匹配时，Claude 会通过 bash 命令从文件系统中读取 SKILL.md 文件的正文。这里存放着程序性知识，如工作流程、最佳实践和操作指南。# PDF Processing
## Quick start
Use pdfplumber to extract text from PDFs:
…
For advanced form filling, see [FORMS.md](FORMS.md).
只有在 Skill 被激活时，这部分内容才会进入上下文窗口，作为任务执行的主要依据。

第三级：资源与代码 (按需加载)

• 内容类型：指令、代码和资源。Skill 可以捆绑额外的材料，如可执行脚本、数据模板、API 文档等。pdf-skill/
├── SKILL.md (main instructions)
├── FORMS.md (form-filling guide)
└── scripts/
└── fill_form.py (utility script)
当指令引用到这些文件时（例如，执行 python scripts/fill_form.py），Claude 会通过 bash 调用它们。关键在于，脚本代码本身永远不会进入上下文窗口，只有脚本的输出结果会返回给 Claude。这使得运行复杂代码的成本极低。

级别	加载时机	Token 成本	内容
元数据	始终 (启动时)	每个 Skill 约 100 tokens	name 和 description
指令	Skill 被触发时	通常低于 5k tokens	SKILL.md 的正文，包含指南
资源与代码	按需	几乎无限制	通过 bash 执行的捆绑文件，其内容不被加载到上下文中

Skills 的架构与适用平台

Skills 在一个代码执行环境中运行。Claude 通过 bash 命令与作为文件目录存在的 Skill 进行交互，读取指令、执行脚本。

Skills 可在 Claude 的主要产品中使用，但共享模式和管理方式有所不同：

平台	支持类型	管理与共享
Claude API	预置 & 自定义	自定义 Skill 通过 API 上传，在组织工作区内共享。
Claude Code	仅自定义	Skill 作为文件系统目录存在，可以是个人或项目级别，无需 API 上传。
Claude.ai	预置 & 自定义	自定义 Skill 通过设置页面上传 zip 文件，归属于单个用户，不共享。

API 集成要点

要在 API 中使用 Skills，您必须在请求头中启用特定的 beta 标志。

1

from anthropic import Anthropic client = Anthropic( api_key="YOUR_API_KEY", default_headers={ "anthropic-beta": "code-execution-2025-08-25,files-api-2025-04-14,skills-2025-10-02" } )

• code-execution-2025-08-25: 启用代码执行环境。
• files-api-2025-04-14: 授权使用文件上传/下载 API。
• skills-2025-10-02: 显式启用 Skills 功能。

当 Skill 生成文件后，您需要使用 Files API 来下载这些文件。这是实现端到端自动化的关键环节。

Skill 的结构与构建

每个 Skill 都必须包含一个 SKILL.md 文件，并带有 YAML 前置数据。

1

--- name:YourSkillName description:BriefdescriptionofwhatthisSkilldoesandwhentouseit --- # Your Skill Name ## Instructions [ Clear, step-by-stepguidanceforClaudetofollow ] ## Examples [ ConcreteexamplesofusingthisSkill ]

• name: 最多64个字符。
• description: 最多1024个字符，应清晰描述 Skill 的功能和适用场景。

要获取完整的创作指南和最佳实践，请参阅最佳实践指南和 Skills Cookbook 中的示例。

安全考量

官方强烈建议只使用来源可信的 Skill（由自己或 Anthropic 创建）。由于 Skill 拥有执行代码的能力，一个恶意的 Skill 可能会引导 Claude 执行非预期的操作，带来数据泄露或系统安全风险。在使用任何第三方 Skill 前，请务必对其包含的所有文件进行彻底审计。

局限与约束

• 跨平台可用性: 自定义 Skills 不会在 Claude.ai, API, 和 Claude Code 之间自动同步，您需要在每个希望使用它们的平台上单独管理。
• 运行环境限制:
• 无网络访问权限：Skill 无法进行外部 API 调用或访问互联网。
• 无法在运行时安装包：只能使用预装的软件包。可用软件包列表请参阅代码执行工具的文档。

更多优质信息，请关注！

🔥推荐阅读

对AI的技术乐观与恰当恐惧

只有5%的AI Agent生产可用？

英伟达的AI帝国：投资100+家顶级初创企业

Agents 2.0：从浅循环到深度 Agent

有了AI，你还思考吗？

Workflow vs Agent 构建器，LangChain创始人的思考

OpenAI官方Sora 2 提示词指南

AI：我们时代的信息塑料

gpt-5-codex超越Claude成为最强编程模型

验证的不对称性与验证器法则

「可验证性」是AI编程的极限所在

OpenAI Codex 团队关于AI编程的洞见分享

没有银弹：软件工程的本质与偶然

选择大模型的三个最关键因素

TML：破解LLM推理中的不确定性

以「可读性」框架理解大型软件公司的怪现象

使用AI的术与道

AI入侵文化，人类的想象力将归于何处？

Cline是如何思考上下文工程的？

“心智模型”是人类工程师无法被替代的壁垒

核心员工对OpenAI的思考

我所了解的优秀系统设计（译）

YC创始人：做那些无法规模化的事

什么编程语言更适合Vibe Coding？

AI浏览器的5个使用技巧，效果绝佳

Manus的上下文工程：从构建AI Agent中学到的教训

AK最新演讲：我们处于软件3.0时代

“AI-Ready”是AI提效和转型的前提

Anthropic：多Agent系统比单Agent得分高90%

OpenAI山姆·奥特曼：AI奇点已至

AI原生时代，GUI转向“文本优先”的技术必然性

OpenAI关于人机关系的思考与实践

不要刻舟求剑，关于Vibe Coding的几点感想

写作即思考，YC创始人对“好文笔”的思考

AI的下半场：从解决问题到定义问题

谷歌：欢迎来到AI的经验时代

没有prompt，一切都是上下文？

如何用好AI大模型：苏格拉底式提问法

#AI #大模型 #Agent #智能体 #openai #anthropic #codex #claude

文章目录