Skills 真香，但非Claude模型怎么办？ --知识铺

AI训练营7期，1月下旬开班，欢迎咨询

关于什么是Skills，我们在之前的文章已经有过详细介绍，他是Anthropic在Claude模型中引入的一种新机制，可以理解为一组封装好的技能包。

每个技能包包含：说明文档、脚本和资源。Claude 在需要时会动态加载相应技能，以提高模型在特定任务上的一致性和表现。

与传统一次性提示不同，Skills 采用按需的逐步迭代加载机制：当用户提出请求时，Claude 会扫描所有可用技能，根据语义匹配自动选择相关技能，并仅加载完成任务所需的指令和资源。整体流程如图所示：

总的来说，Skills 从工程实践出发，显著改善了 Agent 在调用工具方面面临的诸多痛点：

一、工具调用准确性提升

传统 Agent 如果不做工程层面的主动优化，往往一次性注册大量工具接口，这会导致模型容易混淆相似的工具名称或参数，从而出现调用错误。

Skills 引入语义过滤和专用技能包，让模型每次仅关注当前任务相关的少数工具或指令，从源头上减少歧义，结果是整个工具调用准确率上来了。

只不过，技能如果多了后，其中一定会碰到类似的skill，之前Tools意图识别的问题，也有可能再发生。

二、流程一致性

每个 Skill 都以明确的SOP定义任务步骤和内部逻辑，使模型按照既定流程执行，减少自由发挥带来的偏差，这相当于将 Workflow 从代码挪到了提示词，或者Skill。

instructions通常包含多轮交互的步骤拆解、错误检查和决策条件，这种结构化流程让复杂任务的执行更加可靠；

同时，Skills 还能通过上下文隔离来提高稳健性：不同skill各司其职，互不干扰，某一步的错误不易“传染”到整个对话流程.

三、提示词的可维护性

在之前，提示词膨胀其实是个很烦的工程问题，有了 Skills，开发者无需将所有可能的指令和规则预先写入一个庞大的系统提示中。

取而代之的是，将知识和流程按场景拆分到独立skill中，只有在相关任务时才动态加载。这种模块化按需加载既节省了上下文，又使提示词的维护更简单，新增或修改某项流程只需更新对应的skill文件即可，而不用到处去烦躁代码中的提示词。

这里与第二点一样，如果skill过多，依旧会有新的工程维护问题。

综上：Skills 通过封装SOP+按需加载的工程方式，使 AI Agent 的工具使用更加精准、维护成本更低了。

只不过，前面也说了如果skill数量过多，依然会产生新的维护工程问题；另一方面当前很多模型还不支持Skills，所以我们今天简单用代码模拟实现，这样可以让大家更清楚两点：

第一，Skills真的是一种针对Agent的工程优化；
第二，为什么skill数量过多依旧会产生工程维护问题；

OpenAI如何使用Skills

Claude Skills 给人的体验提升，来自三件工程化的事：

**skill资产化：**SOP/规则/话术不再散落在 Prompt 里，而是变成可版本化的文件资产；
**先选再加载：**先路由到相关 Skill，再把这个 Skill 的指令加载进上下文；
**在 Skill 内约束工具使用：**让模型按 SOP 使用工具，减少乱调用、漏调用、乱序；

如果要自己实现简单的Skills，至少需要考虑上述场景。

一、Skills 怎么定义

整体结构设计完全照抄：

<span data-cacheurl="" data-remoteid="" data-lazy-bgimg="https://mmbiz.qpic.cn/mmbiz_svg/lpHDr05YrIRhPZ1nm0TkXOadewbqxqWbz7icbyKtQx8WWdxfdFYrxuxGA6an6xlNhYTKT4YKh9BiadT3jBzUExOuljz2CY9nCic/640?wx_fmt=svg&amp;from=appmsg" data-fail="0"><span leaf="">skills/<span leaf="">  
<span leaf="">  expense_reimbursement/<span leaf="">  
<span leaf="">    skill.json<span leaf="">  
<span leaf="">    instructions.md<span leaf="">  
<span leaf="">    examples.md        <span leaf=""># 可选<span leaf="">  
<span leaf="">    validators.py      <span leaf=""># 可选：结果校验/兜底<span leaf="">

skill.json，用于路由与治理：

<span data-cacheurl="" data-remoteid="" data-lazy-bgimg="https://mmbiz.qpic.cn/mmbiz_svg/lpHDr05YrIRhPZ1nm0TkXOadewbqxqWbz7icbyKtQx8WWdxfdFYrxuxGA6an6xlNhYTKT4YKh9BiadT3jBzUExOuljz2CY9nCic/640?wx_fmt=svg&amp;from=appmsg" data-fail="0"><span leaf="">{<span leaf="">  
<span leaf="">  <span leaf="">"name"<span leaf="">: <span leaf="">"expense_reimbursement"<span leaf="">,<span leaf="">  
<span leaf="">  <span leaf="">"version"<span leaf="">: <span leaf="">"1.2.0"<span leaf="">,<span leaf="">  
<span leaf="">  <span leaf="">"description"<span leaf="">: <span leaf="">"查询员工差旅/报销数据，支持按项目拆分，输出财务口径总结"<span leaf="">,<span leaf="">  
<span leaf="">  <span leaf="">"tools"<span leaf="">: [<span leaf="">"get_employee_info"<span leaf="">, <span leaf="">"query_reimbursements"<span leaf="">, <span leaf="">"analyze_reimbursement_data"<span leaf="">],<span leaf="">  
<span leaf="">  <span leaf="">"owner"<span leaf="">: <span leaf="">"finance-ai-team"<span leaf="">,<span leaf="">  
<span leaf="">  <span leaf="">"risk_level"<span leaf="">: <span leaf="">"internal"<span leaf="">  
<span leaf="">}<span leaf="">

instructions.md。核心：SOP + 工具使用说明

<span data-cacheurl="" data-remoteid="" data-lazy-bgimg="https://mmbiz.qpic.cn/mmbiz_svg/lpHDr05YrIRhPZ1nm0TkXOadewbqxqWbz7icbyKtQx8WWdxfdFYrxuxGA6an6xlNhYTKT4YKh9BiadT3jBzUExOuljz2CY9nCic/640?wx_fmt=svg&amp;from=appmsg" data-fail="0"><span leaf="">触发条件：当用户提到“报销/差旅/项目拆分/财务口径”<span leaf="">  
<span leaf="">步骤：<span leaf="">  
<span leaf="">解析员工与时间范围（必要时追问补槽）<span leaf="">  
<span leaf="">调 get_employee_info<span leaf="">  
<span leaf="">调 query_reimbursements<span leaf="">  
<span leaf="">若用户要求拆分，则调 analyze_reimbursement_data(group_by=<span leaf="">"project"<span leaf="">)<span leaf="">  
<span leaf="">输出格式：一句话结论 + 关键数字 + 风险提示<span leaf="">

至此，已经把“Workflow 从代码搬到了 Skill 里了”。基本配置整理结束，就需要准备全局架构了：

二、全局架构

全局架构的话，依旧是模拟Claude做实现，可以分拆为四个模块：

**Skill Registry：**加载 skills/ 目录，得到所有 skill 元数据与 SOP 文档；
**Skill Router：**根据用户问题，从技能库里选最合适的skill
**Skill Loader：**把选中的 SOP 注入系统；
**Agent Executor：**用 OpenAI Function Calling 调工具，按 SOP 走完整流程；

这里的关键点是Router 与 Executor 分离

**Router：**用便宜模型/小调用做“分类/路由”
**Executor：**用主模型做“推理 + 工具调用 + 生成”

这是工程上把延迟与成本压下来的常用做法，很多真实生产系统都是这样在玩。我们这里没可能全部做实现，就给大家展示下最小伪代码即可：

三、最小伪实现

首先是Skill Registry模块代码大概长这样：

<span data-cacheurl="" data-remoteid="" data-lazy-bgimg="https://mmbiz.qpic.cn/mmbiz_svg/lpHDr05YrIRhPZ1nm0TkXOadewbqxqWbz7icbyKtQx8WWdxfdFYrxuxGA6an6xlNhYTKT4YKh9BiadT3jBzUExOuljz2CY9nCic/640?wx_fmt=svg&amp;from=appmsg" data-fail="0"><span leaf="">def load_skill_registry():<span leaf="">  
<span leaf="">  skills = []<span leaf="">  
<span leaf="">  <span leaf="">for<span leaf=""> folder <span leaf="">in<span leaf=""> list_folders(<span leaf="">"skills/"<span leaf="">):<span leaf="">  
<span leaf="">    meta = read_json(f<span leaf="">"{folder}/skill.json"<span leaf="">)<span leaf="">  
<span leaf="">    sop  = read_text(f<span leaf="">"{folder}/instructions.md"<span leaf="">)<span leaf="">  
<span leaf="">    skills.append({**meta, <span leaf="">"sop"<span leaf="">: sop})<span leaf="">  
<span leaf="">  <span leaf="">return<span leaf=""> skills<span leaf="">

再然后就是最为关键的“意图识别”，选择加载了，这里可以做得很粗暴，但你不想粗暴也没太好办法，这里很依赖模型能力就是了：

<span data-cacheurl="" data-remoteid="" data-lazy-bgimg="https://mmbiz.qpic.cn/mmbiz_svg/lpHDr05YrIRhPZ1nm0TkXOadewbqxqWbz7icbyKtQx8WWdxfdFYrxuxGA6an6xlNhYTKT4YKh9BiadT3jBzUExOuljz2CY9nCic/640?wx_fmt=svg&amp;from=appmsg" data-fail="0"><span leaf="">skill_cards = [{<span leaf="">"name"<span leaf="">: s[<span leaf="">"name"<span leaf="">], <span leaf="">"desc"<span leaf="">: s[<span leaf="">"description"<span leaf="">]} <span leaf="">for<span leaf=""> s <span leaf="">in<span leaf=""> skills]<span leaf="">  
<span leaf="">prompt = f<span leaf="">""<span leaf="">"<span leaf="">  
<span leaf="">你是技能路由器。根据用户问题，从技能列表中选择最相关的1-2个技能。<span leaf="">  
<span leaf="">只输出JSON：{{"<span leaf="">skills<span leaf="">":["<span leaf="">...<span leaf="">"]}}，如果没有合适技能输出{{"<span leaf="">skills<span leaf="">":[]}}。<span leaf="">  
<span leaf="">用户问题：{user_query}<span leaf="">  
<span leaf="">技能列表：{skill_cards}<span leaf="">  
<span leaf="">"<span leaf="">""<span leaf="">  
<span leaf="">r = openai_chat(model=<span leaf="">"gpt"<span leaf="">, messages=[{<span leaf="">"role"<span leaf="">:<span leaf="">"user"<span leaf="">,<span leaf="">"content"<span leaf="">:prompt}])<span leaf="">  
<span leaf="">return<span leaf=""> parse_json(r)[<span leaf="">"skills"<span leaf="">]<span leaf="">

再接下来，就只需要将完整的skill目录加载即可：

<span data-cacheurl="" data-remoteid="" data-lazy-bgimg="https://mmbiz.qpic.cn/mmbiz_svg/lpHDr05YrIRhPZ1nm0TkXOadewbqxqWbz7icbyKtQx8WWdxfdFYrxuxGA6an6xlNhYTKT4YKh9BiadT3jBzUExOuljz2CY9nCic/640?wx_fmt=svg&amp;from=appmsg" data-fail="0"><span leaf="">blocks = []<span leaf="">  
<span leaf="">for<span leaf=""> name <span leaf="">in<span leaf=""> selected_names:<span leaf="">  
<span leaf="">  s = find_skill(skills, name)<span leaf="">  
<span leaf="">  blocks.append(f<span leaf="">""<span leaf="">"<span leaf="">  
<span leaf=""># Skill: {s['name']} v{s['version']}<span leaf="">  
<span leaf="">适用范围：{s['description']}<span leaf="">  
<span leaf="">必须遵循的SOP：<span leaf="">  
<span leaf="">{s['sop']}<span leaf="">  
<span leaf="">"<span leaf="">""<span leaf="">)<span leaf="">  
<span leaf="">return<span leaf=""> <span leaf="">"\n\n"<span leaf="">.join(blocks) or <span leaf="">"你是通用企业助手，如无明确技能则保持谨慎，必要时追问。"<span leaf="">

最后一步是只加载需要的Tools，这也是为什么我们说Skills是在做Tools的工程优化：

<span data-cacheurl="" data-remoteid="" data-lazy-bgimg="https://mmbiz.qpic.cn/mmbiz_svg/lpHDr05YrIRhPZ1nm0TkXOadewbqxqWbz7icbyKtQx8WWdxfdFYrxuxGA6an6xlNhYTKT4YKh9BiadT3jBzUExOuljz2CY9nCic/640?wx_fmt=svg&amp;from=appmsg" data-fail="0"><span leaf="">skills = load_skill_registry()<span leaf="">  
<span leaf="">selected = route_skills(user_query, skills)<span leaf="">  
<span leaf="">system_prompt = build_system_prompt(selected, skills)<span leaf="">  
<span leaf="">allowed_tools = collect_tools_from_selected(selected, skills)  <span leaf=""># 关键：只给相关工具<span leaf="">  
<span leaf="">tools_schema  = build_openai_tools_schema(allowed_tools)<span leaf="">  
<span leaf="">messages = [<span leaf="">  
<span leaf="">  {<span leaf="">"role"<span leaf="">:<span leaf="">"system"<span leaf="">, <span leaf="">"content"<span leaf="">: system_prompt},<span leaf="">  
<span leaf="">  {<span leaf="">"role"<span leaf="">:<span leaf="">"user"<span leaf="">, <span leaf="">"content"<span leaf="">: user_query}<span leaf="">  
<span leaf="">]<span leaf="">  
<span leaf="">while<span leaf=""> True:<span leaf="">  
<span leaf="">  resp = openai_chat(model=<span leaf="">"gpt"<span leaf="">, messages=messages, tools=tools_schema)<span leaf="">  
<span leaf="">if<span leaf=""> resp.is_tool_call:<span leaf="">  
<span leaf="">    result = run_tool(resp.tool_name, resp.arguments)  <span leaf=""># 外部执行<span leaf="">  
<span leaf="">    messages.append(resp.as_assistant_message())       <span leaf=""># 记录tool_call<span leaf="">  
<span leaf="">    messages.append({<span leaf="">"role"<span leaf="">:<span leaf="">"tool"<span leaf="">,<span leaf="">"name"<span leaf="">:resp.tool_name,<span leaf="">"content"<span leaf="">:json.dumps(result)})<span leaf="">  
<span leaf="">    <span leaf="">continue<span leaf="">  
<span leaf="">return<span leaf=""> resp.content<span leaf="">

到这里，你已经在 OpenAI 上做出了一套 Claude Skills 的核心机制…