本文把目前主流 agent 框架进行快速对比,关注它们各自的:

  • 基本思想
  • 技术风格
  • 定位
  • 成熟度与
  • 关注度(含业界背书)

涉及的 agent 框架:

  1. LangGraph,
  2. PydanticAI,
  3. Semantic Kernel,
  4. AutoGen,
  5. CrewAI,
  6. Langroid,
  7. CAMEL,
  8. smolagents,
  9. Swarm,
  10. LlamaIndex Agents,
  11. Haystack Agents,
  12. AutoGPT,
  13. SuperAGI,
  14. AGiXT,
  15. BabyAGI,
  16. MetaGPT, A
  17. gentVerse

一、先给选型结论

  • 要可控、可观测、可上线:首推 LangGraph(编排/持久化/调试/人-在-环),可与 PydanticAI(强类型与校验)组合;如果你在微软生态,Semantic Kernel Agent Framework 也很稳。
  • 要多智能体“团队协作/对话式协同”:看 AutoGen(微软系、多智能体会话、生态工具齐全)、CrewAI(“crew/role/task”范式,上手快,社区活跃)、Langroid(学术派、Actor 风格消息传递)。
  • 要做“角色扮演/仿真/社会学或行为研究”CAMEL(角色扮演与“缩放定律”社区)与 AgentVerse/MetaGPT(多角色 SOP/仿真)更合适。
  • 要极简原型/教学或小巧可嵌smolagents(Hugging Face,千行左右代码,简单直接)、OpenAI Swarm(教育性质的多 Agent 交接范式),若需持久化可看 DurableSwarm
  • 老牌“自主代理”与平台AutoGPT / SuperAGI / AGiXT 提供持续运行与插件/工具生态,但生产稳定性与工程化支持相对弱于上面几家编排框架。
  • RAG/检索 + Agent 统一:做文档/知识工作流优先时,LlamaIndex AgentsHaystack Agents 更顺手。
  • 官方 API 侧的“Agent 能力”:OpenAI Responses API + Agents SDK 新一代官方路径(逐步替代 Assistants API),适合作为底座/工具层与上面编排框架组合。

二、核心理念与技术风格(通俗版)

1) “编排/状态机”派:把 Agent 当流程来建

  • LangGraph:用有向图(Graph)建可恢复、可回放、可插人类反馈的长流程;强调可控性与可观测性。适合你把 Agent 视为业务编排而非“神秘黑箱”。
  • Semantic Kernel Agent Framework:在 SK 生态里提供 Agent/Planner 能力,承接 .NET/JS/Python 企业开发的工程化需求。
  • PydanticAI:把 “强类型+验证/Guardrails” 的 Pydantic 思想带入 Agent,输入输出都“可验可断言”,工程师体验像写 FastAPI。可与任何编排(如 LangGraph)搭配。

2) “多智能体对话/团队”派:把 Agent 当角色来搭

  • AutoGen:一切围绕多智能体对话(Agent 彼此聊),从对话模式就能表达协作/评审/循环改进;配套 AutoGen Studio/Bench
  • CrewAI:把系统抽象为 “Crew(团队)-Role(角色)-Task(任务)”,YAML/CLI 体验友好,上手极快。AWS 也写了选型指南。
  • Langroid:学术派,多 Agent 消息传递范式(Actor 思想),代码简洁可控。
  • CAMEL:**角色扮演(role-playing)**与“社会化”研究起家,适合仿真/数据合成/行为研究。

3) “极简/实验”派:把 Agent 当可插积木

  • smolagents千来行的极简库,强调“写代码即推理”(actions in code),很好嵌入现有工程。
  • OpenAI Swarm / DurableSwarm:面向模式探索/教育的多 Agent 交接与“轻编排”,Durable 版补上持久/重试

4) “RAG+Agent 合一

  • LlamaIndex AgentsHaystack Agents 均把检索/索引/评估与 Agent 循环打通,适合保险理赔、知识抽取、问答流等文档流程。 (

5) “持续自主”与平台

  • AutoGPT / SuperAGI / AGiXT:强调“持续运行”与插件/工具生态,擅长自动化脚本、看板与可视化,但流程确定性与调试体验相对不足。

三、逐一点评(含定位、成熟度、关注度)

注:关注度以GitHub/论文/大厂背书/官方文档等综合评估,非单一指标。

LangGraph(LangChain 团队)

  • 定位:面向生产的状态化编排框架;Python/JS 双栈,Studio/Server/Platform 一体。
  • 技术风格图/DAG 控制流 + 可恢复执行 + 人-在-环;LangChain 新代理栈已全面基于 LangGraph
  • 成熟度:文档完善、企业采纳(页面列举 Klarna、Replit、Elastic 等);配套可视化 IDE、部署与观测。
  • 关注/推崇:社区将其视作“可靠 Agent 的地基”。

AutoGen(Microsoft)

  • 定位多智能体会话与协作的“通用底座”。
  • 技术风格:Agent 以对话对象呈现;支持人类参与工具调用事件驱动 0.4 架构;配 AutoGen Studio/Bench
  • 成熟度:学术论文、教程/样例完整,活跃维护。
  • 关注/推崇:微软系强背书,研究/工业两端都有大量示例与引用。

PydanticAI(Pydantic 官方)

  • 定位强类型/可验证的 Agent 运行时,“像写 FastAPI 一样写 Agent”。
  • 技术风格:模型/工具/上下文全部类型标注,自带测试/假模型等;与 Logfire 生态衔接。
  • 成熟度:发布后增长迅速,API 与文档清晰。
  • 关注/推崇:Python 工程师友好度高,与 LangGraph 组合可同时拿到“强类型 + 编排”。

Agno

  • 定位高性能多智能体运行时(会话管理、记忆、知识、MCP、团队协作)。
  • 技术风格:主打性能与云部署,配套 Agent UI 与模板。
  • 成熟度:快速演进中,生态(模板/示例)在扩充。
  • 关注/推崇:近月 Stars/讨论热度攀升,开发者使用案例增多。

CrewAI

  • 定位“crew/role/task” 的团队自动化框架;上手容易。
  • 技术风格:YAML/CLI + 工具库,多 Agent 协作流程清晰。
  • 成熟度:文档/工具生态齐全;有 AWS 指南背书。
  • 关注/推崇:教程/案例多、社区活跃(Studio/awesome 列表等)。

CAMEL(社区/研究)

  • 定位角色扮演、多智能体社会研究与数据生成。
  • 技术风格:以“role-playing + inception prompting”驱动多 Agent 协作;同时运营社区与产品(如 Eigent)。
  • 成熟度:论文/开源/网站三位一体,长期维护。
  • 关注/推崇:NeurIPS 收录、学界引用广;在仿真/评测/数据合成受欢迎。 (arXiv)

Langroid

  • 定位轻量/原则先行的多智能体编程框架(CMU & UW 学术背景)。
  • 技术风格Actor/消息传递范式;文档、样例齐全。
  • 成熟度:持续更新,适合科研到工程的过渡。
  • 关注/推崇:在学术/工程交叉圈有口碑。

LlamaIndex Agents

  • 定位文档/RAG 工作流里的 Agent(FunctionAgent/ReActAgent)。
  • 技术风格:索引/检索/工作流与 Agent 一体;适合保单理赔等结构化抽取场景。
  • 成熟度:商业案例与博客示例丰富。
  • 关注/推崇:做知识密集任务的团队偏爱。

Haystack Agents(deepset)

  • 定位生产级 RAG 管线 + 循环式 Agent 组件。
  • 技术风格:工具选择/状态校验/退出条件明确;提供 Provider 无关的 ChatModel 支持。
  • 成熟度:多版本迭代、企业生产落地多。
  • 关注/推崇:在检索与问答系统圈层口碑稳定。

Semantic Kernel Agent Framework(Microsoft)

  • 定位:微软 SK 生态里的 Agent 平台;Planner/Function-calling 统一。
  • 技术风格:靠近企业栈(.NET/TS),示例多,学习成本低。
  • 成熟度:官方文档与社区文章完整。
  • 关注/推崇:微软开发者社区与 .NET 阵营推崇。

smolagents(Hugging Face)

  • 定位极简 Agent 库,便于内嵌到现有工程。
  • 技术风格:强调“代码即推理动作”,课程/教程体系完善。
  • 成熟度:轻量但文档、课程齐全。
  • 关注/推崇:教育/快速实验领域受欢迎。

OpenAI Swarm / DurableSwarm

  • 定位教育/范式探索的轻量多 Agent 模式;DurableSwarm 补齐长程与可靠性
  • 技术风格:极简、可手搓 Agent 交接/路由模式。
  • 成熟度:官方定位为“教育性”;Durable 扩展适配生产刚需。
  • 关注/推崇:开发者圈用于理解与对比多 Agent 模式。

AutoGPT / SuperAGI / AGiXT(持续自主 & 可视化)

  • 定位:长时间运行的自主代理平台,自带插件/工具/仪表盘。
  • 技术风格:强调自动化与持续执行,早期爆红,但确定性与成本控制是常见痛点。
  • 成熟度:社区大、分支多;工程化闭环需自行加固。
  • 关注/推崇:大众传播度高(AutoGPT),但企业生产常转向 LangGraph/AutoGen 等。

MetaGPT / AgentVerse(仿真/多角色 SOP)

  • 定位:把“软件公司 SOP”或“多角色协作”固化为流程与代码。
  • 技术风格:角色明确、文档与论文(ICLR 2024)背书。
  • 成熟度:持续更新,适合研究/教学/原型流程自动化结合。
  • 关注/推崇:研究与开源圈热度高。

四、怎么选:结合你的常见需求

  • 你要做可控的“生产”和可追溯的科学实验LangGraph(编排/回放/中断恢复/多 Agent 图)+ PydanticAI(强类型与校验)是当前工程最佳实践组合;在 Azure/.NET 体系可叠 Semantic Kernel
  • 你要“多角色协作 + 人在环 + 智能体互评迭代”:选 AutoGenCrewAI,前者研究/企业两头强,后者上手快、生态丰富。
  • 你要“仿真/行为研究/合成数据”CAMEL/AgentVerse/MetaGPT
  • 你要“知识工作流/文档自动化”LlamaIndex AgentsHaystack Agents 优先。
  • 想快速打样/教学smolagentsOpenAI Swarm;要稳一点的长程执行可看 DurableSwarm
  • 只用官方 API 构建:走 OpenAI Responses API + Agents SDK 路线,必要时在外层再接 LangGraph/PydanticAI。

五、注意的坑与趋势

  • 可靠性与成本:早期“全自治”代理(如 AutoGPT)常循环/幻觉/高费用;工程化落地更偏向**“可控编排 + 适度自治 + 明确退出条件”**。
  • 平台级趋势:OpenAI 正以 Responses API + Agents SDK 强化一站式“搜索/电脑操作/文档检索”等能力,Assistants API 逐步淘汰;可作为底座能力与上层编排结合。
  • 生态与背书:LangGraph/AutoGen/CrewAI/PydanticAI 都有强势文档与案例;微软/开源社区/云厂商的教程与工具链在加速完善。

六、参考来源

LangGraph

AutoGen(Microsoft)

PydanticAI

Agno

CrewAI

CAMEL

Langroid

  • GitHub 与文档/示例:(GitHub)

LlamaIndex Agents

Haystack Agents

Semantic Kernel Agent Framework

smolagents(HF)

  • GitHub/文档/博客/课程与示例:(GitHub)

OpenAI Swarm / DurableSwarm / Agents SDK & Responses API

AutoGPT / SuperAGI / AGiXT(与早期 BabyAGI/演进)

MetaGPT / AgentVerse / 相关汇总

补充(行业动态/多模型支持)

  • GitHub Copilot 多模型/代理趋势、微软引入 Anthropic 代理到 GitHub(新闻):(The Verge)

七、“落地组合”建议(面向产研一体)

  • 研究/产品一体化(需要严谨评估、可回放与人-在-环): 选 LangGraph(编排)+ PydanticAI(强类型/校验)+ LlamaIndex/Haystack(RAG);底层调用 OpenAI Responses/Agents SDK 或你偏好的模型供应商。
  • 多智能体任务分工(评审/迭代/问答-工具混合): 用 AutoGen 组织团队 + LangGraph 把“关键环节/回退/超时/对齐”固化为图,形成“会话协作 + 编排保底”的双层结构。
  • 快速试错/教学 Demosmolagents / Swarm 起步,通了思路后再迁到 LangGraphPydanticAI 以提高鲁棒性。

(文章结束)