全文 4,000字 | 阅读约 13 分钟

图片

(Sam Altman 2025 DevDay 主题演讲)

2025 年 10 月 7 日,OpenAI DevDay 2025 大会现场,Sam Altman 的核心判断是:

别把 ChatGPT 当成插件,它是一个 AI 应用入口(AI application entry point)。

全场一静,然后是掌声。

这句话的潜台词是:OpenAI 不再只是构建模型,而是在构建一个平台。

就在这场大会上,OpenAI 一口气发布了三样核心能力:

  • Apps SDK:让开发者直接把 AI 应用嵌入 ChatGPT,像 App Store 一样分发

  • AgentKit:让智能体不仅能聊天,而是能执行任务、调用工具、完成闭环

  • Codex 重构:让开发者用自然语言在 Slack 等场景中构建可执行的 AI 行为逻辑

这三层架构的真正意义,不是功能更强、API 更快,而是:

ChatGPT 从“AI 工具”变成了“AI 应用入口”。每周超过 8 亿人使用的平台,正在从回答问题转变为承载第三方产品,从模型接口升级为新的生态位。

这次转型的核心是释放 ChatGPT 的真正能力,而不仅仅是版本迭代。

“入口变了,产品逻辑也要变了。”

第一节|ChatGPT:从聊天工具到应用平台

Sam Altman 在 DevDay 说了这样一句话:

“以前,ChatGPT 是人们接触 AI 的方式;现在,它也要成为接触各种 APP 的方式。”

这不是一句营销口号,而是一次产品方向的彻底转变。

OpenAI 正式发布了一套名为 Apps SDK 的新能力,让开发者可以把自己的产品装进 ChatGPT 里,像 iOS 开发者上传 App 一样,让用户在 ChatGPT 内部直接使用。

你不用再跳转网页、打开新程序。 只要在 ChatGPT 里发一句话,AI 就能调出内嵌的 Canva 帮你设计封面,用 Coursera 推送课程,或者通过 Zillow 查房源、看户型。

过去,AI 是你工作的一个“加速器”;现在,它变成了你操作其他 App 的入口。

Altman 的判断是:

“我们希望 ChatGPT 成为一个AI 应用的入口点(entry point),就像移动互联网时代的 App Store 一样。”

✅ Apps SDK 到底能做什么?

这套 SDK(开发工具包)让开发者用四个部分搭建 AI 应用:

  • Prompt(提示词):告诉模型怎么理解用户的意图

  • UI(界面):你可以定制结果展示方式,比如列表、图表、图片

  • Actions(动作):绑定外部服务,比如自动发送电邮、查库存、生成图像

  • Memory(记忆):允许应用记住用户信息、使用偏好,实现持续互动

具体来说:以前你和 ChatGPT 聊完,还要自己去操作;现在 ChatGPT 直接帮你操作那些 App,一步到位。

你说:“我想设计一份求职简历。”

AI 回应的,不再是一段建议,而是直接调出 Canva 应用界面、自动生成草图。

这就像你请了一个懂工具、又能动手的助理。

✅ 不只是接入工具,而是托管应用

最重要的一点是:

这些应用不是外挂的插件,而是 ChatGPT 内部的原生模块。

你可以在左侧菜单栏固定常用应用,像使用系统功能一样调用。

这不是 AI 变强了,而是入口逻辑变了。

OpenAI 不再只提供回答,而是开始托管他人的产品与服务:

  • ChatGPT 已从 AI 模型演变为应用生态平台

  • 开发者无需独立搭建基础设施,可直接在平台上完成产品全流程

他们不是做一个超级万能的 App,而是让无数有用的 App 汇聚在 ChatGPT 中。

第二节|AgentKit:让 AI 会干活

如果 Apps SDK 是为 ChatGPT 装上“入口”, 那么 AgentKit,就是让这个入口后面真的有人在干活。

这两年来,人们习惯让 AI 回答问题、写段文案、给出建议。 但 Sam Altman 在 DevDay 表示:

“未来的 ChatGPT,不只是能说,还要能做。”

比如:你说“我想订一张去东京的机票、安排两晚酒店”,它不再只回复一堆建议和链接,而是能自动跳转第三方服务,完成预订、填好信息、生成确认邮件。

这背后,就是 AgentKit 的作用。

✅ 什么是 AgentKit?

AgentKit 是这次 DevDay 发布的第二个核心能力,它让开发者可以打造“能动手的 AI”。

你可以理解为:它是一个任务助理工具箱,帮你把 AI 从会答题变成办事。

它由四个核心模块组成:

  • Agent Builder(智能体构建器):用可视化方式设计工作流,无需编写代码

  • ChatKit(聊天组件):可嵌入的对话界面,让用户在任何应用中与 AI 助理交互

  • Evals(评估系统):提供轨迹评分、数据集测试和自动提示优化

  • Connector Registry(连接器注册表):安全连接内部工具和第三方系统

OpenAI 工程副总裁在演示中提到:

“我们正在提供一套完整流程,帮助开发者从‘构想’到‘可执行’,让 AI 能处理真正的工作流程。”

✅ 一个真实案例:AI 助理怎么干活?

DevDay 现场演示了一个叫“Ask Froge”的 AI 助理。

工程师 Christina 用 8 分钟完成了从零到上线的全过程。她只需用自然语言告诉 Agent Builder:

  • 用户想查询最新文件、联系人、会议信息

  • 想从公司内部系统中找到答案

  • 希望结果精简、语气礼貌

然后这个 AI 助理就上线了。

用户说:“帮我查一下这个合同客户是谁最后跟进的。”Froge 自动连接公司 CRM 系统,拉出记录,返回清晰摘要。

整个过程,没有写一行代码,也不用打开任何网页。

这不是在“聊天”,而是在“完成任务”。

✅ 为什么说这是真正的进步?

过去的 AI 只能一问一答,AgentKit 能完成需要多个步骤的任务。

它能:

  • 自动调用工具(比如 Zapier、Browser、数据库)

  • 根据上下文规划流程(先查询、再比对、最后生成报告)

  • 允许你在 ChatGPT 中委派任务,然后直接看结果

OpenAI 在训练的不只是 AI 模型,而是可以做事的 AI 助理。

这意味着,你可以将任务交给它完成。

ChatGPT 不再仅仅是入口,而是开始承担执行者的角色。

第三节|Codex:从代码助手到开发搭档

传统编程高度依赖人工,近乎手工作业。

你要开着编辑器,写逻辑、查文档、调接口、改 bug。AI 只能在你写不出来的时候,帮你补几行。

但在这次 DevDay 上,OpenAI 把 Codex 的能力提升到全新层级。

OpenAI 工程负责人 Romain Huet 说:

“Codex 已经不只是 Copilot,而是一个能理解上下文、接得住你想法、主动完成任务的开发搭档。”

✅ 它懂你想干嘛,还能自动执行 

Romain 在 DevDay 现场做了一个演示:他需要让舞台摄像头被实时控制,并联动现场灯光。

他在终端对 Codex 说: “你能制定一个控制 Sony FR7 摄像头的方案吗?”

Codex 立即识别需求,自动查阅技术文档,用 13 分钟完成了完整的控制系统,包括:

  • 协议实现

  • 服务器搭建

  • 接口连接

接着,他继续让 Codex 连接无线控制器、构建灯光控制接口、集成语音功能。

最终效果是:他用语音说“把灯光照向观众”,现场灯光立即响应。

整个过程,他没有手写一行代码。这不是智能补全,而是 AI 参与到需求理解、技术选型、代码实现的完整开发流程中。

✅ Codex 能力升级:听得懂、连得上、动得快

本次 Codex 重构,重点体现在三个方面:

  • 更理解上下文:能听懂自然语言描述的需求,无需精确指令

  • 跨工具协作:可以串联多个服务,调用 API、执行命令、读取文件

  • 持续执行:能连续工作数小时完成大型重构,自我修正,持续优化

用开发者的语言来说,这是从:

帮我写 → 和我写 → 我说它写

未来的编程不是你打字给机器看,而是你跟 AI 商量该怎么做。

✅ Codex :从生成代码,到构建体验。

很多人一直把 Copilot 当成“快捷键”或“改写工具”。 但 Codex 的转变在于:它能参与整体工作流程。

比如:

  • 用语音描述交互逻辑,它自动写完并接入组件

  • 在 IDE、终端、Slack 等多个场景中无缝工作

  • 修改一处设计,它能关联调整相关代码

这是一种新的工作方式:你不再操作工具,而是和 AI 共同推进一个目标。

Romain Huet 总结:

“AI 开发助手不应该只是快捷方式,而应该是能和你一起构建的真正搭档。”

第四节|三大模型:支撑入口的新地基

前面我们讲了三个新能力:能装应用、能干活、能一起开发。

但这些“上层建筑”之所以成立,背后靠的是三块全新升级的基础能力:GPT-5 Pro、Sora 2 和 Realtime Mini。

核心变化不是模型更大,而是 OpenAI 让模型变得能稳定支撑这些复杂交互场景。

它们是让 Apps SDK 流畅运行、让 AgentKit 持续工作、让 Codex 理解复杂意图的底层支撑。

✅ GPT-5 Pro:更聪明,重点在稳定可靠

GPT-5 Pro 在这次 DevDay 正式面向开发者开放 API。它的核心变化不是"更强",而是在复杂任务中表现更稳定。

三个关键提升:

  • 长对话保持上下文:能记住用户说过的每个细节,不会在多轮交互中"断线"

  • 复杂任务持续推理:可以处理长推理链、多步规划,不轻易跑题或卡壳

  • 响应速度更快:交互延迟显著降低,接近实时对话的流畅度

Sam Altman 强调: “我们不是追求绝对性能指标,而是追求在真实任务中表现稳定可靠。”

比如一个开发者需要让 AI 分析销售数据、生成报表、提取趋势、撰写总结邮件并调用 API 发送。GPT-5 Pro 可以全程保持上下文,按步骤完成,不会中途忘记前面的指令。

✅ Sora 2:理解画面逻辑,而非拼接片段

Sora 2 是 OpenAI 最新的视频生成模型,现已通过 API 开放。

它的核心突破是开始理解时间、空间和因果关系。

现场演示中,有一段生成内容是:一个人在水上划皮划艇的场景,不仅画面流畅,连水花、划桨动作、环境音效都完全同步

OpenAI 产品负责人在演示时说:

Sora 2 能理解空间位置、动作连续性,甚至预测下一个合理场景。

这对 App 生态意味着什么?

  • AI 可以生成具有叙事逻辑的广告、创意视频

  • 能模拟产品使用过程、操作演示

  • 对创作者来说,它是“全场景视频拍摄助手”

✅ Realtime Mini:反应更像人,几乎零延迟

这是 OpenAI 最新的语音模型,主打低延迟、自然对话。

之前的语音助手,往往等你说完一句,它再回复一句,中间有空档、有卡顿。

Realtime Mini 的升级在于:

  • 听你说的时候已经在想怎么回,几乎无延迟

  • 语音自然、有停顿、有语气变化,不再是“播音腔”

  • 响应快、成本低,现场展示一个 AI 客服模型,连续回答用户提问,完全不打断、不卡壳

它的体验接近真人对话:反应快、语气自然、交流顺畅。

比如一个客服应用,用户连续提问:

“我的订单在哪?”

 “能改地址吗?”

 “大概什么时候到?”

AI 可以流畅应答,不打断、不卡顿,甚至能在用户说到一半时就开始准备相关信息。

这三个模型不是独立的新功能,而是支撑整个平台体验的基础能力:

  • GPT-5 Pro — 让 AI 能记住上下文、处理复杂流程

  • Sora 2 — 让 AI 能生成符合逻辑的视觉内容

  • Realtime Mini — 让 AI 能自然对话、实时响应

它们共同支撑的目标是:让 AI 从回答问题升级为执行任务,真正融入生活和工作场景。

第五节|创业者:起点已经改变

Sam Altman 给创业者指出了方向:

AI 创业的下一波,不是你去打造一个超级复杂的产品,而是直接在 ChatGPT 上把成果交给用户。

以前你要做一个 AI 产品,需要建模型、调接口、做前端、养服务器、做投放。 现在,你只要有一个清晰的目标,ChatGPT 就能变成你的发布平台。

它给了你三样核心工具:

  • Apps SDK → 让你能把产品装进去

  • AgentKit → 让你的 AI 真能动起来

  • Codex → 让你开发迭代的速度大幅提升

✅ 从零搭建 vs 基于平台构建

OpenAI 这次释放的不是一个个功能组件,而是一个完整的闭环:从开发到分发,从使用到反馈,都在 ChatGPT 内完成。

Altman 明确了目标:

“我们希望构建的是一个可持续的 AI 应用生态。用户不需要离开平台,开发者也能直接交付价值。”

这对创业者意味着:

  • 不必从零搭建平台,ChatGPT 本身就是平台

  • 不是想着“接入 API 增强产品”,而是反过来想:我的产品能不能直接在 ChatGPT 里运行?

✅ 谁已经在这样做了?

DevDay 期间的播客采访中,一些开发者分享了他们基于 ChatGPT 构建产品的思路:

1、 SchoolAI:做教育场景的微助教

  • 教师创建教学任务模板,学生直接在 ChatGPT 中完成互动

  • AI 会根据学生表现自动调整难度、生成新问题、推荐补充材料

  • 教师看到的是结构化结果,不是海量对话记录

SchoolAI 负责人说:

“我们不是让 AI 替代老师,而是直接变成老师的工作台。”

2、Abridge:医疗文档自动化平台

为医生提供实时对话转录和临床笔记生成,帮助医生从每天 2 小时的文书工作中解放出来。医生节省的时间可以用于患者护理或避免职业倦怠。

Abridge 团队强调:“这不仅是节省时间,更是让医生能真正陪伴患者,而不是盯着电脑屏幕。”

✅ 如果你在考虑 AI 创业

这次发布会实际上已经帮你画出了一份路线图。你可以先问自己三个问题:

  1. 能否找到一个必须交付具体结果的场景?

不是建议或内容,而是实际成果:报表、设计稿、分析结果、执行方案

  1. 有没有哪个环节可以让 AI 直接完成?

不是提高效率,而是直接由 AI 执行完成

  1. 用户愿意为成果付费,还是为工具付费?

AI 不是工具补丁,而是新一代执行者

这也许就是新一代 AI 创业的标准:不是看起来有多酷,而是能交付什么结果,能被多快用上。

结语|ChatGPT 的新定位:入口平台

Sam Altman 那句话,不是提醒,而是一种方向的宣告:别把 ChatGPT 当成插件,它是一个应用入口。

这次 DevDay 是一场平台上线仪式:

  • 开发工具开放,

  • 执行能力释放,

  • 模型底座稳固,

  • 首批应用上线。

OpenAI 不再只卖 API、推模型,而是开始汇聚别人的产品、别人的生意、别人的创意。

关键问题不再是 AI 还能做什么,而是:你的产品,能不能上架到这个平台,让 8 亿用户直接使用?

这是一次平台转向,也是一次创业起点的重置。

有人已经开始构建,有人还在观望。

但入口已经打开,规则已经摆在那里。