图片

欢迎来到北茗的AI茶馆🍵

旧金山湾区的晨雾还未散尽,OpenAI DevDay的会场已经熙熙攘攘。

奥特曼走上舞台,掌声雷动。

他在台上宣布:

“全球有4百万开发者在使用OpenAI,ChatGPT每周有8亿活跃用户,我们的API每分钟处理60亿个token。”

图片

AI,早已从玩具变成工具。

而这一次,OpenAI要让它成为世界的操作系统。

ChatGPT

大会的第一个炸点是:Apps in ChatGPT。

图片

简单来说,OpenAI把ChatGPT从一个聊天框变成了一个超级应用平台**。**

除了回答问题,它现在可以直接运行应用程序、调用服务、执行任务。

你可以打开ChatGPT对它说:

“帮我订一张明天从旧金山到芝加哥的机票,要靠窗的位置。”

几秒钟后,它会自动调用Expedia,完成航班选择、座位偏好、付款授权一系列操作,全程都不用切换App。

图片

而这就是Apps SDK的力量。

它基于MCP,让开发者能定义自己的前端界面与后端逻辑。

可以在ChatGPT开发者模式中调试应用,并直接部署到 8 亿 ChatGPT 用户面前。

ChatGPT还会在对话中,自动推荐合适的App,或者你也可以直接叫某个应用帮你做事情。

“Spotify,帮我做一个周五晚派对歌单。”

“Coursera,教我一点机器学习。”

“Zillow,给我看看深圳三室一厅并且带院子的房子。”

AgentKit

过去一年,大家都在谈AI Agent,但发现真正落地困难重重。

图片

而现在,OpenAI给出了答案:AgentKit。

AgentKit = 构建智能体的全家桶。

它由四个核心组件组成:

  • Agent Builder:可视化画布,用拖拽的方式设计多智能体工作流。支持版本管理、预览运行和安全防护。

    图片

  • ChatKit:可嵌入式聊天界面工具,让企业能在自家产品内植入交互式 Agent。

    图片

  • Connector Registry:统一的数据与工具连接面板,支持Dropbox、Google Drive、SharePoint、Microsoft Teams等内外部系统。

  • Evals 2.0:强化评测能力,包含数据集、追踪评分、自动提示词优化、第三方模型支持等等。

在大会现场,OpenAI的工程师Christina用8分钟,搭建了一个能实时回答DevDay活动议程的智能助手Froge

图片

从拖拽节点、接入文档、启用PII防护、测试到部署,全程可视化完成。

Codex

GPT-5-Codex成为了OpenAI历史上增长最快的模型之一。

8月初以来,Codex每天的消息量增长了10倍,处理了超过40万亿token

在OpenAI里,几乎所有工程师都在使用Codex。

图片

Codex让编程语言直接变成了自然语言。

开发者可以直接对它说:

“把我的网站改成深色模式,按钮圆角更柔和一点。”

Codex就会精准修改CSS并部署。

此外,它与Slack、GitHub Actions、VSCode、SDK全面集成,实现了从语音到部署的闭环开发体验。

图片

在现场,OpenAI的开发人员演示了,通过语音直接去控制现场的灯光。

仿佛AI不光是在写代码,更是在写现实。

底座模型API

这一切炫酷的功能,当然离不开底座的大模型。

GPT-5 Pro现已通过API向所有开发者开放。

图片

作为目前最强的模型,它的价格倒是对得起它的实力:输入:$15/百万token,输出:$120/百万token。

呃,其实也不是非要用最强模型……

**GPT-5 Pro的API咱用不起,**多模态模型API倒是给咱降了不少价。

实时语音模型GPT-Realtime-Mini,价格低于高级语音模型70%,提供了相同的语音质量和表现力。

图像生成模型GPT-Image-1-Mini,价格低于图像模型80%,提供了高效的图像生成能力。

图片

最最重要的是,Sora 2也发布了API!

OpenAI提供了两个版本:

  • Sora 2:快速渲染,适合创意草图、社媒内容;

  • Sora 2 Pro:高精度版本,输出电影级画质,适用于广告与影视制作。

API中具体的功能包括:创建视频、获取视频状态、下载视频、列出视频和删除视频。

图片

大会落幕,奥特曼站在舞台上,依旧笑得谦逊。

但眼神中藏着的,却是重写整个世界架构的野心。

图片

图片