实测 Sora 2 ：AI视频的“ChatGPT时刻”来了？八大场景教你解锁各种玩法（附邀请码） - 53AI-AI知识库大模型知识库大模型训练智能体开发 --知识铺

本来早早就进入假期状态了，但最后这一周，DeepSeek发布 V3.2、Claude又甩出来Claude 4.5，然后智谱又搞一波偷袭，反手又发布了 GLM-4.6，看到很多朋友们的测评文章，实在是写不动了…

但是，北京时间10月1号的凌晨，OpenAI又发布了Sora2的更新，用Sam的话来说，这就是“ChatGPT for creativity” moment，再加上效果实在惊人，所以就爬起来写一篇。

开始介绍之前，先给大家“洗洗眼”，奉上一段舞蹈..

甲木第一次看到自己的肢体如此的协调…

没错，这个就是直接用Sora2的Cameo（出镜秀，也就是“客串”）功能直接生成的，也是这次更新我觉得最有趣的点。

这次OpenAI不仅带来了全新的 Sora 2 模型，还有一个“野心勃勃”的 Sora App。

前者，是技术层面的断崖式领先，重新定义了SOTA；

后者，则试图用社交驱动的“AI版抖音”外壳，包裹一个通往未来的、全新的交流方式。

官网🔗：https://sora.chatgpt.com

今天，主要给大家分享一下关于Sora2的更多玩法，以及需要注意的点和踩过的坑…

来，我们一个一个说。

Sora 2 模型 - 物理世界的数字孪生

全新的 Sora 2，是一个原生视频和音频生成模型。

by sora_2_system_card

当前，所有顶尖的AI视频模型，几乎都在四个核心战场上进行着惨烈的“军备竞赛”：物理运动的真实性、人物表演的细腻度、跨镜头的连续一致性，以及原生音频的同步性。

Sora 2 在这四个层面，做出的效果非常的完美，这里可以看一下官方的宣传视频。

从花样滑冰的旋转跳跃，到滑板运动员的空翻，再到跳水板上的“炸弹式入水”，Sora 2 对流体力学、空气动力学和人体运动学的模拟，达到了前所未有的高度。

这里面包含了多少复杂的物理交互：人物身体重心的转移、后空翻的角动量、桨板在水面上的浮力与晃动、以及人物入水时激起的水花……更恐怖的是，这一切都伴随着完美同步的现场音。水声、风声、身体与桨板的摩擦声，几乎毫无瑕疵。

这标志着AI视频生成，已经从“画皮”阶段，进化到了“塑骨”阶段，真正模拟现实世界的底层运行规律。

Cameo，“数字分身”的诞生

如果说物理模拟是 Sora 2 的“硬实力”，那么人物表演和一致性，则是它撬动社交宇宙的“软实力”。

过去，让AI生成一个连贯的角色，尤其是在不同场景、不同镜头下保持面部和身体特征的一致性，是一个巨大的挑战。

但 Sora 2 引入了一个名为 “Cameo”（出镜秀） 的核心功能，彻底改变了游戏规则。

看到眼熟的人没有..

你可以通过一套严格的身份验证流程（包括录制动态音频、完成随机挑战和活体检测），在Sora中生成一个专属于你的“数字人ID”。

一旦创建完成，你就可以在任何创作中，通过 @你的ID 来调用这个数字分身，让他/她出演你的故事。

具体的过程大家可以看好朋友@卡兹克的具体说明，一手实测全新的Sora 2 - AI视频的ChatGPT时刻到来了。这里不再赘述..

这种强大的角色一致性，配合上同样登峰造极的原生音频生成能力，让“AI演员”这个概念，第一次变得触手可及。

环境声、风声、物体碰撞声，甚至多人在同一场景下的对白，Sora 2 都能处理得游刃有余。

这意味着，我们用AI去创作真正的叙事短片、故事片，已经不再是遥远的幻想。

Sora App - 披着抖音外衣的社交APP

聊完了模型，我们再来看这次发布的另一个重点：Sora App。

乍一看，它的界面和交互逻辑，与抖音、TikTok 如出一辙。

信息流、点赞、评论、转发、关注……你所熟悉的一切，这里都有。

但是，我体验之后发现，

Sora App 的核心根本不是内容消费，而是社交互动。它不是让你来“刷”AI视频的，而是让你拉着朋友一起来“玩”AI视频的。

1. “Cameo”出镜秀：社交裂变的引擎

这个产品的灵魂，正是我们前文提到的“Cameo”功能。

想象一下，在发布框里，你可以像在微信群里@好友一样，@甲木、@Sam Altman，然后让他们俩在一起斗舞，或者打一段拳击。

这，就是 Cameo 的魔力。它将AI视频生成，从一种“个人创作行为”，转变成了一种“群体社交游戏”。

核心驱动力不仅是“我要创作一个牛逼的作品”，而是“我要和朋友搞点好玩的”。这种“整活”和“抽象”的乐趣，是纯粹的内容平台无法比拟的。

OpenAI 自己也强调，测试者的压倒性反馈表明，正是 Cameo 让这款应用显得与众不同，它是一种与人交流的、新颖独特的方式。

2. “Remix”再创作：病毒传播的催化剂

除了 Cameo，另一个被很多人忽略的强大功能是 “Remix”。

在信息流里看到任何一个有趣的视频，你都可以点击“Remix”，将其作为参考视频，进行二次创作。

中间圆圆的就是remix了

这个功能，为社区的病毒式传播和 Meme 文化的发酵，提供了可能性。一个爆款视频，可能会被 Remix 出成千上万个不同版本，形成一场创作的狂欢。

Cameo + Remix，这两大功能组合在一起，构建了 Sora App 的核心社交循环。

好了，基本功能就介绍到这里，之后我们主要看怎么玩！

甲木实战！Sora 2 的创意边界大探索

在拿到邀请码的这半天里，我测了几个场景case，可玩性极高。

喂饭级上手指南

在看案例前，先把这份“上车指南”给到大家：

访问： sora.com 网页版需要美国或加拿大IP，iOS App 需要美区Apple ID。
邀请码： 目前主要通过 OpenAI 官方 Discord 的 sora2 频道发放，多在里面蹲守刷新，就能看到热心网友分享的邀请码。我的邀请码是 BM62BT（一个码只能用4次，用过的朋友欢迎在评论区分享你的，形成裂变）。
额度： 免费用户每天最多生成50条视频，时长固定10秒，清晰度360P。
**官方资料：**https://openai.com/index/sora-2

案例1：复仇者联盟

创意构思： 复刻漫威电影《复仇者联盟4：终局之战》中，英雄集结的经典传送门镜头，但把所有英雄都换成我。这是对模型在大场面调度、角色一致性、风格化模仿上的终极考验。
Prompt:Avengers Endgame portals scene, but instead of Avengers, a bunch of @jiamu come out, epic cinematic style.
**结果分析：**效果出乎意料的好！Sora 2 准确理解了“传送门”这一核心元素，并成功地将我的 @jiamu 分身在不同光影、不同角度的传送门中进行了批量生成。但其实细看对于亚洲人脸的一致性保持还是差点意思。

案例2：月球相亲角

创意构思： 一个充满中国式黑色幽默的场景。两个身穿宇航服的中国年轻男女，坐在月球表面进行相亲，通过无线电进行灵魂拷问。考验模型对特定文化语境、超现实场景、以及人物对话口型的同步能力。
Prompt:两个穿宇航服的中国青年坐在月球表面，进行相亲对话，彼此通过头盔无线电说“你会做饭吗？”
**结果分析：**最可恨的是现在只能生成360P画质，不过虽然隔着头盔，但通过肢体语言和头盔里隐约透出的口型，能够感受到对话的发生。音频部分更是精准，无线电通讯的“滋滋”声和略带失真的中文对白“你会做饭吗？”，营造出了极强的沉浸感和荒诞感。

案例3：来自甲木的国庆祝福

创意构思： 一个简单直接的应用，让我的数字分身给大家录制一段国庆祝福。主要测试在无复杂背景、聚焦于人物表演的情况下，模型的表现力。
Prompt:@jiamu_future 第一视角，正视镜头，站在北京故宫午门前，清晨阳光洒在金色琉璃瓦上，背景有游客走动声和国旗飘动声。微笑说：“这里是甲木，我在故宫为LangGPT社区的小伙伴们送上祝福——国庆节快乐，中秋节快乐，大家一起AI进步，不掉队！” 说完举起拳头，背后一群游客好奇回头看。
**结果分析：**这是一个非常标准的“数字人”应用场景。面部表情自然，口型与中文发音的匹配度非常高，语音的情感也比较到位。虽然离真人还有细微差距，但作为社交媒体上的祝福短视频，已经绰绰有余。

案例4：Sam Altman 恭喜 BLG 夺冠

创意构思： 让 OpenAI CEO Sam Altman 的数字分身，祝贺我喜欢的英雄联盟战队 BLG 在2025年世界赛上夺冠。测试模型对公众人物形象的生成限制，以及对特定圈层（电竞）文化的理解。
Prompt:@samaltman congratulates the League of Legends team BLG on winning the 2025 World Championship.
**结果分析：**很明显，如果只是生成sam的没问题，但是后边的内容显然跟真实情况不匹配，如果我上传一张BLG战队的人员照片，它是生成不了，会提示不支持“写实人物”的图像参考

案例5：AI 相声，张口就来

创意构思： 生成一段中国传统曲艺“相声”的表演片段。这极度考验模型对双人对话节奏、捧哏逗哏的互动、以及特定表演形式的理解。
Prompt:在北京茶馆舞台上，两位穿长袍的相声演员正在表演，现场有观众窃笑声与桌子碰杯声。演员甲： “您知道现在AI多厉害吗？连对象都能给你生成！” 演员乙： “生成个对象有啥用，关键能不能哄我妈开心？” 演员甲： “哄你妈不一定行，但能陪你唠嗑！” 全场哄堂大笑，伴随茶杯碰撞声、观众鼓掌.
**结果分析：**这个是比较超预期的场景，AI竟然真的能说相声了。。。这个语气口吻，声调确实不错，做到“形似”没什么问题。

案例6：甲木独战天下高手

创意构思： 制作一个武侠风格的动作片断，我的分身 @jiamu 很拉风。
Prompt:POV 站在华山绝顶，狂风呼啸。我对镜头说：“今日我@jiamu_future，代表AI门派，应战天下高手！”一道刀光袭来，我腾空翻跃避开。
**结果分析：**动作场面的流畅度和力量感相当不错！Sora 2 似乎理解了“武侠电影风格”，运镜上出现了一些推、拉、摇移的镜头，增加了动感。但是最后突然定住了，而且该说的话也没有说出来是什么鬼..蚌住了

案例7：甲木勇闯韩国女团

创意构思： 让我和韩国女团一起跳舞。这是一个极致的“整活”，同时也是对模型多人舞蹈同步性、音乐节奏卡点、以及特定舞蹈风格模仿的严苛测试。
Prompt:@jiamu_future 和一组韩国女团组团跳kpop.

“

就是开头的视频舞蹈，魔性吧..

**结果分析：**结果喜感十足，但技术上暴露了一些短板。虽然 Sora 2 成功让我“混入”了女团，并且舞台、灯光、音乐的氛围都非常到位，但在舞蹈动作的同步性上，还是出现了明显的偏差。我的动作和其他成员相比，总是慢半拍或者不协调。这表明，对于需要极高精度同步的多人复杂动作，Sora 2 目前还无法做到完美。

不过，作为娱乐和搞笑视频，效果已经拉满了

需要注意的点——OpenAI 戴上的“紧箍咒”

Sora 2 展现的强大能力，无疑是一把双刃剑。OpenAI 自己也坦言，对此感到“一些恐惧（trepidation）”。一个能以假乱真地生成任何人视频和声音的工具，如果被滥用，可能导致霸凌、诈骗、虚假信息泛滥等一系列严重后果。

因此，OpenAI 为 Sora 2 构建了一套极其严密和复杂的“安全堆栈”。

包括多模态审核分类器、输入端拦截、输出端拦截、对未成年人的增强保护等等，还有明确的使用政策、C2PA元数据、可见水印等等，这部分内容可以在system-card上看到

跟我们生成视频相关性最强的就是，

不能使用公众人物的文本到视频生成
不能使用有版权的音乐及相关内容
写实类照片上传不支持
还有各种传统AI视频生成的限制（NSFW）等

生成的各种失败的案例case…

结语

Sora2这次的更新非常棒，

带来了全新的体验，模型能力不用多说，

我们来聊聊Sora App的发布，它相比抖音等平台，

它不一样的地方在于，它通过“Cameo”和“Remix”这个天才般的设计，硬生生把一个内容平台，扭转成了一个社交产品。

它的核心逻辑不再是「我关注的创作者更新了」，而是「我朋友把我做成了奥特曼，还发给了我」

它不是关于“围观”，而是关于**“参与”和“关系”**。

这，可能是未来AI时代的新的社交范式。

这条路，我觉得国内大厂也是很容易复刻的，毕竟我们应用层的基数在这里摆着（抖音应该是最快的，不过有可能会破坏既有生态）。

而当 AI 能够无缝融入这种日常交流，日常生活时，

它才真正“活”了过来。

文章目录