实测 Sora 2 :AI视频的“ChatGPT时刻”来了?八大场景教你解锁各种玩法(附邀请码) - 53AI-AI知识库大模型知识库大模型训练智能体开发 --知识铺
本来早早就进入假期状态了,但最后这一周,DeepSeek发布 V3.2、Claude又甩出来Claude 4.5,然后智谱又搞一波偷袭,反手又发布了 GLM-4.6,看到很多朋友们的测评文章,实在是写不动了…
但是,北京时间10月1号的凌晨,OpenAI又发布了Sora2的更新,用Sam的话来说,这就是“ChatGPT for creativity” moment
,再加上效果实在惊人,所以就爬起来写一篇。
开始介绍之前,先给大家“洗洗眼”,奉上一段舞蹈..
甲木第一次看到自己的肢体如此的协调…
没错,这个就是直接用Sora2的Cameo(出镜秀,也就是“客串”)功能直接生成的,也是这次更新我觉得最有趣的点。
这次OpenAI不仅带来了全新的 Sora 2 模型,还有一个“野心勃勃”的 Sora App。
前者,是技术层面的断崖式领先,重新定义了SOTA;
后者,则试图用社交驱动的“AI版抖音”外壳,包裹一个通往未来的、全新的交流方式。
官网🔗:https://sora.chatgpt.com
今天,主要给大家分享一下关于Sora2的更多玩法,以及需要注意的点和踩过的坑…
来,我们一个一个说。
Sora 2 模型 - 物理世界的数字孪生
全新的 Sora 2,是一个原生视频和音频生成模型。
当前,所有顶尖的AI视频模型,几乎都在四个核心战场上进行着惨烈的“军备竞赛”:物理运动的真实性、人物表演的细腻度、跨镜头的连续一致性,以及原生音频的同步性。
Sora 2 在这四个层面,做出的效果非常的完美,这里可以看一下官方的宣传视频。
从花样滑冰的旋转跳跃,到滑板运动员的空翻,再到跳水板上的“炸弹式入水”,Sora 2 对流体力学、空气动力学和人体运动学的模拟,达到了前所未有的高度。
这里面包含了多少复杂的物理交互:人物身体重心的转移、后空翻的角动量、桨板在水面上的浮力与晃动、以及人物入水时激起的水花……更恐怖的是,这一切都伴随着完美同步的现场音。水声、风声、身体与桨板的摩擦声,几乎毫无瑕疵。
这标志着AI视频生成,已经从“画皮”阶段,进化到了“塑骨”阶段,真正模拟现实世界的底层运行规律。
Cameo,“数字分身”的诞生
如果说物理模拟是 Sora 2 的“硬实力”,那么人物表演和一致性,则是它撬动社交宇宙的“软实力”。
过去,让AI生成一个连贯的角色,尤其是在不同场景、不同镜头下保持面部和身体特征的一致性,是一个巨大的挑战。
但 Sora 2 引入了一个名为 “Cameo”(出镜秀) 的核心功能,彻底改变了游戏规则。
你可以通过一套严格的身份验证流程(包括录制动态音频、完成随机挑战和活体检测),在Sora中生成一个专属于你的“数字人ID”。
一旦创建完成,你就可以在任何创作中,通过 @你的ID
来调用这个数字分身,让他/她出演你的故事。
具体的过程大家可以看好朋友@卡兹克的具体说明,一手实测全新的Sora 2 - AI视频的ChatGPT时刻到来了。这里不再赘述..
这种强大的角色一致性,配合上同样登峰造极的原生音频生成能力,让“AI演员”这个概念,第一次变得触手可及。
环境声、风声、物体碰撞声,甚至多人在同一场景下的对白,Sora 2 都能处理得游刃有余。
这意味着,我们用AI去创作真正的叙事短片、故事片,已经不再是遥远的幻想。
Sora App - 披着抖音外衣的社交APP
聊完了模型,我们再来看这次发布的另一个重点:Sora App。
乍一看,它的界面和交互逻辑,与抖音、TikTok 如出一辙。
信息流、点赞、评论、转发、关注……你所熟悉的一切,这里都有。
但是,我体验之后发现,
Sora App 的核心根本不是内容消费,而是社交互动。它不是让你来“刷”AI视频的,而是让你拉着朋友一起来“玩”AI视频的。
1. “Cameo”出镜秀:社交裂变的引擎
这个产品的灵魂,正是我们前文提到的“Cameo”功能。
想象一下,在发布框里,你可以像在微信群里@好友一样,@甲木
、@Sam Altman
,然后让他们俩在一起斗舞,或者打一段拳击。
这,就是 Cameo 的魔力。它将AI视频生成,从一种“个人创作行为”,转变成了一种“群体社交游戏”。
核心驱动力不仅是“我要创作一个牛逼的作品”,而是“我要和朋友搞点好玩的”。这种“整活”和“抽象”的乐趣,是纯粹的内容平台无法比拟的。
OpenAI 自己也强调,测试者的压倒性反馈表明,正是 Cameo 让这款应用显得与众不同,它是一种与人交流的、新颖独特的方式。
2. “Remix”再创作:病毒传播的催化剂
除了 Cameo,另一个被很多人忽略的强大功能是 “Remix”。
在信息流里看到任何一个有趣的视频,你都可以点击“Remix”,将其作为参考视频,进行二次创作。
这个功能,为社区的病毒式传播和 Meme 文化的发酵,提供了可能性。一个爆款视频,可能会被 Remix 出成千上万个不同版本,形成一场创作的狂欢。
Cameo + Remix,这两大功能组合在一起,构建了 Sora App 的核心社交循环。
好了,基本功能就介绍到这里,之后我们主要看怎么玩!
甲木实战!Sora 2 的创意边界大探索
在拿到邀请码的这半天里,我测了几个场景case,可玩性极高。
喂饭级上手指南
在看案例前,先把这份“上车指南”给到大家:
-
访问: sora.com 网页版需要美国或加拿大IP,iOS App 需要美区Apple ID。
-
邀请码: 目前主要通过 OpenAI 官方 Discord 的
sora2
频道发放,多在里面蹲守刷新,就能看到热心网友分享的邀请码。我的邀请码是 BM62BT(一个码只能用4次,用过的朋友欢迎在评论区分享你的,形成裂变)。 -
额度: 免费用户每天最多生成50条视频,时长固定10秒,清晰度360P。
-
**官方资料:**https://openai.com/index/sora-2
案例1:复仇者联盟
-
创意构思: 复刻漫威电影《复仇者联盟4:终局之战》中,英雄集结的经典传送门镜头,但把所有英雄都换成我。这是对模型在大场面调度、角色一致性、风格化模仿上的终极考验。
-
Prompt:
Avengers Endgame portals scene, but instead of Avengers, a bunch of @jiamu come out, epic cinematic style.
-
**结果分析:**效果出乎意料的好!Sora 2 准确理解了“传送门”这一核心元素,并成功地将我的
@jiamu
分身在不同光影、不同角度的传送门中进行了批量生成。但其实细看对于亚洲人脸的一致性保持还是差点意思。
案例2:月球相亲角
-
创意构思: 一个充满中国式黑色幽默的场景。两个身穿宇航服的中国年轻男女,坐在月球表面进行相亲,通过无线电进行灵魂拷问。考验模型对特定文化语境、超现实场景、以及人物对话口型的同步能力。
-
Prompt:
两个穿宇航服的中国青年坐在月球表面,进行相亲对话,彼此通过头盔无线电说“你会做饭吗?”
-
**结果分析:**最可恨的是现在只能生成360P画质,不过虽然隔着头盔,但通过肢体语言和头盔里隐约透出的口型,能够感受到对话的发生。音频部分更是精准,无线电通讯的“滋滋”声和略带失真的中文对白“你会做饭吗?”,营造出了极强的沉浸感和荒诞感。
案例3:来自甲木的国庆祝福
-
创意构思: 一个简单直接的应用,让我的数字分身给大家录制一段国庆祝福。主要测试在无复杂背景、聚焦于人物表演的情况下,模型的表现力。
-
Prompt:
@jiamu_future 第一视角,正视镜头,站在北京故宫午门前,清晨阳光洒在金色琉璃瓦上,背景有游客走动声和国旗飘动声。微笑说:“这里是甲木,我在故宫为LangGPT社区的小伙伴们送上祝福——国庆节快乐,中秋节快乐,大家一起AI进步,不掉队!” 说完举起拳头,背后一群游客好奇回头看。
-
**结果分析:**这是一个非常标准的“数字人”应用场景。面部表情自然,口型与中文发音的匹配度非常高,语音的情感也比较到位。虽然离真人还有细微差距,但作为社交媒体上的祝福短视频,已经绰绰有余。
案例4:Sam Altman 恭喜 BLG 夺冠
-
创意构思: 让 OpenAI CEO Sam Altman 的数字分身,祝贺我喜欢的英雄联盟战队 BLG 在2025年世界赛上夺冠。测试模型对公众人物形象的生成限制,以及对特定圈层(电竞)文化的理解。
-
Prompt:
@samaltman congratulates the League of Legends team BLG on winning the 2025 World Championship.
-
**结果分析:**很明显,如果只是生成sam的没问题,但是后边的内容显然跟真实情况不匹配,如果我上传一张BLG战队的人员照片,它是生成不了,会提示不支持“写实人物”的图像参考
案例5:AI 相声,张口就来
-
创意构思: 生成一段中国传统曲艺“相声”的表演片段。这极度考验模型对双人对话节奏、捧哏逗哏的互动、以及特定表演形式的理解。
-
Prompt:
在北京茶馆舞台上,两位穿长袍的相声演员正在表演,现场有观众窃笑声与桌子碰杯声。 演员甲: “您知道现在AI多厉害吗?连对象都能给你生成!” 演员乙: “生成个对象有啥用,关键能不能哄我妈开心?” 演员甲: “哄你妈不一定行,但能陪你唠嗑!” 全场哄堂大笑,伴随茶杯碰撞声、观众鼓掌.
-
**结果分析:**这个是比较超预期的场景,AI竟然真的能说相声了。。。这个语气口吻,声调确实不错,做到“形似”没什么问题。
案例6:甲木独战天下高手
-
创意构思: 制作一个武侠风格的动作片断,我的分身
@jiamu
很拉风。 -
Prompt:
POV 站在华山绝顶,狂风呼啸。我对镜头说:“今日我@jiamu_future,代表AI门派,应战天下高手!”一道刀光袭来,我腾空翻跃避开。
-
**结果分析:**动作场面的流畅度和力量感相当不错!Sora 2 似乎理解了“武侠电影风格”,运镜上出现了一些推、拉、摇移的镜头,增加了动感。 但是最后突然定住了,而且该说的话也没有说出来是什么鬼..蚌住了
案例7:甲木勇闯韩国女团
-
创意构思: 让我和韩国女团一起跳舞。这是一个极致的“整活”,同时也是对模型多人舞蹈同步性、音乐节奏卡点、以及特定舞蹈风格模仿的严苛测试。
-
Prompt:
@jiamu_future 和一组韩国女团组团跳kpop.
“
就是开头的视频舞蹈,魔性吧..
-
**结果分析:**结果喜感十足,但技术上暴露了一些短板。虽然 Sora 2 成功让我“混入”了女团,并且舞台、灯光、音乐的氛围都非常到位,但在舞蹈动作的同步性上,还是出现了明显的偏差。我的动作和其他成员相比,总是慢半拍或者不协调。这表明,对于需要极高精度同步的多人复杂动作,Sora 2 目前还无法做到完美。
不过,作为娱乐和搞笑视频,效果已经拉满了
需要注意的点——OpenAI 戴上的“紧箍咒”
Sora 2 展现的强大能力,无疑是一把双刃剑。OpenAI 自己也坦言,对此感到“一些恐惧(trepidation)”。一个能以假乱真地生成任何人视频和声音的工具,如果被滥用,可能导致霸凌、诈骗、虚假信息泛滥等一系列严重后果。
因此,OpenAI 为 Sora 2 构建了一套极其严密和复杂的“安全堆栈”。
包括多模态审核分类器、输入端拦截、输出端拦截、对未成年人的增强保护等等,还有明确的使用政策、C2PA元数据、可见水印等等,这部分内容可以在system-card上看到
跟我们生成视频相关性最强的就是,
-
不能使用公众人物的文本到视频生成
-
不能使用有版权的音乐及相关内容
-
写实类照片上传不支持
-
还有各种传统AI视频生成的限制(NSFW)等
结语
Sora2这次的更新非常棒,
带来了全新的体验,模型能力不用多说,
我们来聊聊Sora App的发布,它相比抖音等平台,
它不一样的地方在于,它通过“Cameo”和“Remix”这个天才般的设计,硬生生把一个内容平台,扭转成了一个社交产品。
它的核心逻辑不再是「我关注的创作者更新了」,而是「我朋友把我做成了奥特曼,还发给了我」
它不是关于“围观”,而是关于**“参与”和“关系”**。
这,可能是未来AI时代的新的社交范式。
这条路,我觉得国内大厂也是很容易复刻的,毕竟我们应用层的基数在这里摆着(抖音应该是最快的,不过有可能会破坏既有生态)。
而当 AI 能够无缝融入这种日常交流,日常生活时,
它才真正“活”了过来。
- 原文作者:知识铺
- 原文链接:https://index.zshipu.com/ai001/post/20251010/%E5%AE%9E%E6%B5%8B-Sora-2-AI%E8%A7%86%E9%A2%91%E7%9A%84ChatGPT%E6%97%B6%E5%88%BB%E6%9D%A5%E4%BA%86%E5%85%AB%E5%A4%A7%E5%9C%BA%E6%99%AF%E6%95%99%E4%BD%A0%E8%A7%A3%E9%94%81%E5%90%84%E7%A7%8D%E7%8E%A9%E6%B3%95%E9%99%84%E9%82%80%E8%AF%B7%E7%A0%81-53AI-AI%E7%9F%A5%E8%AF%86%E5%BA%93%E5%A4%A7%E6%A8%A1%E5%9E%8B%E7%9F%A5%E8%AF%86%E5%BA%93%E5%A4%A7%E6%A8%A1%E5%9E%8B%E8%AE%AD%E7%BB%83%E6%99%BA%E8%83%BD%E4%BD%93%E5%BC%80%E5%8F%91/
- 版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议进行许可,非商业转载请注明出处(作者,原文链接),商业转载请联系作者获得授权。
- 免责声明:本页面内容均来源于站内编辑发布,部分信息来源互联网,并不意味着本站赞同其观点或者证实其内容的真实性,如涉及版权等问题,请立即联系客服进行更改或删除,保证您的合法权益。转载请注明来源,欢迎对文章中的引用来源进行考证,欢迎指出任何有错误或不够清晰的表达。也可以邮件至 sblig@126.com