OpenAI发布Sora 2模型与Sora独立应用：创造力将迎来寒武纪大爆发_腾讯新闻 --知识铺

划重点：

OpenAI发布新一代视频生成模型Sora 2，首次支持与画面匹配的AI音频生成。
推出独立应用Sora，让用户能够通过“入镜”（Cameo）功能，将自己或好友置入生成视频中；iOS版已上线，安卓版仍在开发中。
美国和加拿大的ChatGPT用户将率先体验Sora 2和新应用，随后将逐步扩展至其他国家和地区。
Sora应用在发布初期采用邀请制，OpenAI希望用户能与朋友一同加入。推荐机制不以延长用户浏览时间为目标，而是优先推荐激发创作灵感的内容。
Sora 2免费向所有用户开放，但有使用次数限制；ChatGPT Pro用户可使用“Sora 2 Pro”模型；ChatGPT Plus用户与免费用户一样，不额外享受升级权益。

当地时间9月30日，OpenAI发布了新一代视频生成模型Sora 2，首次支持与画面匹配的AI音频生成，并推出一款iOS应用Sora，让用户能够通过全新“入镜”（Cameo）功能，将自己或好友置入生成视频中。

OpenAI还宣布，Sora应用的API将在数周内上线，面向第三方开发者开放。第三方开发者将能够把Sora 2模型集成到自己的视频编辑应用中，解锁更精细的专业编辑功能，推动视频生成技术向新方向发展。OpenAI还确认，安卓版Sora应用目前仍处于开发之中。

在地区上线方面，OpenAI表示，美国和加拿大的ChatGPT用户将率先体验Sora 2和新应用，随后将逐步扩展至其他国家和地区。Sora 2免费向所有用户开放，但有使用次数限制；ChatGPT Pro用户可使用更高画质的“Sora 2 Pro”模型；ChatGPT Plus用户则与免费用户一样，不额外享受升级权益。

01.从“GPT-1时刻”到“GPT-3.5时刻”：Sora 2将重塑AI视频生成领域

Sora 2生成的画面视频截图

2024年初，OpenAI首次展示其原版Sora模型，以逼真的AI视频效果震惊业界。但当时的公测节奏缓慢，直到2024年底才先向少数创意合作伙伴开放。在此期间，AI视频生成领域迅速发展，Runway、Luma、Kling、Higgsfield等初创公司推出了众多更高质量且自带音频生成功能的逼真AI视频模型，让第一代Sora模型在音效与编辑功能上明显落后。这种情况一直持续至Sora 2的发布。

OpenAI把第一代Sora称为视频领域的“GPT-1 时刻”，标志着视频生成技术的初步可行性。而Sora 2则被定位为“GPT-3.5时刻”，在物理模拟、真实感和可控性方面显著提升。

Sora 2能够处理复杂的动作场景，如体操或划桨运动，同时遵循物理规则，如动量和浮力。相较于早期系统可能出现的“篮球瞬间传送进篮筐”等问题，Sora 2能够真实模拟投篮未中时的反弹效果。此外，该模型还能同步生成对话、背景音效和声音效果，创造出从逼真到动漫风格的统一视听体验。

“入镜”功能是Sora 2的一大亮点。用户只需进行一次性短视频录制，捕捉自己的形象和声音，即可将自己或朋友插入生成的视频场景中。直播中，OpenAI强调该功能完全基于用户自愿参与，设有验证机制以防止冒充，且用户可随时撤销授权。

02.邀测开启、免费先行：Sora应用的使用模式与ChatGPT Pro专属权益

Sora应用是体验Sora 2模型的主要入口。它支持视频创作与二次编辑，提供个性化推荐流和社交协作功能。用户可以通过“入镜”加入他人视频，或对热门内容进行再创作。视频风格与基调则由用户的提示词引导。

Sora应用在发布初期采用邀请制，OpenAI希望用户能与朋友一同加入。不同于传统社交媒体平台，该应用的推荐机制不以延长用户浏览时间为目标，而是优先推荐激发创作灵感的内容。推荐内容更倾向于用户关注或互动的对象，用户还可通过自然语言指令调整个性化设置。

Sora iOS应用免费提供，配有较为宽松的使用限制，但受限于算力资源。未来，OpenAI计划推出可选付费套餐，以满足用户对视频生成的高需求。ChatGPT Pro订阅用户将通过sora.com及应用内获得更高画质的“Sora 2 Pro”模型。

03.从验证到撤销：Sora入镜功能通过全流程措施保障用户数字身份安全

入镜功能在身份保护方面起到核心作用，具体措施包括：

·验证环节：用户在应用内录制短视频和动态音频样本，OpenAI通过音频挑战验证样本真实性，防止冒充。

·权限管理：用户可选择允许哪些人使用自己的入镜形象，仅限自己、特定联系人、互相关注用户或所有人，并可随时在设置中调整权限。

·个性化定制：用户可修改模型生成的外观或声音，如纠正衣着错误、口音偏差，或添加趣味化风格。

·撤销与删除权：用户可随时撤销他人对其客串形象的使用权限，并有权删除任何包含其形象的视频，包括他人创建的草稿。OpenAI称此机制赋予用户对其数字身份的“所有权式”控制。

OpenAI表示，这一机制赋予用户类似“身份所有权”的控制力。

04.聚焦青少年健康：Sora的防沉迷、内容过滤及家长控制措施

OpenAI在发布时特别强调了青少年保护与健康使用：

·防沉迷设计：18岁以下用户的应用默认禁用无限滚动，观看一定数量视频后需暂停并进入冷却期。成人用户在长时间被动浏览时也会收到提示，应用优先鼓励创作而非消费。

·未成年人内容保护：当系统检测到上传的客串录像或图像可能涉及未成年人时，将应用更严格的过滤标准，防范有害或不适当内容。

·隐私默认设置：青少年账户默认启用更严格的隐私设置，限制成人对其形象的使用、减少陌生人接触，并增加防骚扰屏障。

·家长控制：家长可通过与ChatGPT联动的工具调整青少年体验，包括覆盖推荐限制、禁用算法个性化、管理客串权限和限制私信功能。

这些措施反映了OpenAI在鼓励实验的同时，关注用户的健康使用问题，应对沉迷行为和有害社交动态的担忧。

05.全流程安全管控：Sora的输入输出审核、C2PA元水印与外部压力测试

除身份保护外，OpenAI还在系统安全白皮书中列出了多项措施：

·输入与输出均通过多模态分类器进行审核。

·禁止生成未经同意的公众人物肖像或写实视频。

·自动识别并阻止极端、裸露、自残及政治操控类内容。

·所有生成视频带有C2PA（内容来源与真实性联盟）元数据与动态水印，便于确认内容来源。

OpenAI还与外部红队测试人员合作，针对极端主义、裸露、自残和政治操纵等类别对系统进行压力测试。

06.构建Sora 2生态：API开放赋能开发者，兼顾娱乐创作与现实模拟

OpenAI还透露，sora.com将新增storyboard工具，让创作者逐镜控制视频结构，预计数周内上线。与此同时，Sora 2 API将在近期推出，供开发者集成至第三方工具。正如OpenAI研究员在直播中所言：“很多细分场景下用户会创造出惊人的作品，我们未必需要亲自开发所有编辑功能，API可以让开发者去完成。

OpenAI将Sora 2定位为娱乐与创作工具，同时也是其在“世界模拟”与“物理现实交互”方向的重要尝试。该公司承认系统仍不完美，但这标志着迈向“模拟现实”的新进展。通过工具升级、社交应用、身份保护机制与即将面向开发者的API，OpenAI 显然希望将Sora 2打造成既是消费级产品，也是开放平台。

07.OpenAI CEO奥特曼：Sora应用是创造力领域的ChatGPT时刻

OpenAI首席执行官山姆·奥特曼（Sam Altman）

OpenAI首席执行官山姆·奥特曼（Sam Altman）当日在博文中将Sora应用称为“创造力领域的ChatGPT时刻”。他表示，早期用户普遍认为“入镜”是一种新颖而有吸引力的社交方式，但同时警告该服务存在成瘾与霸凌风险。

以下为文章全文：

我们推出一款名为Sora的新应用。它结合了全新的Sora 2模型与一个全新的产品，让用户能够轻松创建、分享和观看视频。

在我们许多人看来，这就像是“创造力的ChatGPT时刻”，它新鲜而有趣。能够快速、便捷地将一个想法转化为成果，并因此产生新的社交互动方式，本身就是一件令人振奋的事情。

创造力或许正要迎来一次“寒武纪大爆发”，而艺术与娱乐的整体质量也可能随之大幅提升。即便在Sora应用的早期测试阶段，我们中的许多人已经深刻感受到，创作的舞台变得前所未有地开放。

尤其是“入镜”功能，让用户可以把自己或朋友放入视频中。团队为保持角色一致性付出了大量努力。在测试过程中，我们发现这一功能不仅带来趣味，更是一种出乎意料的全新社交体验。

不过，我们也心存担忧。社交媒体确实对世界产生过积极影响，但同时也带来了消极后果。我们清楚，这类服务很可能具有高度成瘾性，也可能被用于霸凌。

完全可以想象，AI视频生成在最糟糕的情况下会演变为一种强化学习驱动的“劣质信息流”，用户被无限吸附其中。团队对此高度警惕，并投入大量心力思考如何避免这一陷阱，尝试探索多种可能的解决方案。我们将在产品早期阶段不断实验。

除了已经设置的防护措施（例如防止他人滥用肖像生成深度伪造内容、屏蔽令人不安或违法的视频、定期评估Sora对用户情绪与健康的影响等），我们也深知如果Sora获得巨大成功，还会出现新的挑战。为帮助我们引导产品朝着积极方向发展，避免负面影响，我们确立了以下几项原则：

产品原则

1.优化长期用户满意度

绝大多数用户在回顾使用Sora的6个月后，应该会觉得：如果没有使用它，生活反而不如现在好。若无法实现这一目标，我们将对产品进行重大调整；若仍然无法改进，我们会考虑停止提供服务。

2.鼓励用户控制推荐流

用户应能明确告诉Sora自己想要看到什么：是希望视频让自己更放松，还是更有活力？是只观看某一类特定兴趣的内容，还是只在限定时间内使用？随着技术的发展，未来用户甚至可以用自然语言更细致地向 Sora描述偏好。对于青少年用户，家长可选择关闭个性化推荐流，以及关闭私信功能等。

3.优先鼓励创作

我们希望让所有人都能轻松且有成就感地参与创作过程。我们相信，人类天生具有创造力，而创造本身对获得满足感至关重要。

4.帮助用户实现长期目标

我们希望理解用户的真正目标，并帮助他们达成。若用户想与朋友更紧密联系，我们将助力实现这一点；若用户想健身，我们会推荐能激励的内容；若用户想创业，我们会帮助他们学习相关技能。

当然，如果有人确实只是想沉迷于刷视频、发泄愤怒，那也没关系，我们会支持这一使用方式。我们希望用户花时间在应用上，是因为他们认为这值得，而不是因为我们替他们定义什么才是“有意义”的使用。

这就是我们对Sora 2的愿景：一个推动创造力、带来乐趣，同时又努力避免重蹈社交媒体覆辙的产品。

（文/腾讯科技特约编译无忌，编辑/郑萌萌）

免责声明：本内容来自腾讯平台创作者，不代表腾讯新闻或腾讯网的观点和立场。

文章目录

OpenAI发布Sora 2模型与Sora独立应用：创造力将迎来寒武纪大爆发_腾讯新闻 --知识铺

01.从“GPT-1时刻”到“GPT-3.5时刻”：Sora 2将重塑AI视频生成领域

02.邀测开启、免费先行：Sora应用的使用模式与ChatGPT Pro专属权益

03.从验证到撤销：Sora入镜功能通过全流程措施保障用户数字身份安全

04.聚焦青少年健康：Sora的防沉迷、内容过滤及家长控制措施

05.全流程安全管控：Sora的输入输出审核、C2PA元水印与外部压力测试

06.构建Sora 2生态：API开放赋能开发者，兼顾娱乐创作与现实模拟

07.OpenAI CEO奥特曼：Sora应用是创造力领域的ChatGPT时刻

See Also

最近文章

福利派送

分类

标签

友情链接

其它