OpenAI发布Sora 2模型与Sora独立应用:创造力将迎来寒武纪大爆发_腾讯新闻 --知识铺
划重点:
-
OpenAI发布新一代视频生成模型Sora 2,首次支持与画面匹配的AI音频生成。
-
推出独立应用Sora,让用户能够通过“入镜”(Cameo)功能,将自己或好友置入生成视频中;iOS版已上线,安卓版仍在开发中。
-
美国和加拿大的ChatGPT用户将率先体验Sora 2和新应用,随后将逐步扩展至其他国家和地区。
-
Sora应用在发布初期采用邀请制,OpenAI希望用户能与朋友一同加入。推荐机制不以延长用户浏览时间为目标,而是优先推荐激发创作灵感的内容。
-
Sora 2免费向所有用户开放,但有使用次数限制;ChatGPT Pro用户可使用“Sora 2 Pro”模型;ChatGPT Plus用户与免费用户一样,不额外享受升级权益。
当地时间9月30日,OpenAI发布了新一代视频生成模型Sora 2,首次支持与画面匹配的AI音频生成,并推出一款iOS应用Sora,让用户能够通过全新“入镜”(Cameo)功能,将自己或好友置入生成视频中。
OpenAI还宣布,Sora应用的API将在数周内上线,面向第三方开发者开放。第三方开发者将能够把Sora 2模型集成到自己的视频编辑应用中,解锁更精细的专业编辑功能,推动视频生成技术向新方向发展。OpenAI还确认,安卓版Sora应用目前仍处于开发之中。
在地区上线方面,OpenAI表示,美国和加拿大的ChatGPT用户将率先体验Sora 2和新应用,随后将逐步扩展至其他国家和地区。Sora 2免费向所有用户开放,但有使用次数限制;ChatGPT Pro用户可使用更高画质的“Sora 2 Pro”模型;ChatGPT Plus用户则与免费用户一样,不额外享受升级权益。
01.从“GPT-1时刻”到“GPT-3.5时刻”:Sora 2将重塑AI视频生成领域
Sora 2生成的画面视频截图
2024年初,OpenAI首次展示其原版Sora模型,以逼真的AI视频效果震惊业界。但当时的公测节奏缓慢,直到2024年底才先向少数创意合作伙伴开放。在此期间,AI视频生成领域迅速发展,Runway、Luma、Kling、Higgsfield等初创公司推出了众多更高质量且自带音频生成功能的逼真AI视频模型,让第一代Sora模型在音效与编辑功能上明显落后。这种情况一直持续至Sora 2的发布。
OpenAI把第一代Sora称为视频领域的“GPT-1 时刻”,标志着视频生成技术的初步可行性。而Sora 2则被定位为“GPT-3.5时刻”,在物理模拟、真实感和可控性方面显著提升。
Sora 2能够处理复杂的动作场景,如体操或划桨运动,同时遵循物理规则,如动量和浮力。相较于早期系统可能出现的“篮球瞬间传送进篮筐”等问题,Sora 2能够真实模拟投篮未中时的反弹效果。此外,该模型还能同步生成对话、背景音效和声音效果,创造出从逼真到动漫风格的统一视听体验。
“入镜”功能是Sora 2的一大亮点。用户只需进行一次性短视频录制,捕捉自己的形象和声音,即可将自己或朋友插入生成的视频场景中。直播中,OpenAI强调该功能完全基于用户自愿参与,设有验证机制以防止冒充,且用户可随时撤销授权。
02.邀测开启、免费先行:Sora应用的使用模式与ChatGPT Pro专属权益
Sora应用是体验Sora 2模型的主要入口。它支持视频创作与二次编辑,提供个性化推荐流和社交协作功能。用户可以通过“入镜”加入他人视频,或对热门内容进行再创作。视频风格与基调则由用户的提示词引导。
Sora应用在发布初期采用邀请制,OpenAI希望用户能与朋友一同加入。不同于传统社交媒体平台,该应用的推荐机制不以延长用户浏览时间为目标,而是优先推荐激发创作灵感的内容。推荐内容更倾向于用户关注或互动的对象,用户还可通过自然语言指令调整个性化设置。
Sora iOS应用免费提供,配有较为宽松的使用限制,但受限于算力资源。未来,OpenAI计划推出可选付费套餐,以满足用户对视频生成的高需求。ChatGPT Pro订阅用户将通过sora.com及应用内获得更高画质的“Sora 2 Pro”模型。
03.从验证到撤销:Sora入镜功能通过全流程措施保障用户数字身份安全
入镜功能在身份保护方面起到核心作用,具体措施包括:
·验证环节:用户在应用内录制短视频和动态音频样本,OpenAI通过音频挑战验证样本真实性,防止冒充。
·权限管理:用户可选择允许哪些人使用自己的入镜形象,仅限自己、特定联系人、互相关注用户或所有人,并可随时在设置中调整权限。
·个性化定制:用户可修改模型生成的外观或声音,如纠正衣着错误、口音偏差,或添加趣味化风格。
·撤销与删除权:用户可随时撤销他人对其客串形象的使用权限,并有权删除任何包含其形象的视频,包括他人创建的草稿。OpenAI称此机制赋予用户对其数字身份的“所有权式”控制。
OpenAI表示,这一机制赋予用户类似“身份所有权”的控制力。
04.聚焦青少年健康:Sora的防沉迷、内容过滤及家长控制措施
OpenAI在发布时特别强调了青少年保护与健康使用:
·防沉迷设计:18岁以下用户的应用默认禁用无限滚动,观看一定数量视频后需暂停并进入冷却期。成人用户在长时间被动浏览时也会收到提示,应用优先鼓励创作而非消费。
·未成年人内容保护:当系统检测到上传的客串录像或图像可能涉及未成年人时,将应用更严格的过滤标准,防范有害或不适当内容。
·隐私默认设置:青少年账户默认启用更严格的隐私设置,限制成人对其形象的使用、减少陌生人接触,并增加防骚扰屏障。
·家长控制:家长可通过与ChatGPT联动的工具调整青少年体验,包括覆盖推荐限制、禁用算法个性化、管理客串权限和限制私信功能。
这些措施反映了OpenAI在鼓励实验的同时,关注用户的健康使用问题,应对沉迷行为和有害社交动态的担忧。
05.全流程安全管控:Sora的输入输出审核、C2PA元水印与外部压力测试
除身份保护外,OpenAI还在系统安全白皮书中列出了多项措施:
·输入与输出均通过多模态分类器进行审核。
·禁止生成未经同意的公众人物肖像或写实视频。
·自动识别并阻止极端、裸露、自残及政治操控类内容。
·所有生成视频带有C2PA(内容来源与真实性联盟)元数据与动态水印,便于确认内容来源。
OpenAI还与外部红队测试人员合作,针对极端主义、裸露、自残和政治操纵等类别对系统进行压力测试。
06.构建Sora 2生态:API开放赋能开发者,兼顾娱乐创作与现实模拟
OpenAI还透露,sora.com将新增storyboard工具,让创作者逐镜控制视频结构,预计数周内上线。与此同时,Sora 2 API将在近期推出,供开发者集成至第三方工具。正如OpenAI研究员在直播中所言:“很多细分场景下用户会创造出惊人的作品,我们未必需要亲自开发所有编辑功能,API可以让开发者去完成。
OpenAI将Sora 2定位为娱乐与创作工具,同时也是其在“世界模拟”与“物理现实交互”方向的重要尝试。该公司承认系统仍不完美,但这标志着迈向“模拟现实”的新进展。通过工具升级、社交应用、身份保护机制与即将面向开发者的API,OpenAI 显然希望将Sora 2打造成既是消费级产品,也是开放平台。
07.OpenAI CEO奥特曼:Sora应用是创造力领域的ChatGPT时刻
OpenAI首席执行官山姆·奥特曼(Sam Altman)
OpenAI首席执行官山姆·奥特曼(Sam Altman)当日在博文中将Sora应用称为“创造力领域的ChatGPT时刻”。他表示,早期用户普遍认为“入镜”是一种新颖而有吸引力的社交方式,但同时警告该服务存在成瘾与霸凌风险。
以下为文章全文:
我们推出一款名为Sora的新应用。它结合了全新的Sora 2模型与一个全新的产品,让用户能够轻松创建、分享和观看视频。
在我们许多人看来,这就像是“创造力的ChatGPT时刻”,它新鲜而有趣。能够快速、便捷地将一个想法转化为成果,并因此产生新的社交互动方式,本身就是一件令人振奋的事情。
创造力或许正要迎来一次“寒武纪大爆发”,而艺术与娱乐的整体质量也可能随之大幅提升。即便在Sora应用的早期测试阶段,我们中的许多人已经深刻感受到,创作的舞台变得前所未有地开放。
尤其是“入镜”功能,让用户可以把自己或朋友放入视频中。团队为保持角色一致性付出了大量努力。在测试过程中,我们发现这一功能不仅带来趣味,更是一种出乎意料的全新社交体验。
不过,我们也心存担忧。社交媒体确实对世界产生过积极影响,但同时也带来了消极后果。我们清楚,这类服务很可能具有高度成瘾性,也可能被用于霸凌。
完全可以想象,AI视频生成在最糟糕的情况下会演变为一种强化学习驱动的“劣质信息流”,用户被无限吸附其中。团队对此高度警惕,并投入大量心力思考如何避免这一陷阱,尝试探索多种可能的解决方案。我们将在产品早期阶段不断实验。
除了已经设置的防护措施(例如防止他人滥用肖像生成深度伪造内容、屏蔽令人不安或违法的视频、定期评估Sora对用户情绪与健康的影响等),我们也深知如果Sora获得巨大成功,还会出现新的挑战。为帮助我们引导产品朝着积极方向发展,避免负面影响,我们确立了以下几项原则:
产品原则
1.优化长期用户满意度
绝大多数用户在回顾使用Sora的6个月后,应该会觉得:如果没有使用它,生活反而不如现在好。若无法实现这一目标,我们将对产品进行重大调整;若仍然无法改进,我们会考虑停止提供服务。
2.鼓励用户控制推荐流
用户应能明确告诉Sora自己想要看到什么:是希望视频让自己更放松,还是更有活力?是只观看某一类特定兴趣的内容,还是只在限定时间内使用?随着技术的发展,未来用户甚至可以用自然语言更细致地向 Sora描述偏好。对于青少年用户,家长可选择关闭个性化推荐流,以及关闭私信功能等。
3.优先鼓励创作
我们希望让所有人都能轻松且有成就感地参与创作过程。我们相信,人类天生具有创造力,而创造本身对获得满足感至关重要。
4.帮助用户实现长期目标
我们希望理解用户的真正目标,并帮助他们达成。若用户想与朋友更紧密联系,我们将助力实现这一点;若用户想健身,我们会推荐能激励的内容;若用户想创业,我们会帮助他们学习相关技能。
当然,如果有人确实只是想沉迷于刷视频、发泄愤怒,那也没关系,我们会支持这一使用方式。我们希望用户花时间在应用上,是因为他们认为这值得,而不是因为我们替他们定义什么才是“有意义”的使用。
这就是我们对Sora 2的愿景:一个推动创造力、带来乐趣,同时又努力避免重蹈社交媒体覆辙的产品。
(文/腾讯科技特约编译无忌,编辑/郑萌萌)
免责声明:本内容来自腾讯平台创作者,不代表腾讯新闻或腾讯网的观点和立场。
举报
- 原文作者:知识铺
- 原文链接:https://index.zshipu.com/ai001/post/20251010/OpenAI%E5%8F%91%E5%B8%83Sora-2%E6%A8%A1%E5%9E%8B%E4%B8%8ESora%E7%8B%AC%E7%AB%8B%E5%BA%94%E7%94%A8%E5%88%9B%E9%80%A0%E5%8A%9B%E5%B0%86%E8%BF%8E%E6%9D%A5%E5%AF%92%E6%AD%A6%E7%BA%AA%E5%A4%A7%E7%88%86%E5%8F%91_%E8%85%BE%E8%AE%AF%E6%96%B0%E9%97%BB/
- 版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议进行许可,非商业转载请注明出处(作者,原文链接),商业转载请联系作者获得授权。
- 免责声明:本页面内容均来源于站内编辑发布,部分信息来源互联网,并不意味着本站赞同其观点或者证实其内容的真实性,如涉及版权等问题,请立即联系客服进行更改或删除,保证您的合法权益。转载请注明来源,欢迎对文章中的引用来源进行考证,欢迎指出任何有错误或不够清晰的表达。也可以邮件至 sblig@126.com