马斯克旗下xAI加入“世界模型”竞赛,“视觉模型”会是下一个“大语言模型”吗?机器人xai人工智能真实世界超级智能埃隆_马斯克_网易订阅 --知识铺
本文作者:龙玥
来源:硬AI
人工智能领域的战火正在从大语言模型蔓延至一个更前沿的领域——能够理解并模拟真实物理世界的“世界模型”(World Models)。而xAI已悄然加入这场竞赛,与谷歌和Meta等科技巨头同台竞技。
据英国《金融时报》10月12日报道,马斯克的初创公司xAI在今年夏天从芯片巨头英伟达聘请了人工智能专家,专门从事世界模型的研发。与依赖文本的大语言模型不同,世界模型通过对海量的视频和机器人数据进行训练,旨在掌握真实世界的物理规律。
“未来的视频模型将变得和语言模型一样智能”,谷歌研究人员在论文中说道。英伟达上月也曾表示,世界模型的潜在市场规模可能接近当前全球经济的总量。
兵马先行:xAI的游戏“奇袭”与机器人野望
为了在这场竞赛中占据一席之地,xAI正在积极招兵买马。
公司已聘请了来自英伟达的两位AI研究员Zeeshan Patel和Ethan He,他们在世界模型领域拥有丰富经验。英伟达凭借其用于创建和运行模拟的Omniverse平台,一直是该技术的领导者。
知情人士透露,xAI为世界模型规划的第一个商业化落点是游戏领域,用于生成可交互的3D环境。这一动态迅速引发市场关注,因为它不仅是xAI商业化路径的明确信号,也凸显了世界模型作为下一代AI技术的巨大潜力。
马斯克本人也在社交平台X上确认,xAI将在“明年年底前发布一款出色的AI生成游戏”。长远来看,这些技术最终可能应用于机器人的人工智能系统。
xAI的招聘信息也印证了其发展方向。公司正在为其“omni团队”招聘图像和视频生成领域的技术人员,薪资范围高达18万至44万美元,该团队致力于“创造超越文本的神奇AI体验”。
此外,公司还在以时薪45至100美元招聘“视频游戏导师”,以训练其AI模型Grok制作视频游戏。
范式转移:视觉模型的“GPT时刻”
xAI的高调入局,恰逢一个关键的行业预判浮出水面:**未来的视频模型将变得和语言模型一样智能。**谷歌最近的一篇论文指出,其视频模型Veo 3正展现出与大语言模型(LLM)相似的“涌现能力”。
正如LLM通过“下一词元预测”的简单任务,最终学会了数学和创意写作等额外技能,视频模型通过“下一帧预测”,也开始零样本(zero-shot)地解锁一系列令人惊讶的能力,例如物体分割、边缘检测和模拟工具使用等,而这些都未经专门训练。
谷歌的研究人员Jack Clark在论文中写道:“我们认为,正如自然语言处理(NLP)从特定任务模型转向通用模型一样,机器视觉领域也可能通过视频模型发生同样的转变——一个‘视觉领域的GPT-3时刻’。”
他们将视频逐帧生成的过程类比为语言模型中的“思维链”(chain-of-thought),并称之为“帧链”(chain-of-frames),认为这使得视频模型能够跨越时空进行推理。
这一发现意义深远,它暗示着通过发展更智能的视频模型,人们或许能够获得能力极强的机器人“代理”(agent)。
前景与现实:高昂的成本与“愿景”的缺失
尽管前景诱人,但通往世界模型的道路并非坦途。目前,该技术仍面临巨大的技术挑战,其中最主要的是为模拟真实世界寻找和处理足够训练数据的成本极其高昂。
与此同时,业界也存在对AI作用的冷静审视。热门游戏《博德之门3》的开发商Larian Studios的发行主管Michael Douse本周在X上表示,AI无法解决游戏行业的“大问题”,即“领导力和愿景”。
他补充说,行业需要的不是“更多由数学方式生产、经过心理学训练的游戏循环”,而是对世界更多样化的表达。这代表了一种普遍的观点:纯粹的技术突破本身,并不能保证创造出能够真正打动人心的商业产品。
尽管挑战重重,但xAI的入局无疑为世界模型的竞赛再添一把火。
AI的焦点正不可逆转地从纯粹的数字信息处理,转向对复杂物理现实的模拟与交互。视觉模型是否能复刻大语言模型的辉煌,迎来属于自己的“GPT时刻”,不仅将决定下一代AI霸主的归属,更可能重塑我们与数字及物理世界的根本关系。
本文来自微信公众号“硬AI”,关注更多AI前沿资讯请移步这里
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.
- 原文作者:知识铺
- 原文链接:https://index.zshipu.com/ai001/post/20251011/%E9%A9%AC%E6%96%AF%E5%85%8B%E6%97%97%E4%B8%8BxAI%E5%8A%A0%E5%85%A5%E4%B8%96%E7%95%8C%E6%A8%A1%E5%9E%8B%E7%AB%9E%E8%B5%9B%E8%A7%86%E8%A7%89%E6%A8%A1%E5%9E%8B%E4%BC%9A%E6%98%AF%E4%B8%8B%E4%B8%80%E4%B8%AA%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B%E5%90%97%E6%9C%BA%E5%99%A8%E4%BA%BAxai%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD%E7%9C%9F%E5%AE%9E%E4%B8%96%E7%95%8C%E8%B6%85%E7%BA%A7%E6%99%BA%E8%83%BD%E5%9F%83%E9%9A%86_%E9%A9%AC%E6%96%AF%E5%85%8B_%E7%BD%91%E6%98%93%E8%AE%A2%E9%98%85/
- 版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议进行许可,非商业转载请注明出处(作者,原文链接),商业转载请联系作者获得授权。
- 免责声明:本页面内容均来源于站内编辑发布,部分信息来源互联网,并不意味着本站赞同其观点或者证实其内容的真实性,如涉及版权等问题,请立即联系客服进行更改或删除,保证您的合法权益。转载请注明来源,欢迎对文章中的引用来源进行考证,欢迎指出任何有错误或不够清晰的表达。也可以邮件至 sblig@126.com
See Also
- 苹果截胡马斯克抢到 AI 人才,想给 HomePod 加个「智慧眼」初创公司智能家居苹果公司科技巨头知名企业蒂姆·库克埃隆_马斯克_网易订阅 --知识铺
- 高盛-构建AI叙事——关于行业趋势与市场环境的五大核心争议_腾讯新闻 --知识铺
- 库克虎口夺食:马斯克盯上的北大校友AI公司被苹果抢走谷歌微软初创公司苹果公司科技巨头知名企业蒂姆·库克埃隆_马斯克_网易订阅 --知识铺
- LeCun考虑辞职!Meta AI百亿豪赌引爆「内战」-CSDN博客 --知识铺
- 伴随“人工智能+”行动实施,政府科技管理部门如何借助迅捷的AI技术转移操作系统解决创新资源分散难整合,从而增强精细化治理效能,最终增强健全长效运营机制?-科技成果转化-科易网技术创新平台 --知识铺