原创
AI下一轮飞跃的引爆点:科技巨头竞相发力“世界模型”!
09-29 15:02 星期一
财联社 潇湘

财联社9月29日讯(编辑 潇湘)人工智能先驱们几乎一致认为,世界模型对打造下一代人工智能正至关重要。许多人表示,该技术终将助力创造超越人类的“通用人工智能”(AGI)。

早在去年,斯坦福大学教授、人工智能“教母”李飞飞已筹集2.3亿美元创立世界模型初创公司World Labs。英伟达首席执行官黄仁勋今年早些时候也表示,世界模型能助力实现“物理人工智能”,自主操控机器人、自动驾驶汽车等设备。

而就在上周,Meta官宣发布了一款名为代码世界模型(Code World Model)的LLM,探索如何使用世界模型改进AI代码生成性能。Meta新成立的超级智能AI实验室将与机器人团队合作,构建一个“世界模型”,模拟现实世界物理规律,为机器人提供空间感知和精细操作能力,弥补现有机器人的不足。

在中国方面,全球知名增长咨询公司Frost & Sulllivan近期发布的《2025年中国世界模型发展白皮书》报告显示,中国世界模型领域玩家已经超过10家。

不难看到,尽管当前大型语言模型和ChatGPT背后的AI技术备受瞩目,但基于世界模型的人工智能正在前沿研究领域蓄势待发,有望让技术在人类生活中承担全新角色。

这些投入能否如企业界领袖预言般催生“超级智能”尚不明朗。但短期内,世界模型无疑有望提升AI在当前薄弱环节的表现,尤其在空间推理领域。

从“书呆子”到“放眼看世界”

当下的AI就好比“书呆子”,它们所知的一切都来自可获取的语言、图像及视频。要更进一步进化,它们必须具备“街头智慧”,而这背后无疑需要“世界模型”大展拳脚。

世界模型是实现空间智能的核心,通过整合多模态数据,为空间智能技术在立体空间中进行推理和操作提供内在的环境表征,其也被认为是物理推理的基础,可以通过模拟未来状态从而更加接近类人智能,弥合人与机器之间的认知对齐差异。

其中的关键在于,让人工智能像人类和动物那样,从环境中学习并将其抽象版本真实地呈现在“头脑”中。为此,开发者需要通过模拟世界来训练人工智能——这就如同通过玩《GT赛车》来学习驾驶,或通过玩《微软飞行模拟》掌握飞行技巧。此类世界模型涵盖了规划行动、执行操作及预测未来所需的一切要素,包括物理规律与时间维度。

这种世界模型方法,其实已经对现实世界产生了潜在的巨大影响。风险投资公司Lightspeed的合伙人兼投资者Moritz Baier-Lentz表示,无人机战争、新型机器人和比人类更安全的自动驾驶车辆都正从中受益。

优步前AI业务负责人、经常批评当前AI模式的Gary Marcus指出,无论当今生成式人工智能接受多少数据训练,它们只能建立世界运作的概率模型。本质上,当前人工智能学习的是输入数据间的关联性——无论是文字图像,还是分子及其功能。这种对世界模糊的近似认知,似乎被混杂地编码在AI“大脑”中,既包含数据本身,又包含大量关于数据处理的庞杂规则——而这些规则又往往残缺不全或自相矛盾。

一个很好的例子是:一台运行1979年程序的雅达利2600游戏机,可以在国际象棋比赛中击败最先进的聊天机器人。这些聊天机器人往往会尝试非法走法,并很快忘记棋子的位置。本质上,当今基于Transformer架构的人工智能是在进行预测,而不是逻辑推理。尽管它们已经通过无数盘游戏和无数规则手册的训练,但仍然如此。

雅达利2600游戏机之所以能获胜,是因为它使用一个古老而简陋的内部世界模型版本——一个数据库——来保持棋子的位置准确。

连蓝领的岗位也危险了?

现实世界无疑远比受限的游戏世界复杂得多。而为了应对这些挑战,科技巨头们也正在进行新的尝试。

谷歌DeepMind的研究人员着手打造一个系统,寻求以前所未有的逼真程度实现对现实世界的模拟。最终成果是,Genie 3(目前仍处于研究预览阶段,尚未公开发布)能够仅凭文本提示,生成照片般逼真的开放世界虚拟景观。你可以将Genie 3视为一种快速生成本质上类似开放世界电子游戏的方法——可以尽可能忠实于现实世界。在这个虚拟空间中,新生人工智能“婴儿”可以无休止地玩耍、犯错,并学习如何实现目标,就像现实世界中的幼年动物或人类一样。这个实验过程被称为强化学习。

DeepMind项目联合负责人Jack Parker-Holder表示,Genie 3是一个系统的一部分,该系统可以帮助训练未来驾驶机器人、自动驾驶汽车和其他“具身化”人工智能的人工智能。他补充称,环境中可能充满了人和障碍物:人工智能可以通过观察人类在虚拟空间中的活动来学习如何与人类互动。

事实上,特斯拉CEO马斯克可以说是最早抛出“世界模型”这一说法的人士之一。特斯拉为了实现全球范围內所有路况的自动驾驶,在感知跟决策中间,嵌入了一个AI模型,主要是构建一个虚拟环境,以便进行自动驾驶能力的学习和验证。

而与之类似,总部位于多伦多的Waabi公司则构建了一个名为“Waabi World”的虚拟世界,专门用于训练人工智能驾驶卡车。让它们在模拟环境中反复碰撞比在现实世界中尝试一次要更为安全也更便宜。该公司首席执行官Raquel Urtasun表示,这可以让人工智能记录数百万英里的虚拟驾驶里程。她补充称,预计到今年年底,Waabi的软件将能够在真实道路上自动驾驶一辆真正的卡车。

目前,大语言模型似乎已经接管了白领工作中的一些职能,而具备世界模型智能的AI可能会接管更多工作——在过往,蓝领工作一直以来相对安全,但随着人工智能开发者对世界模型的深入研究,机器人可能会开始接手卡车司机、水管工或护理员等职位……

财联社声明:文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。
热门评论
沛Sunya回复1天前·福建0
666
henshao回复2天前·浙江1
西部世界嘛?
www回复2天前·重庆1
低调的过小日子回复2天前·浙江1
cls-udwnts回复2天前·浙江1
加油。就是饼越大。市值越高
秋捷回复2天前·上海1
巴黎午夜的A股人回复2天前·上海0
世界模型是AGI的必经之路,现在的AI只是背书机器,没有‘常识’
保持一颗平常心回复2天前·上海1
AI学开车靠模拟,人类考驾照却还得挂科?这不公平!
无_名回复2天前·上海1
Waabi用虚拟世界训练卡车AI,省油又安全,真香!
评论萝卜特回复2天前·上海3
1、背景补充 世界模型作为AI新焦点,旨在通过模拟物理规律和环境交互,突破大语言模型(LLM)的局限性。谷歌DeepMind推出Genie 3生成动态虚拟世界,Meta通过VJEPA模型模仿人类学习机制,英伟达押注“物理AI”推动机器人革命。李飞飞的World Labs、阿里通义大模型等中企加速布局,技术核心在于整合多模态数据实现空间推理和物理仿真,为自动驾驶、人形机器人和工业数字化提供底层支持。 2、影响分析 产业链机会: 算力硬件:英伟达GPU、华为昇腾等需求激增,但国产替代受制程工艺限制; 应用场景:智能驾驶(特斯拉/小鹏NOA渗透率提升)、工业仿真(Waabi虚拟测试)、机器人(优必选B端落地)成短期变现方向; 数据服务:合成数据训练(如Omniverse平台)和3D生成工具(World Labs)催生新业态。 投资风险: 技术迭代不确定性(如Transformer架构能否突破并行感知瓶颈); 算力成本高企(单模型训练需数百万美元); 监管缺口(物理AI安全标准未建立)。 > (以上内容由AI生成,不构成投资建议,不代表刊登平台观点,请独立判断和决策。)
cls-50m84j回复2天前·河北2
明白了吗?
cls-1397491回复2天前·广东2
别说了,数据中心,ai 服务器,ai 芯片都是基础建设