李飞飞一年前究竟说了啥?怎么又火了
创始人
2025-09-11 11:02:13
0

闻乐 发自 凹非寺

量子位 | 公众号 QbitAI

大语言模型的局限在哪里?

AI教母李飞飞这样说:

大自然中是没有语言存在的,你不会从天空中直接看到文字。

语言是一种纯粹的生成的信号。

语言信号的输出主要基于人类给的输入信号,可以说,语言是不独立于人之外的。

然而,物理世界是客观存在的。所以提取、理解、生成3D世界的数据、实现空间智能和处理语言问题时截然不同。

没想到,李飞飞一年前的访谈被扒出来,又引发大量围观。

她这段话意味着,大语言模型或许还不是真正的智能。

真正的智能将是信号感知、物理以及和现实世界相结合的产物。

下面来看看大家还在热议些啥吧。

空间智能可以借鉴语言模型,但仍存在本质差异

这场讨论的焦点在于,现在基于语言信号训练的模型到底懂不懂物理世界的常识

首先,回顾一下李飞飞的说法。

她认为语言模型及当今的多模态语言模型的底层表示是一维的。它们在根本上就是操作于离散token的一维序列上,所以模型对于书面文本这种一维序列的表示是非常自然的。

然而,在处理空间智能问题时,核心是世界的三维本质。

虽然多模态大语言模型也能看图像,但它是将其他模态硬塞进这种一维token序列的底层表示中,这种一维且由人类生成的数据,可能无法很好地表示物理世界,造成信息损失。

如果直接让模型处理3D数据,那么表示类型与模型旨在执行的任务类型之间将会有更好的匹配。

而空间智能的挑战就是在于从这个真实世界中提取、表示和生成信息。

除了这个维度上的差异,从更哲学的角度来说,她认为语言是一种纯粹由生成产生的信号。自然界中并不存在预设的语言形式,也就是说语言不能独立于人类之外。

大模型能够通过学习并反刍所输入的数据,无论输入什么样的数据,模型都能用足够的泛化能力处理语言任务。这是因为语言,或者说文本的本质允许模型在生成范式下表现得出色。

与语言不同,3D世界是真实存在于外部的。这个世界遵循着物理定律,并因材料等多种因素而具有其自身的结构。

因此,要让模型倒推出3D世界的信息,并能够表示和生成它,在技术层面上,空间智能可以借鉴语言模型,但从哲学的范畴来看,这两者仍存在本质差异。

有人举了一堆例子来证明李飞飞的观点,同时说明语言模型在理解物理世界时确实有局限。

基于语言信号训练的模型在物理世界任务中表现差

比如用一个小实验来测试Claude 3.5 Sonnet、GPT-4o、Gemini 1.5 Pro三个多模态大模型的物理常识,并与人类儿童表现做对比。

研究用Animal-AI这个用来测试动物和人工智能体物理认知的3D环境来测试大模型,让大模型通过前进/后退、左转/右转、环境描述与规划控制三个指令控制一个小角色在虚拟环境中完成任务。

第一个实验是让大模型完成一些简单的任务,如直接找到小球,还有一些稍难的任务,如躲开障碍物找到小球。

结果发现模型只能搞定最简单的任务,稍难一点就不行了。

第二个实验是在第一个实验的基础上增加教学案例,比如演示正确做法,结果模型表现也没有明显的提升。

对比之后再看,这些大模型的表现远不及人类儿童,也比不上专门为这个环境测试的机器人。

还有其他研究团队设计了一个名为ABench-Physics的工具,专门用来测试大语言模型在物理推理方面的能力,核心就是想搞清楚这些模型到底能不能真的理解物理、解决物理问题。

测试分两部分,Phy A由400道竞赛级别的物理难题组成,先给大模型来个基础测试。

Phy B属于动态部分:修改Phy A中题目的数字,但不改变物理原理,用来测试大模型能不能进行灵活的物理推理。

结果显示,最厉害的模型在Phy A上的正确率只有43%,而在Phy B中模型的平均准确率下降了22.5%。

这说明模型并不是真懂物理。

还有团队用视觉任务测试大模型,比如让模型判断照片中哪些物体更近,或者匹配相同的事物。

人类对这些任务的正确率能达到95.7%,而几个模型最高的正确率仅有51%。在视觉感知上,大模型还远不及人类。

这些结果都进一步证明了李飞飞之前访谈中关于大模型理解真实物理世界局限性的观点。

也得到了网友们的认同。

模型的开发确实正在扩展到将模型建立在物理与多模态理解的基础上。

讨论升级

当然了,有正方就有反方。

有人先是反驳了关于语言的论述。

也有人认为,在某些情况下,语言描述现实的能力可能会比感知更优。

还有人说模型的语言不用局限于人类的语言、文本等,人工智能或许能创造出自己的语言来理解物理世界。

或者,我们该思考,用语言训练大模型取得现有成就的根本因素又是什么呢?

对于这场讨论,你又有什么样的看法呢?

参考链接:

[1]https://x.com/rohanpaul_ai/status/1965242567085490547

[2]https://www.youtube.com/watch?v=vIXfYFB7aBI

相关内容

热门资讯

阿里杀红了眼,高德直起了腰 来源:螺旋实验室 " 作者丨追命 编辑丨坚果 封面来源丨Unsplash " 前段时间,有网友爆料...
重庆加快实施“人工智能+制造”... 日前,我市发布首批30个工业智能体产品。入选产品涉及研发设计、生产制造、供应链管理、营销管理、运维服...
服贸会|人形机器人有望服务快递... 来源:滚动播报 (来源:千龙网) 无人车、人形机器人、自动化分拣,9月10日,2025年服贸会供应链...
颠覆性进展!光峰科技携手谷东智... 2025年9月11日,光峰科技(688007.SH)与谷东智能在光博会(CIOE)上举办联合发布会,...
中国农科院:技术集成示范助力苹... 人民网北京9月9日电 (记者赵竹青)记者从中国农业科学院果树研究所获悉,该所在中国农业科学院高产高效...
盘中必读|三大运营商竞速卫星互... 9月11日,卫星互联网概念延续强势,东方通信(600776)、东珠生态(603359)连板,上海沪工...
靠Open AI订单,甲骨文创... 图片来源:Pixabay 仅一个晚上,美国老牌软件公司甲骨文(ORCL.NYSE)创始人拉里·埃里森...
构皮滩水电站水资源利用率达国际... 9月8日,记者从构皮滩水电站获悉,今年上半年,通过三维水流仿真模型和实时负荷智能分配系统,该水电站机...
服贸会:机器人展区最热门,现存... 来源:牛刀商业评论_ 2025年中国服贸会上,机器人展区成为热门打卡地,多款创新产品集中亮相。从服务...
数智山城 一触即达,华为助重庆... 来源:市场资讯 (来源:华为中国政企业务) 嘉陵江蜿蜒而来,长江奔腾而至,在两江交汇的浪涛声中,传统...
原创 逛... 如果问我今年IFA 2025上哪个产品最具新意,我可能还真有点选择困难,但要说哪个产品最让我有想买的...
阿里领投爱诗科技4.3亿新融资... 来源:钛媒体 爱诗科技创始人兼CEO 王长虎 阿里领投了AI视频生成赛道单轮最大一笔融资。 9月1...
湖州×阿里 共推平台经济高质量... 9月10日,湖州市市场监督管理局联合阿里巴巴(中国)网络技术有限公司,举行“湖创优品·链动全球”湖州...
《情绪地理学》读者分享会走进北... 近年来,轻资产不夜城以“对赌游客量+对赌销售额 ”的双对赌模式,在多地表现亮眼。这一模式创新,改变了...
原创 好... 好手机大家都喜欢,可真正能够在各种环境下都能流畅使用的手机并不多,既要性能强,还要拍照好,续航也要有...
光峰科技发布业界首款消费级水下... 本报讯 (记者李雯珊)9月10日,深圳光峰科技股份有限公司(以下简称“光峰科技”)在第26届中国国际...
要务科技:以科技之名,赋能智能... 要务科技,自2021年7月创立以来,便以“要素即服务”为核心理念,致力于运用前沿科技,推动工程机械与...
曾经被炒到20万一只的实验猴,... 文 | VB动脉网 最近,实验猴又涨价了。 根据中国食品药品检定研究院近期发布的食蟹猴采购中标公告...
李飞飞一年前究竟说了啥?怎么又... 闻乐 发自 凹非寺 量子位 | 公众号 QbitAI 大语言模型的局限在哪里? AI教母李飞飞这样说...
对溴氟苯检测仪:筑牢化工安全防... 对溴氟苯检测仪:筑牢化工安全防线的关键利器 对溴氟苯(C₆H₄BrF)作为一种重要的芳香族卤代物,在...