机器人习得“十八般武艺”后,还得有“灵魂”
创始人
2025-07-30 04:20:46
0

来源:IT时报

作者/ IT时报记者 沈毅斌

编辑/ 钱立富 孙妍

去年世界人工智能大会上,“十八金刚人形机器人先锋阵列”作为镇馆之宝惊艳亮相,将具身智能概念以具象化的方式呈现在公众面前。

短短一年间,人形机器人技术突飞猛进,已然习得“十八般武艺”——在擂台上,它们用矫健的身手演绎"武林争霸";在跑道上,凭借"金刚腿"完成马拉松挑战;在球场上,通过默契配合实现精准射门。每一个突破性的应用场景,都在推动具身智能技术迈向新的高度。

本届世界人工智能大会(WAIC 2025)上,镇馆之宝“WAIC里·技能大舞台”仍以人形机器人为主角,但它们已不再是静态展示的"橱窗模特"。从优雅的舞蹈到流畅的书写,从精细地剥鸡蛋到高效地分拣收银,这些机器人正以多样化的技能仿佛在向世界宣告:具身智能时代已然来临。

但仔细观察不难发现,当前具身智能还缺少认识物理世界的“灵魂”——世界模型。这不仅是简单的感知和反应,更是对复杂环境的多维度认知和灵活应对的能力,是赋予机器类似人类智慧和情感的关键所在。

具身智能距离世界模型还有多远?世界模型的突破能否成为具身智能的“iPhone时刻”?

作业智能的“三角矛盾”

世界模型的灵感源于人类自然形成的心智,通过感官获取的抽象信息在大脑中被转化为对周围世界的具象理解。

比如桌上有一杯水,眼睛可以看到杯子的形状、颜色、位置,以及水的透明质感等抽象视觉信息。这些信息在大脑中处理,人们可以理解“这是可以拿起喝水的杯子”,也知道放在桌子边缘可能会被碰倒,也可以用来调配饮料。这些在脑海中出现的多种可能想象,就是世界模型的作用。

“在这过程中要做哪些可能的思考,又如何在机器人执行环节形成闭环,这是目前最大的挑战。”智元机器人通用业务部总裁王闯在接受《IT时报》等媒体采访时表示,智元将机器人“大脑”定义为“一体三智能”,即机械本体和运动智能、交互智能、作业智能。其中,在作业智能领域,泛化率、成功率和节拍(效率)三者之间存在明显矛盾。

通常情况下,若机器人处理的事情较多,做到较高的泛化率,执行成功率便会下降;而要保证高成功率,效率又会变慢。普通老百姓往往期待这三方面都能达到较高水平,但就目前的AI作业智能而言,还难以实现这一目标,而这和世界模型发展密切相关。“目前想要实现大而全的泛化能力,并不现实,更需要聚焦某一个领域去推,这样才具备商业落地的价值。”王闯表示。

智元机器人首席运营官邱恒也曾告诉记者,人形机器人发展有三个阶段:拟人、类人、超人。目前,人形机器人还处于“拟人”到“类人”之间的阶段,想要达到“超人”这一宏伟愿景,世界模型必不可少。

在这过程中,需要打通一个个“小世界”。例如,人形机器人在4S店做销售,既要理解产品、熟悉话术,还要给予买家情绪价值,当一个个认知贯通,便能逐渐形成对“销售世界”的理解。

交互智能方面也存在不足,当前主要通过语音转文字等方式处理输入,端到端输入技术尚不成熟。“无论是OpenAI,还是国内的一些企业,其开发的系统对人类的语义和情感理解都还不到位,这也是未来几年需要重点突破的方向。”王闯说道。

让具身智能插上想象的“翅膀”

“我们希望具身智能不仅能执行指令,还要插上‘想象的翅膀’,去主动预测未来的行动,做到知行合一。”在“智启具身论坛”上,智元机器人具身业务部总裁姚卯青发布了行业首个面向真实世界双臂机器人的世界模型开源平台“Genie Envisioner”(简称GE)。

据介绍,GE平台融合了预测、控制、评测三大核心功能,能提供从视觉感知到动作执行的端到端一体化解决方案,其中有两个核心部分:一个是多视角视频扩散模型GE-Base,另一个是160M参数的动作解码器GE-Act。

GE-Base就像机器人的“火眼金睛”,通过超百万条数据“AgiBot-World-Beta”数据集进行训练,能精准“看懂”周围环境的空间布局、动作变化和背后意图,比如桌子上物品如何摆放、人或其他物体如何移动。GE-Act则像机器人的“行动指挥官”,能把看到的信息转化成具体动作,让机器人从“看懂”到“会做”。

与以往“输入指令——分析指令——执行输出”的方式不同,GE平台能让机器人学会自己“琢磨”,先想怎么干,验证行不行,然后才动手执行,自主性和智能度都得到提升。在视频演示中,搭载GE-Act的机器人成功完成“做三明治”“倒茶”“擦桌面”“使用微波炉加热”“流水线装箱”等多项复杂任务,且各项成功率均超过行业平均值。

先在虚拟环境中理解世界

清华大学计算机系副研究员苏航在“智启具身论坛”上表示,未来机器人将成为人类意识的衍生,助力个人发展,深刻影响社会财富分配,其核心在于推动AI从数字世界走向物理世界。尽管在某些领域,人工智能已经超越人类,但当前算法仍依赖人类设计,若AI能自主完成自身能力的迭代与提升,将开启新的发展阶段。不过,物理世界因受规律限制且存在复杂关系,AI在其中的应用难度远高于数字世界。

苏航认为,需要结合多模态,通过外部交互来加速机器人理解世界,当前则要聚焦泛化能力等核心问题。

在数据与泛化实践方面,苏航表示,过去两年数据集虽快速发展,但部分任务数据仍较少,即使是利用互联网数据,也在安全、真实性等方面存在局限。仿真数据能弥补真实数据的不足,结合强化学习可以提升具身智能的感知与操作稳定性,例如,定点抓取仅需50 ~60个数据,而在更广泛、不固定的空间范围内抓取,这时采集数据量就要翻上几十倍,便可通过仿真策略来弥补。

那么,仿真数据从何而来?

商汤在本届WAIC 2025大模型论坛上发布“悟能”具身智能平台,其核心是“开悟”世界模型,可以从感知理解、视觉导航、多模态交互、决策规划和硬件适配等领域,辅助具身智能理解世界。

据商汤介绍,开悟世界模型背后是商汤积累的10万3D资产,以此为基础支持多视角视频生成,最多能同时生成11个摄像头角度的视频,还能同时处理人、物、场,构建一个4D的真实世界,让仿真数据更加全面、立体,帮助具身智能更好地理解环境和物体的关系。

这个世界包含第一和第三视角,可以让机器人同时看到,“自己看到的场景”和“人类示范动作”,既让模型能基于自身感知进行训练,也能学习人类示范动作,减少遥操作数据量,提高跨机器人、跨场景的泛化能力,使仿真数据更具实用性和高效性。

相关内容

热门资讯

暴雨中的通信生命线:陕西移动延... 阳光讯(记者 郑玮)7月中旬以来,吴起县连降暴雨,防汛形势骤然紧张。作为当地通信保障的主力军,陕西移...
英伟达高管财富暴涨:首席财务官... 7月30日,彭博亿万富豪指数显示,英伟达首席财务官Colette Kress和负责销售与营销业务的副...
谷歌同意但Meta拒签 科技巨... 来源:环球市场播报 谷歌周三表示,将签署欧盟的人工智能准则,而此前Meta因担心该准则可能扼杀创新而...
昆山科森申请组合式零件的连续加... 金融界2025年7月30日消息,国家知识产权局信息显示,昆山科森科技股份有限公司申请一项名为“组合式...
Positron推出专业AI推... 随着大规模AI部署需求激增,芯片创业公司Positron正将自己定位为市场领导者英伟达的直接挑战者,...
江南大学“AI启程”实践团:跨... 连日来,江南大学人工智能与计算机学院“AI启程”少儿编程实践团,走进新疆维吾尔自治区吐鲁番市托克逊县...
播撒国防种子 点亮少年梦想 通... 7月29日上午,南通市通州区金新街道碧堂庙社区天和珺府的活动室内气氛热烈。一场由通州区国动办联合碧堂...
煜盛电子取得一种耐高温电容器专... 金融界2025年7月30日消息,国家知识产权局信息显示,煜盛(广东)电子有限公司取得一项名为“一种耐...
2025WAIC:大厂回归,医... 文 | Vb动脉网 过往数届WAIC,直观感受是医疗AI越来越少,颇有被边缘化之感。直至今年,大模...
鑫极耳科技取得弹夹料仓组件专利... 金融界2025年7月30日消息,国家知识产权局信息显示,苏州鑫极耳科技有限公司取得一项名为“一种弹夹...
仅剩华为坚守!一英寸主摄或被抛... 7月30日消息,据知名博主“数码闲聊站”透露,除华为外,主流国产厂商正集体调整影像战略。小米、OPP...
AI重构财税服务新生态:慧算账... 在数字经济与实体经济深度融合的背景下,财税智能化已成为企业高质量发展的核心基础设施。随着金税四期系统...
原创 华... 7 月 30 日消息来啦,近日知名博主“智慧皮卡丘”透露,华为 Mate 80 系列或将成为业界率先...
河北省青少年高校科学营为学子筑... 走进百年学府,面对面聆听名家大师的科研心路,在动手实践中感受科技魅力……2025年河北省青少年高校科...
狂风骤雨袭申城,永业集团排查隐... 八号台风“竹节草”来势汹汹,申城各处闻“风”而动,迅速吹响防汛防台“集结号”。新民晚报记者今天从永业...
珠片面料工艺革新背后:SHEI... 7月,在广州番禺一家工厂的制衣车间里,胡师傅的双手在珠片面料缝纫机前翻飞。从业二十余年的他从未想过,...
芒果TV三会员在手投屏无门,用... 来源:GPLPCN 近日,有用户爆料称,自己同时持有芒果TV平台的普通会员、全屏会员及SVIP三项...
又一家机器人公司,冲刺A股IP... 又一家机器人企业,向科创板发起冲刺。 7月30日晚,四川天链机器人股份有限公司(下称“川机器人”)...
美好时代取得锂电池隔膜收卷机专... 金融界2025年7月30日消息,国家知识产权局信息显示,湖南美好时代新材料科技有限公司取得一项名为“...
海斯比船舶申请用于船舶的多功能... 金融界2025年7月30日消息,国家知识产权局信息显示,珠海市海斯比船舶工程有限公司申请一项名为“一...