具身智能,进步不小、话题不少。例如,“两条腿”还是“四个轮子”;再例如,感知的“泛化性”和行动的“精准度”;还例如,“智能”是长在“具身”里,还是放在云端。
但到底啥是具身智能?
顾名思义,把软件写在具身里,就只是受条条框框限制的自动化机器,而将智能嵌入具身,才是真正的具身智能。以此为标准,小到流水线上的机械臂、仓库里的AGV、天上飞的无人机、两条腿的机器人、四条腿的机器狗,大到城市中的智能汽车、矿山上的百吨无人矿卡,现在都已在向具身智能方向进化。
这又引出另一个话题,具身智能是迄今为止,最复杂的软硬件结合智能体。期间,具身智能企业所有技术路线上的反复横跳,都是他们在“直奔梦想”,还是“沿途下蛋”间的妥协;所有看似自豪,但实为被迫的技术栈延长,也只能证明他们生存的生态,还存有分工模糊和能力缺失。
问题就在这,现在的具身智能,到底还缺点啥?又有谁,来解决具身智能的燃眉之急?
要说缺点啥,肯定首先是缺数据,尤其是高质量的数据。
具身智能的训练,依赖于海量数据。这些数据在互联网上有,但不多。互联网上的视频数据经过清洗,只有1%能用于具身智能训练。而且再具体到应用场景,有些数据在现实世界中根本不存在。
怎么解决呢?
此前“动捕遥控”很是流行。它的画面就像“提线木偶”,将传感器穿在人体的关键部位,并实时捕捉运动数据。这些数据经过处理转化为指令,再传输给机器人。只不过,此种“1:1私教”的数据采集方式,成本太高,效率也有点低。
还有“模拟仿真”也颇为流行。但受技术条件限制,基于游戏视频渲染引擎,也只能生成“游戏感”十足的画面和空间,物体运动的真实性和连贯性都较差,不可能应用于精细化的操作训练。
有没有更好地解决方式?鉴于真实数据日益稀缺,为填饱AI的“肚子”,科技普遍将眼光正转向使用“数据合成+仿真验证”。HDC 2025期间,华为云CloudRobo具身智能平台正式发布。
该平台就是这个思路。
华为云CloudRobo具身智能平台整合了数据合成、数据标注、模型开发、仿真验证、云边协同部署,以及感知安全监管等端到端能力,并提供了具身多模态生成大模型、具身规划大模型、具身执行大模型三大核心模型。
其中,具身多模态生成大模型就首先缓解了“数据合成”难题。依靠“20%采集+80%生成”的模式,其极大地提高数据获取效率。而且“数据合成”能力,也为“仿真验证”奠定了基础。
正所谓“台上一分钟,台下十年功”,就是在真实的应用场景的“台上”工作一分钟,就要在模拟仿真的“台下”,先训练出十年功。而具身多模态生成大模型就可以为具身智能机器人,提供与物理世界相一致的数字空间。
例如,华龙讯达、星海图等具身智能企业,都与华为云开展了此方面的合作。华龙讯达发布了全球首款面向具身智能工业机器人的数字仿真平台——木星数字仿真平台,平台可将传统工业机器人的换型示教调试周期缩短90%以上。星海图则借助华为云具身智能的仿真与开发技术,实现了云上仿真训练、真机落地部署,加速了产品演进速度。
但除此之外呢?
解决数据样本不足的目的,其实就是为了提升具身智能,缺感知上的“泛化性”和行动上的“精准度”。例如,能不能递给我一杯水,而且一滴不撒,就是行动上的“精准度”,而既能递给我一瓶水,也能递给我一杯咖啡,就是感知上的“泛化性”。
华为云CloudRobo具身智能平台,就将此两项能力融入其中,并落地形成“具身大脑”和“具身小脑”协同架构。“大脑”和“小脑”都可以理解为经过预训练的基础模型。其中,“具身大脑”即具身规划大模型,解决感知和理解泛化性问题;“具身小脑”即具身执行大模型,解决行动精准度问题。
“具身大脑”可以针对机器人在真实环境交互中的实际需求,提供空间感知、环境交互理解、具身推理的能力,而且其能够做出10步以上的复杂任务规划。“具身小脑”的核心优势在于专为工业场景打造,其解锁了抓取、放置、理线、插装等典型技能,且末端控制精度达毫米级。
例如,拓斯达就应用了CloudRobo平台强大的泛化能力,在“分拣”和“码垛”的场景中,解决了货物外形多样化等问题。而佗道医疗借助于CloudRobo平台,让腔镜手术机器人,变成一个手术专家,实现伤口精细缝合等操作。
更重要的是,一条护城河正在形成。“具身小脑”将推、拉、抓、放等基础能力原子化,并构建形成了精密装配、线束整理等动作基元库。而随着华为云具身智能生态体系的建立,原子化能力和动作基元库只会越来越扎实易用。
类似的生态合作还有很多。
在工业喷涂领域,CloudRobo可以赋能埃夫特的工业喷涂机械臂,通过对工艺路径的仿真模拟,生成汽车表面等曲面物体的喷涂轨迹,提升不同喷涂应用场景的泛化能力。
汽车制造领域,CloudRobo可以赋能乐聚机器人,让机器人承担汽车生产线上的物流搬运和上料等工作。
在半导体制造领域,CloudRobo可以赋能优艾智合机器人,把排产系统与机器人任务实时同步,高效完成千道工序的上下料及运输。
在电力领域,CloudRobo可以赋能亿嘉和室内巡检机器人,教会室内巡检机器人结合指示灯及操作流程,对机房高压电设备进行无人化巡检运维。
工程机械领域,华为云与徐工集团合作。目前,百台智能无人矿卡已在内蒙古伊敏露天矿投产运营。这些庞大的矿卡去掉了驾驶室,可自主构图、自主规划行车路线,自动停靠在临近挖掘机的指定地点,而且装满了自动拉走。
是不是感觉,具身智能的发展速度已经超出想象?因为它们都有了“底座”。CloudRobo平台就是工业具身智能的底座,其可提供标准化的仿真环境、预训练基础模型、通用技能库,以及开发工具链。
而且为了让具身智能找到更多的应用场景,为了让更多的机器人本体能够高效地对接到CloudRobo平台,同时也为了应对机器人品类多、传感器类型多、接口协议多等难题,华为云提出了机器人到云的联接协议R2C(Robot to Cloud)行业标准。未来将与机器人伙伴,行业组织等,共同打造R2C开放协议。让更多的机器人本体能够高效、安全、低成本的获得云上智能。
这套接口标准极大地降低了机器人集成门槛。不同厂家、不同形态、不同功能的机器人,只要遵循CloudRobo平台的接口规范进行适配,即可快速、便捷地接入平台,并高效地利用平台提供的统一调度、任务管理、数据分析和应用服务能力。
当然,R2C标准只是技术上的“+”。
是否注意到,华为云CouldRobo平台有“Could”,但Robo没有“T”。“Could”代表了华为云的技术主张,不管是“大脑”,还是“小脑”,智能都应该放在云端,并通过网络与机器本体进行互联。
而有Robo没有“T”,则代表了华为云的生态主张。“T”即是Terminal,华为云的Robo没有“T”,就是为更好地“+T”。其希望“让一切联网的机器本体,都成为具身智能机器人”。但华为云自己不做机器人,机器人的终端本体始终是具身智能企业的核心竞争力,“而华为云将专注在云上,为具身智能企业提供更强的智能,更澎湃的算力。”华为常务董事、华为云计算CEO张平安最后说。