谷歌新推离线AI机器人系统,实现自主操作如系鞋带无需云端支持
创始人
2025-06-26 10:21:29
0

在人工智能领域,聊天机器人如Gemini和ChatGPT常被视作数字世界的交互先锋,然而,生成式AI正悄然在实体机器人技术中扮演核心角色。近期,谷歌DeepMind宣布推出全新设备端VLA(视觉语言动作)模型,专为机器人控制设计,这一版本实现了完全的本地自主运行,无需云端支持。

据谷歌DeepMind机器人部门主管Carolina Parada介绍,这款AI机器人技术能显著提升机器人在复杂环境中的可靠性,是谷歌首个面向开发者调优的机器人模型版本。Parada强调,机器人不仅存在于物理世界,还需与环境互动,这对AI提出了独特挑战。传统强化学习方法在训练机器人动作时效率低下,而生成式AI则展现出更强的泛化能力。

这款VLA模型利用了Gemini的多模态理解能力,使其不仅能执行文本生成、诗歌创作、文章总结等任务,还能编写代码、生成图像,更重要的是,它能生成机器人的动作指令。Parada解释说:“Gemini的多功能性让它成为了一个全能的助手。”

与此前依赖云端辅助的Gemini Robotics版本相比,新设备端模型在性能上仅略有逊色,但在实际应用中已足够强大。许多任务无需调整即可直接使用。开发者在与这些机器人互动时发现,它们在理解新情境方面展现出了惊人的能力。为了鼓励开发者进一步探索,谷歌提供了完整的SDK,使研究者仅需50至100次演示就能让VLA适应新任务。

在AI机器人技术中,“演示”意味着通过远程操作机器人完成任务,以此调优模型。虽然合成数据在训练过程中占有重要地位,但真实数据对于最复杂、最精细的行为仍是不可或缺的。Parada指出:“对于最精细的动作,我们仍然需要真实数据。”不过,仿真技术也在这一过程中发挥了重要作用。

尽管设备端VLA模型在处理简单动作,如系鞋带或折叠衣物时表现出色,但对于更复杂的多步骤任务,如制作三明治,它可能需要更强大的模型来支持。然而,对于云连接不稳定或隐私敏感的环境,如医疗设施,这款设备端模型尤为适用。

安全性始终是AI系统,尤其是实体机器人的一大关注点。为确保Gemini Robotics的行为安全,谷歌采用了多层次的安全机制。Parada解释说,系统首先通过Gemini Robotics连接到能够推理安全行为的模型,然后与生成动作选项的VLA对话,最终由低级控制器执行动作,这些控制器通常包含安全关键组件,如力量限制和速度控制。

虽然新的设备端模型本身不包含完整的安全机制,但谷歌建议开发者遵循Gemini团队的做法,将系统连接到包含安全层的Gemini Live API,并实施低级控制器进行关键安全检查。有兴趣测试Gemini Robotics设备端版本的开发者,可以申请加入谷歌的可信测试计划。

在过去三年里,机器人技术取得了显著进展,而此次发布的Gemini Robotics仅是基于Gemini 2.0的版本。Parada透露,Gemini Robotics团队通常落后于Gemini开发一个版本,而Gemini 2.5在聊天机器人功能方面已有大幅提升,未来机器人技术或许也将迎来类似飞跃。

相关内容

热门资讯

我国发现世界首个全温区固态相变... 我国发现世界首个全温区固态相变制冷材料 传统的冰箱和空调使用的气体压缩制冷技术存在能耗高等问题。为...
字节跳动回应“豆包手机”传闻:... 8月20日消息,针对近日市场上有关字节跳动正在研发“豆包手机”的传言,字节跳动相关负责人明确回应称,...
AI时代,高等教育有何可为与不... 中新社北京8月20日电 题:AI时代,高等教育有何可为与不为? 中新社记者 曾玥 “人工智能(AI)...
共筑社区微景观!这场亲子活动让... 近日,定海路街道党群服务中心在爱西居委举办了一场主题为“绿意萌芽 新芽初绽”的亲子活动,特别邀请了辖...
百度李彦宏曾辟谣“All in... 作者|号外工作室 一周一场媒体招待会,周周“AI Day”,研发费用被砍13%,李彦宏曾辟谣说过“...
山钢·京东运营中心构建区域生态... 近日,山钢·京东运营中心在莱钢文化服务中心启动。该项目是山钢集团与京东集团深度融合的重要成果,也是莱...
医渡科技公布数字疗法海南落地成... 近日,2025数字疗法大会在海南举办。在“AI+慢病管理场景应用论坛”上,一场以“数字疗法在基层糖尿...
日本功率芯片危矣!“散兵”难敌... 来源:金投网 尽管日本已经投入数十亿美元用于人工智能芯片制造,但在传统功率半导体领域,其主导地位却正...
外媒:奥尔特曼称自己不适合担任... 环球网 8月18日消息,据timesofindia援引彭博社报道,OpenAI 首席执行官 Sam ...
绿的谐波跌1.44%,成交额1... 来源:新浪证券-红岸工作室 8月20日,绿的谐波跌1.44%,成交额11.05亿元,换手率4.07%...
驰阳休闲取得户外百叶篷用圈梁组... 金融界2025年8月20日消息,国家知识产权局信息显示,临海驰阳休闲用品有限公司取得一项名为“一种户...
原创 韦... 四十年前旅行者二号曾与之失之交臂。 美国国家航空航天局詹姆斯·韦伯望远镜最新发现天王星最小卫星,这...
印度AI服务卷起价格战,印媒:... 【环球时报报道 记者 苑基荣】生成式人工智能(AI)工具ChatGPT制造商OpenAI于19日推出...
国网平舆县供电公司:数智赋能 ... 大象新闻记者 周文德 通讯员 张超会 闫梦珂 8月20日,国网平舆县供电公司深入落实数字转型赋能行...
能绕过人脸识别的AI,已经盯上... 就前段时间的事情,南京那边发生了一起诈骗案。 195万多条隐私信息,最后只黑了一万五,看上去这哥们...
辛巴五次“退网”,辛选帝国谁来... 图源:辛选官网 “消失与重现”,成了流量密码 撰文/ 李觐麟 编辑/ 李 季 排版/ Annalee...
山东方诺取得加强型拖拉机驱动半... 金融界2025年8月20日消息,国家知识产权局信息显示,山东方诺机械科技有限公司取得一项名为“一种加...
原创 马... 马云现身蚂蚁森林,大口吃西瓜,现场杂草丛生,跟2016年对比明显 2016 年那会儿,马云带着支付宝...
苹果ios游戏群控系统:哪个云... 一、云手机初印象 在当今游戏玩家的世界里,云手机成为了一个热门的话题。云手机为玩家们提供了一种无...
鹿城举办全国科普月活动 人工智... 潮新闻客户端 通讯员 周心茹 8月20日,以“提升全民科学素质 夯实科技强国基础”为主题的鹿城区20...