CMUÐ实现突破:机器狗点满敏捷值天赋,超高速穿越障碍,速度与安全兼备!
创始人
2024-02-05 17:08:47
0

原标题:CMUÐ实现突破:机器狗点满敏捷值天赋,超高速穿越障碍,速度与安全兼备!

机器之心报道

机器之心编辑部

足式机器人领域又一次迎来创新!CMU 与 ETH Zurich 团队联合研发了一个名为 「敏捷但安全」(ABS,Agile But Safe)的新框架,为四足机器人在复杂环境中实现高速运动提供了解决方案。ABS 不仅在避免碰撞方面展现出高效能力,还在极速上达到了前所未有的 3.1 米秒!

在高速机器人运动领域,实现同时兼顾速度和安全一直是一大挑战。但现在,卡内基梅隆大学(CMU)和苏黎世联邦理工学院(ETH)的研究团队带来了突破性进展。他们开发的新型四足机器人算法,不仅能在复杂环境中高速行进,还能巧妙避开障碍,真正做到了「敏捷而安全」。

论文地址: https://arxiv.org/pdf/2401.17583.pdf

在 ABS 的加持下,机器狗在各种场景下都展现出了惊艳的高速避障能力:

障碍重重的狭窄走廊:

凌乱的室内场景:

无论是草地还是户外,静态或动态障碍,机器狗都从容应对:

遇见婴儿车,机器狗灵巧躲闪开:

警告牌、箱子、椅子也都不在话下:

对于突然出现的垫子和人脚,也能轻松绕过:

机器狗甚至还可以玩老鹰捉小鸡:

ABS 突破性技术:

RL+ Learning model-free Reach-Avoid value

ABS 采用了一种双策略(Dual Policy)设置,包括一个「敏捷策略」(Agile Policy)和一个「恢复策略」(Recovery Policy)。敏捷策略让机器人在障碍环境中快速移动,而一旦 Reach-Avoid Value Estimation 检测到潜在危险(比如突然出现的婴儿车),恢复策略就会介入,确保机器人安全。

创新点 1:怎么训练一个敏捷策略 Agile Policy?

敏捷策略的创新之处在于,与以往简单地追踪速度指令不同,它采用目标达成(position trakcing)的形式来最大化机器人的敏捷性。这一策略训练机器人发展出感知运动技能,以在没有碰撞的情况下达到指定目标。通过追求基座高速度的奖励条件,机器人自然学会在避免碰撞的同时实现最大敏捷性。这种方法克服了传统速度追踪(velocity tracking)策略在复杂环境中可能的保守限制,有效提高了机器人在障碍环境中的速度和安全性。Agile Policy 在实机测试中极速达到了 3.1m/s

创新点 2:学习 Policy-conditioned reach-avoid value

「达防」(Reach-Avoid, RA)值学习的创新之处在于,它采用了无模型的方式学习,与传统的基于模型的可达性分析方法不同,更适合无模型的强化学习策略。此方法不是学习全局 RA 值,而是使其依赖于特定策略,这样可以更好地预测敏捷策略的失败。通过简化的观测集,RA 值网络可以有效地概括并预测安全风险。RA 值被用于指导恢复策略,帮助机器人优化运动以避免碰撞,从而实现在保证安全的同时提高敏捷性的目标。

下图展示了针对特定障碍物集合学习到的 RA(达防)值。随着机器人速度的变化,RA 值的分布景观也相应变化。RA 值的符号合理地指示了敏捷策略的安全性。换句话说,这张图通过不同的 RA 值展示了机器人在不同速度下,面对特定障碍物时的安全风险程度。RA 值的高低变化反映了机器人在不同状态下执行敏捷策略时可能遇到的安全风险。

创新点 3:用 Reach-Avoid Value 和恢复策略来拯救机器人

恢复策略的创新之处在于,它能使四足机器人快速追踪线速度和角速度指令,作为一种备用保护策略。与敏捷策略不同,恢复策略的观测空间专注于追踪线速度和角速度命令,不需要外部感知信息。恢复策略的任务奖励专注于线性速度追踪、角速度追踪、保持存活和保持姿势,以便平滑切换回敏捷策略。这种策略的训练同样在仿真环境中进行,但有特定的域随机化和课程设置,以更好地适应可能触发恢复策略的状态。这种方法为四足机器人提供了在高速运动中快速应对潜在失败的能力。

下图展示了当恢复策略在两个特定情况(I 和 II)下被触发时,RA(达防)值景观的可视化展示。这些可视化展示是在 vx(沿 x 轴的速度)与 ωz(绕 z 轴的角速度)平面以及 vx 与 vy(沿 y 轴的速度)平面上进行的。图中显示了搜索前的初始旋转状态(即机器人基座当前的旋转状态)和通过搜索得到的命令。简单来说,这些图表展示了在特定条件下,通过恢复策略搜索得到的最佳运动指令,以及这些指令如何影响 RA 值,从而反映机器人在不同运动状态下的安全性。

鲁棒性测试

作者在「12kg 负载 / 篮球撞击 / 脚踢 / 雪地」的四个场景下测试了 ABS 框架的鲁棒性,机器狗都从容应对:

研究团队

这项研究是由 CMU 和 ETH 的研究团队共同完成。团队成员包括 Tairan He, Chong Zhang, Wenli Xiao, Guanqi He, Changliu Liu 和 Guanya Shi。他们的合作不仅在机器人技术领域取得了重大突破,更开启了四足机器人新的应用可能。这项技术的成功展示了四足机器人在高速移动和安全避障领域的巨大潜力。未来,这种高速且安全的四足机器人有望在搜救、探险甚至是家庭服务等多个领域发挥重要作用。

相关内容

热门资讯

国际象棋冠军分享AI时代的棋艺 中国科学技术馆联合首都体育学院日前举办“乐享健康生活•科技助力成长”主题活动。活动通过科普讲座、运动...
山西斯普瑞取得泡塑成型机快换缸... 金融界2025年6月17日消息,国家知识产权局信息显示,山西斯普瑞机械制造股份有限公司取得一项名为“...
内存条超频稳定性测试方法:科学... 在现代计算机硬件中,内存条超频是一种提升性能的常见方法。超频意味着将内存条的工作频率提高到高于制造商...
中海油服自研超低密度防漏水泥浆... 近日,由中海油田服务股份有限公司(以下简称:中海油服)自主研发的1.2g/cm3高性能超低密度防漏水...
中国载人航天工程空间站系统总设... 6月17日下午,国新办举行“新征程上的奋斗者”中外记者见面会。有记者会上提问:提到中国载人航天,大家...
赛瑞能源取得一种阀板式电子滑套... 金融界2025年6月17日消息,国家知识产权局信息显示,荆州市赛瑞能源技术有限公司取得一项名为“一种...
一觉醒来,专业没了 文 | 惊蛰研究所,作者 | 娅沁 ChatGPT,特别是DeepSeek国产AI大模型的问世后...
京津冀集采动脉瘤夹类耗材 本报讯(记者 柴嵘)京津冀“3+N”医药集采联盟近期开展动脉瘤夹类医用耗材集采工作,采购覆盖京津冀及...
华龙电子取得便于拆装的蜂鸣器专... 金融界2025年6月17日消息,国家知识产权局信息显示,常州华龙电子有限公司取得一项名为“便于拆装的...
中亚本领过硬的“鲁班弟子”越来... 鲁班工坊“出海”中亚,成为助力中国中亚合作的“技术驿站”—— 中亚本领过硬的“鲁班弟子”越来越多(环...
中国新一代人造太阳“中国环流三... 6月7日,科技人员正在装置顶部检查调试。 6月7日,新一代人造太阳“中国环流三号”顶部。 6月7...
局域网监控软件有哪些?推荐6款... “知己知彼,百战不殆”,在当今数字化浪潮汹涌的时代,企业局域网宛如一片没有硝烟的战场,信息就是那决定...
全球第2个满级QQ也来了 当事... 6月16日 消息:16日凌晨,全球第二个满级QQ号正式诞生,其昵称与首个满级号一样,均为“爱芥末”。...
关于AI区块链的一切:哪些是真... 人工智能(AI)正在推动创新,并彻底颠覆人们的工作方式。然而,AI的普及以及人们对这项技术的日益依赖...
开封:AI赋能数字政府 助力政... 人工智能作为新一轮科技革命和产业变革的核心驱动力,正以前所未有的速度重塑着社会发展格局。6月17日,...
真香定律再现,增程式汽车赛道风... 在汽车行业的变迁岁月里,技术路线的变化如同波澜壮阔的史诗,而增程式混动技术的崛起无疑是其中最具戏剧性...
腾讯再出百万奖金吸引全球人才 深圳新闻网2025年6月17日讯(深圳特区报记者 周雨萌)昨日,腾讯发起算法大赛,拿出数百万丰厚奖金...
原创 芯... 前几天,有媒体报道称,任正非面对媒体时称,芯片问题其实没必要担心,虽然单芯片落后美国一代,但通过叠加...
原创 日... 丰田的固态电池专利墙已垒起3000多块砖,美国Factorial的固态电池在-20℃照常狂奔,三星S...
苏州伍源取得电动门转换支架结构... 金融界2025年6月17日消息,国家知识产权局信息显示,苏州伍源建筑装饰工程有限公司取得一项名为“一...