谷歌DeepMind研发AI大模型KnowNo,能更好应对人类的模糊指令
创始人
2024-01-08 22:28:29
0

原标题:谷歌DeepMind研发AI大模型KnowNo,能更好应对人类的模糊指令

一张桌子放着两个碗:一个是塑料的,另一个是金属的。你让机器人拿起其中一个,然后把它放进微波炉里。你觉得它会选择哪一个?

面对这类要求,人类可能会再确认一遍,但如果是机器人,得到这样模糊的指令,它可能会将金属碗放入微波炉中引起爆炸。

现在,有一种被称为“KnowNo”的新训练模型,旨在通过教机器人在命令不明确时寻求人类的帮助来解决这个问题。描述这项研究的论文发表在 2023 年 11 月机器人学习会议上。

该模型会确保机器人只在必要时寻求二次确认,最大限度地减少不必要的来回询问。

这样就得到了一个聪明的机器人助手,它会努力理解你究竟想要什么,而不会过多地打扰你。

(来源:arXiv)

谷歌 DeepMind 的研究科学家 Andy Zeng 帮助开发了这项新技术,他说虽然机器人在许多特定场景中都很强大,但它们往往不擅长需要常识的通用任务。

例如,当被要求给你拿一瓶可乐时,机器人需要首先明白它需要走进厨房,找打冰箱,然后打开冰箱门取出可乐。

按照惯例,这些较小的子步骤必须提前编好,因为否则机器人不会知道人们通常把饮料放在厨房里。

Zeng 说,这是大型语言模型(LLM,large language model)可以帮助解决的问题,因为它们有很多常识。

现在,当机器人被要求拿一瓶可乐时,对世界有着广泛了解的大语言模型可以为机器人生成一套循序渐进的指令。

然而,大模型的问题在于,它无法保证机器人能够执行给出的指令。也许这个人的厨房里没有冰箱,或者冰箱门把手坏了。在这种情况下,机器人需要向人类求助。

KnowNo 通过将大型语言模型与量化置信水平的统计工具相结合,实现了这一点。

当有人给出一个模棱两可的指令,比如“把碗放进微波炉”时,KnowNo 首先使用语言模型生成多个可能的下一个动作,然后它会创建一个置信度得分,预测每个选择成为最佳选择的可能性。

这些置信度估值是根据预定的确定性阈值来确定的,该阈值规定了用户希望机器人在其动作中有多自信或保守。例如,一个成功率为 80% 的机器人至少在 80% 的情况下都应该做出正确的决定。

美国普林斯顿大学机械和航空航天工程助理教授、该研究的高级作者阿尼鲁达·马宗达(Anirudha Majumdar)说,这在不同风险程度的任务中是有用的。

你可能希望你的扫地机器人更独立一些,尽管会犯一些错误,但你不必过于密切地监督它。但对于医疗应用,机器人必须极其谨慎,尽可能保证任务成功。

当有不止一个选项可供选择时,机器人会停下来要求澄清,而不是盲目地继续:“我应该拿起哪个碗,金属的还是塑料的?”

Knowno 在三个机器人上进行了 150 多种不同场景的测试。结果显示,与那些没有进行过相同统计计算训练的机器人相比,经过 KnowNo 训练的机器人在需要更少人力帮助的情况下,成功率更高。

由于人类语言往往模棱两可,教机器人识别和应对不确定性可以提高它们的表现。

美国弗吉尼亚理工大学专门研究人机交互的助理教授迪伦·洛西(Dylan Losey)表示,研究表明,人们更喜欢会提问的机器人,他没有参与这项研究。

他说,当机器人寻求帮助时,会增加他们如何决定做什么的透明度,从而带来更好的互动。

美国普林斯顿大学博士生、该研究的主要作者 Allen Ren 表示,有几种方法可以改善 KnowNo。现在,它假设机器人的视觉总是可靠的,而现实里传感器可能出现故障。此外,模型也可以进一步优化,以考虑人们在提供帮助时可能带来的错误。

马宗达说,人工智能表达不确定性的能力将使我们更加信任机器人。“量化不确定性是我们许多系统中缺失的一部分。”他说,“这让我们对机器人的安全性和完善度更有信心。”

作者简介:我是一名报道气候、能源和技术交叉点的研究员。我热衷于使用数据和图形来讲述引人入胜的人类故事。此前,我曾在美国和韩国的多家媒体机构制作广播和多媒体新闻,涵盖从移民到音乐再到公共卫生等主题。

支持:Ren

相关内容

热门资讯

原创 一... 17名美国国会议员直接把文件送上商务部桌前,点名要求封杀TP-Link。这不是试探,这是亮牌。理由呢...
中国铁塔2025年云资源服务:... C114讯 5月19日消息(颜翊)日前,中国铁塔发布2025年云资源服务采购项目直接采购事前公示。 ...
“智”造未来!深圳安居集团打造... 5月15-16日 由中国土木工程学会主办的 “模块化集成建筑技术交流及现场会” 在深圳成功举办 此...
硅谷60万亿终极野心!AI取代... 新智元报道 编辑:犀牛 【新智元导读】 硅谷终极野心:AI+机器人吞噬全球六十万亿美元工资;马斯克...
多款华为折叠屏手机,降价! 机构数据显示,2025年一季度,中国折叠屏手机出货量达到284万部,同比增长53.1%,市场表现有所...
开拓同位素产业新局 让核技术成... 5月16日,历经一年多的分离、提纯,全球首批利用商用堆生产的碳-14产品正式投放市场。同一天,“和福...
原创 三... 当谈到高端手机时,许多人第一反应是苹果或华为。可偏偏有那么一群人,甘愿多掏几千元,选择三星,也许他们...
杭州泉达取得具备止回功能的水利... 金融界2025年5月19日消息,国家知识产权局信息显示,杭州泉达建设有限公司取得一项名为“一种具备止...
只针对目标突触,不影响其他细胞... 原标题:只针对目标突触,不影响其他细胞分子工具能精准“开关”大脑回路 美国南加州大学研究团队开发出两...
全球首家“人工智能建筑设计与城... 南都讯 记者黄璐 通讯员廖晞媛 2025年5月17日 ,中国工程院院士、深总院首席总建筑师孟建民在中...
天问二号探测器转入发射区 计划... 中新社北京5月18日电 (记者 马帅莎)记者从中国国家航天局获悉,5月18日,中国行星探测工程天问二...
中国电信陕西公司率先商用“5G... 5月17日上午,中国电信陕西公司在西咸国际会议中心举行“聚智向新 开拓共赢——陕西电信5G-A正式商...
聚焦创新发展!2025年太原市... 各县(市、区)科技管理部门、党委宣传部、科协,市直有关单位,中北高新区管委会,各有关单位: 为深入学...
原创 三... 一年一度618大促活动正如火如荼地进行着。手机行业又开始热闹起来了。各大手机品牌纷纷开启了新一轮的“...
江苏本格取得定子的上料装置专利... 金融界 2025 年 5 月 17 日消息,国家知识产权局信息显示,江苏本格自动化科技有限公司取得一...
5G-A来了,如何影响你我(锐... 近日,位于江西省瑞金市经济技术开发区的5G数字产业园内,智能自动导引车在车间里来回穿行运送生产物料。...
全息纱幕还原古乐、VR体验卧薪... (央视财经《天下财经》)当下,“文博热”持续升温,当古韵与科技交织,历史与潮流碰撞,古老的文物“走”...
新疆夜空不明飞行物是什么?揭秘... 5月19日 星期一 农历四月二十二 新疆夜空不明飞行物是什么?揭秘来了。5月16日晚,新疆多地拍摄到...
算力基础设施建设持续提速 将给... 记者从5月17日在江西南昌举行的2025世界电信和信息社会日纪念活动上了解到,我国将推动算力互联网试...
中国电信山东公司举办“云改数转... 五月泉城,万物竞发。2025年5月17日,值此第57个世界电信日来临之际,作为山东数字强省建设的主力...