陈根:为什么要让AI价值对齐?
创始人
2024-01-08 07:19:11
0

原标题:陈根:为什么要让AI价值对齐?

文/陈根

随着AI大模型进入各行各业的应用,以及AI技术的持续迭代,关于AI是否会威胁人类的讨论也越来越多。

其实这样的讨论过去也有很多,甚至从AI技术诞生开始,就有人在担忧AI会不会有一天取代人类,或者威胁人类这个物种的存在。

只不过,今天,AI大模型的爆发,让这个问题一下子从抽象的讨论变得非常具体。我们必须要思考,我们该怎么迎接即将到来的AI时代;必须要面对,如果AI的性能以及达到人类水平甚至超越人类水平时,我们人类该怎么办,以及未来AI会不会有一天真的具有了意识,那个时候,人机发生冲突该又怎么解决。

而面对这些问题时,有一个概念也被人们重新提起,那就是“价值对齐”。这其实也不是一个新的概念,但这个概念放在今天好像特别合适。那么,到底什么是价值对齐?谁和谁的价值对齐?又怎么对齐?

简单来说,价值对齐,其实就是让AI的价值观和我们人类的价值观对齐,而之所以要让AI的价值观和我们人类的价值观对齐,核心目的就是为了安全。

大家可以想象一下,如果不对齐,会有什么后果。

比如哲学家、牛津大学人类未来研究所所长Nick Bostrom,曾经就提出一个经典案例。就是说,如果有一个能力强大的超级智能机器,我们人类给它布置了一个任务,就是要“制作尽可能多的回形针”,于是,这个能力强大的超级智能机器就不择手段的制作回形针,把地球上所有的人和事物都变成制作回形针的材料,最终摧毁了整个世界。

这个故事其实早在古希腊神话里就发生过。说的是一位叫迈达斯的国王,机缘巧合救了酒神,于是酒神就承诺满足他的一个愿望,迈达斯很喜欢黄金,于是就许愿,希望自己能点石成金。结果迈达斯真的得到了他想要的,凡是他所接触到的东西都会立刻变成金子,但很快他就发现这是一个灾难,他喝的水变成了黄金,吃的食物也变成了黄金。

大家从这两个故事里有没有发现一个问题,不管是超级智能机器还是迈达斯,它们都是为了自己的目的,最后超级智能机器完成了回形针任务,迈达斯也做到了点石成金,但得到的结果却是非常灾难的。因为在这个过程中,它们缺少了一定的原则。

这就是为什么今天价值对齐这个概念会被重新重视的原因。AI根本没有与人类同样的关于生命的价值概念。在这种情况下,AI的能力越大,造成威胁的潜在可能性就越大,伤害力也就越强。

因为如果不能让AI 与我们人类“价值对齐”,我们可能就会无意中赋予AI与我们自己的目标完全相反的目标。比如,为了尽快找到治疗癌症的方法,AI可能会选择将整个人类作为豚鼠进行实验。为了解决海洋酸化,它可能会耗尽大气中的所有氧气。这其实就是系统优化的一个共同特征:目标中不包含的变量可以设置为极值,以帮助优化该目标

事实上,这个问题在现实世界已经有了很多例子,今年11月,韩国庆尚南道一名机器人公司的检修人员,被蔬菜分拣机器人压死,原因是机器人把他当成需要处理的一盒蔬菜,将其捡起并挤压,导致其脸部和胸部受伤严重。而后他被送往医院,但因伤重而不治身亡。

除此之外,一个没有价值对齐的AI大模型,还可能输出含有种族或性别歧视的内容,帮助网络黑客生成用于进行网络攻击、电信诈骗的代码或其他内容,尝试说服或帮助有自杀念头的用户结束自己的生命等等。

好在当前,不同的人工智能团队都在采取不同的方法来推动人工智能的价值对齐。OpenAI、谷歌的DeepMind各有专注于解决价值对齐问题的团队。除此之外,还有许多第三方监督机构、标准组织和政府组织,也将价值对齐视作重要目标。这也让我们看到,让AI与人类的价值对齐是一件非常急迫的事情,可以说,如果没有价值对齐,我们就不会真正信任AI,人机协同的AI时代也就无从谈起。

相关内容

热门资讯

宝莱特获得实用新型专利授权:“... 证券之星消息,根据天眼查APP数据显示宝莱特(300246)新获得一项实用新型专利授权,专利名为“遥...
工装夹治具是保障生产精度与稳定... 在制造业的生产环节中,产品质量是企业立足市场的根本。工装夹治具作为保障生产精度与稳定性的重要辅助工具...
动态彩虹壁纸+系统优化!苹果i... 【CNMO科技消息】据CNMO了解,苹果在近日发布新款彩虹主题表带的新闻稿中确认,iOS 18.5系...
科技美学共振!界环×SDOKA... 在智能穿戴设备加速迭代的时代浪潮中,每一次技术革新都如同一把钥匙,开启行业发展的全新维度。作为科技与...
苹果AI国行版或随iOS 18... 图片来源:视觉中国 界面新闻记者 | 宋佳楠 “难产”的苹果AI国行版又有了新消息。 5月6日...
“舞狮”机器狗吸睛五一 AI将... 当前,“人工智能+”行动正在向千行百业各方面延伸。5月4日,由佛山市工业和信息化局指导主办、佛山电信...
兰钧新能源科技取得储能系统专利... 金融界2025年5月6日消息,国家知识产权局信息显示,兰钧新能源科技有限公司取得一项名为“一种储能系...
机器人产业潮起入局者明显增多 ... 据报道,新战略人形机器人产业研究所统计,截至2024年12月,全球人形机器人本体企业数量已经超220...
“热潮下要有定力”,她的目标是... 澎湃新闻记者 鞠文韬 “当前常见的商场迎宾机器人、酒店送餐机器人或者工业线上的工业机器人,都是按照事...
苹果因违反应用商店禁令被开发者... 【CNMO科技消息】5月6日,据外媒消息,苹果公司因被指控“故意违反”法院下达的反引导禁令,遭到了开...
AI大模型“垂直发力” 深度挖... 企业利用大模型一键生成排产计划、钢铁厂的转炉被装上“火眼金睛”、大模型成为服装设计师的“私人助手”…...
微软宣布2025年5月关闭Sk... 2025-05-05 15:20:26 作者:狼叫兽 微软此前宣布,将于2025年5月5日正式停止...
奋战二季度 拼抢上半场丨科创新... 在浙江实施的《全链条支持创新药械高质量发展的若干举措》中,明确将在技术与资金方面加大支持力度,加快布...
新研究实现对超快激光脉冲精确测... 新华社耶路撒冷5月5日电(记者王卓伦 陈君清)以色列研究人员日前在国际学术期刊《光:科学与应用》发表...
深圳小雨点申请图像处理相关专利... 金融界2025年5月5日消息,国家知识产权局信息显示,深圳小雨点数字技术有限公司申请一项名为“图像处...
AMD 锐龙9 9950X3D... 【ZOL中关村在线原创评测】近几年PC平台游戏帧数越来越高,尤其是网络游戏,百帧游戏已经成为玩家打造...
颜宁打假网传简历是太较真吗? □熊丙奇 据媒体报道,5月4日,著名科学家颜宁在社交媒体发布声明,打假网传简历。 颜宁在社交媒体表示...
安序源科技递表 致力于开发新一... 安序源科技,一家融合集成电路、生物科技和人工智能技术的生命科学公司,已向港交所递交上市申请。该公司致...
小米“智驾”更名“辅助驾驶”后... 近日,小米汽车官方宣传物料上,对其智能驾驶功能更换了宣传术语,将原有的“智驾”更改为“辅助驾驶”引发...
整治AI技术滥用!中央网信办出... 为规范AI服务和应用,促进行业健康有序发展,保障公民合法权益,近日,中央网信办印发通知,在全国范围内...