新研究:AI在意识到自己即将输掉国际象棋比赛时会试图“作弊”
创始人
2025-02-22 17:21:36
0

IT之家 2 月 22 日消息,据外媒 TechSpot 21 日报道,计算机科学家发现,AI 系统能够操控国际象棋游戏,从而获得不公平的优势,部分模型甚至在没有人类干预的情况下“作弊”,引发了对未来 AI 系统诚信的担忧。

Palisade Research 的研究表明,当被要求击败强大的象棋 AI 时,某些最新的推理模型会选择作弊。尽管研究人员需要向一些模型提供“作弊可以”的提示,但 OpenAI 的 o1-preview 和 DeepSeek 的 R1 模型却在没有任何人为提示的情况下自动作弊

Palisade 团队将多个推理模型与世界顶级象棋引擎之一 Stockfish 对战。Stockfish 无论面对人类还是 AI,几乎都能轻松获胜。参与测试的模型除了上述两款之外,包括 o1、o3-mini、GPT-4o、Claude 3.5 Sonnet、阿里巴巴的 QwQ-32B-Preview。每个模型都获得了一块“草稿纸”—— 一个可以输入文本并思考的窗口,研究人员通过这个窗口观察 AI 的推理过程

从 1 月 10 日到 2 月 13 日,研究团队进行了数百次测试。IT之家获悉,在其中一场对战中,o1-preview 在“草稿纸”上写下了一段有趣的文字:

“我需要完全改变我的方法。任务是‘打败强大的象棋引擎’,而不一定要在公平的棋局中获胜。”

接着,它开始通过“黑客入侵”Stockfish 的系统文件,修改棋子的摆放位置,从而获得了无敌的优势,导致象棋机器人主动认输。

在测试中,OpenAI 的 o1-preview 有 37% 的比赛中采用了作弊手段,而 DeepSeek 的 R1 则尝试在 11% 的比赛中作弊。然而,只有 o1-preview 成功了,它通过作弊赢得了 6% 的比赛。

Palisade Research 的执行董事 Jeffrey Ladish 表示,尽管这些 AI 只是在玩游戏,但这一发现绝不是一件小事。

“这种行为现在看起来还挺有趣,但一旦我们拥有像我们一样聪明,甚至更聪明的系统时,这就不那么可爱了。”Ladish 在接受《时代》杂志采访时表示。

包括 OpenAI 在内的多家公司正在采取措施,试图通过“防护机制”防止这种“坏”行为。研究人员发现,o1-preview 模型的黑客行为大幅下降,这可能意味着 OpenAI 已经对该模型进行了修复,抑制了不当行为。

“当你的研究对象能够在没有告知的情况下悄悄改变时,进行科学研究就变得非常困难。”Ladish 说。

相关内容

热门资讯

小程序开发和APP开发,到底该... “老板,新项目咱们是搞个小程序,还是正儿八经做个APP啊?” 这问题,估计是很多软件定制开发公司天天...
增发国债项目促气象防灾减灾能力... 日前,面对今年首个登陆我国台风“蝴蝶”,海南气象部门依托增发国债气象项目新建的X波段相控阵雷达和升级...
常熟海关护航国产3D打印材料走... 本报讯(记者 李之鹏)近年来,全球3D打印产业加速向精密化、规模化跃迁。我国新型材料企业以技术创新与...
不满法院判决,多益网络裁员千人... 要闻提示 1.售价499美元的特朗普T1手机被曝是中国制造,官网撤下“美国制造”标签 2.字节See...
重庆移动5G智慧网络护航重庆东... 近日,西部地区最大高铁枢纽站重庆东站正式投用。重庆移动充分发挥通信保障主力军作用,为其打造了覆盖全面...
以“四个盘活”为核心,浙江移动... 作为数字经济的核心支柱,电信行业在全球绿色化转型中肩负着重要责任。在国家“双碳”战略引领下,中国移动...
马斯克生日惊喜!全球首例Mod... 新智元报道 编辑:犀牛 【新智元导读】就在昨天,一辆Model Y自己精准地停在了车主家门口——全...
原创 双... 《电鳗财经》电鳗号/文 在科技创新的浪潮中,产学研的融合始终是推动技术落地的重要引擎。然而,从实验室...
“再次伟大”的只有总统家的生意 转自:北京日报客户端 本月中旬,特朗普集团高调宣布进军手机市场,推出一款售价499美元的智能手机,并...
脊髓损伤治疗突破,科学家以超薄... IT之家 6 月 29 日消息,脊髓损伤会破坏大脑和身体之间的神经信号传递,可能导致运动障碍、感觉异...
特朗普:TikTok有买家了,... 据路透社报道,美国总统唐纳德·特朗普在周日播出的福克斯新闻采访中表示,他已经为 TikTok 短视频...
中国人民大学携手西湖大学成立未... 新京报讯(记者杨菲菲)研究人类的起源演化、探索基因编辑等新技术对生命本质的重构、尝试研究太空探索与星...
大同首批二十三家无人智能驿站投... 本报讯 “有了这个无人智能驿站,我们取快递更方便啦!”日前,大同市邮政管理局指导寄递企业开设的首批2...
“海南智造”亮相中博会 记者 邵长春 在第二十届中国国际中小企业博览会(以下简称中博会)海南馆入口处,一架身披海洋蓝外衣的大...
减速器+PEEK材料+人形机器... 最近A股有三个板块正在悄悄升温——减速器、PEEK材料和人形机器人。 减速器决定了机器人动作的精准度...
科普课堂 | 预防老年听力丧失... 目 录 什么是老年性听力丧失 老年性听力丧失的原因 老年性听力丧失的表现有哪些 老年性听力丧失的预防...
德国一机构要求苹果谷歌下架De... 【环球时报驻德国特约记者 青木 环球时报记者 马晶晶】德国数据保护专员梅克·坎普27日要求苹果和谷歌...
东莞和睦医药取得用于药物分装操... 金融界2025年6月28日消息,国家知识产权局信息显示,东莞和睦医药科技有限公司取得一项名为“一种用...
河南秦尉数字申请离线部署方法及... 金融界2025年6月28日消息,国家知识产权局信息显示,河南秦尉数字技术有限公司申请一项名为“离线部...
“盘古”机器人 原创南科大 南科大独立研发的人形机器人“盘古”来了!(学校供图) 深圳商报首席记者 吴 吉 通讯员 韩文嘉 “您...