致幻的AI Overviews,谷歌再次翻了车
创始人
2024-05-28 22:21:29
0

出品 | 虎嗅科技组

作者 | 杜钰君

编辑 | 苗正卿

头图 | 视觉中国

继将马斯克画成黑人后,谷歌再次翻了车。(虎嗅注:今年2月份,谷歌的Gemini在推出文生图功能几周的时间内,被用户发现该平台刻意拒绝生成白人形象。对此谷歌方面表示加快改进,暂停人物图片的生成功能。)

此次谷歌又犯了前科。在5月15日推出这一AI搜索引擎功能后,有不少用户在使用过程中发现谷歌的AIOverviews会“胡言乱语”,对搜索的问题给出有违常识的、荒谬的解决方案。比如,兔子曾经作为密尔沃基鹰队的后卫在NBA打过球、金毛犬可以生下奶牛、建议人们每天至少吃一块小石头……

此外,谷歌的人工智能搜索系统有时会难以解决基本的数学问题和方程式。例如,询问2000年美元的相对价值,会返回一个荒谬的答案,即“2000年至2023年期间价格累计上涨-43.49%”(根据谷歌自己引用的通胀计算器,当时价格实际上涨了77%);又或是认为2024年10月至2025年1月之间有738,523天。

AIOverviews是谷歌在5月15日的I/O大会上高调推出的新型AI搜索引擎,由Gemini大模型驱动,展示在谷歌搜索的页面顶部,可总结提炼用户查询内容的概要。在I/O大会上,谷歌称该功能将“重新定义搜索体验”。由于这一功能的推出,一些专家甚至将这一天称为Google搜索的“零日”。2023年5月推出的SearchGenerativeExperience是AIOverviews的测试版。CEO桑达尔・皮查伊曾表示,在测试版推出后谷歌已经处理了超过10亿次查询。

之所以会犯这样的错误,最直接原因是Reddit网站网友评论的错误数据。谷歌的大模型以Reddit上的帖子作为学习资料,在数据清洗与训练环节出现纰漏,因而出现了“大模型致幻”。

事实上,谷歌这样“满纸荒唐言”并非个例。

谷歌之外,OpenAI、Perplexity、You.com等无一幸免,均出现过不同程度的失误。为了增强对话的拟真性和数据的全面性,这些AI搜索功能都将Reddit等社交平台作为模型训练的数据库,甚至奥特曼本身便是Reddit的投资人。

但Reddit等社区上的发言良莠不齐,显然AI在内容真实性和可靠度方面的判断力还未成熟。在常规的搜索中,这些来自随机互联网用户的恶作剧帖子可能不会成为人们点击网络链接列表时看到的首个答案。但有了AIOverviews后,这些恶作剧帖子就被整合到结果页面顶部显示的权威数据摘要中。

本质上,AIOverviews此次出现的问题是人工智能幻觉的一种新变体,当生成式人工智能模型提供虚假或误导性信息并将其呈现为事实时,就会出现幻觉。幻觉是由有缺陷的训练数据、算法错误或对上下文的误解造成的。

HITCon安全会议上的相关研究成果显示,仅仅需要“污染”不到0.7%的数据集,就能有效规避防御机制,导致大模型输出的内容准确性大幅下降。当大模型被投喂的数据集含有误导性信息时,其给出的结果必然同样失真。

对此,纽约大学的AI专家和神经科学荣誉教授加里・马库斯(GaryMarcus)曾表示,AI模型天生无法对自己的工作进行理性检查,而这正是这个行业的致命伤。

而谷歌发言人梅根・法恩斯沃斯则表示,“用户展示的事例都是不常见的查询,并不代表大多数人的经历,我们也看到了一些被篡改或我们无法复现的例子”“绝大多数AI概览查询都产生了高质量信息,并提供了深入挖掘网络的链接”。谷歌将使用有问题答案的“孤立例子”来完善其系统。

正在改变与想要改变世界的人,都在虎嗅APP

相关内容

热门资讯

“白月光”火狐落幕 浏览器“新... 21世纪经济报道记者 章驰 实习生 白家诚 这是不是你曾经的“白月光”?火狐浏览器宣布关停中国公司,...
力诺药包获得发明专利授权:“一... 证券之星消息,根据天眼查APP数据显示力诺药包(301188)新获得一项发明专利授权,专利名为“一种...
中国探月工程:对25家科研机构... 2025年7月,探月与航天工程中心组织召开了第九批月球科研样品借用申请评审会。经月球样品专家委员会评...
锐砹科迅智造申请提升化工反应效... 金融界2025年8月2日消息,国家知识产权局信息显示,浙江锐砹科迅智造有限公司申请一项名为“一种提升...
湖南祁阳:开展热门技能培训 精... 红网时刻新闻8月1日讯(通讯员 陈瑾莹 刘玉辉)在湖南省祁阳市的万联职业培训学校,人工智能训练师班的...
普星聚能取得新能源储能电池束线... 金融界2025年8月2日消息,国家知识产权局信息显示,普星聚能股份公司取得一项名为“一种新能源储能电...
中国联通:6G网络内生智能白皮... 白皮书围绕 6G 网络内生智能展开,指出 6G 将实现 AI 与通信技术深度融合,是全球研究热点。 ...
金山办公田然:AI办公第一步,... AI办公似乎成了AI助手的必备技能。 翻看各大AI助手的主界面,无论是字节的豆包、腾讯的元宝还是百度...
海尔智家获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示海尔智家(600690)新获得一项实用新型专利授权,专利名为“...
田中精机获得发明专利授权:“一... 证券之星消息,根据天眼查APP数据显示田中精机(300461)新获得一项发明专利授权,专利名为“一种...
三星S25 FE:电池减重,充... IT之家 8 月 2 日消息,科技媒体 Android Headline 昨日(8 月 1 日)发布...
原创 小... "以发烧为生",听过这句话并且知道来头的人一定都是像小智这样的忠实米粉,当然我自从小米10系列之后就...
富士通启动万级量子比特研发,2... 2025-08-01 14:41:57 作者:狼叫兽 富士通于今日宣布正式启动万级物理量子比特超...
潘建伟:百年量子路 未来科学大奖十周年庆典期间,潘建伟院士接受了光明网的采访,以下根据采访内容整理。 潘建伟,中国科学...
爱旭取得无主栅背接触电池等相关... 金融界2025年8月1日消息,国家知识产权局信息显示,珠海富山爱旭太阳能科技有限公司、浙江爱旭太阳能...
华为开源仓颉编程语言核心组件,... 2025-07-31 14:20:30 作者:狼叫兽 华为近日在代码托管平台Gitcode上正式...
透过史上最火WAIC 看Age... 万物皆可Agent 作者/ IT时报记者 郝俊慧 贾天荣 编辑/ 郝俊慧 孙妍 今年WAIC上,出现...
原创 再... 移动互联网快速发展,人们对隐私保护的需求日益增长。国内 APP 普遍要求手机注册而非国际通用的邮箱,...
经纬恒润获得发明专利授权:“雷... 证券之星消息,根据天眼查APP数据显示经纬恒润(688326)新获得一项发明专利授权,专利名为“雷达...
英伟达被请喝茶,中国芯要争气啊... 文 | 智能相对论 作者 | 莫名 这外国芯果然没有中国芯靠谱啊 前段时间皮衣黄还来中国 又是唐装又...