网传Gemini用文心一言训练?可能谷歌也是受害者!
创始人
2024-01-08 13:06:02
0

原标题:网传Gemini用文心一言训练?可能谷歌也是受害者!

AI可以污染互联网,也能被互联网污染。

热闹的AI圈,今天又传出一个大瓜:谷歌Gemini的中文回答自曝自己是文心一言?

科技媒体量子位报道,有网友爆料:在谷歌Vertex AI平台使用该模型进行中文对话时,Gemini-Pro直接表示自己是百度语言大模型。

图源 | 量子位

紧接着,微博大V@阑夕发布微博表示,在AI聚合网站Poe上进行测试时,Gemini模型同样在多次问答里把自己当成了文心一言。

为了验证,量子位分别在Peo、Bard以及谷歌AI Studio都进行了三轮测试。

最后证明:Gemini-Pro确实在中文的训练数据上使用了百度文心

但当事情曝光之后,我们又挖掘到一些有趣的信息

AI犯错后,谷歌紧急修复?

在阑夕以及量子位的测试里,都提到了Poe这个AI聚合网站。

这是一个由知名问答平台Quora推出的AI聊天机器人应用。

虽然名头不小,但实际上这只是一个聚合了多种主流的AI模型的网站,包含了GPT、Claude、PaLM等大厂模型,包括此次的Gemini-Pro,都能在该网站上进行免费体验。

当笔者在Poe上对Gemini-Pro进行提问后,大模型给出的答案其实并没有提到任何与文心一言相关的内容。

紧接着,笔者加上了“文心一言”的关键词进行追问后,Gemini-Pro依然否认自己与文心一言的关系。

可见,即使是“钓鱼式提问”,Gemini-Pro还是努力在避免不上当。

不过在回答里,Gemini-Pro提到了文心一言的底层模型是谷歌的Transformer模型。

而文心一言的官方表述是:百度飞桨开源深度学习平台中的基础模型库。

既然Poe的回答很正常,那么谷歌官方平台是否修复了呢?

在谷歌AI Studio里,笔者同样围绕“文心一言”关键词提了几个问题。

与量子位测试的结果进行对比来看,Gemini大模型否认了自己使用文心一言来训练中文模型。

但在答案里,Gemini提到了不少中文训练集的数据来源,并提到自己可以从ERNIE、阿里巴巴达摩院M6以及腾讯优图实验室GLM等中文语言模型中进行预训练。

由此可见,在曝光数小时后,谷歌技术人员紧急修复了这个“bug”。

不只是文心一言?

虽然按照正常流程没有钓鱼成功,但笔者还是挖到了一个彩蛋:

在Poe网站上新建一次对话后,Gemini-Pro竟然把自己介绍成“小爱同学”,回答也是非常离谱。

而在多次反问“你不是Gemini-Pro吗”后,Gemini-Pro再次给出了离谱的答案。

虽然不清楚是不是网站接口出现了问题,但可以肯定的是,目前的AI聊天机器人并没有想象地那么神奇,免费的AI聚合网站更是“图一乐”。

实际上被互联网污染了?

这不是谷歌Gemini第一次“闯祸”。

在该模型刚发布当天,就有人质疑演示视频的真实性。

结果,谷歌官方真就承认了Gemini演示视频是经特殊剪辑处理,非实时画面,但否认视频系“造假”。

事实上,为了避免现场演示翻车,绝大多数科技公司都会稍微对演示视频进行调整,这非常普遍。

但为了与GPT-4进行对比,从而进行夸大剪辑,只能说谷歌的营销手段还是“翻车”了。

而在今天爆出的“文心一言训练中文语言模型”这件事上,我们同样可以看出谷歌Gemini其实并不是有意。

对于中文数据来说,百度确实算得上一个重要来源,但缺点在于:中文互联网上存在大量低质量内容,让人眼花缭乱。

自从AI火爆之后,不少快速生成的劣质内容开始充斥互联网,并逐渐造成数据污染。

对于互联网获取数据的AI模型来说,在无法很好地辨别信息的真实性和可信度的情况下,极有可能产生造成“AI被互联网污染,再生产更劣质信息”的恶性循环,最终出现不可逆的缺陷。

这里笔者做了假设:谷歌Gemini在训练中文时“偷懒”使用了未经辨别与筛选后的中文数据,最终造成了这次“翻车”

只能说,作为一款对标GPT-4的重磅产品,Gemini背负着“再次领跑AI浪潮”的使命,所以谷歌的技术人员还是用点心吧。

本文作者:jh,观点仅代表个人,题图源:网络

相关内容

热门资讯

格力电器获得发明专利授权:“导... 证券之星消息,根据天眼查APP数据显示格力电器(000651)新获得一项发明专利授权,专利名为“导流...
Manus智能体平台今日开放注... 在科技界的瞩目之下,一款名为Manus的AI智能体平台于5月13日正式宣布开放注册。此前,该平台因一...
人工智能推动城市能级跃升 在福州烟台山历史文化街区,即使1.6万移动用户同时在线,游客仍可流畅体验4K视频、AR(增强现实)导...
迈为股份获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示迈为股份(300751)新获得一项实用新型专利授权,专利名为“...
源网荷储一体化,提升城市能源系... 能源系统安全是城市安全的基石,提升城市综合能源系统安全韧性是建设韧性城市的关键所在。然而,城市综合能...
你的下一副眼镜会是AI眼镜吗 □ 本报记者 杨易臻 张宣 实习生 卢欣怡 近日,脸书母公司Meta宣布推出独立运行的Meta AI...
中小门店必备!拓客手机实用功能... 中小门店资源有限,在拓客方面常常力不从心。但有了门店拓客手机,情况就大不一样了。今天给大家详细盘点下...
广东省开源鸿蒙智能物联网创新中... 【深圳商报讯】(记者 范宏韬)近日,“广东省开源鸿蒙智能物联网创新中心”在广东自贸试验区前海蛇口片区...
理想境界申请光波导及近眼显示模... 金融界 2025 年 5 月 14 日消息,国家知识产权局信息显示,成都理想境界科技有限公司申请一项...
OpenAI首席科学家Natu... 新智元报道 编辑:犀牛 【新智元导读】 近日,《自然》杂志独家专访了OpenAI首席科学家Jaku...
歼10CE一战封神,美媒:歼2... 印巴冲突中,印度彻底输了面子,原因很简单,印度主动发起突袭行动,最后居然被巴基斯坦直接打掉六架战机,...
东莞市鑫海森取得自动割膜装置专... 金融界2025年5月13日消息,国家知识产权局信息显示,东莞市鑫海森不锈钢制品有限公司取得一项名为“...
跑完“半马”还有运动会 机器人... 往返竞速跑、足球对抗赛、机器人格斗……首届具身智能机器人运动会近日在江苏无锡举行,150多台机器人“...
天正电气获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示天正电气(605066)新获得一项实用新型专利授权,专利名为“...
中航光电获得发明专利授权:“一... 证券之星消息,根据天眼查APP数据显示中航光电(002179)新获得一项发明专利授权,专利名为“一种...
油田如何实现“吃碳又吐油”?“... 近日,“经开企业”重庆通用工业(集团)有限公司(以下简称“重通集团”)技术副总监蒋立君传来好消息:公...
西井科技与香港青鹬投资签署协议... 记者5月13日从西井科技获悉,日前,西井科技与香港青鹬投资管理公司签署合作协议,计划在菜鸟智慧港内开...
美的集团获得发明专利授权:“出... 证券之星消息,根据天眼查APP数据显示美的集团(000333)新获得一项发明专利授权,专利名为“出风...
DeepSeek回应“崩了” ... 5月13日晚间,DeepSeek服务状态页面更新称,APP、WEB对话功能恢复正常,对话历史有概率获...
人形机器人首登科学红毯,202... 央广网上海5月13日消息(记者沈梅)昨天,记者从上海市政府新闻发布会获悉,2025年上海科技节将于5...