原创 中文才是真正的AI母语?相比起来英文被扭曲的很严重!
创始人
2025-02-07 07:40:40
0

为了应对DeepSeek,最近OpenAI紧急发布了自己的最新版本o3-mini,大家却发现了一个很有趣的事情,即使是在用英文提问的情况下,OpenAI居然狂吐中文,这是在蒸馏DeepSeek还是改用中文训练了?

这也给大家提了个醒,DeepSeek异军突起的背后说不定有中文的功劳,从机器学习的角度来说,中文比其他语言高级很多,是有很坚实的底层架构的,而英文则杂乱无章。

比如电这个字,以前用的少,但是现在衍生出来很多电脑、电视、电话、电冰箱等等,相关联的都是用电来组,哪怕是个小孩子看到新词也大概知道意思,但同样用英文来这样解读就很容易出问题。

对于人来说学英文也许不难,但是对于利用神经网络来学习的AI来说,这未必是件好事,有人说硅谷正在加紧学习中文以求破局,还真有可能,尤其是那些诗词歌赋,AI一旦学会了确实会有不一样的体验。

最近中美网友对账时,很多美国人也发现了这个问题,一个故事或者一段历史被整合成了成语,短短几个字就可以表述出丰富的内涵,而且还有语义融合能力,这方面对AI也许很有帮助。

中国有悠久的历史,也留下了大量的文字资料,很多人一直说什么中文互联网内容很垃圾什么的,其实AI肯定优先学习那些成体系的资料,等学完那些之后再从互联网上扒资料就很容易懂了。

之前没有DeepSeek的时候,网上一直流传一种说法称中文AI永远超不过英文AI,没想到只是训练方式不对,DeepSeek最被称道的不完全是数据量,而是好像AI真的在思考,跟OpenAI相比多了一个“顿悟”时刻。

这是个很有趣的现象,看看未来用英文、法文、西班牙文等会不会出现这样的情况,如果他们搞不出来的话,那也许真就是中文本身自带的能力,因为AI单纯学语言很容易,但是能学出花来不容易。

除了语言的差别以外,还有个很严重的问题是ChatGPT被意识形态化了,很多东西被卡死了,最终很可能导致整条链路都会带点毛病,而中文相对来说没那么多限制。

DeepSeek明确表示他们用的中文数据比英文数据略多一点,而且为了解决语言混用的问题他们在强化学习训练期间引入了语言一致性奖励,如今OpenAI在思维过程中开始出现中文,很有可能大模型自己发现中文是最适合推理过程的语言。

估计OpenAI也不肯承认自己蒸馏DeepSeek的数据,那很可能就是因为中文更适合利用思维链来完善推理,也许是因为某种特性,使得中文更适合思考。

相关内容

热门资讯

新能源装配新利器:高精度机器人... 随着新能源产业的快速发展,对电池与电机的装配精度提出了前所未有的挑战,这一需求正引领着机器人夹爪技术...
218个项目!全国智能机器人锦... 深圳新闻网2025年7月8日讯(深圳商报记者 陈发清)近日,2025全国颠覆性技术创新大赛智能机器人...
阿里云智能副总裁安筱鹏 | 工... AI大模型的融入能显著提升制造业的竞争力,其中包含两个风向标:第一个风向标是今年1月美国拉斯维加斯的...
南科大“空海潜”无人集群挺进深... 深圳商报·读创客户端首席记者 吴吉 通讯员 洪妍 7月7日,南方科技大学海洋高等研究院牵头,联合科研...
开闭所、配电房智慧化改造:配网... 1、配网站房存在的问题 配网站房存在总数多、遍布范围广等情况,站点巡视耗人耗力,缺少提高效率的信息...
突破技术瓶颈!我国团队首次实现... ◎ 科技日报记者 陈曦 通讯员 赵晖 记者7日从天津大学获悉,该校精密仪器与光电子工程学院光电子科学...
原创 6... 下半年会有一大波小屏旗舰手机上市,而且骁龙8 Elite 2处理器也会提前到9月份发布,到时候小米1...
超聚变申请虚拟机迁移方法等相关... 金融界2025年7月7日消息,国家知识产权局信息显示,超聚变数字技术有限公司申请一项名为“虚拟机迁移...
外卖大战喂饱了谁? “瑞幸越来越像霸王茶姬,它倾向于植物奶基底兑咖啡,更偏向于95、90后。库迪越来越像蜜雪冰城,它倾向...
智汇金城,数智未来!2025年... 7月7日,由兰州市政府主办,市工信局、市数据局、市投促局承办的2025年兰州市数字经济高质量发展大会...
任天堂财报确认持续研发XR技术... (映维网Nweon 2025年07月08日)根据新发布的财报文件,任天堂证实团队依然有在研究虚拟现实...
合肥盛宝电气取得一种干式变压器... 金融界2025年7月8日消息,国家知识产权局信息显示,合肥盛宝电气有限公司取得一项名为“一种干式变压...
DeepSeek罕见领英扩招A... DoNews7月8日消息,据报道,DeepSeek近日在LinkedIn上大幅加码招聘,释放出可能正...
赛杰爱迪取得三支撑绝缘子固定结... 金融界2025年7月8日消息,国家知识产权局信息显示,赛杰爱迪(江苏)高压电气有限公司取得一项名为“...
广州凯康科技太赫兹掌中宝THz... 广州凯康科技THzMini迷你太赫兹水仪 太赫兹掌中宝迷你共振水仪-太赫兹健康水仪 (0.96) 健...
5G LAN再突破:广域互联开... 面对航空航天、金融保险等行业对数据传输安全,仓储物流等行业对灵活网络部署,政务、交通等行业对网络容灾...
青岛故事|专注造“心”出口30... 为发动机制作高端“心脏”,产品出口到30多个国家和地区;与80余家国内外著名企业建立全面战略合作关系...
2025人形机器人元年:“狂欢... 文 | 智能相对论,作者 | 陈泊丞 过去的半年,资本、工厂、媒体以及大众都盯上了人形机器人。 在...
再玩科技取得手持风扇专利 有效... 金融界2025年7月8日消息,国家知识产权局信息显示,深圳市再玩科技有限公司取得一项名为“一种手持风...
“AI医生”加速进化!两天完成... 转自:上观新闻 清华大学智能产业研究院院长张亚勤近日在接受第一财经的电视节目采访时表示,AI医院用...