原创 马斯克推出的最新AI大模型,可能宣布西方大模型路线即将终结
创始人
2025-02-24 13:02:02
0

马斯克推出的最新版AI大模型,可能正式宣布了,西方大模型路线即将终结。

马斯克除了用政府效率部,最近在美国搅的翻天覆地之外,其实本职工作他倒是也没耽误。一方面,他的火箭正常上天,不断的送卫星。二方面,马斯克名下的xAI公司,最近也推出了号称,到目前为止最强的人工智能大模型,也就是grok3。grok3的发布会上,马斯克是展示了它,在包括推理能力等等,针对,已有的包括了,谷歌的大模型,包括我们,非常熟悉的DeepSeek的大模型,是有相当大的长进。只不过,在PPT里面我们看到,其实它所谓的大幅的性能增长,用了一点点,我们说叫做比例尺的魔法。大家如果看它的比例尺就会发现,比例尺并不是从0开始,而是截取了一段数字,然后专门显示差距部分,特意的放大了差距。更让大家感到惊讶的是,马斯克在grok3上面,投入了巨量的计算资源。

有消息称,为了运行大模型,马斯克新增加了一个20万张计算卡的计算中心,它整个模型推理的计算量,比起我们DeepSeek最新版本,它的计算量是达到了263倍之距的计算量。相比之下,我们的DeepSeek只用了2048张,比马斯克还要低几个档次的计算卡,就实现了非常好的推理性能,这一下就比出了两条路线,两个大模型之间巨大的差别。说白了,马斯克的大模型,还是在尊重所谓的scaling law,也就是比例缩放的定律,迷信的是什么?我的参数规模越巨大,它的性能就会越优异。而我们中国的这些大模型,以DeepSeek为代表大模型,走出了另外的一条路,我们从模型的基础架构上,就相对的不同。

DeepSeek,使用了一种叫做Moe的基础的架构,因此它的训练的效率会更高。不仅如此,不只是一个DeepSeek团队,中国还有其他的一些人工智能团队,还提出了更新的人工智能算法的架构,甚至能比DeepSeek效率再提高83%。这也就意味着,我们是在有限的算力条件下,搞多、快、好、省的计算方向。比起那种纯粹靠堆料,靠上计算卡,来搞的人工智能的大模型,它的使用成本是远远降低的,这其实是有非常大深远的意义的。

我们都知道像DeepSeek这样的一个模型,是可以在个人的电脑上,或者说,中小型企业搭建的小型数据中心上,进行计算运行的,并且还是一个满血版的。这就意味着,这些大模型,它的应用场景会极大的丰富,它的使用门槛会极大降低,特别是我们之前说到的,大模型全世界平权的时代,在DeepSeek这类开源。而且非常节约算力的大模型下,会更快的到来。

相比之下,西方走的还是那一套,靠垄断资源大量计算,去提高性能,去进行应用的大模型思路,恐怕已经接触到了它的天花板,已经遇到了瓶颈,这也很好想象,不是说我多加几块计算卡,大模型的性能就会增加,它最终会触达一个极限,它的边际效应,随着卡的数量的增加,是一个递减的一个效果。因此只有,从根本上去改变一个基础的逻辑,才有可能进一步的提升大模型的,运用的场景,才有可能提升它的效率。现在看来,包括马斯克,包括open AI,西方一众的这些大模型,恐怕都在接触到大模型,它们算法的上限。而反观包括中国在内的,我们这些新兴的大模型玩家,我们可能正在走向,大模型未来发展的正确道路。

相关内容

热门资讯

中国广电5G应急通信技术系列试... 本报讯 (记者李乔宇)近日,中国广播电视网络集团有限公司(以下简称“中国广电”)组织中广电移动网络有...
《新媒体传播研究》创刊号发行仪... 央广网太原6月29日消息(记者张洁)盛夏时节,学术新声绽放龙城。28日,《新媒体传播研究》创刊发布会...
从大国重器到非标零件 制造业插... 经济动脉,畅通为要。信息互联,是供应链“提质升级”的关键引擎。目前,我国已建成全球技术领先、规模最大...
深圳扩维原子科技申请纯直流平面... 金融界2025年6月28日消息,国家知识产权局信息显示,深圳扩维原子科技有限公司申请一项名为“一种纯...
首俊明——奔赴星辰大海 “5、4、3、2、1,点火!”2024年11月30日22时25分,在位于海南省文昌市东郊镇的海南商业...
以园聚产 云南南华打造菌产业全... 6月29日,南华品品鲜生物科技智慧化工厂项目投产仪式在云南省楚雄彝族自治州南华县老高坝产业园区举行。...
2025年续航好拍照手机排行榜... 随着CamMark(手机拍照能力)成为消费者选购手机的核心指标之一,续航表现与拍照能力的结合成为焦点...
时隔36年,今晚记得抬头看! 6月29日,太阳系中的行星海王星与土星相合,上演“星星相吸”。届时如果天气晴好,我国感兴趣的公众可在...
意大利专家纳闷:中国人是无神论... 笔者:杰鲁鲁 尽管我们已经进入科技飞速发展的时代多年,但仍有许多国家选择保持自己的宗教信仰。例如,...
腾讯申请向量移位方法相关专利,... 金融界2025年6月28日消息,国家知识产权局信息显示,腾讯科技(深圳)有限公司申请一项名为“向量移...
OpenAI华人AI大牛集体跳... 梦晨 发自 凹非寺 量子位 | 公众号 QbitAI 扎克伯格又从奥特曼手里挖走4名顶尖AI人才,这...
唯正智能申请用于PCB板钻孔机... 金融界2025年6月28日消息,国家知识产权局信息显示,福建省唯正智能科技有限公司申请一项名为“一种...
扎克伯格“重金招兵”:Meta... 6 月 29 日消息,看起来 meta 仍没有停止从 OpenAI 挖人。据 TechCrunch ...
无线网络全覆盖!南岗区推进AI... 为提升核心商圈与历史文化街区智慧化管理水平,日前,南岗区秋林地区管理处联合中国电信集团哈尔滨市分公司...
拓佳科技取得能提高安全性的注粉... 金融界2025年6月28日消息,国家知识产权局信息显示,珠海市拓佳科技有限公司取得一项名为“一种注粉...
纳滤膜在海水淡化中的技术创新 这是(wowtya)整理的信息,希望能帮助到大家 随着全球水资源紧张问题日益突出,海水淡化技术成为...
原创 木... 家人们,今天咱来唠唠木星。这木星啊,可太奇特了,说它是个 “超级氢气球” 一点不为过。你瞧,它的大气...
抖音新蓝海:中小创作者与小众商... 在当今这个信息洪流与就业形态日益多元的时代,抖音已经悄然成为众多普通人探索新机遇的沃土。曾几何时,它...
印度首次入驻国际空间站,印网友... 大家好啊,我是老陈,今天想和大家聊聊最近发生的一件挺有意思的事情。6月25日这一天,印度人的媒体圈可...
科晶智达取得电芯夹具及终封机专... 金融界2025年6月28日消息,国家知识产权局信息显示,深圳市科晶智达科技有限公司取得一项名为“电芯...