DeepSeek、豆包向左,盘古大模型向右
创始人
2025-07-02 00:21:37
0

文|刘旷

华为的盘古大模型终于推出新版本了。

6月20日华为云计算CEO张平安宣布基于CloudMatrix 384超节点的新一代昇腾AI云服务全面上线,盘古大模型5.5同步发布。

不过,当前国内的AI大模型竞争可谓是相当激烈,华为的盘古大模型在众多大模型中并不是十分出众。华为云此次重磅推出的盘古大模型5.5能否从一众强敌面前杀出重围?

强敌环伺

今天,我们的AI大模型与美国Open AI、谷歌等科技公司的大模型已经相差不大,甚至在某些领域已经反超。

一类是由互联网科技巨头开发的大模型,如阿里巴巴开发的通义千问、字节跳动开发的豆包大模型、百度开发的文心一言4.0、科大讯飞开发的星火大模型、腾讯开发的元宝等。通义千问中文理解能力全球领先,支持百万级上下文窗口和多模态交互;豆包大模型月活用户量第二,擅长图像理解和多模态融合。

另一类是由DeepSeek、Kimi为代表的创业公司大模型。DeepSeek就不用说了,如今也是国内最火的大模型,月活用户量高达1.8亿,妥妥的一哥;Kimi由月之暗面开发,支持20万汉字输入,长文本处理能力突出,适合数据分析与专业文档解读,同样受到了不少用户的欢迎。

华为作为国内的科技巨头,虽然有着相当强劲的AI实力,但盘古大模型要从如此众多的竞争对手中杀出重围,也不是一件容易的事。

国产大模型普遍向左,盘古大模型偏偏向右

不管是DeepSeek也好,还是豆包大模型也罢,大多数的国产大模型几乎都选择了面向C端用户。不过盘古大模型则偏偏选择了To B,他们选择深耕行业,赋能千行百业,推动产业智能化升级。

在工业领域,盘古预测大模型通过优化生产工艺和系统寻优,提升生产效率,如海螺集团利用盘古大模型实现熟料强度预测,准确率超过85%,降低能耗;在农业领域,盘古大模型帮助农业科学家改良水稻株型,提高抗倒伏能力,同时保持产量,实现精准农业。

在金融领域,盘古金融大模型提供精准的风险评估和客户服务,提升金融机构的运营效率和客户满意度;在政务领域,盘古政务大模型助力政府提供智能化服务,提高政务处理效率和透明度。

在医疗领域,盘古医学大模型加速医学研究,提供精准诊断和治疗建议,推动医疗科技进步;在能源领域,盘古大模型优化能源生产和分配,如云南铝业通过坤安大模型降低电耗,实现节能减排。

在自动驾驶领域:盘古多模态大模型生成高质量训练数据,加速自动驾驶技术发展,如广汽集团与华为云合作实现高效数据生成;在机器人领域,盘古世界模型为具身智能机器人提供数字物理空间,提升操作能力,如火星车避障训练。

在过去的一年中,盘古大模型持续深耕行业,在政务、制造、钢铁、铁路、自动驾驶、气象等领域发挥巨大价值,重塑千行万业。此番重磅推出的盘古大模型5.5,同样继续深耕行业,推动各行业的数智化转型与升级。

盘古大模型5.5,内功究竟几何?

打磨了整整一年的时间,盘古大模型终于迎来了升级版。不得不说,盘古大模型是真沉得住气。那么,我们就来看看盘古大模型5.5打磨了这么长时间,究竟有着怎样的实力。

此次发布的5.5版本,包括比肩全球一流大模型的718B准万亿级NLP深度思考大模型、基于盘古多模态大模型的世界模型、升级的预测大模型、升级的视觉大模型,以及科学计算大模型。

算力支持方面。新一代AI云服务基于CloudMatrix 384超节点的新一代昇腾AI云服务,提供强大算力支持,单卡推理吞吐量提升近4倍,算力有效使用率提升50%以上。

技术性能方面。盘古大模型5.5采用256个专家组成的MoE架构,大幅增强了知识推理、工具调用和数学计算能力,通过自适应快慢思考合一技术,实现推理效率提升8倍,能够根据问题难度智能切换推理速度,兼顾效率与准确性。

创新特性方面。盘古多模态大模型可生成数字物理空间,为智能驾驶、具身智能机器人训练提供大量数据,降低训练成本,提高效率。

行业应用方面。盘古大模型在30多个行业、500多个场景中落地,包括政务、金融、制造、医疗、煤矿、钢铁、铁路、自动驾驶、气象等,发挥巨大价值。

总体看来,从技术实力的角度来看,华为盘古大模型5.5确实是一款先进的AI模型。

技术也是一把双刃剑

盘古大模型5.5可能太在乎对技术的追求了,但它也忽视了技术也是一把双刃剑。任何事情都是有利有弊,有好的一面也有不好的一面。

盘古大模型5.5拥有庞大的参数规模,如盘古Ultra MoE模型参数高达7180亿,这导致其在训练过程中需要消耗大量的计算资源和存储资源,从而使得训练成本较高。

与此同时,盘古大模型5.5采用了许多先进的技术和架构,如MoE架构、自适应快慢思考合一技术等。这些技术的复杂性可能会增加模型开发和调试的难度,同时也对开发人员的技术水平提出了更高的要求。

此外,盘古大模型5.5基于华为的昇腾AI云服务和鲲鹏CPU等硬件进行训练和推理,这种依赖性可能限制了其在非华为硬件平台上的部署和运行。

最后,还有一个不能忽视的问题,那便是数据安全问题。大模型训练需要大量的中文语料库,这可能会涉及到用户隐私和数据安全问题。尽管华为采取了相应的保护措施,但数据安全仍然是一个需要持续关注和优化的方面。

总体来看,国产大模型与ChatGPT等国外先进大模型的差距是越来越小了。在DeekSeek、盘古大模型等国产大模型的共同推动下,必然会推动中国式AI走出一条独特发展的道路。

相关内容

热门资讯

自免新靶点,不是一个好选择了? 文|氨基观察 仅次于肿瘤的自免市场,正迎来一场无声的“靶点焦虑”。 过去几年,最显著的进展发生在靶...
“感觉DeepSeek好痛苦”... 这里是“AI新榜”的「每日一AI」,我们在这里记录一些人类跟AI对话的碎片,社交媒体上被热烈讨论、引...
华恒智能取得自动校平放料装置专... 金融界2025年7月1日消息,国家知识产权局信息显示,广东华恒智能科技有限公司取得一项名为“自动校平...
艾格赛特取得无刷励磁机转子支架... 金融界2025年7月1日消息,国家知识产权局信息显示,安徽艾格赛特电机科技有限公司取得一项名为“一种...
中国人民大学与西湖大学联合成立... 近日,中国人民大学与西湖大学联合成立“中国人民大学-西湖大学未来人类联合研究院”。这是国内首个聚焦未...
110 亿年回溯:韦布望远镜揭... 7 月 1 日消息,美国宇航局的詹姆斯・韦布太空望远镜回溯了过去 110 亿年前的时间,揭示了迄今为...
华为申请通信方法及装置专利,提... 金融界2025年7月1日消息,国家知识产权局信息显示,华为技术有限公司申请一项名为“通信方法及装置”...
中国广电5G应急通信技术系列试... 据“中国广电”微信公众号消息,近日,中国广电集团组织中广电移动、广东广电网络在广东汕尾市完成模拟“三...
科创发明在蛇口:深圳蛇口街道创... 深圳商报·读创客户端记者 刘娥 通讯员 杨萌青 未来,如果生产车间的机器人突然停止工作,怎么样快速恢...
捕捉港式风情,华为Pura 8... 在繁华与复古交织的香港,每一砖一瓦都承载着故事,每一条街道都散发着独特的韵味。7月1日,华为官方发布...
南京占据4席,数量全省第一!江... 江苏省具身智能机器人产业联盟成立仪式暨产业创新发展对接会近日在南京举行,由江苏省工信厅主办。会上发布...
终于!微信那个让无数人社死、社... 朋友圈本来是记录生活的地方,结果变成了“谁跟谁关系好”的修罗场。 你发一条朋友圈,一个点赞,就可能引...
(活力中国调研行)我国有望建成... 中新网合肥7月1日电 (记者 张强 贾亦夫)记者7月1日从深空探测实验室(天都实验室)获悉,目前深空...
DeepSeek、豆包向左,盘... 文|刘旷 华为的盘古大模型终于推出新版本了。 6月20日华为云计算CEO张平安宣布基于CloudM...
大数据管理与应用专业数据分析工... 大数据管理与应用专业数据分析工具学习指南 🔍 大数据管理与应用专业是站在时代风口的前沿学科,它将数...
1小时极速通关!“山港通”智能... 7月1日,在山东港口威海港,随着 “山港烟台”轮鸣笛启航,标志着山东省港口集团创新打造的“山港通”智...
点石成金 巨石淮安玻纤零碳智能... “全球每3支风电叶片中有1支运用到了中国巨石的玻纤,我们公司的风电场全年风力发电量超6亿度,所发电量...
水产品药残检测设备:科技守护舌... 水产品药残检测设备是保障水产品质量安全的关键工具,主要基于酶联免疫吸附法(ELISA)和胶体金免疫层...
马斯克带头加班 通宵在办公室搭... 快科技7月1日消息,近日,马斯克在推文中表示,他正通宵达旦地开发Grok 4,并称“进展良好”。 不...
马斯克公布脑机接口重大成果,未... 在硅谷科技圈的聚光灯下,埃隆·马斯克(Elon Musk)再次以一场震撼全球的发布会,将人类对脑机接...