2024年的百度大模型,离「钱」越来越近
创始人
2024-03-23 19:37:32
0

原标题:2024年的百度大模型,离「钱」越来越近

大模型谈钱,不寒碜。

前些日子朱啸虎和杨植麟的隔空对话,代表了技术派和市场派的两种观点。朱啸虎不看好大模型创业,认为现阶段大模型公司缺乏场景和数据,估值过高,且面临开源模型的竞争,投资风险大。他更倾向于投资能快速商业化、变现的应用层项目。

杨植麟坚定看好大模型创业,认为这是未来十年唯一有意义的事,并将其视为一个结合科学、工程和商业的系统,需要长期投入和坚持,最终目标是实现AGl。

虽然两者观点看起来针锋相对,但有一点并不冲突,不论是在通向AGI的过程中“沿途下蛋”,还是现在就投资能看到产出的大模型应用公司,今年大模型的商业化,一定是离钱越来越近。

若论国内对大模型商业化最热衷的企业,百度一定是其中之一。据此前报道,2024年百度创始人李彦宏在百度智能云方向的OKR就是,跑通以大模型为核心智能云发展路径,并且在收入和利润方面都有要求。

百度智能云是百度AI能力的输出口,海外市场大模型与云服务结合得比国内更紧密,这也是百度智能云希望努力的方向。

3月21日,百度智能云千帆大模型平台就一口气发布了5款新模型,包括3个轻量级大模型、2个垂直场景大模型,并且千帆ModelBuilder以千帆AppBuilder也同步升级。钛媒体App了解到,百度后续还将发布大模型应用产品,譬如销售、客服、办公等产品。

可以说,目前百度大模型商业化只有一条主线,让尽可能多的一部分人先用大模型,由此改变自己的产品和面向客户的服务。

大模型落地“值不值”

初期大模型的火热,未必能转化为实实在在的订单,在大模型技术和产业的高速发展期,有些厂商已经被历史的车轮碾过,但却丝毫不起一丝波澜。

“惨烈,我觉得是很惨烈,从去年到现在有很多基础模型厂商参与到市场竞争,也有很多的企业资金链受到了一些挑战,也反映出新技术发展过程中的一些矛盾。”百度智能云AI与大数据平台总经理忻舟说道。

这其中一个很重要的因素,就是大模型供需之间的错位,大量企业没有掏出真金白银,而是处在观望阶段。从企业使用大模型的角度,主要关注三个因素,一是效果好不好,二是成本是否足够低,三是效率,因此多数企业并不关心大模型或者小模型,只会结合自己的预期评估大模型落地到自己的场景“值不值”。

百度也提出了自己“效价比”的理念,除了极少的大客户对大模型有极致的效果追求,更多的企业和机构往往要综合考量大模型的使用效果、性能以及成本,即“效价比”

面向大模型如何落地,业内想了各种各样的技术方法,比如RAG、插件、MoE、小型化、大小协同等等各种各样的问题,轻量级模型就是公认的“效价比”突出的方案。

“业界也逐渐形成一个共识,模型不见得是参数规模越大越好。在很多实际的场景当中,用小尺寸的专家模型也能够达到我们通用大模型的效果,小尺寸专家模型的推理成本会更低,更便宜。”百度副总裁谢广军表示。

他还提到,本次发布的三款模型都是开发专家模型的基座模型,主要面向两个场景:一是客户、合作伙伴结合自己的数据,去做垂类场景模型。二是百度也会基于这些小的基座模型,去开发第一方的行业垂类场景模型,比如做教育行业的教辅答题和解题,可以用一个小尺寸的模型加上一些数据,精调出一个效果很好的解题助手模型。

“3+2”,5款新模型

一月初,OpenAI发布了多款新模型,价格下降,性能提升,百度本次也是同样的策略,百度智能云千帆ModelBuilder发布了包括ERNIE Speed、ERNIE Lite、ERNIE Tiny在内,参数量由大到小的三款轻量级大模型。千帆ModelBuilder的概念就是生产平台,提供整个模型训练的工具链,让模型开发变得更简单。

对于轻量级模型,谢广军表示,基座模型本身的效率一定要好,百度基于文心大模型的技术领先优势积累,再把尺寸做小,模型的效果就会做得很好,在很多场景它能够达到大模型的效果。

同时,百度发布的轻量级模型具备再生产能力,比如支持post-pretrain、sft、lora精调能力,基座模型加上精调数据来达到垂直场景下的效果,同时成本更低。

具体来看,ERNIE Speed在推理场景下拥有最高128k的上下文长度,在处理知识问答等任务时,能够更好的处理上下文的依赖关系,同时,针对特定场景可以将ERNIE Speed作为基座模型进行精调,模型效果可以追平甚至超过旗舰级大参数规模大模型,效价比大幅提升。

ERNIE Lite的参数量则更小,更适合搭载在低算力的AI加速卡上处理推理任务,作为ERNIE-Bot-turbo模型的升级版,ERNIE Lite在情感分析、多任务学习、自然推理等场景下的应用效果提升了20%,推理调用成本大幅下降了53%。

参数量最小的ERNIE Tiny则主打极致低成本、低延迟,可用于检索、推荐、意图识别等高并发、低延时等应用场景中,在某对话推荐业务场景中,精调后的ERNIE Tiny在搜索引擎推荐词激发环节,相比ERNIE 3.5,对话轮次增长了3.5%,成本下降了32%。

此外,百度智能云千帆ModelBuilder还推出了ERNIE Character和ERNIE Functions两款垂直场景大模型,分别适配客户在角色扮演类应用场景(如游戏NPC、客服对话等)和工具调用场景(对话中使用外部工具、调用业务函数等)中的使用需求。

结合企业实际使用大模型的过程,有些企业起初就用最好的模型看最好的效果,再决定投入的资源程度。有些场景需要快速验证,企业可以先上轻量级模型,轻量级模型总结一句话——“轻归轻,可破冰”,在一些场景下完全可用,作为大模型落地的先锋军。

对于注重私有数据的企业和行业,私有数据跟大模型结合也可以先用轻量级模型,不管是知识资产还是数据分析,都可以跑出效果。

“把大模型应用,喂到企业嘴边”

千帆大模型平台上的客户需求主要分为三种,第一类是在AppBuilder开发应用;第二类,直接调用百度的基座模型的,比如直接调用文心4.0、 3.5版本;第三类是生产模型,客户数据和百度基座模型结合做一个新的垂类模型。

AppBuilder去年年底推出,从应用的视角让开发者能够便捷地开发基于大模型的AI原生应用,百度第一方也做了非常多的AI原生应用,也是基于这套平台做的,本次AppBuilder也进一步升级,进一步降低应用开发门槛。

升级后的AppBuilder开放的工具组件多达55个,包括基于百度多年技术积累和自有业务沉淀的大模型组件、AI能力组件,也包括搜索等百度特色的业务组件、和多场景的第三方API工具,另外还提供了 RAG(知识检索问答)、GBI(生成式数据分析)等根据典型应用场景深入调优的高级能力组件。

在组件之上,千帆AppBuilder推出的Agent(智能体)应用框架,具备精准的任务自主规划能力,对多种应用工具的自动编排准确率超过90%。AppBuilder还支持开发者接入自定义工具,实现更复杂场景应用的需求定制。

谢广军介绍,AppBuilder分两个形态,一个是代码态,百度提供SDK,甚至提供底层的组件和能力,这种是大B端的场景下的典型客户画像。另一个是零代码态,以小企业、个人开发者为主,现在零代码态开发者的数量比较多,百度这两条路都要走。

根据百度智能云公布的数据,千帆大模型平台已经服务8万企业用户,累计帮助用户精调1.3万个大模型,帮助用户开发出16万个大模型应用,自2023年12月以来百度智能云千帆大模型平台API日调用量环比增长97%

大模型未来一段时间还会不断快速演进,百度AI团队主抓基础模型,智能云团队主抓商业落地,构成了百度自己的大模型商业落地模式。

(本文首发钛媒体APP 作者|张帅,欢迎添加作者mr3right爆料、交流)

相关内容

热门资讯

华恒智能取得自动校平放料装置专... 金融界2025年7月1日消息,国家知识产权局信息显示,广东华恒智能科技有限公司取得一项名为“自动校平...
艾格赛特取得无刷励磁机转子支架... 金融界2025年7月1日消息,国家知识产权局信息显示,安徽艾格赛特电机科技有限公司取得一项名为“一种...
中国人民大学与西湖大学联合成立... 近日,中国人民大学与西湖大学联合成立“中国人民大学-西湖大学未来人类联合研究院”。这是国内首个聚焦未...
110 亿年回溯:韦布望远镜揭... 7 月 1 日消息,美国宇航局的詹姆斯・韦布太空望远镜回溯了过去 110 亿年前的时间,揭示了迄今为...
华为申请通信方法及装置专利,提... 金融界2025年7月1日消息,国家知识产权局信息显示,华为技术有限公司申请一项名为“通信方法及装置”...
中国广电5G应急通信技术系列试... 据“中国广电”微信公众号消息,近日,中国广电集团组织中广电移动、广东广电网络在广东汕尾市完成模拟“三...
科创发明在蛇口:深圳蛇口街道创... 深圳商报·读创客户端记者 刘娥 通讯员 杨萌青 未来,如果生产车间的机器人突然停止工作,怎么样快速恢...
捕捉港式风情,华为Pura 8... 在繁华与复古交织的香港,每一砖一瓦都承载着故事,每一条街道都散发着独特的韵味。7月1日,华为官方发布...
南京占据4席,数量全省第一!江... 江苏省具身智能机器人产业联盟成立仪式暨产业创新发展对接会近日在南京举行,由江苏省工信厅主办。会上发布...
终于!微信那个让无数人社死、社... 朋友圈本来是记录生活的地方,结果变成了“谁跟谁关系好”的修罗场。 你发一条朋友圈,一个点赞,就可能引...
(活力中国调研行)我国有望建成... 中新网合肥7月1日电 (记者 张强 贾亦夫)记者7月1日从深空探测实验室(天都实验室)获悉,目前深空...
DeepSeek、豆包向左,盘... 文|刘旷 华为的盘古大模型终于推出新版本了。 6月20日华为云计算CEO张平安宣布基于CloudM...
大数据管理与应用专业数据分析工... 大数据管理与应用专业数据分析工具学习指南 🔍 大数据管理与应用专业是站在时代风口的前沿学科,它将数...
1小时极速通关!“山港通”智能... 7月1日,在山东港口威海港,随着 “山港烟台”轮鸣笛启航,标志着山东省港口集团创新打造的“山港通”智...
点石成金 巨石淮安玻纤零碳智能... “全球每3支风电叶片中有1支运用到了中国巨石的玻纤,我们公司的风电场全年风力发电量超6亿度,所发电量...
水产品药残检测设备:科技守护舌... 水产品药残检测设备是保障水产品质量安全的关键工具,主要基于酶联免疫吸附法(ELISA)和胶体金免疫层...
马斯克带头加班 通宵在办公室搭... 快科技7月1日消息,近日,马斯克在推文中表示,他正通宵达旦地开发Grok 4,并称“进展良好”。 不...
马斯克公布脑机接口重大成果,未... 在硅谷科技圈的聚光灯下,埃隆·马斯克(Elon Musk)再次以一场震撼全球的发布会,将人类对脑机接...
描绘智能未来新图景——聚焦福州... 坐上自动驾驶网约车,车外风景宜人,车速不疾不徐;车内无需人工操作,智慧大屏清晰显示车辆情况和路况信息...
原创 南... 这几年,中国在南海默默干了一件大事。 把一块块不起眼的礁石,变成了真正的海上岛屿。 修机场、建码头、...