李彦宏内部讲话曝光:首次谈及文心大模型为什么不开源?
创始人
2024-04-11 22:56:04
0

原标题:李彦宏内部讲话曝光:首次谈及文心大模型为什么不开源?

雷递网 乐天 4月11日

今天,一则李彦宏内部讲话流出。在内部讲话中,李彦宏对大模型开源与闭源的路线选择,以及AI创业者应该专注模型还是应用等业界焦点话题,发表了自己的看法。

以下是李彦宏的几个核心论断。

1、闭源模型在能力上会持续地领先,而不是一时地领先。

2、模型开源也不是一个众人拾柴火焰高的情况,这跟传统的软件开源一比如Linux、安卓等等很不一样。

3、闭源是有真正的商业模式的,是能够赚到钱的,能够赚到钱才能聚集算力、聚集人才。

4、闭源在成本上反而是有优势的,只要是同等能力,闭源模型的推理成本一定是更低的,响应速度一定是更快的。

5、无论中美,当前最强的基础模型都是闭源的。通过基础模型降维做出来的模型也是更好的,这使得闭源在成本、效率上更有优势。

6、对于AI创业者来说,核心竞争力本就不应该是模型本身,这太耗资源了,而且需要非常长时间的坚持才能跑出来。

7、既做模型又做应用的“双轮驱动”,对创业公司不是好模式。创业公司的精力和资源都很有限,更应该专注。既做模型又做应用,势必会分散精力。

以下为李彦宏内部讲话实录的部分原文:

一、为什么不开源

已经有足够多的开源大模型

一年前文心刚刚发布的时候,我们内部是有过非常激烈的讨论的,最后当然大家也知道这个结果,我们的决定是不开源。为什么不开源?当时的判断是,市场上一定会有开源的模型,而且是不止一家会开源。在这种情况下,多百度一家开源不多,少百度一家开源也不少。

我们今天看主流的开源模型:,像Llama,Mistral其实都是有相当影响力的,国内的智源、百川、阿里的通义也都是开源的,这个市场上不缺我们这一家开源的模型。我们要开源还得自己去维护一套开源的版本,这是不划算的。

闭源模型能力会持续领先

更重要的是,在我们的认知里,闭源模型在能力上会持续地领先,而不是一时地领先。为什么会有这个判断?因为我们觉得模型开源的意义其实不是很大,这些开源模型都是在外头零零散散小规模地去做各种各样的验证应用,它没有经过大算力的验证。

而且模型开源也不是一个众人拾柴火焰高的情况。这跟传统的软件开源一比如Linux、安卓等等很不一样,由于是模型带来的开源,我们也不知道参数为什么变成了那个样子,这种情况下很难实现众人拾柴火焰高。虽然Llama也鼓励大家去贡献各种各样的数据、代码,但是实际上大家明白最主要的开发者就是Meta这些人,它并不是一个真正由大家一起来协同开发的产品。

闭源才有真正的商业模式,才能聚集人才和算力

反观闭源,是有真正的商业模式的,是能够赚到钱的,能够赚到钱才能聚集算力、聚集人才。其实也很简单,大家比较一下,比如硅谷有一个优秀的人才,他有OpenAI的offer,有Meta的o ffer,有Llama的offer,他会去哪儿?这是非常显而易见的选择。

闭源在成本上也有优势

大家以为开源是免费的,在成本上有优势,实际上我们认为也不是,闭源在成本上反而是有优势的。只要是同等能力,闭源模型的推理成本一定是更低的,响应速度一定是更快的。反过来,同等参数的情况下,闭源模型的能力也是更强的。今天不管是在中国也好、在美国也好,最强的基础模型都是闭源的,而各种各样的小模型、最好的小模型,都是通过大模型蒸馏来的。通过大模型降维做出来的模型就是更好的,这样也会导致闭源在成本上、在效率上也会有优势。

二、创业者为啥可以依赖文心

双轮驱动不是好模式

首先,外界一些做模型的创业公司讲的所谓的“双轮驱动”不是一个好的模式。既做模型又做应用,势必会分散精力。创业公司的精力和资源都是有限的,同时做两件事情和只做一件事情哪个成功率更高是不言自明的。在任何情况下我们都非常讲专注力,“力出一孔”,当资源有限的时候更应该专注,而不是去搞所谓的“双轮驱动”。

AI创业者的核心竞争力不是模型本身

第二,对于AI创业者来说,核心竞争力本就不应该是模型本身,这太耗资源了,而且需要非常长时间的坚持才能跑出来。

创业者真正的优势应该是在某一个领域的知识、数据。假如说你今天想找一个“黄色的无兜的男士泳裤”,你在任何一个今天的电商平台上都找不到,这种需求目前的技术是解决不了的,大模型如果有领域知识就可以解决,这就是靠领域知识能够提供独特价值的例子。

市面上有这么多模型,大的、小的、开源的、闭源的,在特定应用当中怎么样使用这些模型的组合,是有技巧的,这是创业者可以干的事儿,是可以提供价值增益的。

基础模型不会通吃AI应用

外界担心如果用了文心或者闭源模型,做得好了它就抄你,就把你的饭吃掉了,实际上这种担心也是没有任何道理的。

拼多多、滴滴不怕微信抢饭碗

大家去看一看,在移动时代,微信没有去吃掉拼多多,滴滴也没有变成腾讯的一部分,它们都各自提供了自己独特的价值,有自己非常不一样的竞争力,它们的兴起都是依赖移动生态里的一个封闭平台——微信,但是它们并不怕微信去抢它的饭碗,所以没有必要担心基础模型通吃AI的应用。

文心功能最强,性价比最优

当然更根本的就是文心的功能是最强的,性价比是最好的,我们会持续不断地投入,有了这一点,所有其他的东西才能够成立。

———————————————

雷递由媒体人雷建平创办,若转载请写明来源。

相关内容

热门资讯

浩利丰取得一体式紫铜消音器专利... 金融界2025年7月11日消息,国家知识产权局信息显示,武汉浩利丰机械有限公司取得一项名为“一种一体...
人保再保发布行业首个《新能源汽... 2025年6月,在人保再保险股份有限公司第五届“技术引领,共创未来”技术论坛上,公司正式发布了行业首...
SpaceX第七次载人飞行Cr... 2025-07-11 09:20:55 作者:狼叫兽 NASA 与 SpaceX 近日正式宣布,...
我科研团队首次实现小鼠全身神经... 来源:科技日报 科技日报记者 吴长锋 记者10日从中国科学技术大学获悉,该校毕国强教授、刘北明教授联...
从“实验室”走向“生产线” 全... 封面新闻记者 伍雪梅(主办方供图) 7月10日,“长江首城宜创汇”协同创新大赛人工智能专项赛总决赛在...
正海磁材:人形机器人等领域有望... 今年以来,随着机器人行业的快速发展,作为上游原材料的稀土永磁行业也备受市场关注。 日前,正海磁材(3...
原创 百... 2024年,我选定一个题材,用100台国产老相机拍摄100个胶卷。然后把相机送给有缘人(也就是进入我...
淄博:三大赛道支撑装备制造业突... 回首过往,淄博制造的金字招牌熠熠生辉,在深厚工业底蕴的滋养下,淄博装备制造业这个已有百年底蕴的产业,...
航宇科技获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示航宇科技(688239)新获得一项实用新型专利授权,专利名为“...
真相来了|网传太阳能板释放有害... 央视网消息:国家统计局数据显示,2024年,我国太阳能电池产量达6.8亿千瓦,同比增长15.7%。日...
消息称黄仁勋下周到访中国:特供... 来源:快科技 快科技7月11日消息,H20被禁止向中国厂商禁售后,黄仁勋可能是最着急的人,不过现在看...
叮当健康智能售药机进驻中央民族... “这个24小时售药机真是太方便了“,中央民族大学(丰台分校)一名正在自助购药的学生表示。 日前,在北...
西樵做小程序的公司 在当今数字化快速发展的背景下,小程序作为一种轻量级的应用工具,已成为许多企业和个人实现业务拓展、提升...
123 光年外的天枢星,人类未... 朋友们,咱今儿聊聊北斗七星里的天枢星。这星星可有些年头了,大概 2.8 亿年前就诞生啦,离咱们地球约...
全球最快!中国科大首次实现 记者7月10日从中国科学技术大学获悉,该校教授毕国强、刘北明联合合肥综合性国家科学中心人工智能研究院...
检索增强生成(RAG)为何在今... 在 人工智能领域,有一种名为检索增强生成(RAG)的方法正在成为帮助模型获得精准结果的关键途径。 ...
韩媒感叹:全球百大顶尖人工智能... 【CNMO科技消息】近日,韩媒援引最新研究表示,全球前100名顶尖人工智能(AI)科学家中,半数为中...
智创未来|我校与网易互娱SON... 7月9日上午,网易互娱音频总监吴盛强一行赴我校调研交流,我校党委副书记、院长陶陌出席座谈会。 陶陌...
“空中的士”要来了!温州苍南“... 7月9日,“峰飞航空科技(苍南)展示体验中心” 正式启用,标志着温州市苍南县在打造浙南低空经济产业基...
世运电路获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示世运电路(603920)新获得一项实用新型专利授权,专利名为“...