Kimi引燃大模型“长文本竞赛”,阿里360百度急出手:商业化应用场景继续拓宽
创始人
2024-03-24 17:56:02
0

原标题:Kimi引燃大模型“长文本竞赛”,阿里360百度急出手:商业化应用场景继续拓宽

本报(chinatimes.net.cn)记者石飞月 卢晓 北京报道

从ChapGPT到Sora,从数千亿参数到千万长文本,大模型浪潮下,永远不缺热点。近日,“Kimi概念股暴涨”“Kimi为宕机道歉”等词条先后冲上微博热搜,让月之暗面这家刚成立一年的人工智能公司进入越来越多公众的视野。

3月18日,月之暗面宣布Kimi智能助手启动200万字内测的动作,这引燃了大厂们新一轮“内卷”的热情,阿里巴巴直接将行业最高水平拉到1000万字,百度被曝下月开放200万-500万长度。3月23日下午,360也来凑热闹了,宣布正式内测500万字长文本处理功能。

去年还在拼参数,今年又拼起了长文本/无损上下文,一个大模型让互联网大佬们使尽了全身解数,可见万物皆可AI的大势已经不可阻挡。然而,数据上的领先只是暂时的理论成果,未来,解决问题的能力才是AI公司们真正筑起商业化大楼的底气。

数据比拼

和此前的参数竞赛不同的是,这轮大模型之间的竞争,不只停留在数据层面,还有概念上的“拉扯”。

仅从表面上的数据水平来看,360和百度打的是“安全牌”,并未在数据上猛冲。3月23日,360AI浏览器宣布正式内测500万字长文本处理功能,据用户反馈,该浏览器目前已可一分钟读完《三体》,并就文本外的“超纲”问题进行问答和延展学习。而在2月底时,360AI浏览器就已向用户免费开放100万字长文本阅读功能。

目前,360AI浏览器PC端已可免费下载使用,移动端也即将上线各大移动平台,该浏览器同时也支持对视频、音频、网页和中英文论文等常用文档类型的处理,可以帮助用户自动总结要点、生成思维导图等。

百度也被曝将于下个月对文心一言进行升级,届时也将开放长文本能力,文本范围在200万-500万。

相较于360和百度的“安全牌”,阿里巴巴打出的则是“一鸣惊人牌”,通义千问升级后直接向所有人免费开放1000万字的长文档处理功能,成为全球文档处理容量第一的AI应用。据悉,所有金融、法律、科研、医疗等领域的专业人士,都可通过通义千问网站和App快速读研报、分析财报、读科研论文、研判案情等。

要知道,目前国外头部大模型中,Open AI的GPT-4Turbo上下文窗口为12.8万tokens,谷歌的Gemini1.5支持100万tokens上下文。1个汉字通常相当于1-2个token,单从理论上分析,360AI浏览器、文心一言和通义千问的上下文窗口已经是这些头部大模型的好几倍。

而一开始引燃这场“战争”的月之暗面,给出的数据是200万,虽然和以前的20万字相比有极大提升,但和阿里巴巴的1000万字相比,还是小巫见大巫了。

概念“拉扯”

对于数据上的差距,月之暗面有自己的想法。

首先在概念上,月之暗面给出的是200 万字无损上下文长度,而不是长文本。“之所以不能称为‘长文本’,是因为输入的信息不只是文本,也可以是图片、录音、视频、动作等多模态的信息。”月之暗面相关负责人对《华夏时报》记者表示。

另外,上述负责人指出,一些产品对数百万甚至上千万字的文档支持,通常采用的并不是无损长上下文窗口的方案,而是一种被称为检索增强生成(RAG)的方案,这种方式是从文档中搜索出相关的部分内容,然后将这些内容给到大模型去做推理,模型的真实上下文窗口长度,也就是真正输入给模型去推理的内容,仍然是 3 万字左右(以当前市场上常见的32K上下文窗口模型为例)。“以读书来比喻的话,支持长上下文窗口的模型是真的逐字读了一本书,然后跟你讨论书的内容;RAG方案是读了几个摘抄片段,然后跟你讨论书的内容。讨论的深度和精度自然不可同日而语。”

一石激起千层浪,或许就连月之暗面也没想到,自己的一个动作能引发这么多互联网大佬的竞逐,让AI市场再起涟漪。

月之暗面为200万字无损上下文的能力提供了多个场景,也确实吸引了众多尝鲜的用户:上传一份完整的近百万字中医诊疗手册,让 Kimi 针对用户的问题给出诊疗建议;上传英伟达过去几年的完整财报,让 Kimi分析总结英伟达历史上的重要发展节点;上传几十万字的经典德州扑克长篇教程,让 Kimi 扮演德扑专家提供出牌策略的指导……

由于众多用户涌入,系统流量持续异常增高,3月21日Kimi的App和小程序出现宕机现象,月之暗面对此表示抱歉。

有意思的是,当国内大模型卷向长文本的同时,爱跨界的马斯克还在卷参数。3月18日,马斯克的AI创企xAI正式发布开源大模型Grok-1,其参数量达到3140亿,超过OpenAI GPT-3.5的1750亿,一举成为迄今参数量最大的开源大语言模型。

艾媒咨询CEO兼首席分析师张毅对《华夏时报》记者表示,参数之争到长文本之争的变化,本质上是大模型更加贴近用户的使用和需求场景。“长文本的主要应用领域,目前主要集中在方案、合同、论文、法律文书、科普、小说、文字策划、广告创意等文本处理的场景。”

因此当Kimi突然爆火时,大涨的概念股基本为影视、传媒类的公司。截至3月22日收盘,慈文传媒涨停,华策影视、掌阅科技和中广天择都是三连板。

商业价值待估

除了引燃概念股,Kimi的跨越式升级也在业内引发了对AI应用落地和商业化的期待。

平安证券发布研究报告称,Kimi无损长文本模型的出现,解决了很多大模型在应用中的痛点,打开了大模型的应用空间,AIGC最终的落地,还是要找到合适的场景,Kimi作为千亿大模型,能够支持复杂运算,同时还能接受和处理大文本,解决了很多大模型实际应用中的难题,后续商业化潜力将凸显。

那么,接下来要探讨的问题,就是商业模式。

张毅推断,GPT是用户通过付费方式使用的,但国内的大模型竞争在初期就如此激烈,很有可能会走上过去搜索引擎的路子,免费恐怕是一个主要方向。“所以未来也可能是‘羊毛出在猪身上’成为普遍现象,当然,垂直化应用场景、个性化解决方案,也是大模型文本未来的商业突破之道。”

随着Kimi的爆火,月之暗面自身的商业化诉求正在变得强烈。该公司相关负责人向《华夏时报》记者透露,面对高峰时期 Kimi 会提示需要等待等问题,有用户反映是否可以付费解决,所以今年公司会有初步的方案出来。

商业化诉求背后是文本能力越强成本越高的现实问题。上述负责人表示,当模型支持的上下文窗口长度越长,精度越高(信息越无损),模型推理成本也会呈指数级上升,所以月之暗面会在工程上做一些创新探索,想办法尽快降低成本,让更多有需求的用户体验到超长无损上下文窗口能力。“如果是检索增强生成(RAG)的方案,模型本身的推理成本几乎没有变化,因为实际输入模型的上下文窗口长度没有发生变化。”

对于长文本带来的成本变化和商业化问题,《华夏时报》记者也采访了360方面,截至发稿,对方未给出回复。

但数据上的比拼,以及商业化能力的体现,最终还是要落实到真正的应用、用户体验上。

在张毅看来,从某种意义上讲,如果应用体验做得足够好,大模型长文本的商业化应用场景是存在的。“目前大模型的智能化程度还有待改善,结合具体的应用需求,国内大模型在数据、文字和设计创新上与国外头部大模型相比还有一定的差距,未来长文本的发展格局,或许就是看哪家能在这些方面有更好的表现,是否能够形成更大的竞争力。”

相关内容

热门资讯

无人机清洁外滩玻璃幕墙:科技引... 上海外滩渔人码头,以其独特的地理位置与现代建筑风格闻名遐迩,黄浦江波光粼粼,映衬着周边摩天大楼的玻璃...
餐饮小程序开发 在现代社会,餐饮行业的发展与技术进步密不可分。随着移动互联网的普及,越来越多的餐饮企业开始尝试开发小...
中芯国储储能固态电池研究取得重... 中芯国储研究员-储能行者 近日,中芯国储传来振奋人心的消息,其旗下研究员储能行者在实验室成功取得储能...
杭正电子取得一种车载显示器专利... 金融界2025年7月5日消息,国家知识产权局信息显示,杭州杭正电子科技有限公司取得一项名为“一种车载...
便携式EL检测仪:光伏行业的“... 在光伏产业蓬勃发展的当下,便携式EL检测仪凭借其高效、精准、便携的特性,成为保障光伏组件质量的核心工...
福建省内最大华为门店在厦开业 昨日,华为在福建的最高规格门店——华为智能生活馆(厦门万象城店)正式开业,为我市“首店经济”注入新活...
天津市两部门开展智能养老服务机... 央广网天津7月6日消息(记者褚夫晴)日前,记者从天津市民政局获悉,从今年起到2027年,市民政局将与...
从多模态融合到行业深扎,国内 ... 国内有众多 AI 大模型研发机构,如百度、阿里、字节跳动、科大讯飞等,从这些机构的实践来看,大模型主...
香港特斯拉降价“狙击”内地电动... 特斯拉在中国香港被认为仍拥有一定先发及品牌优势。对于有志于出海的中国内地车企,“借助当地独特的市场环...
鲁建建筑取得新型挡土墙结构专利... 金融界2025年7月7日消息,国家知识产权局信息显示,山东省鲁建建筑工程检测有限公司取得一项名为“一...
星空有约|太阳系迎来第三位“闯... 新华社南京7月7日电(记者王珏玢、朱筱)7月初,一个来自太阳系外的天体在穿过木星轨道时被发现,引起全...
安徽未来产业澎湃崛起 月壤打砖让月球建房成为可能、量子密话密信等“黑科技”走进生活、依托“人造太阳”探索“终极能源”、自研...
中国科技馆“科学方法特训营”暑... 新京报讯(记者张璐)“科学方法特训营”暑期营地系列活动首场——“星际启航”营地探访活动7月5日在中国...
Meta豪掷AI“超级智能”赛... 环球网 7月6日消息,据外媒报道,meta首席执行官马克·扎克伯格近日在人工智能竞赛中火力全开,通过...
杭州ai图像识别技术介绍 一、引言 随着科技的飞速发展,人工智能(AI)已逐渐成为各行业的核心驱动力。其中,AI图像识别技术作...
交通枢纽 “神经网”:无线对讲... 春运高峰单日客流破百万、机场航班起降调度分秒必争…… 现代交通枢纽每日承载着海量人流、物流运转。无线...
雷军顶着35℃高温为首批YU7... 极目新闻记者 王鹏 7月6日,小米YU7正式开启全国交付,覆盖全国58个城市。雷军发文称:“今天(6...
罗马仕停工停产!低价内卷遭反噬... 5月24日,罗马仕还在为618预热,为即将到来的购物节打出“抢半价”的活动,彼时其未曾料到,短短1个...
Deepseek “严重烂尾”... 最近Deepseek的关注度正持续下降!有数据显示,Deepseek的用户活跃度从春节高点的15%一...
矩阵多元取得加热器及半导体设备... 金融界2025年7月5日消息,国家知识产权局信息显示,深圳市矩阵多元科技有限公司取得一项名为“一种加...