大模型竞争升级 算力产业景气上行
创始人
2024-03-27 15:16:46
0

原标题:大模型竞争升级 算力产业景气上行

月之暗面近期宣布,支持200万汉字超长无损上下文的Kimi智能助手正在内测。随后,阿里、360集团、百度等公司紧急“出手”,纷纷入局长文本大模型赛道,推动人工智能领域投资热情进一步升温。

机构人士表示,相比海外大模型,国产模型在中文长文本理解方面具备比较优势,基础模型能力提升有望推动下游应用快速发展。AI模型、语料库、算力租赁及运维等领域将持续受益。

● 本报记者 彭思雨 见习记者 陈子轩

取得技术突破

近期,AI大模型产品Kimi智能助手因能稳定分析处理200万汉字长文“一炮走红”。Kimi智能助手是初创公司月之暗面于2023年10月发布的产品。该公司创立于2023年3月,由清华大学交叉信息学院杨植麟教授领衔。今年3月18日,月之暗面宣布,Kimi智能助手再次取得技术突破,支持200万汉字上下文的Kimi智能助手已经启动“内测”。

随之而来,360集团、阿里、百度等头部厂商纷纷宣布升级AI大模型技术。3月22日,阿里通义千问宣布,向所有人免费开放1000万字的长文档处理功能。3月23日,360智脑宣布正式内测500万字长文本处理功能。该功能即将入驻360AI浏览器。同时,360AI浏览器APP即将上线。另外,百度文心一言4月份将进行版本升级,届时将开放长文本处理能力,文字范围在200万-500万字。

“大模型升级文本长度,是市场需求的直接反映。”人工智能领域天使投资人郭涛向中国证券报记者表示,“长文本处理需求持续增加,如学术论文、法律文件、新闻报道等。而长文本处理能力的提升,能够更好地模拟复杂的人类语言交流,包括理解长篇文献、撰写长篇文章等。”

赛智产业研究院院长赵刚告诉记者,提升长文本处理能力,可以解决当前大语言模型应用中的痛点,使得大模型商业化应用更加成熟,更容易被用户接受。在新的用户需求牵引下,未来长文本处理能力可能成为大模型的标配。率先布局长文本训练和推理的大模型企业,在未来的竞争中将占据有利地位。

拓展应用领域

“从文本处理稳定性方面看,Ki-mi比ChatGPT更胜一筹。使用ChatGPT分析长文本时,很容易遇到报错的情况,而Kimi比较少见。”一位经常使用AI大模型工具处理文本的留学生告诉中国证券报记者。

200万到1000万汉字,国产大模型中文文本处理能力飞速提升。据了解,目前海外主流AI大模型GPT-4 Turbo-128k公布的文本范围约为10万汉字,而Claude 3200k约为16万汉字。

赵刚认为,从实际应用出发,国内大模型厂商闯出一条创新升级的新路线,很大程度上缩小了与海外Open AI等大模型企业的差距。

郭涛表示,长文本处理能力是衡量模型泛化能力的一项重要指标,其能够更好地反映模型在处理未知或复杂数据时的表现,反映出国产大模型企业在自然语言处理(NLP)领域的技术创新能力。

文本长度的突破会带来哪些应用前景?赵刚认为,长文本处理能力主要应用于知识密集的业务场景,比如生产活动中的编制计划、设计方案、广告创意等;管理活动中的文案撰写、合同编制等;文化教育中的论文撰写、小说撰写、剧本编写等应用场景。

文本处理功能扩容带来的应用创新已经崭露头角。近日,华东师范大学王峰教授团队发布国内第一部人机融合式长篇小说《天命使徒》,采用国内大语言模型+提示词工程+人工后期润色,整部小说超过100万字。据介绍,该团队将打造一个可供公众使用的长篇小说创作平台,将好的创意与平台的自动写作服务结合起来,让人人皆可写作长篇小说。团队的下一个目标是将同等体量小说创作由一个半月缩短为两至三周。

值得注意的是,业内人士认为,文本长度只是反映大模型能力的一个侧面,并非评判模型训练能力的唯一标准。郭涛表示,模型的训练能力还包括对不同类型数据的处理能力、模型的稳定性、可扩展性等多个维度。

“在多模态、参数规模、通用性等方面,我们与Open AI等海外企业还有一定距离。”赵刚坦言。

相关产业链受益

长文本处理能力对数据和算力提出了更高要求。郭涛告诉记者,首先,训练能够处理长文本的模型,需要大量的高质量长文本数据。这些数据需要具备多样性和代表性,确保大模型能够学习到广泛的语言模式和知识。其次,长文本处理通常需要更复杂的模型结构,会直接增加模型训练的计算成本。更大的模型意味着更多的参数需要调整,需要更多算力以加速训练过程。

大模型升级对AI算力、数据赛道的催化作用已经体现在二级市场。Wind数据显示,近20日内,AI算力指数上涨11.56%,数据要素概念指数上涨11.94%,IDC(算力租赁)概念指数上涨13.41%。

算力方面,科大讯飞3月23日在投资者互动平台上表示,科大讯飞算力能够满足未来一段时间AI算法模型训练和推理的需求。景嘉微3月22日表示,公司景宏系列高性能智算模块及整机产品可面向AI训练、AI推理和科学计算等应用领域。

数据方面,海天瑞声3月22日在投资者互动平台上表示,公司致力于为AI产业链各类机构提供算法模型开发训练所需的专业数据集。例如,常规的结构化数据分割、信息提取整合、文本摘要等。同时,公司可提供大模型强化学习相关数据处理服务。例如,对prompt的改写、分类以及其回复内容续写改写等。不过,公司过往并未向月之暗面提供过相关训练数据。

华西证券认为,相比海外大模型,国产模型在中文长文本理解方面具备比较优势,能够有效提升使用者工作效率。基础模型能力的提升有望推进下游应用快速发展。AI模型、语料库、算力租赁及运维等板块将继续受益。

民生证券表示,国产大模型再度迎来竞争升级,以Kimi为代表的国内大模型用户数量激增,AI算力需求或是今年最确定的投资主线之一。

相关内容

热门资讯

让千里之外的机器人煎牛排!越疆... 南都讯 隔空千里的机器人也能执行复杂任务?近日,越疆机器人最新发布的一段演示视频显示:在深圳的操控室...
AI浪潮重构PCB产业,CPO... 上海证券近日发布通信行业周报:英伟达最新产品线路图显示,其CPO交换机Quantum3400X800...
日立能源CEO警告:AI将加剧... 财联社7月4日讯(编辑 赵昊)全球最大的变压器制造商日立能源(Hitachi Energy)的CEO...
华为有望Q2重返中国市场第一,... 2025年第二季度,中国智能手机市场在复杂多变的经济环境中呈现温和复苏态势。7月3日,据Counte...
大质量恒星喷射物质揭示黑洞形成... 2025-07-04 12:24:05 作者:狼叫兽 近日,有研究指出,那些质量超过太阳百倍的恒星...
百度AI岗扩招超六成 本报讯(记者 孙奇茹)记者昨日获悉,“百度AIDU计划”招聘岗位近日同比增长超过60%,扩招重点聚焦...
产业科技前沿 | 我国科学家研... 来自上海交通大学、国家纳米科学中心等单位的科研人员,成功研发出一种基于碳纳米管的新型超快电子源,其发...
西丽社区银发学员走进深圳零一学... 深圳商报·读创客户端记者 郑恺 当“数字原住民”的蓬勃朝气与“银发新学员”的岁月智慧相遇,AI技术宛...
广和通获得发明专利授权:“一种... 证券之星消息,根据天眼查APP数据显示广和通(300638)新获得一项发明专利授权,专利名为“一种线...
郑州引入“AI公务员” 政务服... 中新网郑州7月4日电 (阚力王佳宁)一句话通知、一句话选人、一键排位……在河南省郑州市的“数字员工”...
环晟光伏取得电池片包装机专利,... 金融界2025年7月4日消息,国家知识产权局信息显示,环晟光伏(江苏)有限公司取得一项名为“一种电池...
芜湖永臻取得一出四挤压配套出料... 金融界2025年7月4日消息,国家知识产权局信息显示,芜湖永臻精密模具制造有限公司取得一项名为“一出...
折叠屏手机站上舞台“C位” 本报记者 陈雪柠 将手机竖向“折叠”,仅掌心大小,可轻松放入口袋;将手机横向“延展”,展开如平板,办...
楚天科技获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示楚天科技(300358)新获得一项实用新型专利授权,专利名为“...
农创客奏响“浙”里“新农曲” 潮新闻客户端 通讯员 杨怡 “这几天的培训太实用了,AI在农业场景的应用让我大开眼界,回去后我要好好...
文辛春科技取得能增强信号强度的... 金融界2025年7月4日消息,国家知识产权局信息显示,文辛春科技(苏州)有限公司取得一项名为“一种振...
微信最近的更新,怎么狂放大招啊... 掐指一算,很久没写微信更新了。 倒不是它没更新,主要是之前那些小打小闹,什么 UI 小改动,单独写出...
为产业升级储备人才!云南高科技... 7月4日,2025年云南省工业机器人系统操作员、无人机驾驶员竞赛决赛在昆明举行。 在启动仪式结束后,...
每年50万吨退役风机叶片去哪?... 随着全球风电装机规模持续扩大,退役风机叶片处理问题日益凸显。欧洲风能协会(WindEurope)首席...
1X机器人工业版筑基,家庭版持... 上海证券近日发布人形机器人行业观点报告:1X在过去的十年中致力于制造高扭矩、低转速电机,最大限度地提...