科创年度关键词②:“百模大战”正酣,广东卡位大模型新机遇
创始人
2024-01-19 18:34:09
0

原标题:科创年度关键词②:“百模大战”正酣,广东卡位大模型新机遇

2023年是大模型飞速发展的一年。在这一年,AI大模型的惊艳表现让外界深刻感知奔涌而来的AI技术浪潮。对于或将重塑行业生态的AI大模型,由一众科技巨头打响的“百模大战”鏖战正酣。据不完全统计,截至2023年8月,中国已发布的各类大模型数量已超上百个,模型参数规模大于百亿级别的大模型产品达15个。

与此同时,各大省市也相继布局大模型领域。在这个过程中,算力位居全国前列、业生态完善、应用场景丰富的广东省成为布局大模型队列中的佼佼者,并不断将算力部署、企业研发、人才优势等方面的资源优势,转化成抢滩大模型的竞争优势。

日前,南都·湾财社推出“科创年度关键词”系列策划,旨在通过回顾过去一年全国科创大事,聚焦科创新模式及亮点,进一步展望科技创新发展新趋势。作为策划的第二篇,本篇关注AI大模型。聚焦在“百模大战”中,广东如何通过制度引领、平台优势以及企业创新等举措,提前卡位大模型产业,针对大模型发展所面临的技术门槛、人才紧缺和人工智能治理等问题,交出优秀的答卷。

“百模大战”鏖战正酣,行业生态迎重塑

“我们正处在全新起点,这是一个以大模型为核心的人工智能新时代,大模型改变了人工智能,大模型即将改变世界。”在2023中关村论坛上,百度CEO李彦宏表示,“10年后全世界有50%的工作会是提示词工程。”

2023年,以ChatGPT为代表的AI大模型的惊艳表现,让大模型成功破圈,让行业内外看到了实现通用人工智能的路径。与此同时,围绕AI大模型而展开的“百模大战”也拉开正式拉开序幕。

2023年,以ChatGPT为代表的AI大模型不断涌现。

据不完全统计,截至2023年8月,中国已发布的各类大模型数量已超上百个,截至2023年10月,拥有10亿参数规模以上大模型的厂商及高校院所达到了254家。另据《大语言模型综合能力测评报告2023》,模型参数规模大于百亿级别的大模型产品达15个,包括百度ERNiE 3.0模型、华为盘古模型、阿里遵义模型、腾讯混元模型和网易伏羲模型等。

“以ChatGpt为代表的大模型的出现,让深度学习模型不再是一个算法工具,而是具有知识性,成为关键决策者,乃至于大模型已成为许多公司的标配。”阿里巴巴智能信息事业群、夸克AI视觉技术负责人黄锐华表示,“甚至可以说,过去是人在用大模型,现在是人在训练大模型。”

南都·湾财社采访华为、网易、腾讯等企业发现,这些大模型“领头羊”们已在AI领域深耕多年。相关资料显示,2019年至2020年,华为云盘古大模型就投入AI大模型研发,2021年4月,华为云盘古大模型正式对外发布;网易人工智能自2011年起即专注于计算机视觉、自然语言处理、语音交互、模式识别、深度学习等技术研究领域;腾讯则从2016年开始投入AI基础研究,从2021年开始先后研发了多个千亿和万亿级参数的大模型。

“我们始终认为机会是等不来的,你必须预判潮水的方向,在看到浪来的时候,已经想好要以什么样的姿势冲浪,提前布局、持续投入。”网易集团高级副总裁胡志鹏在接受媒体时表示,网易伏羲人工智能实验室在2018年就着手训练AI大模型,且网易明确AI发展路线为——不追风口,不拼模型大小,脚踏实地把AI的产业应用作为头号任务。

有了优势技术的沉淀,国产大模型百花齐放,其应用场景也逐渐拓展并多元化,特别是在各垂直领域都有落地成果,广泛应用于能源、金融、教育、医疗、交通、政务等领域。从2023年10月开始,国产大模型相继迎来版本升级以及技术创新,文心大模型发布4.0版本,讯飞星火认知大模型V3.0版本发布并声称医疗领域能力超越GPT-4,腾讯混元大模型自研机器学习框架Angel再次升级并宣布千亿级大模型训练可节省50%算力成本。

2023年8月31日,国内11家通过《生成式人工智能服务管理暂行办法》备案的AI大模型产品陆续上线,面向全社会开放。开源证券研报指出,首批大模型产品完成备案,并陆续向用户开放服务,使得大模型能够大量获得真实用户数据反馈,加快大模型迭代速度,进而不断提升用户体验,同时基于大模型的ToB、ToC应用落地进程也有望加快。

行业生态初步显现,“百城竞赛”又起

如今,国内大模型仍处于研发和迭代的早期阶段,虽然在 AI 领域积累已久的互联网巨头具备先发优势,但中小厂商可以利用在垂直品类场景和数据层面积累的优势,走出一条创新之路。

“头部企业研发基座模型,一些中小企业结合自己的需求,对基座模型进行优化,满足垂直行业的应用需求。”中山大学计算机学院副教授张青认为,随着应用范围逐渐扩大,目前AIGC的产业生态也在逐渐形成:以预训练模型为代表的基础层,以垂直化、场景化、个性化模型为代表的中间层和以图像、语音、文字生成等各类AIGC应用为代表的应用层。

“我们需要将通用的算法改造成家具行业的专用算法。比如在家具行业中,户型是非常个性化的场景,存在各种弧形、圆弧乃至于各种异形的户型设计,需要我们投入大量精力,将通用算法进行深度调优,与实地落地场景相匹配。”据广东三维家信息科技有限公司PMO兼解决方案首席专家邹明介绍,公司AI知识图谱构建对算力的需求十分大。这也带来了不少挑战,“在构建好知识图谱之后,我们也想训练自己的大模型,但又发现我们的数据并不通用,需要对市面上的通用大模型进行改造,适配家具行业数据并调整成垂直大模型,其中不仅有技术卡点的挑战,也有技术标准、合作适配、数据量不足等各方面的难题。”

因此,张青认为,发展大模型产业链上下游要做好分工。他表示,如阿里、百度、腾讯、华为等拥有海量数据及计算能力的头部企业可以攻坚基础通用模型,然后通过开源或者定制等方式将大模型能力释放给中下游企业,让中下游产业针对自身业务情况进行调整与适配,进而去服务更垂直的行业场景和用户。

在对AI大模型的追逐战,不仅有企业之间的竞争与合作,也有国内各大城市对抓住大模型发展先机的势在必得。据不完全统计,2023年以来,南京、深圳、无锡、杭州、重庆、成都、武汉、上海等城市相继出台人工智能专项政策。

在2023年5月,中国科学技术信息研究所发布的《中国人工智能大模型地图研究报告》显示,中国10亿参数规模以上的大模型已发布79个,主要集中在北京和广东,其中北京38个大模型,广东20个大模型。

在算力底座基础方面,广东目前拥有鹏城实验室、韶关数据中心集群、横琴先进智能计算平台、广深超算中心等重大算力设施平台。同时,广东目前拥有7家国家新一代人工智能开放创新平台和16家省级新一代人工智能开放创新平台,其中“鹏城云脑II”可提供支撑近千个国产AI模型的训练任务,成为国家最重要的AI大模型训练平台之一。

“天河二号”落户广州。

技术门槛、人才紧缺、人工智能治理挑战仍存

2023年,大模型技术研发、产业生态以及感知度迎来阶段性发展的同时,其技术短板以及发展阻碍也随之显示。

腾讯方面向南都·湾财社记者透露,目前,高质量语料的缺乏正日益成为限制大模型发展的瓶颈。高质量语料的多样性涵盖不同类型的文本,如新闻、小说、诗歌、科技文章等,这有助于大模型学习到更丰富的语言表达。对于高质量语料短缺的问题,业内目前主要采取语料清洗筛选、标注分类、预训练语言模型、建立共享和协作的平台等方式。

同时,华为方面认为,在训练上,面临着万卡/十万卡集群分布式训练及可靠性的挑战;在推理上,需解决面向LLM长文本生成的高效解码的挑战;在高效资源利用方面,面临着AI集群碎片资源利用及全局作业最优调度的难题;在大模型压缩方面,需解决高效量化及无损量化评测标准及技术方案的难题。

此外,AI大模型还需解决行业训练数据安全可控、可用不可得,大模型幻觉缓解甚至消除及可解释性,如何构建具备强大逻辑推理与规划能力的大模型,基于图数据的大模型知识增强技术,通用结构化数据及时序数据特征对齐及预训练等难题。

“当前大模型发展面临高质量数据集缺乏、人才数量不足等困难。”广东省人工智能产业协会常务副会长兼秘书长张崟向南都·湾财社表示,“数据集质量对国内大模型性能有直接的影响。目前我国主流数据集多以英文为主,缺少中文数据集。国内数据集质量仍有待提升,数据集种类和内容缺乏多元化,专用领域数据集基本空白。”

另外,《产业数字人才研究与发展报告(2023)》显示,在数字产业化人才方面,人工智能面临着人才总量与质量的双重欠缺,算法研发与开发人才紧缺度高,前沿理论、关键共性技术等方面的复合型、领军型人才欠缺。

与此同时,大模型对数据、算力能力要求甚高,随之而衍生的问题是人工智能治理问题。对外经济贸易大学法学院副教授张欣接受南都·湾财社采访时表示,目前大模型治理主要面临四个挑战:治理滞后、技术鸿沟、资本逐利导致技术异化、协作机制尚不健全。

“2023年,大模型治理的法治化特征日益凸显,从早期以科技伦理、技术标准、自律承诺等为代表的软法治理,逐步转向更为成熟的‘软法与硬法双轨并行、刚柔并济’的新型治理模式。”张欣介绍道,其中,广东将科技伦理治理结合地方特色和区域特色予以细化,不仅有利于凝聚技术、产业、政策等各界共识,还可以在技术研发早期发挥约束和指引作用,成为地方科技伦理治理的亮点与标杆,为企业研发提供更加明确的预期和积极的制度激励。

“2024年,大模型的能力和应用也将逐渐从文生文,到文生图、文生视频等多模态方向不断扩展,带来更加丰富的落地场景。”腾讯相关负责人表示,关键还是要把底层的算法、算力和数据扎扎实实做好,而且更关键的是场景落地。

策划:王莹

统筹:任先博

采写:南都·湾财社记者 陈培均 彭乐怡 徐劲聪

相关内容

热门资讯

因存在火灾隐患,安克宣布全球召... IT之家曾于6月13日报道,安克在美国地区召回 PowerCore 10000 移动电源(型号 A1...
原创 3... 最近民航局颁布了一项重要通知“自6月28日起禁止旅客携带没有3C标识、3C标识不清晰、被召回型号或批...
纪事书场·抗战烽火|没有枪没有... 敌后神工实可夸,边区来了科学家。 只为能把敌人炸,张珍招兵又买马。 在经典的老电影《地雷战》中,“一...
晶合集成获得发明专利授权:“半... 证券之星消息,根据天眼查APP数据显示晶合集成(688249)新获得一项发明专利授权,专利名为“半导...
原创 中... 近期,中关村科学城企业党委与中国科学院科技创新发展中心党委联合举办了“党建引领 智链未来”中关村科学...
成都芯合成取得监控器终端专利,... 金融界2025年6月28日消息,国家知识产权局信息显示,成都芯合成科技有限公司取得一项名为“一种监控...
国际首次!我国取得重大原始创新... 27日,国际期刊《科学》发表了中国科学家在再生医学领域的一项里程碑式成果。北京生命科学研究所、清华大...
格力电器获得发明专利授权:“滚... 证券之星消息,根据天眼查APP数据显示格力电器(000651)新获得一项发明专利授权,专利名为“滚刷...
全球首个!机器人6S店7月底在... 深圳新闻网2025年6月28日讯(深圳商报首席记者 陈小慧)“从机器人‘出生’到‘老坏’维修,有任何...
上海交通大学医学人工智能研究院... 中新网上海6月28日电 (记者 陈静)当前,人工智能已成为科技革命的核心引擎,正重塑医疗健康领域的发...
从一块琥珀,怎样“看见”一片热... 王 博 你知道鸟类是如何起源的吗? 不久前,中美两国科学家合作发表了一件始祖鸟新标本,揭示了始祖鸟的...
华为申请波束测量方法及装置专利... 金融界2025年6月27日消息,国家知识产权局信息显示,华为技术有限公司申请一项名为“波束测量方法及...
湖北普爱药业有限公司是集医疗器... PA05-10热敷贴温度特性测试仪符合YY0060-2018标准,自动采集、记录、分析热敷贴数据,实...
全国首批数据资产纪念系列数字藏... 6月27日,由津数科技(天津)有限公司打造的系列“数据资产纪念章”数字藏品在津投数藏平台实现全国首发...
小米YU7上市掀订购潮:销售一... 蓝鲸新闻6月28日讯(记者 陆鹏鹏)“门店爆满,客流不断,试驾排到了下周工作日。”小米销售说道。 6...
民建徐州市委会与市科技局开展提... 6月27日上午,民建徐州市委会围绕集体提案《关于夯实我市人工智能产业发展基础的提案》,与提案办理单位...
谷歌放大招,AlphaGeno... 21世纪经济报道记者孔海丽、实习生欧思岐 北京报道 近日,谷歌DeepMind发布革命性AI工具——...
微软自研AI芯片爆雷!团队压力... 一份新报告称,微软自研 AI 芯片爆雷!尽管微软花了数年时间设计自己的 AI 芯片,但其首款内部研发...
小米YU7爆火催生倒卖订单:交... “第一次看到像抢购潮牌一样抢购汽车,简直是车圈的一道奇迹。” 6月26日,留足悬念的小米YU7正式公...
事关微短剧!广电总局网络视听司... 主编温静导读:国家广播电视总局网络视听节目管理司副司长杨铮在致辞中表示:微短剧作为数字时代的新型文艺...