中国式现代化奋进者|商汤生成式AI业务收入达12亿 让大模型跑起来的背后动能竟是它
创始人
2024-04-01 09:47:04
0

原标题:中国式现代化奋进者|商汤生成式AI业务收入达12亿 让大模型跑起来的背后动能竟是它

东方网记者王佳妮4月1日报道:人工智能行业无疑是“新质生产力”的代表之一,生成式AI的支柱价值更是在大模型上得以体现。在炙手可热的“变现王”大模型背后,AI开发平台却显得有些默默无闻。事实上,没有以算力为核心的基础设施作为支撑,大模型根本就跑不起来。

深谙此道的商汤科技早在2018年便开始布局,以每年数十亿的“雄心”投入到SenseCore商汤大装置。2022年,作为SenseCore商汤大装置重要载体的人工智能计算中心(AIDC)正式投入运营,成为亚洲最大人工智能计算中心之一。如今,SenseCore商汤大装置管理的总算力到了何种程度?又如何赋能“日日新”大模型体系?近日,东方网记者走近位于临港的AIDC,聆听商汤这位长期深耕底层技术研发、不断探索和更新商业化路径的“领先选手”的故事。

万卡并联,输出丰厚的“新质生产力”

根据《2023年中国AI开发平台市场报告》显示,商汤在增长指数和创新指数两大评估维度的综合评分中位居国内首位。而商汤亮眼的成绩单还远不止于此。最早于国内业界研发和发布大模型产品、国内首个发布超过千亿参数级大模型和性能超越GPT3.5模型的厂商,成功研发320亿参数量的全球最大的通用视觉模型,并在自动驾驶、工业质检、医疗影像等多个领域得到广泛应用……这些成绩,都让商汤成为业内发展的“领军选手”。

2023年,商汤科技生成式AI业务收入达12亿人民币,这是商汤成立十年以来,以最快速度从无到有、超过10亿收入体量的新业务。“生成式AI业务若要长期发展,离不开算力的持续增长。换而言之,没有以算力为核心的基础设施作为支撑,大模型根本就跑不起来。”商汤科技董秘办董事总经理盛世伟在接受东方网记者采访时介绍,

目前商汤管理的算力已实现全国联网的统一调度,在上海、深圳、广州、福州、济南、重庆等地都拓展了新的计算节点,总运营算力达到12000petaFLOPS,上线GPU数量达到45000张。其中临港AIDC为8100 petaFLOPS,远远超出立项规划的3740 petaFLOPS算力总量。

“根据计划,商汤在2024年将会更大面积地拓展全国的算力节点,输出丰厚的‘新质生产力’。”盛世伟说,同时,出于更全面、长远的考虑,商汤增加了对华为昇腾、寒武纪等主流国产芯片的适配,以全国产的技术栈,支持大模型的训练、微调和推理。

而实现这一点的关键,是商汤参与联合开发的DeepLink开放计算体系。 DeepLink是连接国产硬件和主流深度学习算法框架的桥梁和纽带。DeepLink有300多个标准化算子接口;基本上CUDA能够支持的AI大模型计算需求,DeepLink也完全能够支持,覆盖率在99.5%以上。有了DeepLink,各类国产芯片就可以轻松适配主流的大模型训练框架和算法库,比如PyTorch、DeepSpeed等常见的开源训练框架,还有商汤推出的OpenMMLab、OpenDILab、OpenGVLab等开源算法库,充分发挥国产芯片的性能。

值得一提的是,目前,商汤大装置已最大实现了万卡的超大集群互联,并保持90%的加速效率。在训练稳定性上,实现超30天稳定训练不间断的能力,而出现训练间断时的诊断恢复时长也优化到了半小时。

168天刷新纪录,打造国内AIDC“样板间”

强大的算力让商汤在大模型发展上充满底气,而这基础设施方面的先发优势离不开商汤的前瞻性布局。早在2018年,商汤就已开始每年数十亿投入到SenseCore大装置,并建设了上海临港超算中心。2022年,作为SenseCore商汤大装置重要载体的人工智能计算中心(AIDC)正式投入运营,成为亚洲最大人工智能计算中心之一,堪称国内AIDC建设的“样板间”。

项目占地87亩,整体规划建筑面积13万平方米,这么一栋建筑建成需要多久?从2020年7月7日奠基,到9天后桩基开工,再到12月31日主体结构封顶仪式,整个过程只用了168天,创下新纪录,彰显上海服务、临港速度。

“商汤大装置团队规模约400人,上海这里有100多人,其余有分布在北京和深圳。在没有大装置前,商汤的所有算力或服务器都是分散在上海、北京、深圳等若干个机房内。”商汤科技大装置事业群智算中心总经理林海介绍,临港AIDC投运后,园区内纳管了超4万张卡,并实现万卡并联。

商汤科技大装置事业群智算中心技术总监宋祎寓告诉记者,临港AIDC的整体规模为13万平方米,目前一期已投运了大约7万平方米的规模。“在2022年规划园区时,算力的输出规划值是3740P,如今已超出了两倍以上,达到甚至超过8100P。但我们的发展脚步并不会停止,因为无论是应对自身需求还是外部商业化和合作伙伴的需求,算力仍有些供不应求。”

充满前瞻性的商业目光,让商汤赢得了AI2.0时代发展的先机。就在本月,商汤将公布日日新5.0大模型。展望未来,盛世伟表示,商汤会继续聚焦生成式AI业务,保持业务的持续高速增长和行业领先地位。通过进一步发挥“大装置+大模型”深度协同优势,持续扩充算力规模、提升基础设施和大模型的综合服务能力,为行业伙伴提供优质的算力和模型服务。

相关内容

热门资讯

原创 深... 在众多适合人类探索的星球中,火星之所以脱颖而出,成为移民的首选地,是因为它与地球有着诸多相似之处。 ...
新三级医院信息化建设:智慧医疗... 免责声明 本文引用的参考文献搜集于互联网,非原创,如有侵权请联系小编删除! 请勿将该文章用于任何商业...
业内强势定调反内卷!光伏设备或... 7月,中央财经委员会第六次会议强调:纵深推进全国统一大市场建设,要聚焦重点难点,依法依规治理企业低价...
这个暑假,与科技来一次亲密接触 6月26日,在安徽省科技馆新馆,小朋友们在“新能源赛车场”上比拼。 6月27日,在安徽创新馆,来自...
中国科技馆2025“科学方法特... 人民网北京7月7日电(记者池梦蕊)7月5日,“科学方法特训营”暑期营地系列活动首场——“星际启航”营...
彻底戳穿AI「失忆症」!超越O... 新智元报道 编辑:编辑部 【新智元导读】大语言模型越来越「聪明」,但缺失记忆:记不住、改不了、学得...
飞船飞到 240 亿公里外,发... 嘿,朋友们!今天咱来聊聊宇宙探索里一个让人心里五味杂陈的事儿。你们知道吗,人类发射的旅行者 1 号飞...
原创 开... 在AI人才争夺战中,扎克伯格近期展开的系列操作堪称教科书级案例。 继以148亿美元重金将95后华裔天...
振华永光取得双面散热气密性封装... 金融界2025年7月5日消息,国家知识产权局信息显示,中国振华集团永光电子有限公司(国营第八七三厂)...
颠覆搜索引擎,下一代Agent... 新智元报道 编辑:LRST 【新智元导读】在信息爆炸的时代,传统关键词搜索已难以满足复杂知识需求。...
商博会的“未来装备库” “以前光在网上听说5G低空经济,亲眼看到也太帅了!”展台上巨大的电动垂直起降固定翼无人机缓缓转动,十...
有手机就能做的副业:26个作品... 今天咱们来拆一个非常好玩的博主,利用现代的语言解读每日黄历,这种赛道有点国学但不国学,属于情感共鸣型...
率先以“AI+”赋能零基预算改... □ 杨 松 “创建AI智慧审核平台,率先打造智慧审核新标杆,这必将为徐州市推动零基预算改革2.0升级...
原创 微... 在互联网世界,免费午餐终将成为过去式。中国最大的社交平台微信即将对长期免费的云存储和高级朋友圈功能收...
补短板弱项筑发展根基——加强人... 时隔7年,中央政治局近期再次围绕人工智能进行集体学习。 作为引领新一轮科技革命和产业变革的战略性技术...
无人机清洁外滩玻璃幕墙:科技引... 上海外滩渔人码头,以其独特的地理位置与现代建筑风格闻名遐迩,黄浦江波光粼粼,映衬着周边摩天大楼的玻璃...
餐饮小程序开发 在现代社会,餐饮行业的发展与技术进步密不可分。随着移动互联网的普及,越来越多的餐饮企业开始尝试开发小...
中芯国储储能固态电池研究取得重... 中芯国储研究员-储能行者 近日,中芯国储传来振奋人心的消息,其旗下研究员储能行者在实验室成功取得储能...
杭正电子取得一种车载显示器专利... 金融界2025年7月5日消息,国家知识产权局信息显示,杭州杭正电子科技有限公司取得一项名为“一种车载...
便携式EL检测仪:光伏行业的“... 在光伏产业蓬勃发展的当下,便携式EL检测仪凭借其高效、精准、便携的特性,成为保障光伏组件质量的核心工...