优刻得首个「国产千卡智算集群」落地,支持智源千亿大模型训练
创始人
2024-06-28 11:21:31
0

在人工智能引领的时代浪潮中,算力已成为技术进步与创新的核心驱动力。面对当下AI算力需求的飙升、高端AI芯片供应受限的挑战,加之OpenAI带来的技术封锁,唯有坚定不移的发展自主可控的国产技术方案,持续壮大国产智算集群规模,才能一路突破围追堵截,进一步促进国产大模型产业生态繁荣。

作为中立、安全的云计算服务厂商,优刻得持续发力人工智能智算领域,与国内主流AI芯片厂商深度合作,共同搭建的「国产千卡智算集群」现已上线商用。国内顶尖的AI创新型研发机构北京智源人工智能研究院(下称:智源研究院)成为首批用户,标志着优刻得自主可控的国产GPGPU算力底座有能力支撑大模型研发与验证,双方在国产AI智算领域的合作正式开启。

国产千卡智算集群,支持千亿参数大模型训推

优刻得国产智算集群基于国产通用GPU(GPGPU)所建设,能够快速构建大规模分布式训练环境,可支持超千卡规模、千亿参数级别的大模型训练和推理任务,旨在突破算力瓶颈,加速AI算力的国产化进程。

国产千卡智算集群采用软硬件一体化的架构设计,提供低延迟、高吞吐、高可用的IB组网环境,支持GDR技术,使得集群在算力获取、数据传输和算力调度等方面具有极高的效率。经过精心适配和调优,优刻得国产智算集群现已在上海青浦智算中心全面部署,智源研究院正基于国产算力更高效地完成大模型的训推工作。

●突破算力瓶颈,技术自主可控

基于国内知名AI芯片厂商所自研的高性能GPU IP,优刻得国产智算集群具有强大的多精度混合算力、64G大容量高带宽显存以及先进的多卡互联技术,特别适合千亿参数AI大模型的训练和推理,且增强了技术的自主性。在计算精度、稳定性、易用性和算力利用率等方面,优刻得国产智算集群均表现出优异特性,助力智源研究院在千亿MoE大模型训练方面取得了显著成效。

智源研究院成立于2018年,其推出的「智源悟道大模型」,是中国首个大模型,为中国人工智能技术发展奠定了深远的研究基础。在2024北京智源大会上,智源研究院公布了大模型全家桶。当前,智源研究院正在优刻得国产智算集群上持续进行更为复杂的模型结构设计和参数调整,以不断提升大模型迭代速度和自研水平。

基于全自研的虚拟机技术和显卡高效直通技术,优刻得国产智算集群还实现了多用户机器隔离和快速处理GPU故障等功能,确保GPU算力的高效利用。目前,优刻得国产GPU算力底座不仅提供海量算力支持,有效支撑了智源研究院进行国内领先的大模型研发,也进一步论证了国产芯片在收敛性上对于千亿模型的训练的有效性,性能比肩国际一流的同类GPU产品。

●支持异构混训,模型研发更高效

随着多元异构算力成为新的发展趋势,当前智源团队也正致力于研究在多芯片上实现大模型稳定高效训练与推理的并行框架,助力国产算力规模应用和大模型成果转化。智源联合优刻得、国产芯片厂商,共同探索“混训集群”的构建,并证实了优刻得国产智算集群与英伟达主流计算平台混合组网、异构混训的可行性。

得益于国产AI算力加持,智源研究院基于优刻得国产智算集群完成了多元异构大模型训练平台的搭建,并在实训中实现了长时间的稳定训练不中断。联合测试表明,智源研究院推出的开源大模型并行训练框架FlagScale可以支持国产芯片做为算力支撑:FlagScale支持基于国产算力的8x16B千亿参数MoE语言大模型1024卡40天以上的稳定训练,全面帮助用户实现高效稳定的集群管理、资源优化、大模型研发。

●生态兼容,灵活支撑业务发展

优刻得国产智算集群全面兼容CUDA等主流GPU生态软件栈,这意味着企业能够将CUDA应用零成本迁移到国产智算平台,实现快速适配。集群还提供了完善高效的软件栈工具,集成多种主流的深度学习编程框架,通过测试验证,确保了对行业领先人工智能模型的高效支持,做到开箱即用,用户可快速投入模型的开发和部署,加速了其在人工智能领域的布局和发展。

其中,FlagGemm是智源研究院主导开发的一套高性能大模型算子库,技术路线上是基于OpenAI Triton编译器,具有高性能、覆盖广、轻量级的多个优势。优刻得国产智算集群通过适配和支持FlagGemm算子库,实现了强大的生态兼容性和灵活的业务支撑能力。

随着OpenAI决定终止对中国大陆的AI服务,国内对于建设自主可控智算平台的需求愈发迫切。优刻得致力于构建先进的AGI算力底座,携手合作伙伴共建大型国产智算集群,以高性能算力和全栈智算解决方案服务大模型训练和推理。随着更多用户的入驻和应用深入,优刻得国产千卡智算集群将不断推动我国科技创新与智算产业升级迈向新的高度。

相关内容

热门资讯

小行星带:宇宙中的巨型“碎石堆... 在浩瀚无垠的宇宙中,小行星带以其独特的混乱之美,挑战着我们对天体秩序的传统认知。并非如科幻电影中那般...
安科瑞DJSF1352-RN-... 1.概述 DJSF1352-RN导轨式直流电能表可支持双路直流输入,主要针对电信基站、直流充电桩、...
玩转抖音电商,这一届国产品牌有... 这届创二代,是当代商战文最带感的角色。 他们上午还在电商峰会讲供应链,下午就蹲在印染厂里看样品。明明...
南昌华勤取得自动化测试组件及设... 金融界2025年8月19日消息,国家知识产权局信息显示,南昌华勤电子科技有限公司取得一项名为“一种自...
原创 淀... 咱都知道碘一碰上淀粉,那立马就变成蓝色,这现象可太常见了,好多实验里都能瞧见。就比如说,上学那会做化...
原创 打... 在成都高新区新川创新科技园,百米高的写字楼外,无人机正悬停在玻璃幕墙上高效作业——清洗速度是传统“蜘...
连“徐大姐”都来投具身智能了 来源:投中网 这轮融资潮,到底是怎么热起来的? 来源丨投中网 7月9日上午10点,我换好防尘服,走...
沉浸式光伏车棚虚拟仿真——新能... 在“双碳”战略和新能源产业快速发展的背景下,光伏车棚正逐渐走进校园、园区、社区与交通枢纽。但对于许多...
机器人跳群舞,有啥“基本功” 本报记者  王昊男 8月16日,北京国家速滑馆内,9台披着3D打印铠甲的“光子”机器人整齐列阵。伴着...
2025年GEO优化服务商服务... 随着DeepSeek、豆包等AI搜索平台用户突破10亿量级,GEO(生成式引擎优化)已成为企业流量获...
山西证券刘军:新型工业化深入推... 转自:中国证券报·中证网 中证报中证网讯(王珞)日前,山西证券执委会委员兼研究所所长刘军就金融支持新...
雷军宣布:武汉金山软件园年底员... 在武汉金山软件园的盛大开园典礼上,小米集团创始人兼CEO、金山集团董事长雷军透露了一项重要信息。他表...
亮橘色 iPhone 17 P... 爆料达人 Majin Bu 最近上传了一段 iPhone 17 Pro 的「开箱」视频,展示的是 i...
雷泊盾取得胎温胎压监测预警系统... 金融界2025年8月19日消息,国家知识产权局信息显示,惠州市雷泊盾科技有限公司取得一项名为“一种胎...
网传钉钉CEO凌晨12点查工位... 近日,公众号“风声声”发文称,上周某凌晨,十二点到十二点半之间,钉钉CEO“无招”巡查了一趟钉钉的办...
深企闪耀世界人形机器人运动会 深圳新闻网2025年8月19日讯(深圳特区报记者 许依妍)8月17日,2025世界人形机器人运动会在...
密集发射低轨道卫星,外媒:中国... 据中国航天科技集团透露,北京时间8月17日22时15分,中国在太原卫星发射中心使用长征六号改运载火箭...
品质消费浪潮下,电视行业的破局... 近年来,在政策支持、市场需求和技术革新的多重推动下,我国银发经济蓬勃兴起。据测算,中国银发经济规模到...
一等奖!广州理工学院学子拿下这... 近日,第二十七届中国机器人及人工智能大赛全国总决赛在苏州落幕。作为中国高等教育学会官方认证的全国普通...
上城区发布首批十大AI机会场景 本报杭州8月18日讯 (记者 张梦月 通讯员 褚陈静 李凌婧 王豪文) “您的咖啡到了。”18日下午...