英伟达打脸AMD:H100在软件加持下,AI性能比MI300X快47%!
创始人
2024-01-08 20:21:54
0

原标题:英伟达打脸AMD:H100在软件加持下,AI性能比MI300X快47%!

12月14日消息,AMD于本月初推出了其最强的AI芯片Instinct MI300X,其8-GPU服务器的AI性能比英伟达H100 8-GPU高出了60%。对此,英伟达于近日发布了一组最新的H100与MI300X的性能对比数据,展示了H100如何使用正确的软件提供比MI300X更快的AI性能。

根据AMD此前公布的数据显示,MI300X的FP8/FP16性能都达到了英伟达(NVIDIA)H100的1.3倍,运行Llama 2 70B和FlashAttention 2 模型的速度比H100均快了20%。在8v8 服务器中,运行Llama 2 70B模型,MI300X比H100快了40%;运行Bloom 176B模型,MI300X比H100快了60%。

但是,需要指出的是,AMD在将MI300X 与 英伟达H100 进行比较时,AMD使用了最新的 ROCm 6.0 套件中的优化库(可支持最新的计算格式,例如 FP16、Bf16 和 FP8,包括 Sparsity等),才得到了这些数字。相比之下,对于英伟达H100则并未没有使用英伟达的 TensorRT-LLM 等优化软件加持情况下进行测试。

AMD对于英伟达H100测试的隐含声明显示,使用vLLM v.02.2.2推理软件和英伟达DGX H100系统,Llama 2 70B查询的输入序列长度为2048,输出序列长度为128。

而英伟达最新公布的对于DGX H100(带有8个NVIDIA H100 Tensor Core GPU,带有80 GB HBM3)测试,带有公开的NVIDIA TensorRT LLM软件,v0.5.0用于Batch-1,v0.6.1用于延迟阈值测量。工作量详细信息与脚注与AMD之前的测试相同。

结果显示,与 AMD展示的MI300X 8-GPU服务器性能相比,英伟达DGX H100 服务器在使用优化的软件加持后,速度提高了 2 倍多,相比 AMD MI300X 8-GPU 服务器快了47%。

DGX H100 可以在1.7 秒内处理单个推理任务。为了优化响应时间和数据中心吞吐量,云服务为特定服务设置了固定的响应时间。这使他们能够将多个推理请求组合成更大的“Batch”,并增加服务器每秒的总体推理次数。MLPerf 等行业标准基准测试也使用此固定响应时间指标来衡量性能。

响应时间的微小权衡可能会导致服务器可以实时处理的推理请求数量产生不确定因素。使用固定的 2.5 秒响应时间预算,英伟达DGX H100 服务器每秒可以处理超过 5 个 Llama 2 70B 推理,而Batch-1每秒处理不到一个。

显然,英伟达使用这些新的基准测试是相对公平的,毕竟AMD也使用其优化的软件来评估其GPU的性能,所以为什么不在测试英伟达H100时也这样做呢?

要知道英伟达的软件堆栈围绕CUDA生态系统,经过多年的努力和开发,在人工智能市场拥有非常强大的地位,而AMD的ROCm 6.0是新的,尚未在现实场景中进行测试。

根据AMD之前透露的信息显示,其已经与微软、Meta等大公司达成了很大一部分交易,这些公司将其MI300X GPU视为英伟达H100解决方案的替代品。

AMD最新的Instinct MI300X预计将在2024年上半年大量出货,但是,届时英伟达更强的H200 GPU也将出货,2024下半年英伟达还将推出新一代的Blackwell B100。另外,英特尔也将会推出其新一代的AI芯片Gaudi 3。接下来,人工智能领域的竞争似乎会变得更加激烈。

编辑:芯智讯-浪客剑

相关内容

热门资讯

天能集团取得铅酸电池浆液回收设... 金融界2025年5月17日消息,国家知识产权局信息显示,天能集团(濮阳)再生资源有限公司取得一项名为...
新疆夜空不明飞行物是什么?揭秘... 5月16日晚,新疆多地拍摄到一个发光移动的物体,引发关注。 5月18日,航天科普博主及星空摄影师对此...
信息通信领域十大科技进展正式发... 5月17日,在2025世界电信和信息社会日纪念活动上,2024年度信息通信领域十大科技进展正式发布。...
倚光(深圳)科技申请显示模组专... 金融界2025年5月17日消息,国家知识产权局信息显示,倚光(深圳)科技有限公司申请一项名为“显示模...
原创 骁... 在国补优惠的加持下,骁龙8Elite机型跌到了2294元,是目前最值得推荐的性能旗舰,其游戏表现和能...
2人死亡!小米SU7又一事故! 点击上面↑“电动知家”关注,记得”! 电动知家消息,2025年5月17日凌晨,贵阳花果园区域发生了一...
腾讯云加码AI投入和产业布局 ... 深圳商报记者 陈姝 5月16日,腾讯全球数字生态大会广州峰会召开,腾讯云宣布将全方位加码AI投入,以...
中国空间站内发现微生物新物种 本报讯(记者 刘苏雅)中国载人航天工程办公室5月16日发布消息称,近日,科研人员首次公布了在我国空间...
向未来发问,激励更多“从0到1... 解放日报记者 俞陶然 科学家走红毯仪式是每年上海科技节的启动环节,今年的科学红毯秀与往年不同,人形机...
太空中的气象“哨兵”风云三号G... 风云三号G星是我国首颗低倾角轨道降水测量卫星,它在距离地球407公里的轨道上翱翔,这一较低的轨道高度...
济南恒瑞取得地基基础压力检测设... 金融界2025年5月17日消息,国家知识产权局信息显示,济南恒瑞工程检测有限公司取得一项名为“一种地...
民政部康复辅助器具重点实验室“... 深圳商报·读创客户端记者 赵鸿飞 2025年5 月17日,在深圳召开的第十三届国际骨科康复学术会议暨...
华晖五金取得防夹损的机械手夹具... 金融界 2025 年 5 月 17 日消息,国家知识产权局信息显示,东莞市华晖五金制品有限公司取得一...
全国首条全自动辐射板生产线在綦... 保温上料、铝板上料、盘管、检测、涂胶、刻印……5月13日,全国首条全自动辐射板生产线在重庆綦桥科技有...
原创 纪... 2016年,王亚平正处于事业的巅峰期,她的名字在宇航员队伍中熠熠生辉,成为了无数人心中的榜样。这位充...
报告:国家哲学社会科学文献中心... 北京5月17日电 (记者 李京泽)“学术期刊高质量发展研讨会暨国家哲学社会科学文献中心最受欢迎期刊报...
促消费四川解锁新赛道 首个全域... 四川日报全媒体记者 陈碧红 ●从5月16日持续至6月15日,采用全域联动模式,覆盖全省超1.1万家线...
天津康途取得电梯通用内招控制系... 金融界2025年5月17日消息,国家知识产权局信息显示,天津康途科技有限公司取得一项名为“一种电梯通...
深圳市整点科技取得新型鼻毛器专... 金融界2025年5月17日消息,国家知识产权局信息显示,深圳市整点科技有限公司取得一项名为“一种新型...
新质生产力的壮美图景 第19届杭州亚运会组织无人机表演,由1000架无人机组成了一个奔跑的“人”。 湖北武汉一列无人驾驶...