技术解析|AMD Instinct MI350的架构演进
创始人
2025-06-15 09:01:25
0

芝能智芯出品

在AI加速芯片市场竞争日益激烈的背景下,AMD正式发布了Instinct MI350系列加速器,包括MI350X和MI355X两款型号,试图在性能、系统扩展性与成本控制方面对标甚至超越NVIDIA最新的Blackwell架构产品。

相较于此前的MI300系列,MI350不仅在架构层面进行了迭代,更明确了其面向AI训练和推理的市场定位。

结合发布会信息,对MI350系列的技术规格、性能表现及其背后的系统设计理念进行分析,探讨AMD在AI算力领域所走出的具有现实意义的路径。

Part 1

从“追赶”到“匹敌”:

MI350系列的演进方向

在Instinct MI300系列成功打入HPC与AI市场后,AMD此次推出的MI350系列显然不再满足于作为“替代者”的角色,而是主动寻求与行业领头羊NVIDIA展开正面竞争。

MI350系列包括风冷版本MI350X与液冷高性能版本MI355X,两者均采用先进的3nm工艺,并配备288GB HBM3E高带宽内存,延续了AMD一贯的高规格堆料思路。

MI355X作为旗舰型号,其功耗达到了1400W,搭配液冷系统,明显面向高密度计算环境。

在实际性能对比中,AMD选择以MI300X为对照基准,展示MI355X在主流大模型 (如DeepSeek R1、Llama 3 70B与Llama 4 Maverick)推理任务中的3倍以上性能提升。这种跨代式跃迁显示出架构层面确有实质优化。

而在与NVIDIA Blackwell平台的对比中,AMD虽尚未完全掌控市场话语权,但凭借相似的计算性能、更大的显存配置与较低的预期成本,在特定客户需求下确实具备一定的竞争力,AMD此次强调的不仅仅是单卡性能,而是整体系统架构的优化与机架规模的部署能力。

MI350系列在规格设计上兼容UBB 8 GPU模块,意味着其可无缝集成至现有的高性能AI计算平台中,包括NVIDIA HGX类系统。这种平台级兼容性,为其打入更多数据中心与云厂商体系铺平了道路,减少部署壁垒。

AMD并未刻意突出峰值性能的“领先性”,而是将关注重点放在综合系统效能、RACK级资源配置与开放标准支持上。

例如,通过超级以太网联盟 (UEC)和UALink等互联协议,支持64至128颗GPU的横向扩展,在单个机架中构建起高达36TB的共享显存资源池。

AMD在此不仅展示的是一颗芯片,更是一个具有延展性的AI基础设施组件。

Part 2

价值导向与技术路线:

AMD对AI时代的再定义

MI350系列的发布不仅仅是一次技术更新,更是AMD面向AI产业趋势调整战略重心的体现。

从架构设计到市场策略,AMD显然正在淡化过去高性能计算为主的产品定位,将更多资源投向AI加速尤其是大模型训练与推理的主战场。

从当前提供的信息来看,MI350系列延续了MI300时代的模块化封装与堆叠设计思路,但在芯粒数量、互联方式、缓存架构以及张量计算能力等方面均有所优化,特别是在FP4与FP6浮点计算性能上的提升,成为AMD本代产品的核心技术亮点。

相比以往聚焦FP16或BF16的主流AI芯片,FP4/FP6的精度粒度更适配推理场景下对功耗与计算资源的综合要求,也标志着AI芯片的发展正朝着更精细的能效平衡方向演进。

MI350系列的定位也更清晰地面向AI训练和推理两个核心场景。

在训练方面,得益于更大的HBM带宽与GPU间互联性能,MI355X在处理超大参数模型时具备天然优势;

而在推理环节,FP4的高密度计算能力可以显著提升每瓦性能,进而降低整体部署成本。

AMD对自身产品角色的重新定义,并不简单是对NVIDIA路线的“复刻”,而是通过精确市场定位与资源匹配,走出了一条更具工程实用性的平衡路径。

AMD在此次发布会中强调“基于价值的销售”模式,即以系统总效能与总成本的均衡来争取客户,而非单纯追求性能参数上的绝对领先。

这种策略背后,是对AI基础设施建设日益复杂化、资源分布多样化趋势的深入理解。

在大型训练与推理集群中,单个GPU的极限性能不再是决定因素,带宽瓶颈、功耗平衡、部署密度以及互联协议的开放性,正成为客户决策中的关键要素。

此外,与NVIDIA更封闭的生态构建策略不同, AMD选择开放标准作为其生态扩展的支点。

通过支持开放式互联标准、构建可替换模块、兼容主流平台等方式,增强产品的可适配性与可持续性,也在一定程度上降低了用户的技术锁定风险。

AMD似乎意识到,在未来AI基础设施构建过程中,市场需要的不仅是“最强”的GPU,更是一个可持续、灵活且经济高效的系统解决方案。

面对NVIDIA的Blackwell系列强势登场,以及其在软件生态 (CUDA、TensorRT)方面的领先地位,AMD依然面临不小挑战。特别是在AI框架优化、模型支持、开发工具链等“软实力”层面,AMD仍需投入大量资源加以追赶。

MI350系列虽然在硬件规格与系统能力上已具备一定对等能力,但要真正形成市场影响力,还需通过持续的生态建设与客户协作不断积累信任与口碑。

小结

AMD Instinct MI350以相对务实的产品策略,结合架构演进、系统扩展能力与成本控制,在高度集中化的AI算力市场中,为客户提供了一个更具灵活性与性价比的选择。

在GPU芯片不断向超高性能演进的同时,AMD通过整合式解决方案去提升实际部署效率与长期运营收益。

相关内容

热门资讯

绿米联创取得驱动组件及电动卷帘... 金融界2025年6月14日消息,国家知识产权局信息显示,深圳绿米联创科技有限公司取得一项名为“驱动组...
《开播吧!国潮》守住文化,玩出... 来源:央视网 中央广播电视总台携手抖音平台,开创一档集文艺创作、才艺展示、文化传承于一体的新型台...
天文学家发现 10 万亿倍太阳... 6 月 15 日消息,哈佛-史密森尼天体物理中心研究团队本周在阿拉斯加举行的第 246 届美国天文学...
北京橡胶院申请自密封轮胎涂胶设... 金融界2025年6月14日消息,国家知识产权局信息显示,北京橡胶工业研究设计院有限公司申请一项名为“...
15岁中国少女解决世界难题,一... 2020年10月,第二届世界顶尖科学家大会在上海举行,汇聚了众多世界级的科学家,其中不乏诺贝尔奖获得...
原创 1... 2020年10月,第二届世界顶尖科学家大会在上海举行,汇聚了众多世界级的科学家,其中不乏诺贝尔奖获得...
超声检查、微生物研究……“太空... 超声检查、微生物研究……“太空出差”乘组各项工作进展顺利 “太空出差”50余天,神舟二十号航天员陈...
“华强北”围攻AI耳机,未来智... 文/曹双涛 编辑/杨博丞 跨境游热度不减、出海成为当前中企的“必答题”、AI大模型技术持续升级等多重...
无人机运动相机VR头显:新兴数... 随着科技的飞速发展,无人机、运动相机和VR头显这些新兴数码产品逐渐走进了我们的生活。作为一名数码爱好...
显卡“三风扇”和“双风扇”区别... 当显卡风扇的轰鸣声化作数据洪流中的战鼓,三风扇与双风扇的较量早已超越简单的数量之争,而是演变为一场关...
突如其来的怀旧!Win11开机... 快科技6月15日消息,Windows 11近日的Dev和Beta版本的更新带来了一些改进,但这些预览...
原创 又... 作为定位年轻人群的科技潮牌,realme真我从一开始就不是循规蹈矩的角色,而是真正打破规则、敢于“越...
2025FIFA世俱杯开幕,海... 6月15日,当“海信100吋,世界第一”的标语出现在2025FIFA世俱杯赛场时,海信再一次成为了赛...
aPS3e成首款登陆谷歌Pla... IT之家 6 月 15 日消息,游戏模拟器领域又迎来了一个重要进展,一款名为 aPS3e 的 Pla...
中巴合作的大型单口径射电望远镜... 中国日报6月13日电(记者 赵磊)记者从中国电子科技集团有限公司获悉,近日,由中国电科网络通信研究院...
全球程序员炸锅!老黄伦敦放豪言... 新智元报道 编辑:定慧 【新智元导读】「编程的未来是Human语言」,AI掀起编程70年来最大变革...
华集智控取得嵌入式网络交换机专... 金融界2025年6月14日消息,国家知识产权局信息显示,华集智控(天津)电子科技有限公司取得一项名为...
百度大规模招募顶尖AI人才,岗... 百度近日宣布,其AIDU计划将像培育飞行员那样,精心雕琢未来的AI领航者。这一消息是在6月14日的A...
上海市档案馆举办开放日:近50... 东方网记者熊芳雨6月13日报道:海鸥牌照相机、永久牌自行车、上海牌手表、英雄牌钢笔、蝴蝶牌缝纫机等“...
高颜值大流量手机比拼,哪款才是... 在当下这个数字化的高速时代,消费者选购手机时,往往倾向于那些不仅外观出众,而且网络性能卓越的产品。一...