芝能智芯出品
在AI加速芯片市场竞争日益激烈的背景下,AMD正式发布了Instinct MI350系列加速器,包括MI350X和MI355X两款型号,试图在性能、系统扩展性与成本控制方面对标甚至超越NVIDIA最新的Blackwell架构产品。
相较于此前的MI300系列,MI350不仅在架构层面进行了迭代,更明确了其面向AI训练和推理的市场定位。
结合发布会信息,对MI350系列的技术规格、性能表现及其背后的系统设计理念进行分析,探讨AMD在AI算力领域所走出的具有现实意义的路径。
Part 1
从“追赶”到“匹敌”:
MI350系列的演进方向
在Instinct MI300系列成功打入HPC与AI市场后,AMD此次推出的MI350系列显然不再满足于作为“替代者”的角色,而是主动寻求与行业领头羊NVIDIA展开正面竞争。
MI350系列包括风冷版本MI350X与液冷高性能版本MI355X,两者均采用先进的3nm工艺,并配备288GB HBM3E高带宽内存,延续了AMD一贯的高规格堆料思路。
MI355X作为旗舰型号,其功耗达到了1400W,搭配液冷系统,明显面向高密度计算环境。
在实际性能对比中,AMD选择以MI300X为对照基准,展示MI355X在主流大模型 (如DeepSeek R1、Llama 3 70B与Llama 4 Maverick)推理任务中的3倍以上性能提升。这种跨代式跃迁显示出架构层面确有实质优化。
而在与NVIDIA Blackwell平台的对比中,AMD虽尚未完全掌控市场话语权,但凭借相似的计算性能、更大的显存配置与较低的预期成本,在特定客户需求下确实具备一定的竞争力,AMD此次强调的不仅仅是单卡性能,而是整体系统架构的优化与机架规模的部署能力。
MI350系列在规格设计上兼容UBB 8 GPU模块,意味着其可无缝集成至现有的高性能AI计算平台中,包括NVIDIA HGX类系统。这种平台级兼容性,为其打入更多数据中心与云厂商体系铺平了道路,减少部署壁垒。
AMD并未刻意突出峰值性能的“领先性”,而是将关注重点放在综合系统效能、RACK级资源配置与开放标准支持上。
例如,通过超级以太网联盟 (UEC)和UALink等互联协议,支持64至128颗GPU的横向扩展,在单个机架中构建起高达36TB的共享显存资源池。
AMD在此不仅展示的是一颗芯片,更是一个具有延展性的AI基础设施组件。
Part 2
价值导向与技术路线:
AMD对AI时代的再定义
MI350系列的发布不仅仅是一次技术更新,更是AMD面向AI产业趋势调整战略重心的体现。
从架构设计到市场策略,AMD显然正在淡化过去高性能计算为主的产品定位,将更多资源投向AI加速尤其是大模型训练与推理的主战场。
从当前提供的信息来看,MI350系列延续了MI300时代的模块化封装与堆叠设计思路,但在芯粒数量、互联方式、缓存架构以及张量计算能力等方面均有所优化,特别是在FP4与FP6浮点计算性能上的提升,成为AMD本代产品的核心技术亮点。
相比以往聚焦FP16或BF16的主流AI芯片,FP4/FP6的精度粒度更适配推理场景下对功耗与计算资源的综合要求,也标志着AI芯片的发展正朝着更精细的能效平衡方向演进。
MI350系列的定位也更清晰地面向AI训练和推理两个核心场景。
◎ 在训练方面,得益于更大的HBM带宽与GPU间互联性能,MI355X在处理超大参数模型时具备天然优势;
◎ 而在推理环节,FP4的高密度计算能力可以显著提升每瓦性能,进而降低整体部署成本。
AMD对自身产品角色的重新定义,并不简单是对NVIDIA路线的“复刻”,而是通过精确市场定位与资源匹配,走出了一条更具工程实用性的平衡路径。
AMD在此次发布会中强调“基于价值的销售”模式,即以系统总效能与总成本的均衡来争取客户,而非单纯追求性能参数上的绝对领先。
这种策略背后,是对AI基础设施建设日益复杂化、资源分布多样化趋势的深入理解。
在大型训练与推理集群中,单个GPU的极限性能不再是决定因素,带宽瓶颈、功耗平衡、部署密度以及互联协议的开放性,正成为客户决策中的关键要素。
此外,与NVIDIA更封闭的生态构建策略不同, AMD选择开放标准作为其生态扩展的支点。
通过支持开放式互联标准、构建可替换模块、兼容主流平台等方式,增强产品的可适配性与可持续性,也在一定程度上降低了用户的技术锁定风险。
AMD似乎意识到,在未来AI基础设施构建过程中,市场需要的不仅是“最强”的GPU,更是一个可持续、灵活且经济高效的系统解决方案。
面对NVIDIA的Blackwell系列强势登场,以及其在软件生态 (CUDA、TensorRT)方面的领先地位,AMD依然面临不小挑战。特别是在AI框架优化、模型支持、开发工具链等“软实力”层面,AMD仍需投入大量资源加以追赶。
MI350系列虽然在硬件规格与系统能力上已具备一定对等能力,但要真正形成市场影响力,还需通过持续的生态建设与客户协作不断积累信任与口碑。
小结
AMD Instinct MI350以相对务实的产品策略,结合架构演进、系统扩展能力与成本控制,在高度集中化的AI算力市场中,为客户提供了一个更具灵活性与性价比的选择。
在GPU芯片不断向超高性能演进的同时,AMD通过整合式解决方案去提升实际部署效率与长期运营收益。