技术解析｜AMD Instinct MI350的架构演进_资讯

创始人

2025-06-15 09:01:25

0次

芝能智芯出品

在AI加速芯片市场竞争日益激烈的背景下，AMD正式发布了Instinct MI350系列加速器，包括MI350X和MI355X两款型号，试图在性能、系统扩展性与成本控制方面对标甚至超越NVIDIA最新的Blackwell架构产品。

相较于此前的MI300系列，MI350不仅在架构层面进行了迭代，更明确了其面向AI训练和推理的市场定位。

结合发布会信息，对MI350系列的技术规格、性能表现及其背后的系统设计理念进行分析，探讨AMD在AI算力领域所走出的具有现实意义的路径。

Part 1

从“追赶”到“匹敌”：

MI350系列的演进方向

在Instinct MI300系列成功打入HPC与AI市场后，AMD此次推出的MI350系列显然不再满足于作为“替代者”的角色，而是主动寻求与行业领头羊NVIDIA展开正面竞争。

MI350系列包括风冷版本MI350X与液冷高性能版本MI355X，两者均采用先进的3nm工艺，并配备288GB HBM3E高带宽内存，延续了AMD一贯的高规格堆料思路。

MI355X作为旗舰型号，其功耗达到了1400W，搭配液冷系统，明显面向高密度计算环境。

在实际性能对比中，AMD选择以MI300X为对照基准，展示MI355X在主流大模型（如DeepSeek R1、Llama 3 70B与Llama 4 Maverick）推理任务中的3倍以上性能提升。这种跨代式跃迁显示出架构层面确有实质优化。

而在与NVIDIA Blackwell平台的对比中，AMD虽尚未完全掌控市场话语权，但凭借相似的计算性能、更大的显存配置与较低的预期成本，在特定客户需求下确实具备一定的竞争力，AMD此次强调的不仅仅是单卡性能，而是整体系统架构的优化与机架规模的部署能力。

MI350系列在规格设计上兼容UBB 8 GPU模块，意味着其可无缝集成至现有的高性能AI计算平台中，包括NVIDIA HGX类系统。这种平台级兼容性，为其打入更多数据中心与云厂商体系铺平了道路，减少部署壁垒。

AMD并未刻意突出峰值性能的“领先性”，而是将关注重点放在综合系统效能、RACK级资源配置与开放标准支持上。

例如，通过超级以太网联盟（UEC）和UALink等互联协议，支持64至128颗GPU的横向扩展，在单个机架中构建起高达36TB的共享显存资源池。

AMD在此不仅展示的是一颗芯片，更是一个具有延展性的AI基础设施组件。

Part 2

价值导向与技术路线：

AMD对AI时代的再定义

MI350系列的发布不仅仅是一次技术更新，更是AMD面向AI产业趋势调整战略重心的体现。

从架构设计到市场策略，AMD显然正在淡化过去高性能计算为主的产品定位，将更多资源投向AI加速尤其是大模型训练与推理的主战场。

从当前提供的信息来看，MI350系列延续了MI300时代的模块化封装与堆叠设计思路，但在芯粒数量、互联方式、缓存架构以及张量计算能力等方面均有所优化，特别是在FP4与FP6浮点计算性能上的提升，成为AMD本代产品的核心技术亮点。

相比以往聚焦FP16或BF16的主流AI芯片，FP4/FP6的精度粒度更适配推理场景下对功耗与计算资源的综合要求，也标志着AI芯片的发展正朝着更精细的能效平衡方向演进。

MI350系列的定位也更清晰地面向AI训练和推理两个核心场景。

◎ 在训练方面，得益于更大的HBM带宽与GPU间互联性能，MI355X在处理超大参数模型时具备天然优势；

◎ 而在推理环节，FP4的高密度计算能力可以显著提升每瓦性能，进而降低整体部署成本。

AMD对自身产品角色的重新定义，并不简单是对NVIDIA路线的“复刻”，而是通过精确市场定位与资源匹配，走出了一条更具工程实用性的平衡路径。

AMD在此次发布会中强调“基于价值的销售”模式，即以系统总效能与总成本的均衡来争取客户，而非单纯追求性能参数上的绝对领先。

这种策略背后，是对AI基础设施建设日益复杂化、资源分布多样化趋势的深入理解。

在大型训练与推理集群中，单个GPU的极限性能不再是决定因素，带宽瓶颈、功耗平衡、部署密度以及互联协议的开放性，正成为客户决策中的关键要素。

此外，与NVIDIA更封闭的生态构建策略不同， AMD选择开放标准作为其生态扩展的支点。

通过支持开放式互联标准、构建可替换模块、兼容主流平台等方式，增强产品的可适配性与可持续性，也在一定程度上降低了用户的技术锁定风险。

AMD似乎意识到，在未来AI基础设施构建过程中，市场需要的不仅是“最强”的GPU，更是一个可持续、灵活且经济高效的系统解决方案。

面对NVIDIA的Blackwell系列强势登场，以及其在软件生态（CUDA、TensorRT）方面的领先地位，AMD依然面临不小挑战。特别是在AI框架优化、模型支持、开发工具链等“软实力”层面，AMD仍需投入大量资源加以追赶。

MI350系列虽然在硬件规格与系统能力上已具备一定对等能力，但要真正形成市场影响力，还需通过持续的生态建设与客户协作不断积累信任与口碑。

小结

AMD Instinct MI350以相对务实的产品策略，结合架构演进、系统扩展能力与成本控制，在高度集中化的AI算力市场中，为客户提供了一个更具灵活性与性价比的选择。

在GPU芯片不断向超高性能演进的同时，AMD通过整合式解决方案去提升实际部署效率与长期运营收益。