技术解析|AMD Instinct MI350的架构演进
创始人
2025-06-15 09:01:25
0

芝能智芯出品

在AI加速芯片市场竞争日益激烈的背景下,AMD正式发布了Instinct MI350系列加速器,包括MI350X和MI355X两款型号,试图在性能、系统扩展性与成本控制方面对标甚至超越NVIDIA最新的Blackwell架构产品。

相较于此前的MI300系列,MI350不仅在架构层面进行了迭代,更明确了其面向AI训练和推理的市场定位。

结合发布会信息,对MI350系列的技术规格、性能表现及其背后的系统设计理念进行分析,探讨AMD在AI算力领域所走出的具有现实意义的路径。

Part 1

从“追赶”到“匹敌”:

MI350系列的演进方向

在Instinct MI300系列成功打入HPC与AI市场后,AMD此次推出的MI350系列显然不再满足于作为“替代者”的角色,而是主动寻求与行业领头羊NVIDIA展开正面竞争。

MI350系列包括风冷版本MI350X与液冷高性能版本MI355X,两者均采用先进的3nm工艺,并配备288GB HBM3E高带宽内存,延续了AMD一贯的高规格堆料思路。

MI355X作为旗舰型号,其功耗达到了1400W,搭配液冷系统,明显面向高密度计算环境。

在实际性能对比中,AMD选择以MI300X为对照基准,展示MI355X在主流大模型 (如DeepSeek R1、Llama 3 70B与Llama 4 Maverick)推理任务中的3倍以上性能提升。这种跨代式跃迁显示出架构层面确有实质优化。

而在与NVIDIA Blackwell平台的对比中,AMD虽尚未完全掌控市场话语权,但凭借相似的计算性能、更大的显存配置与较低的预期成本,在特定客户需求下确实具备一定的竞争力,AMD此次强调的不仅仅是单卡性能,而是整体系统架构的优化与机架规模的部署能力。

MI350系列在规格设计上兼容UBB 8 GPU模块,意味着其可无缝集成至现有的高性能AI计算平台中,包括NVIDIA HGX类系统。这种平台级兼容性,为其打入更多数据中心与云厂商体系铺平了道路,减少部署壁垒。

AMD并未刻意突出峰值性能的“领先性”,而是将关注重点放在综合系统效能、RACK级资源配置与开放标准支持上。

例如,通过超级以太网联盟 (UEC)和UALink等互联协议,支持64至128颗GPU的横向扩展,在单个机架中构建起高达36TB的共享显存资源池。

AMD在此不仅展示的是一颗芯片,更是一个具有延展性的AI基础设施组件。

Part 2

价值导向与技术路线:

AMD对AI时代的再定义

MI350系列的发布不仅仅是一次技术更新,更是AMD面向AI产业趋势调整战略重心的体现。

从架构设计到市场策略,AMD显然正在淡化过去高性能计算为主的产品定位,将更多资源投向AI加速尤其是大模型训练与推理的主战场。

从当前提供的信息来看,MI350系列延续了MI300时代的模块化封装与堆叠设计思路,但在芯粒数量、互联方式、缓存架构以及张量计算能力等方面均有所优化,特别是在FP4与FP6浮点计算性能上的提升,成为AMD本代产品的核心技术亮点。

相比以往聚焦FP16或BF16的主流AI芯片,FP4/FP6的精度粒度更适配推理场景下对功耗与计算资源的综合要求,也标志着AI芯片的发展正朝着更精细的能效平衡方向演进。

MI350系列的定位也更清晰地面向AI训练和推理两个核心场景。

在训练方面,得益于更大的HBM带宽与GPU间互联性能,MI355X在处理超大参数模型时具备天然优势;

而在推理环节,FP4的高密度计算能力可以显著提升每瓦性能,进而降低整体部署成本。

AMD对自身产品角色的重新定义,并不简单是对NVIDIA路线的“复刻”,而是通过精确市场定位与资源匹配,走出了一条更具工程实用性的平衡路径。

AMD在此次发布会中强调“基于价值的销售”模式,即以系统总效能与总成本的均衡来争取客户,而非单纯追求性能参数上的绝对领先。

这种策略背后,是对AI基础设施建设日益复杂化、资源分布多样化趋势的深入理解。

在大型训练与推理集群中,单个GPU的极限性能不再是决定因素,带宽瓶颈、功耗平衡、部署密度以及互联协议的开放性,正成为客户决策中的关键要素。

此外,与NVIDIA更封闭的生态构建策略不同, AMD选择开放标准作为其生态扩展的支点。

通过支持开放式互联标准、构建可替换模块、兼容主流平台等方式,增强产品的可适配性与可持续性,也在一定程度上降低了用户的技术锁定风险。

AMD似乎意识到,在未来AI基础设施构建过程中,市场需要的不仅是“最强”的GPU,更是一个可持续、灵活且经济高效的系统解决方案。

面对NVIDIA的Blackwell系列强势登场,以及其在软件生态 (CUDA、TensorRT)方面的领先地位,AMD依然面临不小挑战。特别是在AI框架优化、模型支持、开发工具链等“软实力”层面,AMD仍需投入大量资源加以追赶。

MI350系列虽然在硬件规格与系统能力上已具备一定对等能力,但要真正形成市场影响力,还需通过持续的生态建设与客户协作不断积累信任与口碑。

小结

AMD Instinct MI350以相对务实的产品策略,结合架构演进、系统扩展能力与成本控制,在高度集中化的AI算力市场中,为客户提供了一个更具灵活性与性价比的选择。

在GPU芯片不断向超高性能演进的同时,AMD通过整合式解决方案去提升实际部署效率与长期运营收益。

相关内容

热门资讯

青年人才“攀峰”行动丨协同创新... 8月22日,苏州市青科协联合民建徐汇区委、上海市青科协组织青年科技人才代表在上海开展“青科行”青年科...
瑞芯微的“下沉市场”:AI的钱... 来源:经济观察报 记者 郑晨烨 一块芯片,能有几次高光时刻? 大概两次。第一次,是装进最新款的手机里...
“小零件”如何创造“大价值”?... 8月23日,晨曦初露,位于扬州西郊仪征市新集镇八桥工业园的扬州宏佳新材料有限公司,智能化车间内已灯火...
威科智数取得托盘搬运机械手专利... 金融界2025年8月23日消息,国家知识产权局信息显示,青岛威科智数科技有限公司取得一项名为“一种托...
2025年从“千人一面”到“一... 今天分享的是:2025年从“千人一面”到“一人千面”:人工智能引领广告行业智能化转型报告 报告共计:...
《苹果云手机云平台:性能好的云... 一、云手机初印象 随着科技的不断发展,云手机逐渐走进大众的视野。云手机,简单来说,就是一种基于云...
境外间谍“黑手”频现!摄像头总... 会自动转向的摄像头 高校遭遇持续网络攻击 …… 境外间谍“黑手”频现 这些背后究竟隐藏着哪些阴谋↓ ...
共筑军民情深 南湾上李朗举办退... 为纪念中国人民抗日战争暨世界反法西斯战争胜利80周年,进一步推动爱国主义教育与军民融合发展,8月22...
苹果云手机云租机iOS系统:究... 作为一名资深游戏玩家,我一直在寻找一款既能满足高性能需求,又价格实惠的云手机。最近,我深入研究了市面...
“攒一台机器人”,谁都能? 来源:市场资讯 (来源:经济观察报) 经济观察报记者 郑晨烨 机器人行业“乱花渐欲迷人眼”。 20...
ios苹果虚拟机手游平台:流畅... 作为一名资深游戏玩家,我一直在寻找能够让我在手机上畅玩大型游戏的解决方案。最近,我发现了云手机这一概...
深港将进行无人机载货跨境试飞,... 无人机载货跨境有望今年在深港突破性地进行试飞!这是记者昨天在罗湖举办的“深港跨境低空经济沙龙”上获悉...
凯瑞博公布“一种织带收卷装置”... 天眼查APP显示,近日,浙江凯瑞博科技股份有限公司申请的“一种织带收卷装置”专利公布。 摘要显示,本...
月球“晚年”为何还有火山喷发?... 作为地球的一颗天然卫星,月球的起源演化备受关注。科学界普遍认为,月球在30亿年前就已“休眠”,其火山...
天津智导科技取得可拓展工作平台... 金融界2025年8月23日消息,国家知识产权局信息显示,天津智导科技有限公司取得一项名为“一种机电工...
原创 大... 在8月15日晚,大疆偷了Insta360的家,推出了旗下首款全景相机——Osmo 360。Osmo ...
OpenAI用GPT-4b攻克... 新智元报道 编辑:定慧 好困 【新智元导读】OpenAI与Retro Biosciences合作,...
原创 8... 从2018年到现在的确诞生了众多屏幕设计,比如水滴屏、刘海屏、双面屏、升降屏、折叠屏、打孔屏、屏下摄...
中国科学家揭秘嫦娥六号样品:月... 中国日报8月23日电(记者 李梦涵)一直以来,科学家普遍认为月球在30亿年前就已"休眠",火山活动基...
MIT团队借助CHIME望远镜... 2025-08-23 11:40:21 作者:狼叫兽 2025年8月23日消息,根据近日发布的一...