▍黄仁勋称还将发布一款专攻AI与数字孪生的新显卡
来源:IC Research
北京时间7月15日,NVIDIA官方账号“NVIDIA Newsroom”正式发布消息:
“NVIDIA将恢复向中国销售H20芯片。美国政府已确认将授予出口许可,预计交付将在不久后开始。”
据央视新闻,美国英伟达公司创始人兼首席执行官黄仁勋今天在接受总台央视记者采访时宣布两个重要进展:
美国已批准H20芯片销往中国 英伟达将推出RTXpro GPU
英伟达创始人兼首席执行官黄仁勋表示:“美国政府已经批准了我们的出口许可,我们可以开始发货了,所以我们将开始向中国市场销售H20。我非常期待能很快发货H20,对此我感到非常高兴,这真是个非常、非常好的消息。
第二个消息是,我们还将发布一款名为RTX Pro的新显卡。这款显卡非常重要,因为它是专为计算机图形、数字孪生和人工智能设计的。”
据悉,美国政府今年4月决定禁止英伟达向中国市场销售其H20芯片。
H20是NVIDIA专为中国市场打造的“受限版AI芯片”,属于H100架构的降配版本,用于规避美国出口管制。尽管其性能不及H100、B100等主力AI GPU,但在中国大模型训练与AI推理市场中,依然具备高算力、低功耗等显著优势。
数据显示,英伟达2024年在中国营收高达171 亿美元,占其全球总营收的13%。中国市场对英伟达的重要性不言而喻,在H20于4月被禁售中国之后,黄仁勋此前已多次公开表示:“限制对华出口将削弱美国企业竞争力,损害国家安全”。
有分析称,从目前来看,B30芯片的参数和性能可以视为H20的进一步“阉割版”。其FP16性能大致在80出头,FP8接近200出头,互连带宽约为1.5–1.6TB。从整体性能看,B30显然并不适合用于训练。虽然H20勉强还能用于训练(比如靠内存解决方案、FP8精度以及传统方法),尚非完全不可行,但B30的训练能力较弱。
在模型推理方面,例如图像、语音等当前主要应用,可能还有部分文本模块推理,B30具备一定确定性,尤其是未来整合多模态处理(图像、语音、视频)等方向上。随着机架式方案逐渐出现,类似互连架构的推理部署方案可以成为一个不错的选项。不过,B30的量产与交付预计要到8月或9月,GB30的情况尚不明确,机架式方案的实际推进时间也未可知,仍存在较多不确定性。目前最合理的方向,仍是推动算力租赁,如果算力租赁全面放开,将是未来公司算力供给架构的重大转变。
因而,对比B30的不确定性,一旦H20确认出口放行,不仅将为Nvidia在华业务打开重要缺口,为英伟达业绩增长带来强劲动能,还可缓解中国AI大模型企业的算力焦虑。
声明:本公众号文章版权归原作者及原出处所有,只提供参考并不构成投资及应用建议。本公众号平台上部分文章为转载,不用于商业目的,如有涉及侵权请及时联系告知我们,我们会尽快处理。本公众号对此声明拥有最终解释权。