Positron推出专业AI推理芯片,挑战英伟达市场地位
创始人
2025-07-31 08:21:14
0

随着大规模AI部署需求激增,芯片创业公司Positron正将自己定位为市场领导者英伟达的直接挑战者,通过提供专用的节能内存优化推理芯片,旨在缓解行业日益严重的成本、功耗和可用性瓶颈。

Positron联合创始人兼首席技术官Thomas Sohmers在接受VentureBeat视频采访时表示:"我们的关键差异化优势是能够以更高效率运行前沿AI模型——与英伟达相比,每瓦特和每美元可实现2倍到5倍的性能提升。"

Positron首席执行官、前AI云推理提供商Lambda首席运营官Mitesh Agrawal指出:"我们制造的芯片可以部署在数百个现有数据中心,因为它们不需要液体冷却或极端功率密度。"

风险投资家和早期用户似乎对此表示认同。Positron昨日宣布完成超募的5160万美元A轮融资,由Valor Equity Partners、Atreides Management和DFJ Growth领投。

在早期客户群体中,包括知名企业和推理密集型行业的公司。已确认的部署包括主要安全和云内容网络提供商Cloudflare,该公司在其全球分布式、功耗受限的数据中心使用Positron的Atlas硬件。

进入充满挑战的市场

然而,Positron也正进入一个充满挑战的市场。据报道,竞争对手AI推理芯片创业公司Groq已将其2025年收入预测从20亿美元以上下调至5亿美元,凸显了AI硬件领域的波动性。

面对更高效、更小的大语言模型和专用小语言模型的兴起,Positron的领导层选择拥抱这一趋势。Agrawal表示:"一直存在这种双重性——本地设备上的轻量级应用和集中式基础设施中的重量级处理。我们相信两者都会持续增长。"

Atlas:推理优先的AI芯片

虽然英伟达GPU通过加速模型训练帮助催生了深度学习热潮,但Positron认为推理——模型在生产中生成输出的阶段——现在是真正的瓶颈。

Positron的解决方案是Atlas,这是专门为处理大型Transformer模型而构建的第一代推理加速器。与通用GPU不同,Atlas针对现代推理任务的独特内存和吞吐量需求进行了优化。

该公司声称,Atlas的每美元性能比英伟达H100高出3.5倍,功耗降低66%,同时实现93%的内存带宽利用率。

从Atlas到Titan

仅在成立15个月后,Atlas就已开始出货和投产。该系统支持在单个2kW服务器中运行多达5000亿参数的模型。

Positron正准备在2026年推出下一代平台Titan。基于定制设计的"Asimov"硅芯片,Titan将提供每个加速器高达2TB的高速内存,支持多达16万亿参数的模型。

关键是,Titan设计为在传统数据中心环境中使用标准风冷运行,避免了下一代GPU日益需要的高密度液冷配置。

工程效率与兼容性

从一开始,Positron就将其系统设计为即插即用替代方案,允许客户使用现有模型二进制文件而无需重写代码。Sohmers解释说,Positron专注于推理,设计能够直接处理英伟达训练模型的硬件。

内存是关键需求

Sohmers和Agrawal指出AI工作负载的根本转变:从计算密集型卷积神经网络转向内存密集型Transformer架构。虽然英伟达和其他公司继续专注于计算扩展,但Positron押注于内存优先设计。

美国制造的芯片

Positron的生产管道完全在美国本土。公司第一代芯片使用英特尔设施在美国制造,最终服务器组装和集成也在国内完成。对于Asimov芯片,制造将转向台积电,但团队致力于尽可能保持其余生产链在美国。

未来展望

Agrawal强调,基于经济性和性能销售物理基础设施——而不是将其与专有API或商业模式捆绑——是Positron在怀疑论市场中获得信誉的部分原因。他表示:"如果你无法基于硬件的经济性说服客户部署你的硬件,你就不会盈利。"

相关内容

热门资讯

渔船回港、果农抢收、人员转移…... 7月30日4时30分前后,今年第8号台风“竹节草”在浙江省舟山市朱家尖岛沿海登陆,随后在舟山附近“徘...
畅行江苏 平安有我丨记录高速公... 近日,台风 “竹节草”来势汹汹,给百姓出行带来巨大挑战。7月30日,扬子晚报/紫牛新闻记者跟随江苏省...
【村超感恩季】榕江“水电医教”... “我们要在8月15日前,完成32台智能户外开关箱、60余台柱上智能断路器的安装。”7月28日,记者在...
德国加快无人机商业化应用 随着空气中响起的嗡嗡声,携带着血液样本的无人机飞过城市的拥挤车流和居民区,稳稳降落在目的地,20公里...
物理学“完美”大厦被他一夜推翻... 19 世纪末,经典物理学看似坚不可摧,开尔文勋爵甚至断言“物理学已接近完美”,然而,小小的“乌云”中...
安徽濉溪:“智爱妈妈行动”用科... 为深入贯彻落实全民科学素质提升行动,助力女性掌握科学知识、提升生活技能,7月28日至29日,淮北市濉...
国家互联网信息办公室就H20算... 近日,英伟达算力芯片被曝出存在严重安全问题。此前,美议员呼吁要求美出口的先进芯片必须配备“追踪定位”...
可0.1秒避险!“成都造”无人... 来源:锦观新闻 在成都市郫都高新技术产业园(筹)内的道路上,一辆造型新颖的无人车正平稳行驶,遇见行人...
系统化思维重构数智化战略,推动... 从通用AI技术到大模型技术飞速发展,各行各业都在追寻数智化转型,但为什么AI落地后带来的实际体验,远...
知名品牌电动牙刷被曝“自燃” ... 据媒体报道,近日有网友在社交媒体发文表示,自家舒客品牌电动牙刷在洗手间发生“自燃”,并发出巨响,随后...
21书评︱“深度学习之父”辛顿... 刘嘉/文 编者按:“深度学习之父”杰弗里·辛顿近日首次来到中国,出席2025世界人工智能大会,受到社...
4类作物保险适用 农业保险遥感... 人民网北京7月31日电 (记者杜燕飞)为规范遥感技术在农业保险上的应用,中国保险行业协会与中国农业风...
“AI to B”进行时,轻创... 来源:响铃说 7月30日,阿里巴巴集团旗下源头厂货拿货平台1688在杭州举办浙江省“平台+产业”AI...
《苹果云手机群控系统:性能好的... **一、云手机的兴起与优势** 云手机是一种新兴的技术概念,它为用户带来了许多传统手机无法比拟的...
2025华为手机最建议买什么型... 2025-07-31 18:01:00 作者:狼叫兽 最近总被朋友问:“2025年华为手机哪款最值...
华为吴辉:以服务升维破解数智化... 【环球网科技报道 记者 张阳】“华为坚持以客户为中心,提供全周期服务,全场景打造服务体系,全方位深度...
五步策略解决云工作负载“三重毒... 摘要:云计算具备速度、可伸缩性和创新等优点,但对它的日益依赖已改变了威胁格局并产生了大量漏洞。 云...
高通骁龙8系神U预定:一加首发 快科技7月31日消息,博主数码闲聊站爆料,高通今年将推出两款旗舰芯片,一款是SM8850,名为骁龙8...
AI算力集群迈进“万卡”时代 ... [ WAIC上展出的华为昇腾384超节点可通过总线技术实现384个NPU(神经网络处理器)之间的大带...
25新版北师大七年级上册生物学... 今天为大家分享:北师大版·生物学七年级上册(五彩教师)新,内容涵盖 “走进生命世界”“探索生命奥秘”...