火爆全网!AI新星Groq横空出世,真的能碾压英伟达GPU?
创始人
2024-02-21 12:12:05
0

原标题:火爆全网!AI新星Groq横空出世,真的能碾压英伟达GPU?

火爆AI圈,刷屏互联网!

近期,Groq引发广泛讨论,其大模型每秒能输出750个tokens,比GPT-3.5快18倍,自研LPU推理速度是英伟达GPU的10倍

速度快得出奇

Groq名字与马斯克的大模型Grok读音类似,成立于2016年,定位为一家人工智能解决方案公司。

Groq爆火主要是因为其处理速度非常快。据媒体报道,该公司的芯片推理速度较英伟达GPU提高10倍,成本只有其1/10。

运行的大模型生成速度接近每秒500 tokens,碾压ChatGPT-3.5大约40 tokens/秒的速度。

极限情况下,Groq的Llama2 7B甚至能实现每秒750 tokens,为GPT-3.5的18倍。

在Groq的创始团队中,有8人来自谷歌早期TPU核心设计团队,但Groq并未选择TPU、GPU、CPU等路线,而是自研了语言处理单元(LPU)。

Groq官网显示,在 Groq LPU™推理引擎上运行的Meta AI的Llama 2 70B的性能优于所有其他基于云的推理提供商,吞吐量提高了18倍。

能否取代英伟达?

不过,速度并不是AI发展的唯一决定性因素。在Groq爆火的同时,也有一些质疑声音。

首先,Groq似乎只是看起来了便宜。Groq的一张LPU卡仅有230MB的内存,售价为2万多美元。

有网友分析,英伟达H100的成本效益应为Groq的11倍。

更为关键的是,Groq LPU完全不配备高带宽存储器(HBM),而是仅配备了一小块的超高速静态随机存取存储器(SRAM),这种SRAM的速度比HBM3快20倍。

这也意味着,与英伟达的H200相比,在运行单个AI模型时需要配置更多的Groq LPU。

另据Groq员工透露,Groq的LLM在数百个芯片上运行。

对此,腾讯科技的芯片专家姚金鑫认为,Groq的芯片目前并不能取代英伟达。

他认为,速度是Groq的双刃剑。Groq的架构建立在小内存、大算力上,因此有限的被处理的内容对应着极高的算力,导致其速度非常快。

另一方面,Groq极高的速度是建立在很有限的单卡吞吐能力上的,要保证和H100同样吞吐量,就需要更多的卡。

他分析,对于Groq这种架构来讲,也有其尽显长处的应用场景,对许多需要频繁数据搬运的场景来说再好不过。

相关内容

热门资讯

朱雀三号火箭完成九机并联热试车 2025-06-20 13:41:15 作者:狼叫兽 6月20日,朱雀三号可重复使用运载火箭一级动...
2025政务大模型典型案例发布 北京6月20日电(记者 刘育英)由中国通信标准化协会主办、中国信息通信研究院(以下简称“中国信通院”...
数字赋能!拜泉县实现残疾人证全... 近日,拜泉县残联在服务残疾人领域实现重要突破——残疾人证办理正式迈入全流程信息化时代。这项举措通过数...
外泌体的研究热点与未来趋势:D... 引言(来源于DeepSeek) 外泌体研究是当前生命科学和医学领域最活跃的方向之一,其重要性源于外...
均富机电取得一种显示器增高架专... 金融界2025年6月20日消息,国家知识产权局信息显示,宁波均富机电有限公司取得一项名为“一种显示器...
小米申请耳机盒、智能指环及耳机... 金融界2025年6月20日消息,国家知识产权局信息显示,北京小米移动软件有限公司申请一项名为“耳机盒...
刚刚,华为重磅发布多个大模型! “一年以来,盘古大模型深入行业解难题,在30多个行业、500多个场景中落地。”6月20日下午,在华为...
国内第一艘绿色低碳智能甲醇双燃... 【国内第一艘绿色低碳智能甲醇双燃料集装箱船今日交付】财联社6月20日电,国内首制16000TEU甲醇...
《知识就是力量》编委会副主任许... 中国科学家第四次摘得国际最高气象荣誉!中国工程院院士许健民以“风云之眼”守护地球家园。 瑞士日內瓦时...
相约上合 绽放津彩:中俄共建鲁... 天津北方网讯:相约上合,绽放津彩。俄罗斯当地时间6月19日下午,由天津电子信息职业技术学院与俄罗斯莫...
活力中国调研行丨向“智”!中国...   一场比工业革命更为深刻的人工智能革命近在眼前。中国机器人正加速“跑”起来!   带球对抗、过人、...
内蒙古博物院(新馆)开馆试运行 当日,位于呼和浩特市的内蒙古博物院(新馆)开馆试运行。新馆建筑面积14.7万平方米,展陈面积3.9万...
呼和浩特:着力打造“兽用疫苗研... 日前,位于内蒙古自治区呼和浩特市的金宇保灵生物药品有限公司(以下简称“金宇保灵”)正式面向全球首发“...
鸿蒙6来了!一文看懂有哪些新升... 在今天下午的华为开发者大会HDC 2025主题演讲中,华为常务董事、终端BG董事长余承东正式官宣鸿蒙...
浙江省邮电工程建设取得雨水回收... 金融界2025年6月20日消息,国家知识产权局信息显示,浙江省邮电工程建设有限公司取得一项名为“一种...
原创 红... 6月份首批新机已发布,而且机型丰富,倾向于游戏性能和影像方面,配置可达高端/旗舰级别。接下来还有一批...
智元CMO邱恒谈机器人行业:市... 在2025年的盛夏时节,全球移动通信领域的焦点汇聚于上海,世界移动通信大会(MWC上海)如期拉开帷幕...
5G-A与AI深度融合 描绘通... 当人形机器人灵活完成物品搬运、四足机器人平稳走下台阶,当华为和荣耀与运营商合作的AI图谱逐步展开,近...
安徽建仓科技取得塑料桶生产用原... 金融界2025年6月20日消息,国家知识产权局信息显示,安徽建仓科技有限公司取得一项名为“一种塑料桶...
“人间清醒”马斯克:和AI海啸... 近日,美国创业加速器Y Combinator(YC)在旧金山举办首届AI新创学校(AI Startu...