DeepSeek开源新模型!英伟达跌近4%,市值蒸发超7500亿元
创始人
2025-05-01 16:21:03
0

每经编辑 张锦河

4月30日,DeepSeek今日于AI开源社区Hugging Face上发布了一个名为DeepSeek-Prover-V2-671B的新模型。新模型是专注于数学定理证明的大语言模型,专门针对形式化数学证明任务进行优化。

DeepSeek-Prover-V2-671B使用了DeepSeek-V3架构,参数高达6710亿,采用MoE(混合专家)模式,具有61层Transformer层,7168维隐藏层。更令人惊叹的是,其最大位置嵌入达到了16.38万,这意味着它能够处理极其复杂的数学证明问题。

值得注意的是,3月发布的V3-0324版本已被业内视为未来R2的基础模型。这一版本通过6850亿参数的MoE架构升级,代码能力获得显著增强。

值得注意的是,4月30日晚美股开盘,英伟达股价下跌3.9%,市值蒸发1037亿美元(约合人民币7541亿元)。

每日经济新闻综合自公开信息

免责声明:本文内容与数据仅供参考,不构成投资建议,使用前请核实。据此操作,风险自担。

相关内容

热门资讯

癌症、痴呆或被终结?哈佛AI ... 近日,哈佛医学院发布了一个叫PDGrapher的新玩意儿,一个可能会让许多传统药厂冒冷汗的人工智能模...
智汇苏城 云创未来:央地携手加... 9月16日,2025苏州人工智能+产业创新大会暨云智算技术生态大会成功举办。大会由中国移动云能力中心...
海尔智家获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示海尔智家(600690)新获得一项实用新型专利授权,专利名为“...
让中国企业飞向世界,金山办公+... “自古华山一条路,登临犹比上天难”,华山的险峻难攀,恰如当下中国企业的增长困境:存量市场天花板已经清...
OpenAI发布GPT-5-C... OpenAI今日推出了新的人工智能模型GPT-5-Codex,该公司表示这款模型能够在无需用户协助的...
爱立信推出首个企业级5G智能体... 爱立信宣布在私有5G技术中集成智能体AI,声称这是企业5G网络领域的"重大突破",将简化部署和管理,...
感受服务贸易的数字化创新潮流 (来源:廊坊日报) 转自:廊坊日报 “中国在服务贸易数字化、智能化转型升级方面的活力令人印象深刻。”...
2025广州互联网企业“十大正... 网络治理的深化,离不开立法支撑与专业力量加持。在9月15日广州“法商融合大讲堂”第四期暨“E法穗成—...
2025人形机器人行业报告:人... 今天分享的是:2025人形机器人行业报告:人形机器人大脑神机妙算,加速进化 报告共计:27页 人形机...
2025机器人关节论坛本周六开... 全国机器人精密减速器与关节创新论坛将于9月20日在青岛红岛国际会展中心举行。本次论坛以“精进传动·智...
堆垛机自动化立体仓库:企业降本... 在现代物流与制造业飞速发展的背景下,仓储环节作为供应链的关键节点,正经历着从传统人工模式向智能化、自...
同方股份招标结果:爬行机器人成... 证券之星消息,根据天眼查APP-财产线索数据整理,同方股份有限公司9月14日发布《爬行机器人成交候选...
将形成全球粤语语料库高地 广州大学网络空间安全学院二级教授、粤语语料库建设与大模型评测广州市重点实验室主任、联合实验室专家 齐...
马斯克周末血裁xAI 500人 Jay 发自 凹非寺 量子位 | 公众号 QbitAI 什么情况,帮马斯克训练大模型的人说失业就失业...
iOS 26 正式版发布,改变... 一觉醒来,iOS26终于来了。 9月16日,苹果正式推送了大家期待已久的iOS26正式版,这个版本用...
小确幸、畅想还有吐槽?金桥这场... 在第六届浦东新区移动通信创新应用竞赛决赛前夕,一场别开生面的科技下午茶活动近日在金桥开发区上演。 本...
应用AI,在运营铁路桥上精准换... 本报杭州电(记者李心萍、刘军国)记者从中国铁路上海局集团有限公司获悉,9月10日凌晨,在浙江绍兴城际...
英特尔中国区董事长王锐将退休 ... 【CNMO科技消息】9月16日,英特尔公司正式宣布,中国区董事长王锐将于本月退休。据CNMO了解,这...
原创 i... 近日,苹果发布的新品引发关注,其中,iPhone Air为史上最薄的iPhone。苹果表示,iPho...
温岭造船:AI打磨破解行业“卡... (来源:中国水运网) 转自:中国水运网 近期,来自上海交通大学的工程师陈旺一直驻扎在状元台智能科技(...