原创 成本不到50!美国华裔女院士成功复刻Deepseek,性能媲美顶级模型
创始人
2025-02-08 10:40:46
0

26分钟,成本不到50美元就训练出新模型s1-32B?

本以为中国的DeepseekAI出台后,已经让美国震惊,让英伟达股市下跌,没想到华裔女院士出手,竟然让人如此震惊,难道就那么容易被复刻吗?那么如何才能理解AI“白菜价”背后的隐喻呢?

近几日,我国DeepSeek备受全球关注,短短几天就让AI巨头英伟达股价暴跌,人工智能推理已经有了新的发展。

然而让人想不到的是,根据外媒报道,还不到49岁的华裔女院士李飞飞,带领她的团队,竟然仅仅只用了不到50美元的费用,花费了26分钟的时间,就完成了训练,打造了一个名为s1-32B的人工智能推理模型。

根据李飞飞的研究论文表述,该模型的编码能力在测试中,竟然可以和DeepSeek以及openAI不相上下。

一时间,低成本、高效能让李飞飞的模型瞬间成为了科技界热议的话题之一,不过背后却还是有着让人难以置信的真相。

AI教母?

说起李飞飞,在她的身上可谓是充满了戏剧性,如今她的身份不仅是美国国家工程院院士和医学院院士以及艺术与科学院院士,还是Twittre公司的独立董事,甚至被外界称为“AI教母”。

不过出生在北京的她,能够在如此年纪成就这番事业,其实这也并不容易。

1999年,23岁的李飞飞从普林斯顿大学本科毕业后,就去了我国西藏研究藏药,作为物理学专业的学生,她对于生物的研究却十分感兴趣,这也为她后来成为医学院士奠定了基础。

一年之后,李飞飞回到了美国,并且开启了自己更高的求学之路,顺应时代的脚步发展,年轻的她就有这样的想法。

在美国李飞飞凭介子的实力,打出了属于自己专业的一片天地,就连美国媒体都报道,称她“美国梦”成真了!

李飞飞凭借实力留在了美国,在物理、医学和科技创新上,几乎都有她的脚步,而之所以能够成为“AI教母”,也是因为她那勇于创新的能力。

前几年的时候,可能对于AI我们并不是很熟悉,毕竟AI也需要强大的算法和芯片支持,而当时李飞飞在美国就已经是斯坦福人工智能实验室主任了。

用数字改变生活,在李飞飞的带领下,团队的人工智能产业发展壮大,也正是因此,当她说用50美元复刻DeepSeek的时候,才会让外界如此震惊,但并不是那么简单。

前期烧钱不提?

如今李飞飞团队虽然表示用了不到50美元复刻,但是要知道他们可是使用了16张英伟达H100GPU。

而且就比如我国DeepSeek这样的公司,前期为了能够训练出更强大的人工智能推理模型,前期那是非常烧钱的。

而李飞飞团队所训练的s1-32B,并不是说从零起步,而是在原有训练模型基础之上,此次他们预训练的模型是“阿里通义千问Q问2.5-32B-Instruct”进行一个监督微调。

不得不说,李飞飞团队在AI上的能力确实很强,但是他们所说的50美元成本,说白了也是把别人当做垫脚石,而且没有包含Qwen模型的训练费用。

如果说人工智能训练模型如此廉价,李飞飞团队这样“卷”价格的话,是不会带来什么好处的。AI大数据是未来发展的一个重要方向,但不是说为了争夺市场就在成本上压缩。

根据官方消息,DeepSeek-V3当初训练的成本就已经高达600万美元了,而且还只是包括了训练时GPU算力的费用。

此次李飞飞使用了16张英伟达H100GPU,才“打造”一个人工智能推理模型,而且在测试的时候,也并不是那么简单的,毕竟AI模型推理的时间越短且答案越准确,才能够被人使用。

如果说都按照李飞飞团队来训练模型的话,那么谁会去创造新的技术呢?毕竟很多都希望踩在“巨人肩膀”上。

AI人工智能的发展,必将是科学界未来最主要的一条路,但也并不是说让英伟达一家独大,能够让全人类享受到其中的利益才是最重要的!

相关内容

热门资讯

“AI+绿色发展”:为守护绿水... 6日,“AI+绿色发展”论坛作为2025年生态文明贵阳国际论坛的系列活动之一在贵阳举办。 国内AI领...
太赫兹+声波!我国科学家使无针... 新华社天津7月7日电近日,我国科研人员开发了一种新型太赫兹光声系统,在无针诊断领域迈出了重要一步。该...
原创 哈... 摘要:近日,上海昇视唯盛科技有限公司携“激光+地轨+悬臂”全场景智能机器人工作站方案在第28届埃森展...
全国首个深空探测领域国际科技组... 据安徽省人民政府消息,国际深空探测学会成立大会7月7日在安徽合肥举行,这是全国首个深空探测领域国际科...
沧州为现代农业装上“智慧大脑” 建设示范园区 应用大数据技术 推广智能农机装备 沧州为现代农业装上“智慧大脑” 河北日报客户端讯(记...
荐读•悦科普 |《现实不似你所... 爱科普,读科普 悦科普,尽在数读空间 推荐语: 陈嘉映盛赞的物理学家卡洛·罗韦利重磅作品,带你在《七...
左撇子更有创造力?百年研究数据... 美国康奈尔大学科学家对持续百年的惯用手与创造力关联研究进行全面梳理,发现传统认知中“左撇子更具创造力...
东软发布“10+2应用场景” ... 7月3日,由东软集团与中国就业促进会共同成立的“联合数字就业研究中心”正式发布“数智化赋能高质量就业...
应对Steam商店黑屏:常见原... 作为当前全球最受欢迎的数字游戏平台之一,Steam为玩家提供了丰富多样的游戏内容。然而,许多用户在访...
美国的播客文化是如何养成的 文|刀客Doc 6月18号,OpenAI在YouTube上线了自己的播客节目,揭秘了ChatGPT...
小米YU7首批正式交付,雷军现... 7月6日下午,雷军发文:今天下午,小米YU7正式交付首批车主。 希望这台车,陪伴每一个热爱生活的你和...
“内贸版广交会”破圈升级!京东... 7月7日,广东省新闻办举行广东优品展览会吹风会。记者在会上了解到,作为“内贸版”的广交会,首届广东优...
广东科技力量闪耀残特奥会 展区现场 羊城晚报记者 颜业宏 摄 羊城晚报记者 郑明达 7月6日,全国第十二届残疾人运...
无创测血钠!天大团队突破太赫兹... 记者7日从天津大学获悉,该校精密仪器与光电子工程学院光电子科学技术系科研团队开发了一种新型太赫兹光声...
日本防灾头盔销量七月激增显著,... 本文基于以下微博话题的智搜结果生成 根据现有信息,日本防灾头盔在2025年7月的销量增长情况可综合如...
从“制造”到“智造”|哈尔滨老... “共和国长子”正以创新为引擎 在数字浪潮中焕发新生机 哈尔滨这座老工业基地通过蜕变 用科技创新的钥匙...
灵宝机器人完成近亿元融资,工厂... 作者|Li Yuan 编辑| 郑玄 当多数人形机器人公司还在争夺展台 C 位时,灵宝 CASBOT...
媒体关注|浙江全海域进入III... 根据今年第4号台风“丹娜丝”态势及走向,浙江海事局于6日上午8时将北部海域防台应急响应提升至III级...
“AI数智关员”陆续上岗,推动... 深圳商报记者 罗凯燕 通讯员 莫燕妮 唐硕 李珺 在深圳海关,一群24小时在岗的“AI数智关员”正悄...
我国成立首个深空探测领域国际科... 国际深空探测学会成立大会7日在安徽合肥举行。这是我国首个深空探测领域国际科技组织。 国际深空探测学会...