原创 华裔女院士复刻DeepSeek,成本不到50美元,性能媲美顶级模型
创始人
2025-02-10 11:41:34
0

在2025年年初,AI界杀出来了一员猛将——DeepSeek,一经问世震惊了整个人工智能行业,下载量一跃攀升至美国地区AI软件下载量榜首位置,与此同时也预示着为低成本AI的推理模型拉开了帷幕.....

来源网络

就当大家还在消化中国带来的科技震撼之际,这时候美国华裔科学家李飞飞携团队出击,以DeepSeek为基础,推出了一款功能类似,但成本更低的AI推理模型,取名“s1”。

中国近些年来在科技上取得的成功,想必让美国也感到了威胁,如今“s1”的问世,也难免让大家好奇,李飞飞是如何在短时间内做出类似DeepSeek的AI软件的呢?

李飞飞

放下AI传统形式走向新征程

在过去很长一段时间内,我国科技曾经面临过一段灰暗的日子,受人制约,还要忍受排挤,而随着近些年我国国力增强,也实现了科技报国的愿景。

尤其是在2025年,简直可以称作是中国科技崛起之年,再次让世界认识到了中国力量,DeepSeek的成功也成为了众多优秀的中国AI企业走向国际的桥梁。

DeepSeek创始人梁文峰

而今年在央视的春节联欢晚会上出现的16个扭秧歌机器人,直接给世界一个震撼,虽说穿上了花棉袄,转起了手绢,看起来有些诙谐,但只有内行人懂得,中国的机器人和AI技术已经到了怎样一个可怕的地步。

春晚机器人表演

据和讯网在2025年2月6日发布的报道中,可以了解到的是在中国DeepSeek没有问世之时,可以说美国的OpenAI的在人工智能方面是“霸主”级别的,使用成本也非常的高。

为了能用上技术,很多企业都不得不增加项目成本,但DeepSeek的出现直接打破了这个困局,从实在的价格入手,先拿下市场份额,比OpenAI的成本价直接缩水20倍-40倍,解除了很多人对于这方面的顾虑,率先拿下客户群体,让对手感受到压力。

便宜并不代表商品功效不好,两者相比较下来,Open AI的实力也不容小觑,在技术和多模态能力还以后生态扩展等方面综合实力上是占据有优势。

DeepSeek更具有颠覆性的潜力,其低成本的营销策略可能会推动AI技术更快的普及,最实在的受益者就是各行业的用户们,门槛低了,大家就会更加愿意接受,从而推动行业的全方面发展,说不定还能激发更多的AI创造者。

据华尔街见闻在2025年2月6日发布的报道中了解,前有DeepSeek打头阵,相信已经有不少AI企业跃跃欲试。

在这个节点上,“s1”的出现再次受到了大家的关注,对比前两个有成本更低的绝对优势,并且研究成果表明,s1在数学和编码能力测试中和前两个受人瞩目的AI模型表现上不相上下,填补了DeepSeek在测试时间扩展图上需要大量数据的不足。

作为“s1”团队的主创,李飞飞是何许人也呢?

李飞飞

李飞飞1976年出生于北京,在16岁的时候就和家人移居到了美国,多年来在电子工程领域取得了显著的成绩,素有“AI教母”的美名,DeepSeek的成功自然也是逃不过她的眼睛,于是就带领团队做出了可以相媲美的“s1”。

据第一财经在2025年2月7日发布的报道中看,从技术层面来看,李飞飞带领的团队证明了只要是数据样本高质量,是可以通过简单的测试时间扩展就可能带来模型训练效率的大幅度提升。

而但是大家都知道做科研,一般情况下科研都是比较费钱的,需要投入大量的算力和人力,对数据的要求也非常高,这样一来,成本自然就高了。

而李飞飞却只用了一点点零头,不到50美金就完成了可能别人几千万都拿不下的项目,她是怎么做到的呢?这就不禁让人有些疑问。

李飞飞

根据相关资料显示,他们先挑选了上千个问题和答案,并且给出其中的“推理过程”,让其一点一点的了解其中的逻辑和规律,不到半小时就完成了训练。

到这个时候还有一个关键的问题,就好似不管是人工也好还是AI也好,难免会出错,那么怎样提高它的准确率则是必须思考的问题。

于是,李飞飞的研究团队就想到了运用一种“预算强制”技术,能控制测试的时间计算,提前强制种植模型的思考过程,另外在推理的同时也可以追加“等待”的指令方便更好的思考问题,优化各方面性能。

李飞飞

这时候肯定也有不少人有疑问,为什么这么复杂的AI算法李飞飞团队就可以轻易的突破,而其国际顶尖的AI公司却要花费大量的人力财力进行研究呢?

原来是因为采取了“蒸馏技术”,这种方法可以在极短的时间内,通过技术手段将数据压缩,使得小模型具备大模型的推理能力,更方便节省训练成本。

李飞飞取得的成功,也代表这种方法是有效的,在节省一定的资源的同时,也引起了行业内部的担忧,若是大家都采取这样的方式,可以轻易的复制甚至是超越现有的顶级模型,那么未来可能就会出现大家都不愿意在花费财力与精力,继续研发顶级模型了!

这样的担忧不无道理,若是未来大家都采取这样的形式,人工智能的发展可能会进入到一个瓶颈期,所以要适可而止或者制定出一个使用规则,大家都必须遵守,这样维持好平衡才能更有利于今后的发展。

相关内容

热门资讯

餐饮小程序开发 在现代社会,餐饮行业的发展与技术进步密不可分。随着移动互联网的普及,越来越多的餐饮企业开始尝试开发小...
中芯国储储能固态电池研究取得重... 中芯国储研究员-储能行者 近日,中芯国储传来振奋人心的消息,其旗下研究员储能行者在实验室成功取得储能...
杭正电子取得一种车载显示器专利... 金融界2025年7月5日消息,国家知识产权局信息显示,杭州杭正电子科技有限公司取得一项名为“一种车载...
便携式EL检测仪:光伏行业的“... 在光伏产业蓬勃发展的当下,便携式EL检测仪凭借其高效、精准、便携的特性,成为保障光伏组件质量的核心工...
福建省内最大华为门店在厦开业 昨日,华为在福建的最高规格门店——华为智能生活馆(厦门万象城店)正式开业,为我市“首店经济”注入新活...
天津市两部门开展智能养老服务机... 央广网天津7月6日消息(记者褚夫晴)日前,记者从天津市民政局获悉,从今年起到2027年,市民政局将与...
从多模态融合到行业深扎,国内 ... 国内有众多 AI 大模型研发机构,如百度、阿里、字节跳动、科大讯飞等,从这些机构的实践来看,大模型主...
香港特斯拉降价“狙击”内地电动... 特斯拉在中国香港被认为仍拥有一定先发及品牌优势。对于有志于出海的中国内地车企,“借助当地独特的市场环...
鲁建建筑取得新型挡土墙结构专利... 金融界2025年7月7日消息,国家知识产权局信息显示,山东省鲁建建筑工程检测有限公司取得一项名为“一...
星空有约|太阳系迎来第三位“闯... 新华社南京7月7日电(记者王珏玢、朱筱)7月初,一个来自太阳系外的天体在穿过木星轨道时被发现,引起全...
安徽未来产业澎湃崛起 月壤打砖让月球建房成为可能、量子密话密信等“黑科技”走进生活、依托“人造太阳”探索“终极能源”、自研...
中国科技馆“科学方法特训营”暑... 新京报讯(记者张璐)“科学方法特训营”暑期营地系列活动首场——“星际启航”营地探访活动7月5日在中国...
Meta豪掷AI“超级智能”赛... 环球网 7月6日消息,据外媒报道,meta首席执行官马克·扎克伯格近日在人工智能竞赛中火力全开,通过...
杭州ai图像识别技术介绍 一、引言 随着科技的飞速发展,人工智能(AI)已逐渐成为各行业的核心驱动力。其中,AI图像识别技术作...
交通枢纽 “神经网”:无线对讲... 春运高峰单日客流破百万、机场航班起降调度分秒必争…… 现代交通枢纽每日承载着海量人流、物流运转。无线...
雷军顶着35℃高温为首批YU7... 极目新闻记者 王鹏 7月6日,小米YU7正式开启全国交付,覆盖全国58个城市。雷军发文称:“今天(6...
罗马仕停工停产!低价内卷遭反噬... 5月24日,罗马仕还在为618预热,为即将到来的购物节打出“抢半价”的活动,彼时其未曾料到,短短1个...
Deepseek “严重烂尾”... 最近Deepseek的关注度正持续下降!有数据显示,Deepseek的用户活跃度从春节高点的15%一...
矩阵多元取得加热器及半导体设备... 金融界2025年7月5日消息,国家知识产权局信息显示,深圳市矩阵多元科技有限公司取得一项名为“一种加...
科技赋能 智治建设数字化幸福小... 漯河市临颍县城关街道以数字化建设为牵引,持续用好一体化治理智治平台,聚焦辖区群众民生问题的进展情况,...