DeepSeek论文登上《自然》封面,R1成为首个严格学术审查大模型
创始人
2025-09-18 12:00:48
0

9月18日,由DeepSeek(深度求索)团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文,登上了国际权威期刊《自然(Nature)》的封面。

DeepSeek R1成为首个通过同行评议的主要大语言模型,发表在《自然》杂志的新版DeepSeek-R1论文,与今年1月未经同行评审的初版有较大差异。

在同行评议过程中,DeepSeek团队根据评审意见减少了对模型的拟人化描述,并增加了模型训练的技术细节说明,包括模型训练数据类型和安全性考虑等,并回应了此前关于知识蒸馏的质疑。

DeepSeek明确否认了此前关于其使用OpenAI模型输出进行训练的质疑。在长达64页的同行评审文件中,DeepSeek介绍,DeepSeek-V3 Base(DeepSeek-R1的基座模型)使用的数据全部来自互联网,虽然可能包含GPT-4生成的结果,但绝非有意而为之,更没有专门的蒸馏环节。

DeepSeek还透露,为了防止基准测试数据污染,对DeepSeek-R1的预训练和后训练数据都实施了全面的去污染措施。

开源之后,R1在Hugging Face下载量破1090万次,成为全球最受欢迎的开源推理模型。

DeepSeek首次公开了仅靠强化学习,就能激发大模型推理能力的重要研究成果,从而启发全球AI研究者。DeepSeek R1的核心创新在于采用了“纯强化学习”这一自动化试错方法,R1通过奖励模型达到正确答案的行为来学习推理策略,而非传统模仿人类预设的推理模式。

在补充材料中,DeepSeek团队还首次公开了R1训练成本仅为29.4万美元。这个金额即使加上约600万美元的基础模型成本,也远低于OpenAI、谷歌训练AI的成本。

今年1月,当DeepSeek R1模型发布时,其卓越的推理能力和极低的开发成本曾引发全球科技股大幅下跌。

作为全球首个通过同行评审的主流大语言模型,《自然》期刊不但将该篇论文作为封面论文,还在评论报道文章中用了“里程碑式论文揭示 DeepSeek AI 模型的秘密”、“创造历史”表达赞赏和肯定,此次论文发表标志着中国在大模型基础研究领域取得重要突破。

在AI行业快速发展中,未经证实的说法和炒作不在少数。《自然》杂志认为,随着AI技术日渐普及,大模型厂商们无法验证的宣传可能对社会带来真实风险。依靠独立研究人员进行的同行评审,是抑制AI行业过度炒作的一种有效方式。而DeepSeek所做的一切,是非常值得欢迎的先例。

8月21日,DeepSeek正式发布了最新大语言模型DeepSeek-V3.1。

据DeepSeek介绍,新升级版本的变化主要体现在三个方面:混合推理架构、更高的思考效率、更强的Agent(智能体)能力。DeepSeek-V3.1实现了一个模型同时支持思考模式与非思考模式。

DeepSeek是2023年成立于杭州的人工智能公司,由幻方量化孵化。创始团队由梁文锋领衔,成员来自顶尖高校与国际机构技术专家。

相关内容

热门资讯

蓝思科技生产Rokid Gla... 松果财经获悉,9月17日,第22届中国-东盟博览会在广西南宁开幕。由蓝思科技与Rokid共同开发的R...
原创 苹... 苹果iOS18.7不出意外的话将是iOS18最后一次大版本更新,一些比较新的机型升级后都有不错的优化...
百度大涨超12%,AI大模型安... 来源:界面新闻 随着AI应用场景持续拓展,新的漏洞与攻击手法不断涌现,AI大模型的安全治理工作面临着...
起售价799美元!Meta推出... 社交媒体巨头Meta举办年度大会,如期推出新的消费级AI(人工智能)眼镜。 当地时间9月17日,在M...
切实把好人工智能安全关口 杨广铭 如今,人工智能正深刻改变着人们的生产生活方式,也给社会安全与稳定带来了严峻挑战。人工智能技术...
华为大消息,立马20cm涨停! 中国基金报 晨曦 9月18日上午,华为昇腾概念股行情火热。利和兴盘中封住20cm涨停,股价再创新高。...
老牌NAS卷起来有多狠!性价比... 哈喽小伙伴们好,我是Stark-C~ 威联通作为传统NAS的老牌厂商,在NAS领域有着深厚的技术积累...
原创 i... 很多用苹果手机的网友都吐槽iPhone的续航差,早上出门满电,中午就得找插座,晚上回家必插电,这种现...
科学学习变成充满惊喜的冒险 在化学实验中探寻科学的乐趣。 在信息爆炸的时代,如何点燃青少年对科学的热情,让抽象的公式和原理转化为...
“将推动新技术在拉美生物多样性... 人民网北京9月17日电 (记者刘旭霞)近年来,人工智能、大数据等新技术发展迅猛,为生物多样性保护开辟...
华为《AIDC机房参考设计白皮... 2025-09-18 11:46:49 作者:狼叫兽 2025年9月17日,首届AIDC产业发展大...
“AI赋能千行百业超级联赛”交... 9月16日,“AI赋能千行百业超级联赛”交通创新大赛在广西南宁正式启动。本次大赛以“数智交通·通达未...
抖音推出AI辟谣、识谣功能 9月17日消息,抖音在2025年不实信息治理开放日上宣布上线全新功能 “AI 抖音求真”,以应对误导...
褒贬不一:苹果iOS 26液态... 9 月 18 日消息,科技媒体 MacRumors 昨日(9 月 17 日)发布博文,简要汇总了苹果...
DeepSeek论文登上《自然... 9月18日,由DeepSeek(深度求索)团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推...
周红波率团参加东博会并出席中国... 9月17日,省委常委、市委书记周红波率江苏、南京代表团参加第22届中国—东盟博览会,并与广西壮族自治...
展示科技魅力 激发创新思维 “科创游”是一种将科技与旅游相结合的新型旅游形式,不仅展示科技企业的生产过程和产品,还注重科技教育的...
Meta推出雷朋Display... IT之家 9 月 18 日消息,Meta 创始人兼 CEO 扎克伯格昨天在 Connect 大会上发...
腾讯云TDSQL自研产品家族扩... 9月17日,在2025腾讯全球数字生态大会上,腾讯云正式公布自研数据库TDSQL全新产品家族,包含T...
原创 苹... 不少朋友想买一款苹果手机,但不知道哪款值得入手?就目前来看,可供选择的苹果手机有4款,所以本文就来盘...