DeepSeek,突传大消息!最新回应来了
创始人
2025-02-26 01:21:56
0

DeepSeek又传来重磅消息。

2月25日,据路透社报道,DeepSeek计划提前发布其新一代AI模型R2。该公司最初计划在5月推出,但目前正在努力尽快推出。DeepSeek表示,新模型将在编程能力和多语言推理方面有所提升。

对此,幻方量化相关人士回复券商中国记者,“以官方消息为准。”

此外,阿里巴巴将于今日晚间全面开源旗下视频生成模型万相2.1模型。

值得注意的是,DeepSeek API开放平台今日也宣布重新开启API充值服务。由于服务器资源紧张,该平台曾在2月6日暂停了API服务的充值功能。

DeepSeek-R2要来了?

DeepSeek的下一代模型R2的进展备受市场关注。

2月25日,据路透社报道,DeepSeek计划提前发布其新一代AI模型R2。据知情人士透露,R2原定于5月初发布,但现在公司希望尽快推出。DeepSeek表示,新模型将在编程能力和多语言推理方面有所提升。对于R2 的发布时间表,没有提供具体细节。

印度技术服务提供商Zensar的首席运营官Vijayasimha Alilughatta表示:“DeepSeek的R2模型发布可能会成为AI行业的一个关键时刻。DeepSeek成功打造了具有高性价比的AI模型,将促使全球公司加速研发进程,打破目前由几家主导企业垄断的格局。”

对此,幻方量化相关人士回复券商中国记者,“以官方消息为准。”

此前,有行业人士在Reddit中发帖表示,DeepSeek-R1在编码和SWE-Bench方面已经与OpenAI匹敌,甚至没有使用他们最大的突破——强化学习 (RL),这种情况即将改变。“他们正在解决这个问题。未来版本将集成拒绝采样和异步评估,使强化学习可用于软件工程。路线图非常清晰:DeepSeek-R2将是一次优化飞跃,而不是算法飞跃。如果说DeepSeek证明了什么,那就是他们解决优化问题的能力。”

分析认为,DeepSeek的成功得益于幻方投资十多年来在研究和计算力方面的大量投入。幻方于2020年和2021年斥资12亿元人民币建立了两个AI超级计算集群,其中包括约1万片英伟达A100芯片。

据知情人士透露,DeepSeek前员工表示,公司的成功主要归功于梁文锋专注于更具成本效益的AI架构。DeepSeek采用了混合专家(MoE)和多头潜在注意力(MLA)等技术,大大降低了计算成本。

伯恩斯坦经纪公司的分析师在2月初估计,DeepSeek的定价比OpenAI同类模型的收费便宜20到40倍。这也引发OpenAI在本月降价,而谷歌的Gemini也推出了折扣访问层级。自R1推出以来,OpenAI还发布了一款依赖较少计算能力的O3-Mini模型。

此外,DeepSeek API开放平台今日也宣布重新开启API充值服务。此前,由于服务器资源紧张,该平台曾在2月6日暂停了API服务的充值功能。

阿里将发布视频生成模型

与此同时,阿里巴巴也传来一则重磅消息。

据新浪科技从知情人士处获悉,阿里巴巴将于今日晚间全面开源旗下视频生成模型万相2.1模型。今年1月,阿里旗下万相刚宣布推出2.1版本模型升级,视频生成、图像生成两大能力均获得提升。

在视频生成方面,万相2.1通过自研的高效VAE和DiT架构增强了时空上下文建模能力,支持无限长1080P视频的高效编解码,首次实现了中文文字视频生成功能,登上VBench榜单第一。

据此前介绍,万相2.1支持中英文视频,可以一键生成艺术字,还提供多种视频特效选项,以增强视觉表现力,例如过渡、粒子效果、模拟等。

随着万相2.1模型开源,这意味着更多的开发者,将能够低成本获取并使用该模型底层代码,进而用以开展与自身业务相关的各类视频生成应用。

值得注意的是,就在今日早间,阿里Qwen团队在社交媒体宣布发布新推理模型——深度思考(QwQ)。这是在QWQ-MAX-PREVIEW支持下,一个基于Qwen2.5-Max的推理模型。QwQ可同时支持深度思考和联网搜索,并会展示完整的思维链。

Qwen团队称,QWQ-MAX官方版本即将发布,同步会发布Android和iOS应用程序,还会发布更小的可在本地设备部署的模型,如QWQ-32B等。

AI芯片需求激增?宇宙最重要的财报即将来袭

值得注意的是,DeepSeek的崛起一度让投资者质疑,英伟达的尖端芯片是否还是科技公司在人工智能竞赛中的“制胜法宝”?英伟达市值1月底曾一天蒸发5930亿美元,创下美国公司单日市值损失之最。

不过,事实可能并非如此,DeepSeek的横空出世,引发各行各业的多家企业纷纷布局采用DeepSeek,或使得英伟达AI芯片需求大增。

据路透社消息,中国企业推出低成本人工智能模型DeepSeek后,显著推高了模型使用的英伟达人工智能芯片在中国市场的需求。路透社引述知情人士的消息说,多家互联网巨头对同款H20芯片的订单激增。

两名知情人士表示,自DeepSeek上个月引起全球瞩目以来,中国企业腾讯、阿里巴巴及字节跳动都“大幅增加”对H20的订单。这三家科技巨头除了内部需要先进AI芯片外,也提供云计算服务,让其他企业能取得并使用AI工具。

相关内容

热门资讯

“科学学全球伙伴计划”搭建全球... 近日,在“浦江创新论坛——科学学上海论坛·2025科技创新智库国际研讨会”现场,“科学学全球伙伴计划...
永祥硅材料取得硅芯包装平台专利... 金融界2025年6月28日消息,国家知识产权局信息显示,四川永祥硅材料有限公司取得一项名为“一种硅芯...
迈金科技取得一种电子变速器专利... 金融界2025年6月28日消息,国家知识产权局信息显示,青岛迈金智能科技股份有限公司取得一项名为“一...
珠海冠宇获得发明专利授权:“一... 证券之星消息,根据天眼查APP数据显示珠海冠宇(688772)新获得一项发明专利授权,专利名为“一种...
小火龙拜访土星朋友之旅 ■西安经开第七小学四年级一班 宋佳骏 在浩瀚的宇宙中,在有着八大行星的太阳系中,在美丽的地球上,居住...
汇智聚力优化创新生态 近年来,上海以建设国际科技创新中心为战略使命,聚焦强化科技创新策源功能主线,从政策赋能、机制突破、未...
学术破界,科普惠民,这场医学大... 6月28日,首届“浦江-明道”普外学术大会暨“浦公英”健康科普驿站普外专场在上海举办。这场以“学术引...
珠海冠宇申请一种极片及电池专利... 金融界2025年6月28日消息,国家知识产权局信息显示,珠海冠宇电池股份有限公司申请一项名为“一种极...
小米申请充电控制相关专利,提高... 金融界2025年6月28日消息,国家知识产权局信息显示,北京小米移动软件有限公司申请一项名为“充电控...
AI技术赋能 西安音乐项目获文... 文化和旅游部科技教育司、全国艺术科学规划领导小组办公室近日公布了17项2025年度国家社科基金艺术学...
这一星象时隔36年再现,明晚记... 6月29日,太阳系中的行星海王星与土星相合,上演“星星相吸”。届时如果天气晴好,我国感兴趣的公众可在...
双向奔赴!乐源智慧农业产业园在... 6月28日,乐源智慧农业产业园开工奠基仪式在重庆市武隆区白马工业园区举行。项目的落地,为武隆工业经济...
海内外业者聚首厦门“侨”见世界... 中新网厦门6月28日电 (李思源 汪文婷)2025侨文化国际传播学术研讨会28日在华侨大学厦门校区举...
到2030年撬动1万亿资产!一... 我国数据要素市场3.0时代,如何加快建设一体化数据市场? 6月27日,在由大数据流通与交易技术国家工...
图书馆电子资源上新——NATU... 为了满足我校师生的教学与科研需求,图书馆目前开通了nature及子刊服务,欢迎大家使用。 期刊范围 ...
除草不再需要农药,华工科技发布... 6月28日,2025年华工科技创新日活动发布众多“黑科技”产品。其中,国内首款激光除草机尤引关注。 ...
上海硅光未来产业集聚区落地浦东 中新社上海6月28日电 (记者 李姝徵)上海硅光未来产业集聚区“光启天地”28日在浦东新区启动建设。...
时隔36年再现,明晚记得抬头看... 6月29日,太阳系中的行星 海王星与 土星相合, 上演“星星相吸”。届时如果天气晴好,我国感兴趣的公...
连打40万页创世界纪录,奔图“... 全球科技竞争日益激烈,中国自主创新释放出强大的韧性和活力。2025年6月26日,奔图扛打再破纪录暨2...
科技感拉满!这场机器人开发者大... 2025年睿抗机器人开发者大赛(RAICOM)是极具影响力的全国性赛事。大赛以“机器照护人”为主题,...