生成式AI模型转向?微软开始尝试“以小博大”
创始人
2024-01-09 05:15:23
0

原标题:生成式AI模型转向?微软开始尝试“以小博大”

来源:界面新闻 作者:李京亚

图:匡达

当人们开始质疑能耗和资金投入过大的大模型竞逐是否道路正确时,微软用27亿参数的小模型指明了一些新方向。

近日,微软研究院在X上公布了其开源小尺寸模型Phi-2的一些技术细节,凭借在各类复杂基准测试之上展现的出色能力,这款小模型迅速在业界引发反响。

Phi-2的输入和输出都只能采取文本形式,经过基准测试评估,仅用27亿参数就在主要性能上超越Llama2(Meta最新开源的语言大模型)家族中一些小模型如LIama2 7B、Llama2 13B等,并与谷歌新释出的端侧模型Google Gemini Nano 2不相上下。

图源:微软研究院 评测结果还显示,Phi-2与经典的Llama-2-70B模型(开源社区最为核心和衍生模型最多的大语言模型LLM)相比,整体差距也不太大,在多步推理任务如编码和数学方面,性能还比后者更好,而Llama-2-70B的体量是Phi-2的25倍。

据微软所述,Phi-2的设计目标是通过模仿较大模型的推理过程来克服较小模型的局限,具体做法上以预测下一个单词为目标,在1.4万亿个词库上进行训练,训练过程中使用了96块A100 GPU,耗时14天完成。

据微软研发团队解释,Phi-2效果之所以好,是因为使用了比较优质的合成数据以及大语言模型LLM提示工程技巧。

据悉,这款模型在毒性和偏见方面的表现超越了其他开源模型,可以在笔记本和手机上运行。有毒性主要是大模型产生的攻击性、有害内容,偏见则会导致大语言模型在性能和社会文化上产生危害。目前,微软已经在Azure AI Studio模型目录中提供了Phi-2。

值得注意的是,除使用研究界惯常的测试方法之外,Phi-2还展示了在真实使用场景中的能力。

微软大胆地将自家小模型与谷歌的最强多模态大模型Gemini Ultra进行对比,结果Phi-2在解决物理问题和纠正学生错误方面表现不逊于Gemini Ultra,展示出超越常规测试之外的综合能力。

对于一个用于测试模型解决物理问题的能力的prompt(最近用于评估 Gemini Ultra 模型),Phi-2给出了如上结果图源:微软研究院 Gemini Ultra的参数规模据推测大于3400亿,而Phi-2只有27亿。这充分说明,微软的小语言模型不仅能在核心的推理和理解能力上与大其5倍、10倍的模型相当,还能展现出前沿超大语言模型的些许特性。

一般而言,小语言模型是指参数量低于130亿的模型,大语言模型是指千亿参数规数的模型。在极少公司才能拿到必要资源训练大模型的当下,微软试图用微型模型研究为这一领域树立新的范式。

特别是在近期,微软逐步显露出对小语言模型的偏好。

事实上,Phi-2是微软 “小语言模型(SLM)” 系列中的最新版本,其首个版本是13亿参数的Phi-1。就在11月,CEO纳德拉领导的微软研究部门还发布了另一对小型语言模型Orca 2,也能做到在完成复杂推理任务时,可以与5到10倍大的语言模型(包括Meta的Llama-2 Chat-70B)相媲美。

在推广小模型方面,微软还计划开发一种名为“Tiny”的新模型系列,这些模型优化之后,能够在资源有限的设备上运行。此外,微软也会通过Azure OpenAI服务提供更多小模型,供开发者使用。

随着Phi-2的发布,微软将继续推动在小型基础语言模型方面的研究和发展。但需要指出的是,Phi-2目前有一大局限:只被许可用于“研究目的”,而不能商用。

相关内容

热门资讯

神工造粒取得造粒机用颗粒筛选装... 金融界2025年5月23日消息,国家知识产权局信息显示,常州市神工造粒设备有限公司取得一项名为“一种...
尼康亮相2025 CHINA ... 2025年5月16日,第二十六届中国国际照相机械影像器材与技术博览会(CHINA P&E 2025)...
京东工业:AI重塑供应链新范式... 上证报中国证券网讯(记者 宋薇萍 操子怡)以“工业供应链助企增效”,5月22日,京东工业在上海现身说...
赋能创业创新 九龙坡创业创新大... 5月22日,2025年重庆市九龙坡区创业创新大赛暨成渝地区创业创新邀请赛项目复赛在重庆启迪科技园开赛...
苏州诺倍泽取得多肽合成设备专利... 金融界2025年5月23日消息,国家知识产权局信息显示,苏州诺倍泽机电有限公司取得一项名为“一种多肽...
应急管理部发布《精细化工企业安... 中新网5月23日电 据应急管理部网站消息,近日,应急管理部公告发布强制性安全标准《精细化工企业安全管...
文博会观察:“科技+文化”AI... 中新社深圳5月22日电 (张璐)AI弹奏钢琴,人机棋艺对决,数字算法刺绣……在22日开幕的第二十一届...
中房新能源取得一种太阳能集热器... 金融界2025年5月23日消息,国家知识产权局信息显示,中房(北京)新能源有限公司取得一项名为“一种...
“学以智用”生态出圈, 华为擎... 2025年5月23日至25日,第63届中国高等教育博览会在中铁·长春东北亚国际博览中心盛大启幕。本届...
华海药业获准在新西兰开展双抗药... 雷达财经 文|杨洋 编|李亦辉 5月23日,华海药业(600521)公告,公司的下属子公司上海华奥泰...
中山百得厨卫取得触摸显示组件专... 金融界2025年5月23日消息,国家知识产权局信息显示,中山百得厨卫有限公司取得一项名为“触摸显示组...
消息称苹果加速推进智能眼镜项目... 【太平洋科技快讯】近日,据相关消息透露,苹果正全力推进其智能眼镜的研发计划,目标是在 2026 年底...
迪哲医药两款创新药物将在202... 5月23日,迪哲医药(688192)发布公告,宣布其自主研发的两款源头创新药物DZD8586和DZD...
智能升级!吉林高速AI巡查精准... 随着高速公路建设的飞速发展,传统人工检测路面病害的方式弊端日益突出,存在着标准化缺失、成本高、精确度...
聚焦具身智能 “安永复旦最具潜... 5月23日,“安永复旦最具潜力企业”2025评选活动正式启动。本次评选将以“无限可能·智能具身拓未来...
原创 充... 在移动智能设备高度普及的今天,充电宝已成为现代人出行、办公、旅行的“电力生命线”。无论是应对手机电量...
网络存储方案怎么选?满足不同规... 在信息科技行业,网络存储扮演着核心角色,对于数据的安全、高效管理和应用至关重要。一个恰当的网络存储方...
骄傲!芜湖“智造”再次闪耀太空 5月22日,神舟二十号航天员圆满完成出舱任务。在这历史性时刻的背后,由安徽华夏光电股份有限公司自主研...
Cy5-Glucose,Cy5... Cy5-葡萄糖,菁类染料Cy5-葡萄糖,Cy5-Glucose Cy5-葡萄糖(Cy5-Glucos...
芬尼取得热泵机组专利,减少对底... 金融界2025年5月23日消息,国家知识产权局信息显示,安徽芬尼节能设备有限责任公司、广东芬尼克兹节...