SLM逆袭LLM?微软下注更小、更便宜的“大模型”
创始人
2024-01-24 14:38:05
0

原标题:SLM逆袭LLM?微软下注更小、更便宜的“大模型”

在过去一年左右的时间里,大模型(LLM)吸引了全球的注意力,从GPT3.5、GPT-4到LLaMA等开源模型。然而,种种迹象表明,小模型(SLM)如今越来越受到重视。

1月23日,媒体援引两位知情人士透露,微软已经组建了一个新团队来开发对话式AI,与目前使用的OpenAI软件相比,微软开发的这种AI需要的计算资源更少。知情人士称,微软已将几位顶尖AI开发人员,从其研究小组调至新的GenAI团队。

上个月,微软亮出了小模型大招,发布27亿参数规模的小语言模型Phi-2,在部分基准测试中超过谷歌的Gemini Nano 2,可以在笔记本电脑、手机等移动设备上运行。

分析指出,微软与OpenAI的紧密合作,使得GPT模型的表现在大模型市场一骑绝尘,再加上微软参数规模更小的Phi系列,能进一步抢占开源模型长尾市场。

微软大、小模型两手抓

上述知情人士表示,GenAI团队与微软的另一个团队Turing是分开的,Turing开发了大模型来改进Bing和其他微软产品。而GenAI团队致力于开发小模型。

微软的小模型Phi参数规模足够小,但在处理某些任务上可以媲美GPT-4。为了让Phi表现足够优秀,研究人员去年曾使用GPT-4生成了数百万条高质量文本,并根据这些数据对Phi进行了训练。

Phi曾在AI研究社区中引起了轰动,此后,微软又推出该模型的最新版本Phi-2,作为开源模型提供给用它来构建自己的AI应用程序的Azure客户。高盛等公司近几个月就一直在测试Phi。

与此同时,微软已经在研究如何利用小模型,来处理Bing AI聊天机器人和Windows Copilot用户较为基本的咨询问题,以降低计算成本。

本月早些时候,在达沃斯论坛上,微软首席执行官Satya Nadella夸赞了公司在小模型方面的工作,称其为“掌控我们自己命运”的一种方式。

Nadella表示:"我们对拥有最好的前沿模型非常重视,当前最先进的大模型是GPT-4。我们还有Phi,它是微软最好的小模型。因此,我们将拥有多样化的模型。”

“小模型”开辟新战场

除了微软之外,也是在上个月,法国初创公司MistralAI公布的开源模型Mixtral 8x7B引起轰动。

华尔街见闻此前文章提到,模型Mixtral 8x7B规模参数相对较小,而能力却能达到GPT-3.5的水平。

Mixtral 8x7B之所以叫Mixtral 8x7B,是因为它属于稀疏模型,将各种为处理特定任务而训练的较小模型组合在一起,从而提高了运行效率。

性能方面,Mixtral表现优于Llama 2 70B,推理速度提高了整整6倍;在大多数标准基准测试上与GPT-3.5打平,甚至略胜一筹。

成本方面,由于Mixtral的参数较小,所以其成本也更低。与Llama 2相比,Mixtral 8x7B表现出自己高能效的优势。

毫无疑问,规模较小的模型可以降低了大规模运行人工智能应用的成本,同时极大地拓宽了生成式AI技术的应用范围。

值得一提的是,MistralAI刚刚完成4.15亿美元融资,最新估值已经冲破20亿美元,在短短6个月中增长了7倍多。

相关内容

热门资讯

华能水电获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示华能水电(600025)新获得一项实用新型专利授权,专利名为“...
visionOS 26 全面升... IT之家 6 月 10 日消息,苹果公司在 visionOS 26 中,将对 Apple Visio...
苹果iOS 26发布 AirP... 快科技6月10日消息,今日,苹果正式发布全新操作系统iOS 26,为AirPods带来录音棚级录音和...
商业化路径渐明 家用机器人赛道... 人民财讯6月10日电,相比于还未见到商业化曙光的通用人形机器人,家用机器人赛道公司正在排队融资和IP...
小米SU7 Ultra又给中国... 太疯狂了!这次雷军又该被人酸了! 为什么?就因为小米SU7 Ultra又拿了个第一,而且是在目前大多...
2025网聚“合”力丨以“人工... 6月10-11日,2025年中国网络文明大会将在合肥启幕。这座“科里科气”的创新之城,正以人工智能技...
一批重大工程取得新进展 为经济... 央广网北京6月9日消息 据中央广播电视总台中国之声《新闻和报纸摘要》报道,连日来,一批重大工程取得新...
直击WWDC25:苹果系统视觉... 出品 | 搜狐科技 作者 | 张雅婷 6月10日消息,苹果举行年度全球开发者大会(WWDC 2025...
新华每日电讯:别把“韦神”的学... 一个4秒短视频,一段3句话的个人介绍,让一位朴实的青年教师在短短几天内涨粉2300万,一跃成为社交平...
英国金融监管机构与英伟达合作 ... 英国金融行为监管局(FCA)周一宣布与美国芯片制造商英伟达达成合作,将允许银行在安全环境中进行人工智...
海归科学家黄志伟:择安静一隅 ... “很多人说哈尔滨冬天冷,但正是这种气候能让人保持冷静,在年富力强的时候专心做好研究。”从海外归来入职...
Niantic Spatial... 编译/VR陀螺 以AR平台开发闻名的Niantic公司,近日分拆成立了专注于空间计算技术的新公司Ni...
谷歌All in AI的背后驱... 文 | 王智远 两个多小时,听完之后一个感受:信息量巨大。 谷歌和Alphabet的首席执行官桑达...
马斯克的“星链”已坠落近600... 今天,马斯克的“星链”卫星频繁坠落的消息在网上炸开了锅。这个原本被寄予厚望的全球互联网计划,突然变成...
和辉光电获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示和辉光电(688538)新获得一项实用新型专利授权,专利名为“...
自动行走、自动养护 智能造桥机... 湖北日报讯(记者林晶、通讯员周成臣 李鹏远)6月9日,合武高铁跨沪渝蓉高速公路特大桥上,4台智能造桥...
豪美新材获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示豪美新材(002988)新获得一项实用新型专利授权,专利名为“...
两部门:开展智能养老服务机器人... 6月9日电 据工信部网站消息,6月9日,工业和信息化部办公厅、民政部办公厅发布关于开展智能养老服务机...
小红书开源首个大模型dots.... 🤖 由 文心大模型 生成的文章摘要 上文介绍了社交平台小红书开源的大模型do 社交平台小红书,在...