苹果推出开源AI语言模型OpenELM 加速生成式AI发展
创始人
2024-04-28 19:38:26
0

原标题:苹果推出开源AI语言模型OpenELM 加速生成式AI发展

苹果公司最近发布了一个开源的大型语言模型OpenELM,旨在推动生成式人工智能技术的发展。这一模型通过Hugging Face平台公布,采用分层扩展技术,有效提高了文本生成的效率和准确性。

苹果释出 AI 开源大型语言模型 OpenELM

苹果为了加速生成式 AI 领域发展,提前通过开源 AI 平台 Hugging Face 发表「OpenELM」具有开源的高效率文本生成模型家族,OpenELM采用了分层扩展(layer-wise scaling)技术策略,能在模型的每一层中有效分配参数,能让 OpenELM 转换器具有不同的配置与参数,近而够提高准确性。

苹果表示OpenELM是使用神经网络库CoreNet作为训练框架,并且搭配 Adam 优化演算法进行35万次模型训练,连同苹果MobileOne、CVNets、MobileViT、FastVit等知名研究也同样都是靠CoreNet完成。

OpenELM分别为4款经过预训练以及4款针对指令优化调校过的版本,在参数规模也分成2.7亿、4.5亿、11亿和30亿四种参数,每款规模也都比起高性能模型(70亿参数)要来得更小,比起微软 Phi-3 模型 38亿更小。

外媒指出,对于OpenELM训练资料全来自维基百科、Wikiboos、Reddit、arXivx论文、StackExchange 问答,以及 GitHub 的 RedPajama 资料集、Project Gutenberg等公共资料集,总计有1.8兆 tokens 的数据进行训练。

仅管OpenELM以开源许可证发布,并没有过度的限制,但苹果明确表示,任何基于 OpenELM 的衍生作品都将被视为侵犯权利,苹果保留提出专利索赔的权利。

OpenELM 模型小、性能表现优异

苹果分享的 OpenELM 模型特别是 4.5 亿参数的变体效能表现相当优异,另外 11 亿参数的 OpenELM 变体性能表现方面,也超越具备艾伦人工智能研究所所发布的开源大型语言模型 OLMo,预训练 token 数量减少一半,OpenELM 在性能比 OLMo 提高 2.36%。

至于 30 亿参数的 OpenELM 变体,在经由 ARC-C 基准测试中,知识和推理能力准确率达到了 42.24%,且 MMLU 和 HellaSwag 得分也分别获得 26.76% 和 73.28%。

虽然苹果的 OpenELM 模型在 AI 领域算不上是最顶尖,在回应也被多方证实相当可靠,与人类思考逻辑几乎一致,也能实现小参数达到超强性能。但是苹果 AI 模型在创造力方面,OpenELM 就容易出现稍显不足情况。

OpenELM 支持iPhone或Mac电脑独立运作

苹果在 OpenELM 公开说明中提到「将模型转换为 MLX 资料库的程式码,以便在苹果设备上进行推理和微调」,其中MLX是去年释出能在苹果芯片上运行机器学习的框架,能够在非连网络状态下,直接通过苹果设备本机执行。

苹果一直都是封闭系统领导者,如今罕见公开 AI 大模型,外界认为这有可能就类似 Google 操作方式,先通过开源拉拢开发人员,再利用封闭产品进行商业化。

如今苹果选在 WWDC 2024 开发者大会前,对外释出大模型用来展现将进军 AI 领域的决心,那也代表 iOS 18 和 iPhone 16 新机将导入 AI 功能应用将成为今年最热门的话题。

相关内容

热门资讯

洋旺机电取得轧机用板带夹送矫直... 金融界2025年7月18日消息,国家知识产权局信息显示,石家庄洋旺机电技术有限公司取得一项名为“一种...
AI超级联赛,何以落户广西? 中新网南宁7月18日电(记者 杨陈)近期全国各地高温热浪持续。在广西南宁,即将于7月19日启动的AI...
REDMI 15C曝光,多款新... 最近,关于REDMI后续新机的消息开始陆续出现。 最新的消息显示,一款型号为 2508CRN2BC ...
机器狗有什么作用?看完这些应用... 近日,一则“国产四足机器人打破沉寂十年世界纪录”的新闻,再次引发全球对国产四足机器人的关注。无独有偶...
原创 两... 现如今消费者对“性价比”的追求愈发极致,一加ACE5以旗舰级配置下放至2000元档的策略,成为202...
龙江森工集团:“一棚果”结出产... 人民网哈尔滨7月18日电 盛夏时节,龙江森工集团林区各地的设施棚室内生机盎然,一颗颗即将成熟的果实缀...
上海天文馆推暑期档重磅特展:听... 今天上午,上海天文馆B1临展厅,金石声划破静默,20片陨铁切片在磬锤敲击下震颤,清越悠长的音阶层层回...
奠基开工!延庆再建低空技术新基... 7月18日,“低空技术智能组装及配套设施项目”开工奠基仪式在中关村延庆园举行。项目的启动标志着园区继...
东丽这个社区开展“青少年探秘机... 随着科技的飞速发展,机器人逐渐走进了青少年的生活。手机中的语音助手、电视上的智能棋手,甚至是孩子们手...
北京大学国际医院成立预住院中心... 7月18日,北京大学国际医院成立预住院中心。该中心通过整合术前检验、麻醉评估、健康宣教等关键环节,将...
国内首台国产A320五级飞行训... 7月18日,春秋航空携手本土民航科技企业莱特科技,正式交付国内首台国产A320五级飞行训练设备,以丰...
月球车模型制作活动在涡阳县博物... 为纪念1969年7月20日人类第一次登月成功,每年的7月20日被定为人类月球日。中国人“九天揽月”的...
Roblox更新失败,更新不了... 当玩家沉浸于Roblox这个广受赞誉的创意虚拟空间时,时常面临更新失败,更新不了或无法完成升级等困扰...
安卓部门负责人:计科专业需“重... IT之家 7 月 18 日消息,据《商业内幕》今日报道,谷歌安卓部门负责人 Sameer Samat...
快应用智慧服务生态支持智能体一... 随着人工智能技术的快速发展,AI智能体正逐步成为新一代服务交互的核心形态。与此同时,开发者对高效、轻...
再造一个鲁塘矿区!湖南郴州微晶... 记者近日从湖南省地质院下属湖南省地球物理地球化学调查所(以下简称“湖南省地质院物化所”)获悉,该所通...
原创 i... 在今年的iOS 26发布之前,国外小有名气的视频账号FrontPageTech(简称fpt.)连发了...
适航标准再进一步!T1400无... 7月15日至18日,中国民.航局型号合格审查组专家在哈尔滨组织召开联合飞机《T1400型无人直升机系...
奇树有果取得卡牌天地盖全自动成... 金融界2025年7月18日消息,国家知识产权局信息显示,杭州奇树有果科技有限公司取得一项名为“一种卡...
嫦娥六号样品或包含月球原始月壳... 月球正面和背面为什么不同,一直是个谜。科学家认为,早期月球像个滚烫的岩浆海,冷却时,富含钙的斜长岩因...