不用加大内存,iPhone也能运行端侧大模型了
创始人
2024-01-08 18:31:14
0

原标题:不用加大内存,iPhone也能运行端侧大模型了

2023年科技圈最热的概念无疑非AI大模型莫属,不仅是国内的阿里、百度、腾讯,海外的微软、Meta、谷歌、亚马逊都参与其中,就连做硬件的手机厂商如今似乎也在试图讲述一个AI赋能的故事。此前,vivo的蓝心大模型已经在S18、X100系列上运行、三星的Gauss大模型也即将出现在Galaxy S24系列上,OPPO拿出了AndesGPT、荣耀方面有荣耀魔方大模型,谷歌的Gemini同样也有端侧运行的Gemini Nano。

就在Android阵营的友商纷纷开始搞起端侧大模型的时候,苹果方面自然也不甘落后。日前,苹果公司的人工智能相关研究人员就表示,在将大模型部署到iPhone和其他内存有限的苹果设备上取得了关键性突破,他们们发明了一种创新的闪存利用技术,可用于存储大模型的数据,以应对内存限制的问题。

苹果方面在一篇题为《LLM in a flash: Efficient Large Language Model Inference with Limited Memory》的论文中,就介绍了一种可以在超出可用DRAM容量的设备上运行大模型的方法。其构建了一个以闪存为基础的推理成本模型,并使用窗口化(Windowing)以及行列捆绑(Row-Column Bundling)两项关键技术,来最小化数据传输和最大化闪存吞吐量。

其中,窗口化让苹果的大模型不会每次都加载新的数据,而是重复使用部分已处理的数据。行列捆绑技术则是通过更有效地分组数据,让大模型从闪存中更快的读取数据。其实这项新技术在某种意义上来说,更像是他们刚刚发布的MLX框架的延伸。而MLX则是一个全新的机器学习框架,目的是可以在苹果的芯片上更高效的运行各种机器学习模型,与其他框架的一个显著区别就是统一内存模型。

换而言之,在过去一年里,苹果方面并没有对这股AI大模型的热潮无动于衷,而是在默默根据自身产品的特质来打造适合的大模型。在更小内存规模的基础上运行端侧大模型、而非扩大未来设备的内存规格,这就是苹果方面给出的答案。

至此,几乎所有主流手机厂商也都加入了将端侧大模型部署到手机上的行列。

为什么这些手机厂商会对端侧大模型感兴趣呢?用小米集团AI实验室主任、自然语言处理(NLP)首席科学家王斌此前在接受媒体采访时曾表示,“等到春节左右,有人觉得至少要动手去做了,这个风暴来了,我们做技术的肯定不能置身事外,如果不入局就会在竞争当中处于不利的位置”。

毫无疑问,手机行业的现状大家都很清楚,衰退已经持续了很长一段时间,因此各大厂商也都在期待如全面屏一般引爆这个市场的新概念。

此外,端侧大模型也很好的承载了手机厂商对于新技术点燃消费者换机热情的期望,并且他们相信人工智能会使得手机能够帮助用户实现更多的功能。但相比于运行在云端的大模型,端侧大模型的隐私泄露和数据安全风险则大幅降低,此外端侧大模型还有个性化、定制化的潜力,能够用于解决特定场景的问题。

更妙的是,端侧大模型也意味着手机会对用户需求的理解更上一层楼,远非目前名为智能助手、实则“人工智障”的功能可比肩。再加上,如果端侧大模型可以控制和调用别的应用,就好像谷歌的AI Core一般,那么未来手机厂商和第三方应用之间的格局可能就会迎来天翻地覆的改变,手机厂商或将拥有实质上影响第三方应用的能力,这背后的利益可就无法估量了。

只不过相比于其他手机厂商,苹果想要在iPhone上部署端侧大模型的难度其实更高。目前,手机上已经有了不少端侧大模型可供用户体验,但在实际使用过程中,抛开Android系统本身的占用,8GB内存的机型一旦运行端侧大模型几乎就什么都干不了。事实上,内存对于大模型的性能有着至关重要的作用,比如AMD刚刚发布的AI芯片MI300系列,就正是主打大内存高带宽。

此前已经有人使用搭载苹果M系列芯片的机型运行大模型,测试的结果是统一内存可以让芯片运行更大规模的大模型,可缺点就是由于内存带宽低,使得推理速度不那么理想。即便苹果没有拿出新的相关技术,实际上iPhone也能运行端侧大模型,但结果是推理速度可能用户会无法忍受。而最小化数据传输、并最大化闪存吞吐量,就刚好能够解决这个问题。

目前,iPhone 15和iPhone 15 Plus均配备的是6GB内存 ,iPhone 15 Pro和iPhone 15 Pro Max则提升至8GB内存。现阶段外界推测,为了在iPhone上运行端侧大模型,苹果方面很可能会给iPhone 16系列新机加大内存配置。但苹果设备的内存价格是众所周知的,继续给iPhone加内存的结果可能就会使得其售价进一步上涨。

要知道,上一次iPhone大规模涨价的结果还是将市场份额拱手让人,所以在如今Android旗舰的产品力不断追赶的情况下,苹果方面不太可能实施涨价。与此同时,大模型的底层技术Transformers架构其实就是基于分层推理的,而分层加载调度又是当下优化内存的主要方式,因此两者结合就是苹果所给出的解决方案。

这样看来,苹果方面为了不加内存而爆发的潜能,着实是让人惊叹。

相关内容

热门资讯

联想集团董事长杨元庆:打造超级... 在AI领域,智能体炙手可热,其代表着更高的智能水平,用户下达一项任务,就能理解、规划并调用各类软件执...
三环集团获得发明专利授权:“一... 证券之星消息,根据天眼查APP数据显示三环集团(300408)新获得一项发明专利授权,专利名为“一种...
中国人工智能企业50强,南京企... 5月11日 2025福布斯中国人工智能科技企业TOP50 榜单评选结果正式发布 南京1家企业上榜! ...
原创 2... 年轻用户更喜欢“尝鲜”,感受新技术带来的新鲜感,每当新手机发布的时候,就会第一时间入手。但也有部分用...
英媒惊叹中国科技崛起:马斯克、... 中国科技快速进步 北京时间5月16日,英国《金融时报》专栏作家西蒙·库珀(Simon Kuper)周...
新宙邦获得发明专利授权:“铝电... 证券之星消息,根据天眼查APP数据显示新宙邦(300037)新获得一项发明专利授权,专利名为“铝电解...
时光相册·“唤醒”旧时光|电报... 编者按:时间,像一条大河,不停地往前奔流。老照片,宛如一座桥,让我们能够回到记忆中的彼岸。然而老照片...
英维克取得流体连接器专利,可使... 金融界2025年5月16日消息,国家知识产权局信息显示,深圳市英维克智能连接技术有限公司取得一项名为...
量子纠缠:超越时空的宇宙连接之... 来自:书海文途 第一重天:太虚之海的涟漪 当混沌初开时,太虚之海便以幽蓝星辉凝成三千世界。那些在凡俗...
穿越古今探星河,AI互动展天文... 5月16日,南京市紫金山天文台博物馆迎来了一场别开生面的展览——“星瀚万象——天文与科技的交融诗章”...
雪迪龙获得实用新型专利授权:“... 证券之星消息,根据天眼查APP数据显示雪迪龙(002658)新获得一项实用新型专利授权,专利名为“吸...
焦点科技获得发明专利授权:“一... 证券之星消息,根据天眼查APP数据显示焦点科技(002315)新获得一项发明专利授权,专利名为“一种...
雷军憋了个大招,再次回应SU7... 花朵财经观察出品 撰文丨华见 “做芯片九死一生。” 5月15日晚,小米董事长兼CEO雷军在微博上称,...
数字孪生赋能智慧能源管理解决方... 在能源系统复杂度与运营压力同步攀升的当下,传统能源管理依赖人工经验与离散数据的模式,逐渐暴露出响应滞...
原创 A... AI诈骗已从低级骗局升级为国家级威胁!美国联邦调查局(FBI)近日拉响警报,黑客利用AI语音克隆技术...
小隼智创取得具有防脱功能的快装... 金融界2025年5月16日消息,国家知识产权局信息显示,深圳市小隼智创科技有限公司取得一项名为“一种...
运达智储科技取得一种转运辅助工... 金融界2025年5月16日消息,国家知识产权局信息显示,运达智储科技(河北)有限公司;运达能源科技集...
人形机器人批量进厂“实习”,资... 魔法原子近期获得新一轮数亿元战略投资,计划今年生产400台人形机器人,放到工厂、商业场景试用。几天前...
新宙邦获得发明专利授权:“一种... 证券之星消息,根据天眼查APP数据显示新宙邦(300037)新获得一项发明专利授权,专利名为“一种非...
TDK加速推出第三代硅阳极电池... 【太平洋科技快讯】近日,日本电子元件制造商TDK宣布,其第三代硅阳极电池量产计划将提前至2025年6...