苹果取得技术突破:可在 iPhone 上运行大型语言模型
创始人
2024-01-09 05:48:18
0

原标题:苹果取得技术突破:可在 iPhone 上运行大型语言模型

IT之家 12 月 21 日消息,苹果的人工智能研究人员表示,他们已取得一项重大突破,通过一种创新的闪存利用技术,成功地在内存有限的 iPhone 和其他苹果设备上部署了大型语言模型(LLM)。这一成果有望让更强大的 Siri、实时语言翻译以及融入摄影和增强现实的尖端 AI 功能登陆未来 iPhone。

近年来,像 ChatGPT 和 Claude 这样的 LLM 聊天机器人风靡全球。它们能够进行流畅的对话、撰写不同风格的文本,甚至生成代码,展现出强大的语言理解和生成能力。然而,这些模型有一个致命弱点:它们极其“吃”数据和内存,普通手机根本无法满足其运行需求。

为了突破这一瓶颈,苹果研究人员开辟了一条新路,将目光投向了手机中普遍存在的闪存,也就是储存应用和照片的地方。在题为“闪存中的 LLM:利用有限内存实现高效的大型语言模型推理(LLM in a flash: Efficient Large Language Model Inference with Limited Memory)”的论文中,研究人员提出了一种巧妙的闪存利用技术,将 LLM 模型的数据存储在闪存中。作者指出,与传统用于运行 LLM 的 RAM 相比,闪存在移动设备中更为丰富。

IT之家注意到,他们的方法巧妙地利用两种关键技术绕过限制,从而最小化数据传输并最大化闪存内存吞吐量:

  • 窗口化(Windowing):可以将其视为一种回收利用的方法。AI 模型不会每次都加载新数据,而是会重复使用部分已处理的数据。这减少了频繁读取内存的需要,让整个过程更加流畅高效。
  • 行-列捆绑(Row-Column Bundling): 这种技术类似于你读一本书时,不是逐字逐句地阅读,而是成段地阅读。通过更有效地分组数据,可以从闪存中更快地读取数据,从而加速 AI 理解和生成语言的能力。

论文指出,这项技术可以让 AI 模型的运行规模达到 iPhone 可用内存的两倍。这意味着标准处理器 (CPU) 的速度提高了 4-5 倍,图形处理器 (GPU) 的速度提高了 20-25 倍。“这一突破对于在资源有限的环境中部署先进的 LLM 至关重要,极大地扩展了它们的适用性和可访问性,” 研究人员写道。

更快更强的 iPhone AI

人工智能效率的突破为未来的 iPhone 开辟了新的可能性,例如更先进的 Siri 功能、实时语言翻译以及摄影和增强现实中复杂的 AI 驱动功能。该技术还为 iPhone 在设备上运行复杂的人工智能助手和聊天机器人奠定了基础,据悉苹果已经开始着手这项工作。

苹果开发的生成式 AI 最终可能被整合到其 Siri 语音助手中。2023 年 2 月,苹果举办了人工智能峰会,并向员工介绍了其大型语言模型工作。据彭博社报道,苹果的目标是打造一个更智能的 Siri,与 AI 深度集成。苹果计划更新 Siri 与信息应用程序的交互方式,让用户能够更有效地处理复杂问题和自动完成句子。除此之外,传闻苹果还计划将 AI 添加到尽可能多的苹果应用程序中。

Apple GPT:口袋里的超级大脑

据报道,苹果正在研发自己的生成式 AI 模型,代号为“Ajax”,旨在与 OpenAI 的 GPT-3 和 GPT-4 竞争,拥有 2000 亿个参数,暗示其在语言理解和生成方面具有高度复杂性和强大的能力。Ajax 在内部被称为“Apple GPT”,旨在统一苹果机器学习开发,这表明苹果将 AI 更深入地整合到其生态系统中。

据最新报道,Ajax 被认为比早期的 ChatGPT 3.5 更加强大。然而,一些消息人士也指出,OpenAI 的新模型可能已经超越了 Ajax 的能力。

The Information 和分析师 Jeff Pu 均声称,苹果将在 2024 年底左右,也就是 iOS 18 发布之时,在 iPhone 和 iPad 上提供某种形式的生成式 AI 功能。Pu 在 10 月份表示,苹果将在 2023 年建设数百台 AI 服务器,2024 年还将建设更多服务器。据报道,苹果将提供云端 AI 和设备端处理 AI 相结合的解决方案。

相关内容

热门资讯

全国首单!低空检测设备保险在渝... 5月24日,上游新闻记者获悉,全国首单低空航空器机载检测设备损失补偿保险同时在重庆、雄安两地落地,为...
科普建筑的“阿鹏哥哥”:做沉淀... 新华社北京5月23日电 5月23日,《新华每日电讯》发表题为《科普建筑的“阿鹏哥哥”:做沉淀下来播撒...
鸟类声纹识别系统 鸟类鸣声数据... 鸟类声纹识别系统背景 生物多样性是人类生存和社会发展的基础,是生态文明建设和民族永续发展的保障;生物...
甲骨文400亿美元购英伟达芯片... 【5000 亿美元“星际之门”项目首站:甲骨文 400 亿美元助力 OpenAI 打造全球最大 AI...
传统与现代辉映 科技与文化交融... 来源:光明网-《光明日报》 “今年文博会上,咖啡师都变机器人啦!不但能现磨咖啡豆,还能做手冲、拉花咖...
驼峰500HS全球首发,获30... 重庆驼航科技在第十届深圳国际无人机展览会上,以“驼峰,特种低空物流先锋”为主题,完成驼峰500HS纵...
山西征集申报2025年度国家科... 5月20日,省科技厅下发通知,征集申报2025年度国家科学技术奖项目(人选)。 征集奖种为: 国家最...
原创 全... 2021年,全球首个活体机器人成功“生娃”,这一突破性的科研成果引发了广泛关注,人们惊叹于科技的飞速...
特朗普AI顾问叫嚣:荷兰继续对... 据路透社报道,当地时间5月23日,白宫人工智能和加密货币事务负责人戴维·萨克斯叫嚣,限制向中国出售极...
AI隐私风暴升级 智谱清言、K... 《科创板日报》5月22日讯(记者 李明明 黄心怡)热门AI应用再卷入隐私安全风暴。 国家网络与信息安...
原创 A... 在人工智能加速重构商业格局的关键节点,山东正和岛于5月14日成功举办 AI 先锋大课。此次大课以 《...
极为罕见!中国天眼有重要发现 日前,中国科学院国家天文台韩金林研究员带领团队利用中国天眼FAST发现了一个罕见的毫秒脉冲星,与伴星...
小米汽车回应YU7门把手冬天冰... 【CNMO科技消息】近日,随着小米YU7热度不断攀升,消费者对其在极寒天气下的使用表现,尤其是门把手...
晶合集成获得发明专利授权:“半... 证券之星消息,根据天眼查APP数据显示晶合集成(688249)新获得一项发明专利授权,专利名为“半导...
龙腾光电获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示龙腾光电(688055)新获得一项实用新型专利授权,专利名为“...
珠海超俊科技取得显影件和显影盒... 金融界2025年5月23日消息,国家知识产权局信息显示,珠海超俊科技有限公司取得一项名为“显影件和显...
Meta:2025年Meta ... 今天分享的是:Meta:2025年Meta Al移动应用出海增长白皮书 报告共计:112页 《202...
华沿S50大负载机器人在深发布 深圳商报•读创客户端 记者 潘文婷 5月23日,华沿机器人“共铸华章·沿创未来”全球合作伙伴大会在深...
原创 华... 5月24日知名数据调研公司Counterpoint对2025年第一季度国内智能手机市场进行了一个简单...
如何看待ARM官网上显示小米玄... 从技术合作的角度来看,ARM官网内容引发争议的核心在于对“定制”概念的理解差异。根据搜索结果,ARM...