AI与iPhone结合?苹果最新论文给出突破性方案
创始人
2024-01-08 23:45:54
0

原标题:AI与iPhone结合?苹果最新论文给出突破性方案

c苹果GPT就在你口袋里?这或许会更快成为现实。

苹果人工智能(AI)研究人员近日在预印本网站arXiv上发表了一篇论文,其中提到了一种创新的“闪存利用”技术,可以在iPhone和其他内存有限的苹果设备上部署大型语言模型(LLM),这几乎是一项重大突破。

内存的约束

基于LLM的聊天机器人(如ChatGPT、Claude等)都非常依赖于数据和内存,其需要同时处理的数据量非常庞大,往往需要大量内存才能运行。

因此运行LLM对于DRAM(一般指内存)容量有限的iPhone等设备来说是一个挑战。

通常,运算数据标准的方法是将闪存中的数据加载到DRAM中,再在DRAM中进行数据推理。

性能水平高的DRAM可以让数据处理的速度提升数百万倍,然而,弊端在于容量上。在DRAM上运行严重限制了可以运行的最大模型大小。

为了解决这个问题,苹果公司的研究人员开发了一种新技术,使用容量较大的闪存(flash memory)来存储人工智能模型的数据,再在需要时在将数据调入DRAM内存中来处理。

在闪存上存储AI

在一篇题为《flash中的LLM:有限内存下的高效大型语言模型推理》的新研究论文中,作者指出,移动设备中的闪存比传统上用于运行LLM的内存更加丰富。

这种方法巧妙地绕过了容量限制。改论文提出了两项关键技术,最大限度地减少数据传输、并最大限度地提高闪存处理能力

其一叫做“窗口化(windowing)”技术,相当于一种回收方法。AI模型不需要每次都加载新数据,而是重新使用一些已经处理过的数据。这减少了对不断获取内存的需求,使过程更快更平滑。

其二叫做“行-列捆绑(Row-Column Bundling)”技术。该技术是通过更有效地分组数据,即针对闪存的数据特征制定访问数据块的顺序,可以更快地从闪存中读取数据,加快人工智能理解和生成语言的能力。

根据这篇论文,这些方法的结合使人工智能模型的运行容量达到iPhone可用内存的两倍。这意味着该方法下,CPU中的推理速度较传统加载方式提高了4-5倍,GPU中的推理速度提高了惊人的20-25倍。

该论文作者写道,“这一突破对于在资源有限的环境中部署先进的LLM尤其重要,从而扩大了它们的适用性和可及性。”

苹果的AI战略

人工智能效率的突破为未来的iPhone打开了新的可能性,比如更先进的Siri功能、实时语言翻译、复杂的人工智能驱动的摄影和增强现实功能。

论文中的新技术还为iPhone在设备上运行复杂的人工智能助手和聊天机器人奠定了基础,据说苹果已经在开发这方面的技术。

苹果在生成式人工智能方面的工作最终可能会被整合到其语音助手Siri中。苹果在今年2月的人工智能峰会上,向员工介绍了其大型语言模型的工作。据媒体此前报道,苹果的目标是推出与人工智能深度集成的智能版Siri。

还有传言称苹果计划在尽可能多的苹果应用程序中添加人工智能。

除此之外据报道,苹果还正在开发自己的生成式人工智能模型“Ajax”,其在2000亿个参数上运行,为了与OpenAI的GPT-4模型相抗衡。

内部称为“Apple GPT”的Ajax旨在统一整个苹果的机器学习开发,这突显了苹果将人工智能更深入地融入苹果生态系统的更广泛战略。

根据最新的报告,Ajax被认为比早期的ChatGPT 3.5更强大。然而,2023年9月OpenAI推出的新模型GPT-4可能已经超越了Ajax的能力。

果链分析师Jeff Pu曾指出,苹果将在2024年底左右在iPhone和iPad上推出某种生成式人工智能功能,届时iOS 18将会包含这项功能。Pu还表示,苹果将在2023年建造几百台人工智能服务器,2024年还会有更多。

来源:财联社

相关内容

热门资讯

群星闪耀时:2025年世界互联... 世界互联网大会杰出贡献奖 2024年的乌镇,小桥流水激荡创新能量,船橹荡开闪耀璀璨星光:首届世界互联...
AI+补拍技术调查:谁在为“不... 作者|阿Po 如果说AI技术在影视行业的价值,一度被视为“创作辅助”与“降本提效”,那么刚刚收官的仙...
登封创威取得硅碳棒焊接用真空烧... 金融界2025年5月19日消息,国家知识产权局信息显示,登封市创威碳化物制品有限公司取得一项名为“一...
山东飞宏取得矩形箍筋焊接机器人... 金融界2025年5月19日消息,国家知识产权局信息显示,山东飞宏工程机械有限公司取得一项名为“一种矩...
科技赋能 激活阅读新体验 “书香河南|青少年阅读与AI素养提升计划”正式启动 4月29日,由河南广播电视台主办,河南省教育人...
原创 事... 消息人士透露,特朗普政府正在起草自己的替代方案,可能会转向与各国单独磋商协议。美国商务部负责工业和安...
雷军:小米自研芯片采用第二代3... 5月19日,小米董事长雷军通过微博发文,小米战略新品发布会定在5月22日晚7点,这次重磅新品特别多手...
美国废除《人工智能扩散规则》 ... 近日,美国商务部工业安全局(BIS)进行了一项重大政策调整,在撤销此前拜登政府推出《人工智能扩散规则...
华为首款鸿蒙折叠电脑,HUAW... 5月19日,华为在nova 14系列及鸿蒙电脑新品发布会上连发两款鸿蒙电脑,包括首款鸿蒙折叠电脑HU...
国产替代新标杆!易通5G嵌入式... 在5G基站建设浪潮中,深圳股份有限公司,凭借其自主研发的,5G嵌入式电源系统,成为国产替代的领军企业...
腾讯混元图像2.0模型来了,A... 智东西 作者 | ZeR0 编辑 | 漠影 智东西5月16日报道,今日,腾讯发布最新混元图像2.0模...
云手机网页版有什么用?小白必看... 上班族的摸鱼神器来了!云手机网页版直接在浏览器里开挂——游戏全天自动刷装备、多账号办公一键切换,重要...
探月工程再传喜讯 鹊桥二号中继... 新华社合肥5月19日电 记者19日从深空探测实验室获悉,鹊桥二号中继星自2024年3月20日发射,目...
苏州大学讲席教授王尧:文科最大... 在人工智能与人形机器人的一骑绝尘中,中国大学迎来2025。 2025年,注定要成为变革的年份。是以战...
探访“三体计算星座”“诞生地”... 5月19日,之江实验室内展示的“三体计算星座”星载智能计算机。近日,中国首个整轨互联太空计算星座“三...
湖北省农科院专家到巴东开展科研... 云上恩施报道(通讯员 冯繁文)近日,湖北省农业科学院植保土肥研究所向礼波研究员,率领技术团队深入巴东...
张朝阳谈AI发展:科技进步带来... 中国日报5月19日电(记者 樊菲菲) 2025搜狐科技年度论坛近日在北京举办。多位院士、科学家与产业...
人工智能与储备货币的黄金标准 黄金是唯一没有对手风险的货币。网络货币本质上意味着你在挖比特币的时候使用的是能源标准。我们对网络货币...
陕西移动西安分公司:用心用情创... 一次细致的检修;一次暖心的搀扶;一次耐心的解答……陕西移动西安分公司始终将“心级服务”理念落到实处,...
探月工程鹊桥二号中继星取得阶段... 鹊桥二号中继星自2024年3月20日发射,目前已在轨稳定运行14个月,其携带的3台载荷在完成在轨测试...