苹果为自家芯片打造开源框架MLX,实现Llama 7B并在M2 Ultra上运行
创始人
2024-01-08 10:04:46
0

原标题:苹果为自家芯片打造开源框架MLX,实现Llama 7B并在M2 Ultra上运行

机器之心报道

编辑:杜伟、小舟

苹果的这个新框架 MLX 不仅拥有 PyTorch 风格的 API,还为开发者提供了很多经典示例(比如 Llama、LoRa、Stable Diffusion 和 Whisper)。

2020 年 11 月,苹果推出 M1 芯片,其速度之快、功能之强大一时令人惊艳。2022 年苹果又推出了 M2,今年 10 月,M3 芯片正式登场。

苹果在发布芯片的同时,也非常注重在其芯片上训练和部署 AI 模型的能力。

苹果推出的 ML Compute 可用于在 Mac 上进行 TensorFlow 模型的训练。PyTorch 则支持在 M1 版本的 Mac 上进行 GPU 加速的 PyTorch 机器学习模型训练,使用苹果 Metal Performance Shaders (MPS) 作为后端来实现。这些使得 Mac 用户能够在本地训练神经网络。

现在,苹果宣布推出专门在 Apple 芯片上用于机器学习的开源阵列框架 ——MLX。

MLX 是专门为机器学习研究人员设计的,旨在有效地训练和部署 AI 模型。框架本身的设计在概念上也很简单。研究人员能够轻松地扩展和改进 MLX,以快速探索、测试新的想法。MLX 的设计灵感来自 NumPy、PyTorch、Jax 和 ArrayFire 等框架。

项目地址:https://github.com/ml-explore/mlx

MLX 项目贡献者之一、Apple 机器学习研究团队(MLR)研究科学家 Awni Hannun 展示了一段使用 MLX 框架实现 Llama 7B 并在 M2 Ultra 上运行的视频。

2023-12-07 11:23·机器之心Pro

机器之心报道

编辑:杜伟、小舟

苹果的这个新框架 MLX 不仅拥有 PyTorch 风格的 API,还为开发者提供了很多经典示例(比如 Llama、LoRa、Stable Diffusion 和 Whisper)。

2020 年 11 月,苹果推出 M1 芯片,其速度之快、功能之强大一时令人惊艳。2022 年苹果又推出了 M2,今年 10 月,M3 芯片正式登场。

苹果在发布芯片的同时,也非常注重在其芯片上训练和部署 AI 模型的能力。

苹果推出的 ML Compute 可用于在 Mac 上进行 TensorFlow 模型的训练。PyTorch 则支持在 M1 版本的 Mac 上进行 GPU 加速的 PyTorch 机器学习模型训练,使用苹果 Metal Performance Shaders (MPS) 作为后端来实现。这些使得 Mac 用户能够在本地训练神经网络。

现在,苹果宣布推出专门在 Apple 芯片上用于机器学习的开源阵列框架 ——MLX。

MLX 是专门为机器学习研究人员设计的,旨在有效地训练和部署 AI 模型。框架本身的设计在概念上也很简单。研究人员能够轻松地扩展和改进 MLX,以快速探索、测试新的想法。MLX 的设计灵感来自 NumPy、PyTorch、Jax 和 ArrayFire 等框架。

项目地址:https://github.com/ml-explore/mlx

MLX 项目贡献者之一、Apple 机器学习研究团队(MLR)研究科学家 Awni Hannun 展示了一段使用 MLX 框架实现 Llama 7B 并在 M2 Ultra 上运行的视频。

重播

01:35 / 01:35

视频来源:

https://twitter.com/awnihannun/status/1732184444629647840

MLX 迅速引起机器学习研究人员的关注。TVM、MXNET、XGBoost 作者,CMU 助理教授,OctoML CTO 陈天奇转推表示:「苹果芯片又有新的深度学习框架了。」

有网友评价 MLX 称,苹果再次「重造了轮子」。

图源:https://twitter.com/ofervic/status/1732305883814596953

MLX 特性、示例

在该项目中,我们可以看到,MLX 有以下一些主要特性。

熟悉的 API。MLX 拥有非常像 NumPy 的 Python API,以及功能齐备的 C++ API(与 Python API 非常相似)。MLX 还有更高级的包(比如 mlx.nn 和 mlx.optimizers),它们的 API 很像 PyTorch,可以简化构建更复杂的模型。

可组合函数变换。MLX 拥有自动微分、自动矢量化和计算图优化的可组合函数变换。

惰性计算。MLX 中的计算是惰性的,阵列只有在需要时才被实例化。

动态图构建。MLX 中的计算图构建是动态的,改变函数参数的形状不会导致编译变慢,并且 debug 很简单、容易上手。

多设备。任何支持的设备上(如 CPU 和 GPU)都可以运行操作。

统一内存。MLX 与其他框架的显著差异在于统一内存,阵列共享内存。MLX 上的操作可以在任何支持的设备类型上运行,无需移动数据。

此外,项目中提供了多种使用 MLX 框架的示例,比如 MNIST 示例可以很好地让你学习如何使用 MLX。

图源:https://github.com/ml-explore/mlx-examples/tree/main/mnist

MLX 还有其他更多有用的示例,包括如下:

  • Transformer 语言模型训练;
  • LLaMA 大规模文本生成和 LoRA 微调;
  • Stable Diffusion 生成图片;
  • OpenAI 的 Whisper 语音识别。

更详细的文档可参阅:https://ml-explore.github.io/mlx/build/html/install.html#

相关内容

热门资讯

山东安谱检测科技取得绿原酸楂物... 金融界2025年5月10日消息,国家知识产权局信息显示,山东安谱检测科技有限公司取得一项名为“一种绿...
下一代智能体如何跨界进化 想象未来某天,你的保姆机器人接到下楼买咖啡的指令,自主完成开门、乘坐电梯、寻找便利店、取咖啡、付钱等...
原创 为... 广告作为互联网行业最经典的流量变现方式,一直都是各类产品开启商业化的首选。诸如开屏广告、信息流广告、...
重磅!新型细胞技术“治愈”糖尿... 《科创板日报》5月11日讯(记者 徐红)新型干细胞技术“治愈”糖尿病。 自去年以来业界就不断有消息...
在轨53年,苏联时代废弃航天器... 俄罗斯国家航天集团10日说,在绕地轨道运行53年后,苏联时代发射、前往金星失败的航天器“宇宙482”...
原创 五... 2025年的智能手机市场,中端价位段(2000-4000元)竞争愈发白热化,不过随着旗舰技术下放、用...
河北石家庄:推进生物医药产业高... 中新网河北新闻5月11日电 (俱凝搏 韩晓欧)在河北省石家庄经济技术开发区,走进石家庄四药集团药物研...
多措并举点亮长效回馈星辰 深市... 本报记者 田鹏 在科技发展的漫漫长夜中,通信行业恰似那熠熠生辉的启明星,始终闪耀在时代前沿,以不断突...
原创 2... 2 月,全球新能源汽车市场延续了高速增长的态势,动力电池作为核心零部件的需求持续攀升。在这一背景下,...
英伟达首款ARM超级芯片GB1... 5 月 10 日消息,科技媒体 notebookcheck 昨日(5 月 9 日)发布博文,报道称英...
助力打造人工智能先锋城市 深圳... 深圳新闻网2025年5月11日讯(深圳商报首席记者 王海荣)2025年度深圳市训力券兑现申请已正式启...
“第三届未来口腔生物材料前沿论... “第三届未来口腔生物材料前沿论坛” 在西安成功举办 阳光讯 (记者 郑亚雷 )5月9—10日,由香港...
湖南先导新材料申请三氯化铱制备... 金融界2025年5月10日消息,国家知识产权局信息显示,湖南先导新材料科技有限公司申请一项名为“一种...
李大潜:从18分逆袭到应用数学... 在中国应用数学领域,李大潜的名字如同一把“万能钥匙”——他既能在导弹轨迹方程中破解国防密码,也能蹲在...
拓展应用场景 提供创新方案 在当今新技术突破加速带动产业变革的浪潮中,中国人工智能技术发展迅速、应用场景不断拓展。从德国的工厂、...
星启蚌埠 箭指苍穹 蚌埠召开商... 共谋商业航天发展大计,共拓未来产业广阔蓝海。5月10日,中国·蚌埠商业航天产业发展大会在蚌埠市禹会区...
重庆康佳光电申请弱化结构专利,... 金融界2025年5月10日消息,国家知识产权局信息显示,重庆康佳光电科技有限公司申请一项名为“弱化结...
王兴兴透露:非常缺人 近日,在第六届上海创新创业青年50人论坛期间,宇树科技首席执行官、创始人王兴兴发表主旨演讲。 在论坛...
填补国内空白的“蛋白酶战士”登... 十堰智造亮相北京科博会 填补国内空白的“蛋白酶战士”登场 湖北日报讯 (记者余宽宏、通讯员顾才华、...
中山市江波龙电子申请电流校准专... 金融界2025年5月10日消息,国家知识产权局信息显示,中山市江波龙电子有限公司申请一项名为“电流校...