苹果为自家芯片打造开源框架MLX,实现Llama 7B并在M2 Ultra上运行
创始人
2024-01-08 10:04:46
0

原标题:苹果为自家芯片打造开源框架MLX,实现Llama 7B并在M2 Ultra上运行

机器之心报道

编辑:杜伟、小舟

苹果的这个新框架 MLX 不仅拥有 PyTorch 风格的 API,还为开发者提供了很多经典示例(比如 Llama、LoRa、Stable Diffusion 和 Whisper)。

2020 年 11 月,苹果推出 M1 芯片,其速度之快、功能之强大一时令人惊艳。2022 年苹果又推出了 M2,今年 10 月,M3 芯片正式登场。

苹果在发布芯片的同时,也非常注重在其芯片上训练和部署 AI 模型的能力。

苹果推出的 ML Compute 可用于在 Mac 上进行 TensorFlow 模型的训练。PyTorch 则支持在 M1 版本的 Mac 上进行 GPU 加速的 PyTorch 机器学习模型训练,使用苹果 Metal Performance Shaders (MPS) 作为后端来实现。这些使得 Mac 用户能够在本地训练神经网络。

现在,苹果宣布推出专门在 Apple 芯片上用于机器学习的开源阵列框架 ——MLX。

MLX 是专门为机器学习研究人员设计的,旨在有效地训练和部署 AI 模型。框架本身的设计在概念上也很简单。研究人员能够轻松地扩展和改进 MLX,以快速探索、测试新的想法。MLX 的设计灵感来自 NumPy、PyTorch、Jax 和 ArrayFire 等框架。

项目地址:https://github.com/ml-explore/mlx

MLX 项目贡献者之一、Apple 机器学习研究团队(MLR)研究科学家 Awni Hannun 展示了一段使用 MLX 框架实现 Llama 7B 并在 M2 Ultra 上运行的视频。

2023-12-07 11:23·机器之心Pro

机器之心报道

编辑:杜伟、小舟

苹果的这个新框架 MLX 不仅拥有 PyTorch 风格的 API,还为开发者提供了很多经典示例(比如 Llama、LoRa、Stable Diffusion 和 Whisper)。

2020 年 11 月,苹果推出 M1 芯片,其速度之快、功能之强大一时令人惊艳。2022 年苹果又推出了 M2,今年 10 月,M3 芯片正式登场。

苹果在发布芯片的同时,也非常注重在其芯片上训练和部署 AI 模型的能力。

苹果推出的 ML Compute 可用于在 Mac 上进行 TensorFlow 模型的训练。PyTorch 则支持在 M1 版本的 Mac 上进行 GPU 加速的 PyTorch 机器学习模型训练,使用苹果 Metal Performance Shaders (MPS) 作为后端来实现。这些使得 Mac 用户能够在本地训练神经网络。

现在,苹果宣布推出专门在 Apple 芯片上用于机器学习的开源阵列框架 ——MLX。

MLX 是专门为机器学习研究人员设计的,旨在有效地训练和部署 AI 模型。框架本身的设计在概念上也很简单。研究人员能够轻松地扩展和改进 MLX,以快速探索、测试新的想法。MLX 的设计灵感来自 NumPy、PyTorch、Jax 和 ArrayFire 等框架。

项目地址:https://github.com/ml-explore/mlx

MLX 项目贡献者之一、Apple 机器学习研究团队(MLR)研究科学家 Awni Hannun 展示了一段使用 MLX 框架实现 Llama 7B 并在 M2 Ultra 上运行的视频。

重播

01:35 / 01:35

视频来源:

https://twitter.com/awnihannun/status/1732184444629647840

MLX 迅速引起机器学习研究人员的关注。TVM、MXNET、XGBoost 作者,CMU 助理教授,OctoML CTO 陈天奇转推表示:「苹果芯片又有新的深度学习框架了。」

有网友评价 MLX 称,苹果再次「重造了轮子」。

图源:https://twitter.com/ofervic/status/1732305883814596953

MLX 特性、示例

在该项目中,我们可以看到,MLX 有以下一些主要特性。

熟悉的 API。MLX 拥有非常像 NumPy 的 Python API,以及功能齐备的 C++ API(与 Python API 非常相似)。MLX 还有更高级的包(比如 mlx.nn 和 mlx.optimizers),它们的 API 很像 PyTorch,可以简化构建更复杂的模型。

可组合函数变换。MLX 拥有自动微分、自动矢量化和计算图优化的可组合函数变换。

惰性计算。MLX 中的计算是惰性的,阵列只有在需要时才被实例化。

动态图构建。MLX 中的计算图构建是动态的,改变函数参数的形状不会导致编译变慢,并且 debug 很简单、容易上手。

多设备。任何支持的设备上(如 CPU 和 GPU)都可以运行操作。

统一内存。MLX 与其他框架的显著差异在于统一内存,阵列共享内存。MLX 上的操作可以在任何支持的设备类型上运行,无需移动数据。

此外,项目中提供了多种使用 MLX 框架的示例,比如 MNIST 示例可以很好地让你学习如何使用 MLX。

图源:https://github.com/ml-explore/mlx-examples/tree/main/mnist

MLX 还有其他更多有用的示例,包括如下:

  • Transformer 语言模型训练;
  • LLaMA 大规模文本生成和 LoRA 微调;
  • Stable Diffusion 生成图片;
  • OpenAI 的 Whisper 语音识别。

更详细的文档可参阅:https://ml-explore.github.io/mlx/build/html/install.html#

相关内容

热门资讯

厦门普诚半导体取得翻转上料装置... 金融界2025年7月21日消息,国家知识产权局信息显示,厦门普诚半导体科技有限公司取得一项名为“一种...
格式化的U盘数据能恢复吗?U盘... 在日常工作和生活中,U盘凭借其小巧便携、传输速度快的特点,成为了我们存储和转移数据的重要工具。里面常...
宇宙神秘物体穿越星系,引发天文... 近日,天文界传出一则令人瞩目的消息,一个神秘物体在遥远的星系间以惊人的速度穿梭,引发了广泛关注和热烈...
场景汇加速科创成果在河北省落地... 原标题: 为技术找场景,为场景找技术 场景汇加速科创成果全省落地开花 日前,在白洋淀元妃荷园码头,随...
江西丰强取得一种边坡防护锚杆专... 金融界2025年7月21日消息,国家知识产权局信息显示,江西丰强科技发展有限公司取得一项名为“一种边...
原创 美... 2023年5月30日,在全国人民的期待和关注下,我国自主研发的神舟十六号载人飞船成功发射升空,标志着...
东锋材料取得高效的液氮除毛边装... 金融界2025年7月21日消息,国家知识产权局信息显示,东锋材料科技(苏州)有限公司取得一项名为“一...
饥饿营销?英伟达H20被曝供应... 科技媒体《The Information》当地时间7月19日爆料称,美国科技巨头英伟达已告知中国客户...
心言集团心元大模型算法工程师:... 近日,心言集团高级算法工程师、心元大模型核心贡献者之一颜鑫接受阿里通义千问的采访,作为00后模型开发...
华为官宣鸿蒙旗舰平板新品发布 ... 一直以来,华为MatePad Pro从硬件实力,再到软件生态,都能为用户带来出色的生产力体验。7月2...
台风“韦帕”来袭,成都至深圳、... 今年第6号台风“韦帕”已于7月19日夜间加强为台风级,7月20日早晨5时,其中心位于广东省珠海市东偏...
原创 发... 咱人类对宇宙的好奇,那可是打从心底里就有的。小时候,我总喜欢在夏夜的院子里,躺在凉席上,望着满天繁星...
浙江锐鹰取得超薄型分体式编码器... 金融界2025年7月21日消息,国家知识产权局信息显示,浙江锐鹰传感技术股份有限公司取得一项名为“一...
华瑞医疗首台量产128Max高... 2025年7月20日,华瑞医疗科技(山西)有限公司在其位于晋中山西大学城的CT生产基地隆重举行首台量...
我国首台高时空分辨布里渊显微镜... 2025-07-21 08:20:50 作者:狼叫兽 我国在科研仪器研发领域再次取得重要突破。由...
原创 五... 丁江洲 中国人体工程学研究院书记 在文明的熔炉中,伦理精神的思想体系如同待锻的精钢,既承载着历史的厚...
“韦帕”台风眼即将打开,今天下... 本文转自【广州日报】; 今天的台风来势汹汹! “韦帕台风眼已打开” 话题一度冲上热搜 @中国天气 ...
烧钱、抢矿、挖人!本周,AI好... 7月17日,第三届链博会先进制造链主题活动现场,英伟达公司创始人兼首席执行官黄仁勋与之江实验室主任、...
沉金板工艺对焊接影响大揭秘 —... 作为电子工程师,在设计和制造线路板时,选择合适的表面处理工艺至关重要。今天我们来聊聊沉金板工艺,探讨...
备案成功!八月瓜科技“创新大脑... 在互联网技术飞速发展的当下,算法已成为驱动各行业创新发展的核心动力,但其合规应用也愈发受到国家和社会...