苹果大模型最大动作:开源M芯专用ML框架,能跑70亿大模型
创始人
2024-01-09 09:42:43
0

原标题:苹果大模型最大动作:开源M芯专用ML框架,能跑70亿大模型

萧箫 发自 凹非寺

量子位 | 公众号 QbitAI

苹果M系列芯片专属的机器学习框架,开源即爆火!

现在,用上这个框架,你就能直接在苹果GPU上跑70亿参数大模型、训练Transformer模型或是搞LoRA微调。

它由苹果官方发布,风格与PyTorch相似,不过并不基于任何已有框架实现。

LeCun等大佬纷纷赶来点赞转发。

英伟达高级AI科学家Jim Fan赞叹称:

这应该是目前苹果在开源AI开源上最大的动作了。

甚至还有网友动起了iPhone上A芯的念头(手动狗头)

所以,这个框架究竟长啥样?

参考多个ML框架设计

这个新框架名叫MLX,有探索机器学习(ml-explore)的意思。

从功能来看,MLX主要有以下几点特性:

API熟悉(包括C++ API、类似NumPy的Python API以及一些高级功能包近似于PyTorch的API)、可组合函数变换、惰性计算、动态图构建、多设备可用、统一内存。

框架作者Awni Hannun介绍,之所以MLX不直接基于PyTorch实现,主要有几个方面的考量。

首先是因为,MLX框架是给苹果芯片设计的。

苹果芯片在采用了一些独特的设计,例如统一内存,这些设计在框架中都可以被利用。

然后,MLX框架也参考了不同机器学习框架的优势,包括NumPy、PyTorch、Jax和ArrayFire等。

例如JAX中可组合的函数转换,就被加进了MLX的设计中,但graph(计算图)仍然是动态构建的。

除此之外,作者认为MLX也有一些属于自己的特性,如简单、灵活和多样性等。

因此,MLX在功能和设计上与PyTorch等经典框架不完全一样,有一些“自己的style”。

如果你手上有苹果M芯电脑的话,现在就可以上手一试跑AI模型了。

苹果电脑M系列芯片才能用

目前,官方给出了5类MLX的使用参考案例:

  • Transformer架构语言模型的训练
  • 用LLaMA或Mistral进行长文本生成
  • 用LoRA进行参数微调
  • 用Stable Diffusion进行图像生成
  • 用Whisper进行语音识别

作者们还在GitHub上放出了基于Stable Diffusion对比的PyTorch和MLX的性能:

要是对这几个AI模型感兴趣,装好MLX之后就可以直接上手试玩了。

作者给出了一系列手把手的教程,教你如何在苹果电脑上运行MLX框架。

首先是pip install mlx,安装一下框架:

我们也在苹果M芯电脑上尝试了一下,可以成功安装:

值得一提的是,安装前记得检查一下你的苹果电脑,各种环境和操作系统是否都搞好了。

而且芯片必须是苹果自研的M系列芯片,可以用这个口令检查一下:

如果是英特尔平台,也是用不了MLX的:

搞定之后,git clone一个副本,就可以在样例里面找到自己想玩的模型,尝试上手运行了:

这里跑一个LLaMA试试:

然后就可以开始问问题了,例如波尔查诺-魏尔斯特拉斯定理是什么等等,LLaMA就能在终端给你解答:

LightningAI的Sebastian Raschka表示,这个框架看起来非常酷,希望能看到更多PyTorch与MLX在macOS上的性能对比。

除此之外,LLaMA在MLX上的实现细节也非常有意思:

还有不少苹果用户表示高兴:H100稀缺的情况下,终于可以用M3 Max来搞事了。

你试用过MLX了吗?感觉如何?

参考链接:

[1]https://github.com/ml-explore/mlx

[2]https://twitter.com/awnihannun/status/1732184443451019431

点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~

相关内容

热门资讯

正商服务与郑州联通合作 接入联... 观点网讯:正商服务携手郑州联通智慧城市军团,就物业服务AI生态达成合作,并在5月22日成功签约,标志...
智元机器人新一轮融资,京东参投 日前,京东、上海具身智能基金参与了智元机器人的新一轮融资,此外,包括上汽在内的多家老股东也进行了增资...
杨德龙:中美在科技领域呈现出你... 中美在顶尖科技领域现在可以说是你追我赶,各有千秋。最近英伟达创始人黄仁勋在接受采访时也表示,中国在科...
声通科技(02495.HK)与... 2025年5月19日,乌兹别克斯坦塔什干——在华为云TechWave峰会2025上,声通科技(024...
英媒:符合美国监管要求背景下,... 【环球时报特约记者 甄翔】路透社25日报道称,美国人工智能(AI)巨头英伟达拟新推出一款专门面向中国...
安全+数智 AI赢未来 C3安... 在数字化与智能化持续交汇合流、虚实世界加速重构的当下,网络安全产业既迎来焕新发展的历史机遇,更肩负生...
胸外科微创 上海技术“全球共享... 在日前开幕的2025上海科技节上,上海市肺科医院两大医疗技术突破引发关注——当微创技术在国际舞台持续...
泛基因组干货 | 动植物基因组... Highlights 1.泛基因组整合物种内所有个体基因组信息,蕴含的遗传多样性远超单一参考基因组,...
科学天团开讲!7位大咖在成都叩... 改变世界的每一次创新 都源自一次面对未知的追问 屈原问天 用173个问题叩问万物 李冰问水 巴蜀有了...
海口新添一中试实验平台及国际科... 记者郭萃 党朝峰 5月25日上午,海南微智高端医疗器械中试实验平台及国际科技成果转化中心项目在海口国...
江苏京创申请工作台自调平相关专... 金融界2025年5月24日消息,国家知识产权局信息显示,江苏京创先进电子科技有限公司申请一项名为“工...
iPhone 新系统「阳光房」... 距离苹果发布传闻中「十年来风格最大更新」的 iOS 19,只剩下半个月左右的时间。 而今天彭博社的通...
解锁SDN:软件定义网络,重塑... 网络变革的新时代 在过去的几十年里,网络技术经历了翻天覆地的变化,深刻地影响着我们的生活、工作和社会...
共绘未来视界|中国移动元宇宙和... 5月23日,由中国移动集团公司科技创新部指导,中国移动咪咕公司主办,咪咕新空承办的“元链新篇·生态共...
斯普瑞取得纸张对齐装置专利,使... 金融界2025年5月24日消息,国家知识产权局信息显示,惠州市斯普瑞新材料科技有限公司取得一项名为“...
手机轻轻一晃就进广告,还有人不... 上班路上,想查看车辆信息点开交通信息APP,却跳转到某电商购物平台;闲暇时间,点开视频APP煲剧,却...
京东,投了稚晖君 5月24日,从国家企业信用信息公示系统获悉,京东和上海具身智能基金参与了智元机器人新一轮融资,上汽旗...
持续至6月1日,怀柔科技周上新... 怀柔区委宣传部供图 5月24日,2025年怀柔区科技周主题活动在怀柔科学城城市客厅举办。活动通过“...
祝贺!我国又成功攻克一项技术难... 中国团队攻克钙钛矿规模化生产技术难题 我国企业和高校创新团队提出太阳能电池材料钙钛矿的涂层革新技术,...
【高质量发展调研行】玉屏一座无... 5月19日,玉屏侗族自治县贵福菌业发展有限公司菌包生产车间,多台大型自动化设备正高效进行菌包的定量包...