“Transformer挑战者”Mamba,用Macbook也能跑了!GitHub半天斩获500+星
创始人
2024-01-09 04:04:44
0

原标题:“Transformer挑战者”Mamba,用Macbook也能跑了!GitHub半天斩获500+星

克雷西 发自 凹非寺

量子位 | 公众号 QbitAI

“Transformer的挑战者”Mamba,用MacBook也能跑了!

有大佬在GitHub上共享了一份笔记,让人们可以用最简单的方式运行Mamba。

这份共享中,算上说明书一共只有三个文件,而且发布不到一天,就斩获了500+星标。

Mamba是一种新的大模型架构,在语言任务上的表现可以与两倍规模的Transformer一决雌雄。

但官方给出的只有模型文件,需要一定专业知识才能部署使用,而且要Linux+N卡才能运行。

有了这份笔记,Mamba的运行步骤大大简化,而且也不再要求N卡,M系列的MacBook也能跑了。

从事相关专业的网友看了表示,这种简单化的模型实在是太棒了,希望自己的工作也能朝着这个方向进展。

原版Mamba的作者Tri Dao和Albert Gu也转发了这份笔记,并对它的简洁性和易读性给予了肯定。

那么,这份笔记该如何使用呢?

两个文件即可运行

首先,打开一个能运行PyTorch笔记的工具,比如Jupyter、VSCode,或者在线的谷歌Colab等。

然后下载作者的笔记和Python脚本,用Colab的话也可以使用GitHub导入功能。

如果在本地运行,需要把两个文件放到同一个目录;如果用Colab,则需要在连接成功后把model.py上传。

如果不上传,会出现“找不到‘model’”的报错

之后是安装所需的依赖环境,Colab需要手动安装的是einops,其他工具可以根据报错信息判断缺少的依赖。

!pip install 需要安装的依赖名称

解决好依赖问题后,就可以点击笔记第一组中的运行按钮了,这里可以对模型规模进行选择,默认370M。

接下来是初始化,直接点击运行按钮即可。

这里也可以对输出token的数量进行调节,默认是50。

接着,笔记中给出了一些实例,我们也可以修改单引号之间的prompt内容(换行用\n表示),然后点击运行。

不过需要注意的是,这里的prompt和我们平时用ChatGPT等bot型应用的方式有所区别。

这里可以借用一下Hugging Face中Llama 2的系统提示词:

Below are a series of dialogues between various people and an AI assistant. The AI tries to be helpful, polite, honest, sophisticated, emotionally aware, and humble-but-knowledgeable. The assistant is happy to help with almost anything, and will do its best to understand exactly what is needed. It also tries to avoid giving false or misleading information, and it caveats when it isn’t entirely sure about the right answer. That said, the assistant is practical and really does its best, and doesn’t let caution get too much in the way of being useful.

User: 想问的问题

Assistant:

性能上,在默认的规模和输出长度(370M,50token)下,输入Once Upon a time,在纯CPU版Colab中需用时约1分钟,在TPU上的用时则约为30秒,内存消耗在3到4GB之间。

在M1芯片的Mac上,以相同设置处理同样的内容,则需花费1分半左右。

不过作者也解释道,出于易读性的考虑,去掉了原版Mamba中的一些加速指令。

参考链接:

https://news.ycombinator.com/item?id=38708730

点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~

相关内容

热门资讯

商业化路径渐明,家用机器人赛道... 相比于还未见到商业化曙光的通用人形机器人,家用机器人赛道公司正在排队融资和IPO。据港交所6月8日披...
M5白炭黑开创未来的革命材料之... 近年来,M5白炭黑作为一种全新的革命性材料,在各个领域得到了广泛的应用和高度的赞誉。M5白炭黑是一种...
太钢焦化环保数据监控平台成功投... 近日,由山西宝信承接的太钢焦化环保数据监控平台项目成功投入运行。该平台深度整合在线监测、物联网及大数...
腾势N8L无人机版官图发布,配... 6月9日消息,腾势官方发布了一组腾势N8L无人机版的官图。新车搭载灵鸢·比亚迪智能车载无人机系统,预...
免ROOT云手机破解版推荐:低... 咱游戏党都懂,手机配置拉胯、挂机老中断有多抓狂!但最近挖到宝了——免ROOT云手机破解版,低配机也能...
热搜!马斯克的“星链”,大批坠... 据外媒6月8日报道,埃隆·马斯克的太空探索技术公司发射的“星链”卫星接连坠落。 由美国国家航空航天局...
大模型 token 太贵了?苹... 去年 WWDC 上,被苹果过度宣传又放了鸽子的苹果智能 (Apple Intelligence),余...
马斯克的“星链” 卫星大批坠落... 据北京日报,援引6月8日参考消息,埃隆・马斯克的太空探索技术公司(SpaceX)发射的 “星链” 卫...
国产 AI 初创企业硅基流动完... IT之家 6 月 9 日消息,国内 AI 初创企业硅基流动(SiliconFlow)今日发文宣布,已...
任正非最新发声:在掌声与困境中... 来源|中访网 责编|何怡然 在深圳华为总部,一场与任正非的对话,如同一扇窗,让我们得以窥见华为在复杂...
海尔智家获得发明专利授权:“烹... 证券之星消息,根据天眼查APP数据显示海尔智家(600690)新获得一项发明专利授权,专利名为“烹饪...
未上市即遭山寨,老头乐版“小米... IT之家 6 月 9 日消息,博主 @韩路 发布视频,展示了一款酷似小米 YU7 的“老头乐”车型,...
亿纬锂能获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示亿纬锂能(300014)新获得一项实用新型专利授权,专利名为“...
智慧环卫系统平台解决方案(40... 方案聚焦智慧环卫系统平台,旨在借助物联网、大数据等技术,解决传统环卫管理中的人员、车辆、事件管理难题...
人民日报专访任正非:说我们好,... 6月10日,《人民日报》头版刊发文章《国家越开放,会促使我们更加进步——对话任正非》。 全文如下: ...
国产带压作业“神器”助力涪陵页... 日前,记者从涪陵页岩气公司获悉,该公司打破国外技术垄断而研发的国产化防顶回式堵塞器,目前已在焦页69...
天文学家:在距离地球很近的地方... 在距离地球仅300光年的地方,一个巨大的分子云悄然漂浮在太阳系的边缘。 2025年初,以Blakes...
华能水电获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示华能水电(600025)新获得一项实用新型专利授权,专利名为“...
visionOS 26 全面升... IT之家 6 月 10 日消息,苹果公司在 visionOS 26 中,将对 Apple Visio...
苹果iOS 26发布 AirP... 快科技6月10日消息,今日,苹果正式发布全新操作系统iOS 26,为AirPods带来录音棚级录音和...