欢迎阅读 OSCHINA 编辑部出品的开源日报——您探索和理解开源世界的日常指南。在这里,我们每天从宏观到微观,全面展现开源技术和文化的动态图景。
每日一更,风雨无阻。
OpenSource Daily # 2024.6.7省流概览
01 阿里云发布全球最强开源 LLM “Qwen2”
02 Kubernetes 十周年
05 SJTUG 下架 Docker Hub 镜像
06 西工大在 RISC-V 设计中发现可远程利用的中危漏洞
07 国内的开源模型就是一直很行
08 921 芯级回收和载人登月器的着陆算法
09AI 会怎么写今年高考作文
10 AI 时代,苹果真的落后了?
11 被扒用 OpenAI 牟私利, Altman 到底在下哪一盘棋?
12 硬件软件背道而驰,港股当前的主线逻辑是什么?
今日要闻
阿里通义千问 Qwen2 大模型开源发布
6 月 7 日凌晨,阿里云更新技术博客:重磅发布全球性能最强的开源模型 ——Qwen2-72B,据称性能超过美国最强的开源模型 Llama3-70B,也超过文心 4.0、豆包 pro、混元 pro 等众多中国闭源大模型。亮点如下:
- 5 个尺寸的预训练和指令微调模型,包括 Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B 以及 Qwen2-72B;
- 在中文英语的基础上,训练数据中增加了 27 种语言相关的高质量数据;
- 多个评测基准上的领先表现;
- 代码和数学能力显著提升;
- 增大了上下文长度支持,最高达到 128K tokens(Qwen2-72B-Instruct)。
SJTUG(上海交通大学 Linux 用户组)下架 Docker Hub 镜像
Kubernetes 十周年
Kubernetes 的历史始于 2014 年 6 月 6 日的那次历史性提交,随后是 Google 工程师 Eric Brewer 在 2014 年 DockerCon 的 6 月 10 日主题演讲中宣布该项目(以及相应的 Google 博客)。
在接下来的一年里,主要来自 Google 和红帽的小型贡献者社区努力工作,最终在 2015 年 7 月 21 日发布了 1.0 版本。与 1.0 版同时,Google 宣布 Kubernetes 将捐赠给 Linux 基金会的一个新分支 —— 云原生计算基金会(CNCF)。
西工大在 RISC-V 设计中发现可远程利用的中危漏洞
西北工业大学(简称 “西工大”)近日发布新闻稿,称该校网络空间安全学院胡伟教授团队在 RISC-V SonicBOOM 处理器设计中挖掘出中危漏洞。据了解,该团队的研究人员在开源处理器架构 RISC-V 设计中发现了一个可远程利用的中危漏洞。它在 4 月 24 日报告给了国家计算机网络应急技术处理协调中心 (CNCERT),5 月 24 日公开了更多细节。
西工大官方新闻稿称,这是国内首个自主挖掘的 RISC-V 处理器设计上可远程利用的中危漏洞,也是国内首个处理器硬件安全领域国家重点研发计划项目 —— 纳米级芯片硬件综合安全评估关键技术研究的重要进展。
今日观察社交观察
AI 的未来在哪里?
AI 的未来在哪里?或者说,如何避开和 chatgpt 为首的基座大模型正面竞争?
RAG 不是。RAG 是最容易上手的方向,本地知识库没什么门槛,应用场景也很浅。RAG 的地位类似于 web1.0 的 cms 一样,是个 LLM 工程师就得会的基本功。
AI agent 是。function call 是个好东西,多模交互是个好东西,ReAct 更是个好东西。有了它们就有了贾维思的条件,连上硬件更可以得到幻视!问题的关键是,如果 chatgpt 这种基座大模型公司自己下场做 agent 呢?注意,chatgpt 有最聪明的 LLM,通过 gpts 它还有最全的 tools,gpt4-o 证明它还有最强的多模交互。做通用型的 agent 就像做通用大模型一样,一定干不过 chatgpt 这种公司。
- 微博真阿当
国内的开源模型就是一直很行,国际上口碑也不错
在通用大模型里,国内发布的开源大模型也一直算是开源模型里第一梯队的。
比较有名的是 Qwen 系列大模型,Qwen 的技术团队从去年夏天到现在一直在持续参与更新。系列模型里即有适合个人折腾玩的模型,也有超过千亿参数的大模型。去年发布的 Qwen-72B 口碑炸裂(产品发布的推文两千多赞),今年又连续推出了 1.5 版本的升级版,特别是还有 110B 这个参数过千亿的版本,吊打 Llama2,口碑和 Mistral 的 MoE 模型差不多。
- 微博蚁工厂
通义千问 2 的 700 亿参数版本果然好用
我也手动测试了几个之前的 bad case,结果都是对的(见图 2 和图 3)。。提升巨大,我们现在用大模型处理数据的场景还是蛮多的,比如要标注笔记的正负面,标注对话数据的甲乙方,标注文章里面提到的品牌名称,地名等等。现在开源的大模型真是福音,方便我们这种有大量数据处理业务的企业了。
又安排员工把之前发现的其他大模型跑数据遇到的 bad case 都跑一遍,发现这一版通义千问在其他大模型跑出的 bad case 里面的表现正确率超过了 75.2% (当然也有一些是错的,见图 4)。其他大模型跑通过的 case 里面正确率达到 99%。因为我们是有正确答案的,比较好统计,其实我可以给各家大模型在数据标注方面做测评啊,是不是又一个发财的机会啊。。
- 微博梁斌penny
AI 会怎么写今年高考作文
分享一下让 AI 写高考作文的 Prompt 技巧吧,希望对你用大模型写其他文章也有帮助。
1. 先给他评分标准,告诉 AI 什么样的作文能得高分。(这里从网上搜一下高考作文评分标准,拷贝到你的提示词里)
2. 不要让 AI 直接写,先让他根据上面的提示词和作文要求,写出 AI 的写作思路,每一段怎么写,以及具体有哪些技巧可以。
3. 让 AI 根据写作思路来生成作文正文。
4. (可选项)让 AI 检查下自己的作文,是否符合上面的评分标准,列出可以改进的地方
5. (可选项)让 AI 根据检查的结果,修改作文,生成最终的作文稿。
- 微博蚁工厂
今年信息最给力的 paper——DeepSeekV2
【大模型扩吞吐】#CacheKV 压缩 又添一员,MLA(Multi-head Latent Attention),低秩 KV 压缩;
1. 动机:压缩 CacheKV 的好处:①Cache 小了就可加速 MHA 计算 ②memory 省下来了可以加大 batch 增吞吐;
2. 标准 CacheKV 的大小:每个 k 和 v 的大小都是 ${n_h * d_h * t},即 head 头数 (如 8) * k 和 v 的特征维数 (如 1024) * 序列长度;
- 微博Rachel____Zhang
自己写的 921 芯级回收和载人登月器的着陆算法
全部都是 KSP-RSS/RO 仿真模拟条件下,燃料效率优先的算法。(非常屎山)
这是最基本的代码,有理由相信 SpaceX 其实在着陆船着陆的那部分使用了 G-Flop 算法(开源,网上有)。而猎鹰 9 和 Ss/Sh 星舰系统使用的更多依赖发射前模拟,把数据和坐标三维信息 Mapping 到控制器里的方式来控制火箭的,而不是飞行器实时根据自身状态计算的。(当然可能最后驳船着陆有可能有一部分 G-Flop 算法)
- 微博赵若泓rhZhao
你应该问 HR 什么问题
我觉得你至少要问四个问题。
第一:我们公司过去一两年晋升或者加薪的员工,都是因为什么原因晋升或者加薪的?
第二:咱们公司鼓励跨部门合作吗?有多少跨部门合作?
第三个问题:咱们公司员工平均年龄多少?
第四个问题:咱们公司过去一两年离职的人,他们平均在公司任期多长?
- 微博思维螺旋
媒体观察
全球最强开源模型 Qwen2 发布,阿里云为开闭源之争画下休止符
阿里云在 1 个月前刚刚发布中文场景性能超过 GPT-4 的闭源模型 —— 通义千问 2.5,从这个角度来看开闭源的路线选择,阿里云实际上是两条腿走路。既利用开源的优势进行广泛的技术传播和创新,又通过闭源的方式保障关键技术的领先和商业应用的稳定。这种类似于双轨制的策略,使得阿里云能够在技术创新和商业化应用中取得平衡,实现技术价值的最大化。
所以,开源与闭源并不矛盾,而是在不同的场景和需求下扮演着各自独特的角色,这并不是一道非此即彼的选择题,也是时候为两者的路线之争画下休止符了。
- 品玩
面向更大市场,重视合规发展,中国 AI 大模型正加速 “出海”
2023 年,知名人工智能模型中 15 个在中国。截至今年 3 月份,中国 10 亿参数规模以上的大模型数量已超 100 个,行业大模型深度赋能电子信息、医疗、交通等领域。得益于中国大模型市场的快速发展,AI 出海的趋势愈发明显。无论是大厂还是初创企业,纷纷把目光投向海外。
-环球时报
英伟达盘中 “闪崩” 近 6%!美国监管机构将展开反垄断调查,
耶伦发出 AI “重大风险” 警告
耶伦在演讲中透露,人工智能与金融稳定是拜登政府高度重视的话题,“在未来几年只会变得更加重要”。金融公司使用人工智能带来的 “巨大机遇和重大风险” 已成为美国财政部和金融稳定监督委员会的首要议题。
-每日经济新闻
智能经济 未来可期
攻克关键核心技术。应用算法、智能芯片、开源框架…… 人工智能关键核心技术是行业发展的重中之重。国家发展改革委经济运行调节局局长黄勇建议,要加快建立关键共性技术攻关体系,打造国有企业、民营企业、高校及科研院所等广泛参与的产学研用创新联合体,着力实现算力芯片、高带宽内存等关键元器件的突破,加快突破人工智能关键核心技术。
-人民日报海外版
AI 时代,苹果真的落后了?
人们似乎已习惯了苹果引领着行业,对苹果跟风别人嗤之以鼻。因此,相同的功能,苹果做得比其它公司更强,理所应当;在无人区里,苹果点燃了一盏不熄灭的油灯,才是大众所期待的结果。
若是从苹果的角度来说,iPhone 的销售额仍然占据苹果公司的 50% 以上,拿走了全球智能手机利润都 85%。苹果比任何人都希望 AI 上机后,能帮助 iPhone 卖得更好。尤其是在 Apple Car 项目取消,Vision Pro 失利的前提之下。
-品玩
硬件软件背道而驰,港股当前的主线逻辑是什么?
交银国际发表报告指出,今年人工智能(AI)基础设施建设或将进一步加速,并建议投资者关注芯片在计算、存储和通信以及数据中心服务器等机会。该行认为,今年上半年市场表现符合预期,展望人工智能基础设施的旺盛需求或在下半年继续,而半导体或持续分化。
-港股研究社
为什么说国产大模型的野心,都藏在 MaaS 的生态中
如果说,过去是单一算法找场景,拿着锤子找钉子,算法无法解决整体问题,导致除了人脸识别、自动驾驶外,明星场景寥寥。
MaaS 则意味着,在承认企业的需求不同、数字化能力不同的基础上,通过大模型的通用性以及生态优势,来解决这千变万化需求。
一定程度上,这是场技术你追我赶的闪电战,更是场生态与商业的持久战。
-极客公园
黄仁勋深度访谈:十年时间,我是怎么带领 2.8 万人超越苹果的?
前不久,黄仁勋与美国移动支付巨头 Stripe CEO 帕特里克・克里森(Patrick Collison)进行了一场企业家之间的深度对谈,不仅畅聊自己曲折的成长史、与 AMD 董事长兼 CEO 苏姿丰的亲戚关系,而且点名夸奖 Llama 系列模型的重大意义和自己日常爱用的 AI 工具。黄仁勋还大谈管理经验,包括 60 位高管如何向他汇报、怎么安排日常工作、为何坚持不裁员,以及大家最关心的 —— 这位兼具工作狂魔与魅力型领导者特质的创业者,当初如何做出卓有远见的判断,带领英伟达 2.8 万人走向伟大的成功?
-芯东西
被扒用 OpenAI 牟私利, Altman 到底在下哪一盘棋?
有没有一种可能,OpenAI 的 CEO 才是 Altman 的 “副业”,而投资则是他的主业。
从这个角度思考,Sam Altman 何尝不是用一笔笔投资,建立一个未来的 AI 帝国。
-36氪
今日推荐
开源项目
cyberbotics/webots
https://github.com/cyberbotics/webots
Webots 是用于模拟机器人的开放源代码和多平台桌面应用程序。它提供了一个完整的开发环境来对机器人进行建模,编程和仿真。
每日一博
万字长文详解降本增效利器 PikiwiDB (Pika) 混合存储原理
在大型键值(kv)存储系统中,用户访问的数据通常呈现明显的冷热分布特性。所谓热数据,即那些被频繁访问的数据;而冷数据则相反,它们被访问的频率极低。为了提高数据访问的效率,降低读取耗时,关键在于如何让热数据更多地驻留在内存层,减少不必要的磁盘 I/O 操作。
https://my.oschina.net/dubbogo/blog/11207232
开源之声
用户观点
被美国列入制裁 “实体清单”的西工大——
在开源处理器架构 RISC-V 中发现可远程利用的中危漏洞
阿里云发布全球最强开源 LLM “Qwen2”:
- 观点 1:这个漏洞怕不是故意留的吧!!!
- 观点 2:你去 kimi 问问 龙芯有过安全漏洞没有。堵上就好。谁能保证设计的处理器 不经大量使用验证天生是安全的 。
- 观点 3:普及下,我们用的是一套架构规范,这种架构规范全世界也在使用。架构规范的意思人家提出来了一套方案,具体实现你自己来做。任何方案都是有漏洞的,包括英特尔,amd 他们的芯片架构都有。唯一避免漏洞的办法就是彻底不再使用电脑。千万不要阴谋论啊。
- 观点 4:这就是开源的好处
- 观点 5:这玩意好像还没有流片。
- 观点 6:换道超车,不是弯道
性能超越众多闭源模型、火速登顶 HuggingFace
Java Solon v2.8.3 发布(打破 Java 资源浪费的传统印象)
- 观点 1:这个和那个前几天刚发布的 glm4 哪个好啊
- 观点 2:国内一概不用,全是阉割的,我用 rwkv
- 观点 3:RWKV 也是中国团队搞的。。
- 观点 4:以后应该加入普通人的测试体验,现在的榜单,好像不太真实
- 观点 5:我都不敢想这后面的算法工程师一个月能挣多少钱
- 观点 6:和 GPT4 哪个好
- 观点 7:专业性强的问题,这两货都会瞎扯鸡爹蛋。但 GPt 在英文语料上有更好的答案,因为专业问题,很多只有英文社区才有答案
- 观点 8:手机跑不了一点
- 观点 9:为啥要手机看能跑?手机是天吗?顶天万把元的消费级玩具而已。
- 观点:1:开放原子开源基金会孵化了,赞
- 观点 2:同时有开源版和收费版的一般开源版就是被放弃的命
- 观点 3:mysql 好像一直就是 社区版 + 企业版。
- 观点 4:你为何如此高产 (」゜ロ゜)」
程序员梗图
END
References
https://www.oschina.net/news/296212
https://mp.weixin.qq.com/s/304kiYO11G4-s-WliwtEJw
https://mp.weixin.qq.com/s/uFnUKx0CSpwDYeLiu28gtw
https://mp.weixin.qq.com/s/cVV1x3bBe0cwjc_M4SyK2Q
https://weibo.com/1659574154/OgEgP0YGB
https://weibo.com/2194035935/OhSY2FLn7
https://weibo.com/2194035935/OhRAoqPBp
https://weibo.com/2607574543/OhN61jNUD
https://weibo.com/6572777608/OhKeQfWPG
https://weibo.com/6462113764/OhQPGqq3A
https://weibo.com/1497035431/OhRFmjW19
https://mp.weixin.qq.com/s/awahQdDTstsOLPdFjhqGkw
https://mp.weixin.qq.com/s/s_Vb8pSvGNZ2r3LUs-rbkQ
https://www.pingwest.com/a/295558
https://36kr.com/p/2808370830367104
https://mp.weixin.qq.com/s?__biz=MTMwNDMwODQ0MQ==&mid=2653043410&idx=1&sn=f9b6d2fcd71933c51e4c566efff78fed&chksm=7e5747644920ce72fe672716b4d84dae5603e5bb99b7ad5082773c3e793b1905594dd02553a0#rd
https://finance.sina.com.cn/stock/hkstock/2024-06-06/doc-inaxuuky4934289.shtml?cref=cj
https://a.mp.uc.cn/article.html?uc_param_str=frdnsnpfvecpntnwprdssskt&&from=media#!wm_cid=624245632145562624!!wm_aid=9398043376486855099!!wm_id=466168ece9a641cd925a1a05b1de7e6a
https://finance.sina.com.cn/jjxw/2024-06-07/doc-inaxwhnm5448668.shtml?cref=cj
https://m.huanqiu.com/article/4I6Se61TWdy
https://github.com/cyberbotics/webots
https://my.oschina.net/dubbogo/blog/11207232
https://www.oschina.net/news/296031/solon-2-8-3-released
https://mp.weixin.qq.com/s/Ro345yw3EKLSN-QolfCuHw
https://mp.weixin.qq.com/s/uFnUKx0CSpwDYeLiu28gtw
最后,欢迎扫码下载「开源中国 APP」
阅读海量技术报告、程序员极客分享