开源日报 | Qwen2开源;Docker Hub镜像被下架;K8s十周年;西工大发现RISC-V漏洞;国内开源模型一直很行
创始人
2024-06-08 00:02:00
0

欢迎阅读 OSCHINA 编辑部出品的开源日报——您探索和理解开源世界的日常指南。在这里,我们每天从宏观到微观,全面展现开源技术和文化的动态图景。

每日一更,风雨无阻。

OpenSource Daily # 2024.6.7省流概览

01 阿里云发布全球最强开源 LLM “Qwen2”

02 Kubernetes 十周年

05 SJTUG 下架 Docker Hub 镜像

06 西工大在 RISC-V 设计中发现可远程利用的中危漏洞

07 国内的开源模型就是一直很行

08 921 芯级回收和载人登月器的着陆算法

09AI 会怎么写今年高考作文

10 AI 时代,苹果真的落后了?

11 被扒用 OpenAI 牟私利, Altman 到底在下哪一盘棋?

12 硬件软件背道而驰,港股当前的主线逻辑是什么?

今日要闻

阿里通义千问 Qwen2 大模型开源发布

6 月 7 日凌晨,阿里云更新技术博客:重磅发布全球性能最强的开源模型 ——Qwen2-72B,据称性能超过美国最强的开源模型 Llama3-70B,也超过文心 4.0、豆包 pro、混元 pro 等众多中国闭源大模型。亮点如下:

- 5 个尺寸的预训练和指令微调模型,包括 Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B 以及 Qwen2-72B;

- 在中文英语的基础上,训练数据中增加了 27 种语言相关的高质量数据;

- 多个评测基准上的领先表现;

- 代码和数学能力显著提升;

- 增大了上下文长度支持,最高达到 128K tokens(Qwen2-72B-Instruct)。

SJTUG(上海交通大学 Linux 用户组)下架 Docker Hub 镜像

Kubernetes 十周年

Kubernetes 的历史始于 2014 年 6 月 6 日的那次历史性提交,随后是 Google 工程师 Eric Brewer 在 2014 年 DockerCon 的 6 月 10 日主题演讲中宣布该项目(以及相应的 Google 博客)。

在接下来的一年里,主要来自 Google 和红帽的小型贡献者社区努力工作,最终在 2015 年 7 月 21 日发布了 1.0 版本。与 1.0 版同时,Google 宣布 Kubernetes 将捐赠给 Linux 基金会的一个新分支 —— 云原生计算基金会(CNCF)。

西工大在 RISC-V 设计中发现可远程利用的中危漏洞

西北工业大学(简称 “西工大”)近日发布新闻稿,称该校网络空间安全学院胡伟教授团队在 RISC-V SonicBOOM 处理器设计中挖掘出中危漏洞。据了解,该团队的研究人员在开源处理器架构 RISC-V 设计中发现了一个可远程利用的中危漏洞。它在 4 月 24 日报告给了国家计算机网络应急技术处理协调中心 (CNCERT),5 月 24 日公开了更多细节。

西工大官方新闻稿称,这是国内首个自主挖掘的 RISC-V 处理器设计上可远程利用的中危漏洞,也是国内首个处理器硬件安全领域国家重点研发计划项目 —— 纳米级芯片硬件综合安全评估关键技术研究的重要进展。

今日观察社交观察

AI 的未来在哪里?

AI 的未来在哪里?或者说,如何避开和 chatgpt 为首的基座大模型正面竞争?

RAG 不是。RAG 是最容易上手的方向,本地知识库没什么门槛,应用场景也很浅。RAG 的地位类似于 web1.0 的 cms 一样,是个 LLM 工程师就得会的基本功。

AI agent 是。function call 是个好东西,多模交互是个好东西,ReAct 更是个好东西。有了它们就有了贾维思的条件,连上硬件更可以得到幻视!问题的关键是,如果 chatgpt 这种基座大模型公司自己下场做 agent 呢?注意,chatgpt 有最聪明的 LLM,通过 gpts 它还有最全的 tools,gpt4-o 证明它还有最强的多模交互。做通用型的 agent 就像做通用大模型一样,一定干不过 chatgpt 这种公司。

- 微博真阿当

国内的开源模型就是一直很行,国际上口碑也不错

在通用大模型里,国内发布的开源大模型也一直算是开源模型里第一梯队的。

比较有名的是 Qwen 系列大模型,Qwen 的技术团队从去年夏天到现在一直在持续参与更新。系列模型里即有适合个人折腾玩的模型,也有超过千亿参数的大模型。去年发布的 Qwen-72B 口碑炸裂(产品发布的推文两千多赞),今年又连续推出了 1.5 版本的升级版,特别是还有 110B 这个参数过千亿的版本,吊打 Llama2,口碑和 Mistral 的 MoE 模型差不多。

- 微博蚁工厂

通义千问 2 的 700 亿参数版本果然好用

我也手动测试了几个之前的 bad case,结果都是对的(见图 2 和图 3)。。提升巨大,我们现在用大模型处理数据的场景还是蛮多的,比如要标注笔记的正负面,标注对话数据的甲乙方,标注文章里面提到的品牌名称,地名等等。现在开源的大模型真是福音,方便我们这种有大量数据处理业务的企业了。

又安排员工把之前发现的其他大模型跑数据遇到的 bad case 都跑一遍,发现这一版通义千问在其他大模型跑出的 bad case 里面的表现正确率超过了 75.2% (当然也有一些是错的,见图 4)。其他大模型跑通过的 case 里面正确率达到 99%。因为我们是有正确答案的,比较好统计,其实我可以给各家大模型在数据标注方面做测评啊,是不是又一个发财的机会啊。。

- 微博梁斌penny

AI 会怎么写今年高考作文

分享一下让 AI 写高考作文的 Prompt 技巧吧,希望对你用大模型写其他文章也有帮助。

1. 先给他评分标准,告诉 AI 什么样的作文能得高分。(这里从网上搜一下高考作文评分标准,拷贝到你的提示词里)

2. 不要让 AI 直接写,先让他根据上面的提示词和作文要求,写出 AI 的写作思路,每一段怎么写,以及具体有哪些技巧可以。

3. 让 AI 根据写作思路来生成作文正文。

4. (可选项)让 AI 检查下自己的作文,是否符合上面的评分标准,列出可以改进的地方

5. (可选项)让 AI 根据检查的结果,修改作文,生成最终的作文稿。

- 微博蚁工厂

今年信息最给力的 paper——DeepSeekV2

【大模型扩吞吐】#CacheKV 压缩 又添一员,MLA(Multi-head Latent Attention),低秩 KV 压缩;

1. 动机:压缩 CacheKV 的好处:①Cache 小了就可加速 MHA 计算 ②memory 省下来了可以加大 batch 增吞吐;

2. 标准 CacheKV 的大小:每个 k 和 v 的大小都是 ${n_h * d_h * t},即 head 头数 (如 8) * k 和 v 的特征维数 (如 1024) * 序列长度;

- 微博Rachel____Zhang

自己写的 921 芯级回收和载人登月器的着陆算法

全部都是 KSP-RSS/RO 仿真模拟条件下,燃料效率优先的算法。(非常屎山)

这是最基本的代码,有理由相信 SpaceX 其实在着陆船着陆的那部分使用了 G-Flop 算法(开源,网上有)。而猎鹰 9 和 Ss/Sh 星舰系统使用的更多依赖发射前模拟,把数据和坐标三维信息 Mapping 到控制器里的方式来控制火箭的,而不是飞行器实时根据自身状态计算的。(当然可能最后驳船着陆有可能有一部分 G-Flop 算法)

- 微博赵若泓rhZhao

你应该问 HR 什么问题

我觉得你至少要问四个问题。

第一:我们公司过去一两年晋升或者加薪的员工,都是因为什么原因晋升或者加薪的?

第二:咱们公司鼓励跨部门合作吗?有多少跨部门合作?

第三个问题:咱们公司员工平均年龄多少?

第四个问题:咱们公司过去一两年离职的人,他们平均在公司任期多长?

- 微博思维螺旋

媒体观察

全球最强开源模型 Qwen2 发布,阿里云为开闭源之争画下休止符

阿里云在 1 个月前刚刚发布中文场景性能超过 GPT-4 的闭源模型 —— 通义千问 2.5,从这个角度来看开闭源的路线选择,阿里云实际上是两条腿走路。既利用开源的优势进行广泛的技术传播和创新,又通过闭源的方式保障关键技术的领先和商业应用的稳定。这种类似于双轨制的策略,使得阿里云能够在技术创新和商业化应用中取得平衡,实现技术价值的最大化。

所以,开源与闭源并不矛盾,而是在不同的场景和需求下扮演着各自独特的角色,这并不是一道非此即彼的选择题,也是时候为两者的路线之争画下休止符了。

- 品玩

面向更大市场,重视合规发展,中国 AI 大模型正加速 “出海”

2023 年,知名人工智能模型中 15 个在中国。截至今年 3 月份,中国 10 亿参数规模以上的大模型数量已超 100 个,行业大模型深度赋能电子信息、医疗、交通等领域。得益于中国大模型市场的快速发展,AI 出海的趋势愈发明显。无论是大厂还是初创企业,纷纷把目光投向海外。

-环球时报

英伟达盘中 “闪崩” 近 6%!美国监管机构将展开反垄断调查,

耶伦发出 AI “重大风险” 警告

耶伦在演讲中透露,人工智能与金融稳定是拜登政府高度重视的话题,“在未来几年只会变得更加重要”。金融公司使用人工智能带来的 “巨大机遇和重大风险” 已成为美国财政部和金融稳定监督委员会的首要议题。

-每日经济新闻

智能经济 未来可期

攻克关键核心技术。应用算法、智能芯片、开源框架…… 人工智能关键核心技术是行业发展的重中之重。国家发展改革委经济运行调节局局长黄勇建议,要加快建立关键共性技术攻关体系,打造国有企业、民营企业、高校及科研院所等广泛参与的产学研用创新联合体,着力实现算力芯片、高带宽内存等关键元器件的突破,加快突破人工智能关键核心技术。

-人民日报海外版

AI 时代,苹果真的落后了?

人们似乎已习惯了苹果引领着行业,对苹果跟风别人嗤之以鼻。因此,相同的功能,苹果做得比其它公司更强,理所应当;在无人区里,苹果点燃了一盏不熄灭的油灯,才是大众所期待的结果。

若是从苹果的角度来说,iPhone 的销售额仍然占据苹果公司的 50% 以上,拿走了全球智能手机利润都 85%。苹果比任何人都希望 AI 上机后,能帮助 iPhone 卖得更好。尤其是在 Apple Car 项目取消,Vision Pro 失利的前提之下。

-品玩

硬件软件背道而驰,港股当前的主线逻辑是什么?

交银国际发表报告指出,今年人工智能(AI)基础设施建设或将进一步加速,并建议投资者关注芯片在计算、存储和通信以及数据中心服务器等机会。该行认为,今年上半年市场表现符合预期,展望人工智能基础设施的旺盛需求或在下半年继续,而半导体或持续分化。

-港股研究社

为什么说国产大模型的野心,都藏在 MaaS 的生态中

如果说,过去是单一算法找场景,拿着锤子找钉子,算法无法解决整体问题,导致除了人脸识别、自动驾驶外,明星场景寥寥。

MaaS 则意味着,在承认企业的需求不同、数字化能力不同的基础上,通过大模型的通用性以及生态优势,来解决这千变万化需求。

一定程度上,这是场技术你追我赶的闪电战,更是场生态与商业的持久战。

-极客公园

黄仁勋深度访谈:十年时间,我是怎么带领 2.8 万人超越苹果的?

前不久,黄仁勋与美国移动支付巨头 Stripe CEO 帕特里克・克里森(Patrick Collison)进行了一场企业家之间的深度对谈,不仅畅聊自己曲折的成长史、与 AMD 董事长兼 CEO 苏姿丰的亲戚关系,而且点名夸奖 Llama 系列模型的重大意义和自己日常爱用的 AI 工具。黄仁勋还大谈管理经验,包括 60 位高管如何向他汇报、怎么安排日常工作、为何坚持不裁员,以及大家最关心的 —— 这位兼具工作狂魔与魅力型领导者特质的创业者,当初如何做出卓有远见的判断,带领英伟达 2.8 万人走向伟大的成功?

-芯东西

被扒用 OpenAI 牟私利, Altman 到底在下哪一盘棋?

有没有一种可能,OpenAI 的 CEO 才是 Altman 的 “副业”,而投资则是他的主业。

从这个角度思考,Sam Altman 何尝不是用一笔笔投资,建立一个未来的 AI 帝国。

-36氪

今日推荐

开源项目

cyberbotics/webots

https://github.com/cyberbotics/webots

Webots 是用于模拟机器人的开放源代码和多平台桌面应用程序。它提供了一个完整的开发环境来对机器人进行建模,编程和仿真。

每日一博

万字长文详解降本增效利器 PikiwiDB (Pika) 混合存储原理

在大型键值(kv)存储系统中,用户访问的数据通常呈现明显的冷热分布特性。所谓热数据,即那些被频繁访问的数据;而冷数据则相反,它们被访问的频率极低。为了提高数据访问的效率,降低读取耗时,关键在于如何让热数据更多地驻留在内存层,减少不必要的磁盘 I/O 操作。

https://my.oschina.net/dubbogo/blog/11207232

开源之声

用户观点

被美国列入制裁 “实体清单”的西工大——

在开源处理器架构 RISC-V 中发现可远程利用的中危漏洞

  • 观点 1:这个漏洞怕不是故意留的吧!!!
    • 观点 2:你去 kimi 问问 龙芯有过安全漏洞没有。堵上就好。谁能保证设计的处理器 不经大量使用验证天生是安全的 。
    • 观点 3:普及下,我们用的是一套架构规范,这种架构规范全世界也在使用。架构规范的意思人家提出来了一套方案,具体实现你自己来做。任何方案都是有漏洞的,包括英特尔,amd 他们的芯片架构都有。唯一避免漏洞的办法就是彻底不再使用电脑。千万不要阴谋论啊。
  • 观点 4:这就是开源的好处
  • 观点 5:这玩意好像还没有流片。
  • 观点 6:换道超车,不是弯道
阿里云发布全球最强开源 LLM “Qwen2”:

性能超越众多闭源模型、火速登顶 HuggingFace

  • 观点 1:这个和那个前几天刚发布的 glm4 哪个好啊
    • 观点 2:国内一概不用,全是阉割的,我用 rwkv
    • 观点 3:RWKV 也是中国团队搞的。。
  • 观点 4:以后应该加入普通人的测试体验,现在的榜单,好像不太真实
  • 观点 5:我都不敢想这后面的算法工程师一个月能挣多少钱
  • 观点 6:和 GPT4 哪个好
    • 观点 7:专业性强的问题,这两货都会瞎扯鸡爹蛋。但 GPt 在英文语料上有更好的答案,因为专业问题,很多只有英文社区才有答案
  • 观点 8:手机跑不了一点
  • 观点 9:为啥要手机看能跑?手机是天吗?顶天万把元的消费级玩具而已。
Java Solon v2.8.3 发布(打破 Java 资源浪费的传统印象)
  • 观点:1:开放原子开源基金会孵化了,赞
  • 观点 2:同时有开源版和收费版的一般开源版就是被放弃的命
    • 观点 3:mysql 好像一直就是 社区版 + 企业版。
  • 观点 4:你为何如此高产 (」゜ロ゜)」

程序员梗图

END

References

https://www.oschina.net/news/296212

https://mp.weixin.qq.com/s/304kiYO11G4-s-WliwtEJw

https://mp.weixin.qq.com/s/uFnUKx0CSpwDYeLiu28gtw

https://mp.weixin.qq.com/s/cVV1x3bBe0cwjc_M4SyK2Q

https://weibo.com/1659574154/OgEgP0YGB

https://weibo.com/2194035935/OhSY2FLn7

https://weibo.com/2194035935/OhRAoqPBp

https://weibo.com/2607574543/OhN61jNUD

https://weibo.com/6572777608/OhKeQfWPG

https://weibo.com/6462113764/OhQPGqq3A

https://weibo.com/1497035431/OhRFmjW19

https://mp.weixin.qq.com/s/awahQdDTstsOLPdFjhqGkw

https://mp.weixin.qq.com/s/s_Vb8pSvGNZ2r3LUs-rbkQ

https://www.pingwest.com/a/295558

https://36kr.com/p/2808370830367104

https://mp.weixin.qq.com/s?__biz=MTMwNDMwODQ0MQ==&mid=2653043410&idx=1&sn=f9b6d2fcd71933c51e4c566efff78fed&chksm=7e5747644920ce72fe672716b4d84dae5603e5bb99b7ad5082773c3e793b1905594dd02553a0#rd

https://finance.sina.com.cn/stock/hkstock/2024-06-06/doc-inaxuuky4934289.shtml?cref=cj

https://a.mp.uc.cn/article.html?uc_param_str=frdnsnpfvecpntnwprdssskt&&from=media#!wm_cid=624245632145562624!!wm_aid=9398043376486855099!!wm_id=466168ece9a641cd925a1a05b1de7e6a

https://finance.sina.com.cn/jjxw/2024-06-07/doc-inaxwhnm5448668.shtml?cref=cj

https://m.huanqiu.com/article/4I6Se61TWdy

https://github.com/cyberbotics/webots

https://my.oschina.net/dubbogo/blog/11207232

https://www.oschina.net/news/296031/solon-2-8-3-released

https://mp.weixin.qq.com/s/Ro345yw3EKLSN-QolfCuHw

https://mp.weixin.qq.com/s/uFnUKx0CSpwDYeLiu28gtw

最后,欢迎扫码下载「开源中国 APP」

阅读海量技术报告、程序员极客分享

相关内容

热门资讯

百镜出道,C位依旧:WAIC顶... 来源:雷科技 如果说 WAIC 2025 是今年 AI 硬件的「集体高考」,那 Rokid Glas...
韩媒:韩国扶持五大联合体开发“... 综合韩联社、《朝鲜日报》和《京乡新闻》等韩媒报道,韩国政府4日正式选定NAVER Cloud、Ups...
录取通知书的“飞驰”之路 7月盛夏,安徽省近50万封承载着无数学子青春梦想与家庭期盼的高考录取通知书,正从四面八方“飞驰”向它...
凡知智造取得恒温核酸扩增分析仪... 金融界2025年8月6日消息,国家知识产权局信息显示,山东凡知智造医药科技有限公司取得一项名为“一种...
原创 离... [撒花] 随着科技的不断发展,“仿人形机器人”也变的越来越成熟了,AI的加持也让这些机器人变的更加智...
当AI化身“全能助手”,人类的... 正在屏幕前玩手机的你 有没有过这样的体验? 遇到不懂的问题 第一反应不是翻书思考 而是脱口而出“嘿 ...
珠海创信电子取得电路板用锡膏检... 金融界2025年8月6日消息,国家知识产权局信息显示,珠海创信电子有限公司取得一项名为“一种电路板用...
NBN Co转投亚马逊柯伊伯计... 来源:C114通信网 C114讯 北京时间8月6日晚间消息(蒋均牧)NBN Co与亚马逊达成协议,通...
石景山这家医院药品有了“电子身... “窗口不用一盒盒扫码吗?取药几乎不用排队,这速度真给力!”在北京大学首钢医院门诊药房,刚取到药的患者...
电力数据“会说话” 点亮智慧新... 本文转自【新华社】 新华社北京8月6日电 《经济参考报》8月6日刊发记者邓林如采写的文章《电力数据“...
国能新疆红沙泉二号矿实现纯电无... 近日,在国家能源集团新疆红沙泉二号露天煤矿(以下简称“红二矿”),58台无人驾驶矿卡正高效运转,其中...
普天科技:致力数据治理领域打造... 金融界8月6日消息,有投资者在互动平台向普天科技提问:公司相关产品或技术有哪些能为人工智能赋能?谢谢...
DeepMind发布Genie... 来源:至顶网 尽管目前还没有人找到通过生成式人工智能赚钱的可靠方法,但这并没有阻止Google D...
【喜讯】骨三科陈美玲在全国竞赛... 8月2日,在全国首届护理AI创新应用技能挑战赛决赛中,我院骨三科陈美玲的作品《创新聚力赋能发展——A...
微信内存一下就少了10G上热搜... 站长之家(ChinaZ.com)8月6日 消息:今日,微博热搜榜上#微信内存一下子就少了10G#的话...
我是宁波技能冠军④丨这些技能高... 前言 从工业设备控制(PLC)、工业机器人系统操作等“硬核”制造能力,到人工智能训练、网络安全等高科...
聚焦人工智能产业链 山东蓄力打... 中新网济南8月6日电 (记者 沙见龙)“这项体系如同人工智能产业的‘中央厨房’,能根据不同行业的差异...
2025未来科学大奖揭晓,他们... 科学之光照亮人类未来。6日,备受关注的2025未来科学大奖揭晓。这个夏天,“高冷”的基础研究再次变得...
为什么CA需要有《电子认证服务... 来源:SSL_SecureSocketLayer 1. CA是什么?—— 数字世界的「信任基石」 C...
2025 年 2 款华为会议记... 现在远程会议越来越多,不管是企业还是个人,都需要能快速整理会议记录的工具。我作为科技产品体验师,选了...