欢迎阅读 OSCHINA 编辑部出品的开源日报——您探索和理解开源世界的日常指南。在这里,我们每天从宏观到微观,全面展现开源技术和文化的动态图景。
每日一更,风雨无阻
# 2024.5.13Today Summary
01 零一万物开源 Yi-1.5 系列模型,采用 Apache 2.0 License
02 华中科技大学开源镜像站正式开放外网访问
03 一个不知名的开源项目可以带来多少收入
04 公网 IPv4 是 “分配完了” 而不是 “用完了”
05 向第一个 OneWrt One 原型问好
06 OpenAI 考虑允许 AI 生成色情内容
07 微软向 Rust 基金会捐赠 100 万美元
08 消息称 Arm 计划 2025 年推出 AI 芯片
09 限制 AI 模型对华出口,美方将自损八百
10 对话李开复:这次大模型创业,我十年都不会变现
OpenSource Daily
零一万物开源 Yi-1.5 系列模型,采用 Apache 2.0 License
零一万物近日宣布,旗下全新模型 Yi-1.5 正式发布,包括 6B、9B 和 34B 三种规模,并宣布这些模型均采用 Apache2.0 许可开源。Yi-1.5 是 Yi 模型的升级版,它在编码、数学、推理和指令遵循能力方面展现出更强的性能,同时保持了在语言理解、常识推理和阅读理解方面的卓越能力。
华中科技大学开源镜像站正式开放外网访问
华中科技大学开源镜像站于 2023 年 11 月通过校园网域名 https://mirrors.hust.edu.cn 开放内测。
经过半年时间的内测,镜像站如今正式面对全体用户开放外网访问。
一个不知名的开源项目可以带来多少收入
NocoBase 是一个极易扩展的开源无代码和低代码开发平台。
虽然我们刚刚发布 1.0-alpha,还未公开提供标准的商业许可证和商业插件,但在 2022 年 10 月我们就收到了第一笔大额的收入。在过去的 12 个月里(2023 年 5 月 至 2024 年 4 月),我们的收入共计人民币 226 万元(外币全部兑换成人民币)。
今日观察社交观察
公网 IPv4 是 “分配完了” 而不是 “用完了”
虽然很早就吵着公网 IPv4 分配完了,但注意用词 “分配完了” 而不是 “用完了”。比如说有些名气的大学,可能分到 */24 甚至 */16 这样的大网段,然而真用起来的有几个呢?占着一堆位置又不做事,荒唐可笑。反观我们普通人上网就得用 NAT 共享公网出口,可见分配不均的现象到处都有。
- 微博业余早睡选手
2024 年 AI 初创公司的机会在哪里
红杉合伙人 Stephanie Zhan 在彭博做了一个关于 “AI 初创公司” 访谈,虽然很简单只有 6 分钟,但是谈得非常有见地,主要是三方面内容(当然主要是北美市场,但也有一些思路借鉴)。
1、2024 年是关键一年
Transformer 发布 7 年了,ChatGPT-3 时刻也三年了,而 2024 年是飞越一年,有三个关键词:视频、代理和机器人。闭源、开源、大、小模型,不同模型并存,生态系统很繁荣。
2、短期高估,长期低估
虽然现在 AI 看起来很热了,短期有点高估嫌疑,但是长期依然被低估了。现在依然是 AI 浪潮的早期阶段。大公司机会很多,比如抱抱脸(这个翻译越来越可爱了)、微软、英伟达、谷歌。
3、初创公司的机会
虽然大公司很有权势,但是初创公司也有机会,当年英伟达也是初创公司(也是红杉投的)。数据是个竞争的分水岭,高质量的标记数据,垂直领域的数据。
4、Meta 是个扭转战局的人
Meta 的开源模型给很多初创公司一个低成本进入市场的机会。而且 Meta 的模型后发优势很大,因为他们拥有高质量数据集(Facebook 社交平台)。
- 微博高飞
「顶级」的开源无头 CMS
无头 CMS 是指仅包含内容管理的后台(提供 API),没有现成的前台展示需要自己实现,极大提升了前端展示的自定义和灵活性。
Strapi 是一款完全免费、采用 Java/Type 开发的无头内容管理系统。它拥有开箱即用的 API 和友好的管理面板,自带权限管理、默认安全、SEO 友好等特点。Strapi 作为目前 GitHub 上最流行的开源内容管理系统之一,已成为多家世界 500 强公司的首选 CMS。
- 微博HelloGitHub
向第一个 OneWrt One 原型问好
但今年早些时候,开发商 John Crispin 宣布,该团队正在考虑发布第一个官方 OpenWrt 硬件。二十年来,OpenWrt 背后的开发人员一直致力于为路由器和其他嵌入式设备提供基于 Linux 的开源操作系统。到目前为止,该团队主要专注于制作可以安装在现有硬件上的软件。但今年早些时候,开发商 John Crispin 宣布,该团队正在考虑发布第一个官方 OpenWrt 硬件。
看起来这项工作正在向前推进,因为现在他分享了即将推出的 OpenWrt One 路由器板的硬件原型的 第一张图片。
- 微博BananaPi_香蕉派
媒体观察
李开复:中国需要自己的 ChatGPT 时刻,2024 将是爆发年
人工智能创业公司零一万物 CEO 李开复在接受采访时表示,中国需要自己的 “ChatGPT 时刻”,2024 年将是中国生成式 AI 应用爆发的一年。李开复在接受彭博社采访时表示,中国需要自己的 “ChatGPT 时刻” 来提高人们的兴趣、加快普及和投资。“对美国人来说,这一刻发生在 17 个月前,” 李开复在北京通过会议平台 Zoom 接受采访时说,“中国用户还没有体验到 ChatGPT 时刻。目前为止,中国的聊天机器人或工具都不够好。”
与许多全球 AI 创业公司不同的是,李开复透露零一万物已接近盈利。在对这些模型进行中文和通用数据集的训练之后,李开复正在将这些模型和应用程序推向全球,并与国内外客户签约以增加明年的收入。“2024 年将是中国生成式 AI 应用的爆发年。” 李开复称。
-凤凰科技
国产大模型:今天起,我们 100 万 tokens 只需 1 元!
智谱 AI 大模型开放平台大幅降价,GLM-3-Turbo 价格降至 1 元 = 100 万 tokens,还提供用户 tokens 优惠计划。GLM 系列迎来更新,在多个领域展现出色能力。智谱 AI 正通过降价和技术实力提升市场渗透率,形成普惠闭环,吸引更多用户使用。
什么概念呢?
相当于花 1 元钱就能写 1 万条小红书(以 350 字计算)。
这个大动作,一下子就让智谱 AI 成为入门级里最便宜的那一个;而且它还特别提供用户 tokens 优惠计划:送!
- 量子位
零一万物千亿参数模型 Yi-Large 发布,
基准测试登顶国产大模型,新 MoE 模型对打 GPT-5
在成立一周年之际,国内 AI 大模型独角兽零一万物重磅发布系列产品升级。
闭源模型方面,零一万物发布全球 SOTA 千亿参数闭源大模型 Yi-Large,评测结果部分超越 GPT-4,同时,零一万物创始人及 CEO 李开复该公司正在训练更大参数规模的 MoE 模型 Yi-XLarge MoE。
在开源领域,零一万物将早先发布的 Yi-34B、Yi-9B、6B 中小尺寸开源模型版本升级为 Yi-1.5 系列,每个版本达到同尺寸中 SOTA 性能最佳。
-智东西
今日推荐开源项目
zhw2590582/ArtPlayer
https://github.com/zhw2590582/ArtPlayer
ArtPlayer.js 是易于使用、现代且功能齐全的 HTML5 视频播放器。
ArtPlayer.js 支持自定义大部分功能控件,可便捷地与不同的业务逻辑进行集成。此外还直接支持 .vtt, .ass 和 .srt 字幕格式,与其他依赖库的集成也非常简单,比如 flv.js, hls.js 和 dash.js 等。
每日一博
用一只小猪来解释 On-Prem, IaaS, PaaS 和 SaaS 的区别
亚马逊云科技首席布道师 Jeff Barr 发过一张图,用一只小猪🐷讲清了 On-Prem, IaaS, PaaS 和 SaaS 的区别。
https://my.oschina.net/u/6148470/blog/11105568
事件点评
OpenAI 考虑允许 AI 生成色情内容
OpenAI 日前发布了一份《Model Spec》文件草案,阐述了它希望 ChatGPT 及其他 AI 技术的行为方式。其中有一部分透露,该公司正在展开向色情和其他露骨内容领域的探索。
“我们正在探索是否可以通过 API 和 ChatGPT 负责任地提供在适合年龄的环境中生成 NSFW 内容的能力。我们期待更好地了解用户和社会对该领域模型行为的期望”。NSFW 是 not safe for work 的缩写,OpenAI 对其的定义包括了色情、极端血腥、污言秽语等。
点评
这一决策反映了 AI 技术和内容的快速发展,特别是在生成式 AI 领域。随着 AI 技术的发展,如何管理其生成内容,特别是那些可能被视为不适当的内容,成为了一个重要议题。
但同时可能引发关于内容生成和审查的广泛讨论。在当前环境中,AI 生成的内容,特别是那些可能被视为色情或不适宜的内容,如何被合理地生成和监管,是一个需要深入探讨的问题。以及影响 OpenAI 的品牌形象和用户信任。允许生成性内容可能会引起一些用户的担忧,特别是关于隐私和内容安全的问题。
最后,这一决策还涉及到技术伦理和法律法规的挑战。如何在保护用户和遵守法律法规的同时,允许 AI 生成性内容,是一个复杂的问题。
微软向 Rust 基金会捐赠 100 万美元
Rust 基金会宣布,其白金会员 Microsoft 于 2023 年 12 月捐赠了不受限制的 100 万美元,以用于支持各种关键的 Rust 语言和项目优先事项。
微软 Rust 基金会成员董事兼董事会副主席 Nell Shamrell-Harrington 表示,这一贡献体现了微软对 Rust 编程语言的承诺,以及通过 Rust 基金会持续取得的成功。
点评
微软向 Rust 基金会捐赠 100 万美元不仅是对 Rust 语言的认可,也是对整个开源社区和生态系统的重要支持,同时体现了微软在开源领域的领导地位和对未来技术发展的投资策略。
通过投资于像 Rust 这样的开源项目,微软不仅支持了开源社区,还加强了其在技术界的影响力和领导地位。此外还可能鼓励其他公司对开源项目进行投资,从而推动整个技术行业的发展和创新。
消息称 Arm 计划 2025 年推出 AI 芯片
日经亚洲报道称,软银集团子公司 Arm 计划进军 AI 芯片的开发,寻求明年推出首批产品。此举是软银集团首席执行官孙正义 (Masayoshi Son) 斥资 10 万亿日元(合 640 亿美元)推动将该集团转型为 AI 巨头计划的一部分。
Arm 将成立 AI 芯片部门,目标是在 2025 年春季之前制造出原型产品。预计将于当年秋季开始由合同制造商进行大规模生产。
点评
Arm 计划在 2025 年推出 AI 芯片的决定不仅标志着该公司在 AI 领域的重大步伐,也反映了 AI 技术在当前科技行业中的重要性和增长潜力。
Arm 的加入将引入新的竞争者,推动技术创新和产品多样化。且 Arm 的 AI 芯片预计将专注于处理大量数据的应用,可能会在数据中心、机器人和发电等领域带来新的应用可能性。通过与台积电等制造商合作,以确保生产能力,也表明了该公司对 AI 芯片市场的长期承诺。
此外,Arm 的这一举措也反映了 AI 技术在当今社会中的重要性,以及其在推动各行各业创新中的核心作用。随着 AI 技术的不断进步,对专门设计的 AI 芯片的需求也在增长,这为 Arm 提供了巨大的市场机遇。
开源之声
媒体观点
刘伟:限制 AI 模型对华出口,美方将自损八百
人工智能技术从来不是一个孤立的科技产品或系统,而是由人、机、环境共同组成的生态系统。人不能脱离环境独自存在,国际的 AI 合作与发展也不会因一纸禁令而彻底断绝。艰难困苦,玉汝于成。在中美技术领域的博弈中,通信、半导体、新能源汽车等产业均曾受到或仍在承受美方的无理打压,但都靠对自身的不断完善开辟了新的天地,成为了 “中国智造” 的名片。指望靠限制出口就能打断中国 AI 的发展之路是打错了算盘。中国人工智能必将继往开来,在竞争与自新中走向成功。
-环球网
OpenAI,为什么没敢推 AI 搜索
AI 搜索目前是海内外 AI 创业团队的重要方向之一。在海外,主打 AI 搜索的 Perplexity 目前估值已经超过 10 亿美元。
OpenAI 为什么会选择这个时间点做了一波这样的宣传?如果 OpenAI 真的入局搜索,会对搜索格局带来什么影响吗?对于创业者来说,AI 搜索是一个好的方向吗?
-极客公园
对话李开复:这次大模型创业,我十年都不会变现
“没有收入的四、五十亿美元估值,在 AI 1.0 时代都支撑不了。大模型公司迟早要面对投行拷问,要未雨绸缪,否则这些纸牌屋最后都会坍塌。” 李开复说。
我们问他这次为什么一定要自己创业,有多想赢?他说他相信乔布斯的一句话:“每一个人一生有很多点,我终于来到一个机会,把这些点全部串在一起。我相信我来到这个世界就是来串这些点的。”
-晚点 LatePost
向拼多多学习,拿了 10 亿的 AI 独角兽下沉求生
一位投资人曾告诉《中国企业家》,当创业者手握极具竞争性的技术时要善用资本,让技术的领先地位进一步扩大,资本也是竞争的手段之一但这位投资人还有半句话没说出来,资本只会流向更优秀的创业者,只见新人笑,不见日人哭,这是资本的属性,也是商业的规则。
-中国企业家
用户观点
一个不知名的开源项目可以带来多少收入
微软向 Rust 基金会捐赠 100 万美元
- 观点 1:比我们知名开源项目赚得多
- 观点 2:工作理念很不错
- 观点 3:3 个人,3 年时间,200 万,虽然不算多,但比起在大厂里当螺丝钉,这事更自由,也更酷
- 观点 4:这确实是一个很酷的团队和工作,非常值得分享的事,看的出来作者有创造力和行动力,但这又是大部份人不具备的前提
- 观点 5:看完这篇文章 1. 由心的佩服。“至少先做够 6 年再下结论” 让我们更加有信心坚持下去。我会在内部分享你们的故事。2. 由心的开心,能从开源项目走出来(实现盈利)。加油!会越来越好!
- 观点 6:类似的项目 16-17 年的时候考虑过,当时断断续续做了一个 demo,最终放弃了。 当时的构想是本体项目完全免费使用,依靠插件商城生态收费盈利。插件有标准的开发与对接接口,第三方插件盈利抽成。 插件既包括前端界面的构建插件也包括后台的功能性插件,前端插件与后端功能插件互相分离,通过统一的声明式的数据接口组合对接使用。 前端界面主要使用拖拽布局与拖拽插件构建,选择后端功能模块,配置数据源、构建操作流程完成。后端则启用相应功能插件。 当时放弃的原因有几个,深入开发考虑后发现这类系统适用性很有限,如果用于复杂的系统,数据源和流程的配置会非常复杂,不懂程序的做不来,懂程序的也许直接写更加顺手。 如果用于简单一点的系统,当前市面上的模板加数据源模式的建站系统已经非常成熟,易用性上优势也不大
- 观点 1:就多请了个人
- 观点 2:等成熟了微软直接出个 R# 语言出来摘桃子
- 观点 3:微软要是想当开源领导者的话,应该不会做这种事情
程序员梗图
END
References
https://www.oschina.net/news/292236
https://www.oschina.net/news/291861/hust-mirrors
https://www.oschina.net/news/292147/nocobase-3yr
https://weibo.com/5692692520/Oe4mvdrEg
https://weibo.com/1233486457/OdUnFfGZO
https://weibo.com/7616053865/Oe5JIq84n
https://weibo.com/ttarticle/p/show?id=2309405033610003480853
https://baijiahao.baidu.com/s?id=1798914836805323931&wfr=spider&for=pc
https://baijiahao.baidu.com/s?id=1798764788998457285&wfr=spider&for=pc
https://i.ifeng.com/c/8ZXs6K35VZC
https://my.oschina.net/u/6148470/blog/11105568
https://github.com/zhw2590582/ArtPlayer
https://www.oschina.net/news/292032/rust-1m-microsoft-donation
https://www.oschina.net/news/292154/openai-considers-nsfw
https://www.oschina.net/news/292235/arm-ai-chip-2025
https://m.163.com/dy/article/J20SBGPR0550ANUU.html
https://mp.weixin.qq.com/s?__biz=MzU3Mjk1OTQ0Ng==&mid=2247515979&idx=1&sn=6840588dc1a3248e3a7f6982b254e7d5&scene=0
https://mp.weixin.qq.com/s?__biz=MTMwNDMwODQ0MQ==&mid=2653041078&idx=1&sn=6cc63a9d5eef4b21832e02231c71b726&chksm=7e574c004920c516dfeb97c278e0d8ccedbc4416b9d500adbee482d747346bf4a49ee532b461#rd
https://opinion.huanqiu.com/article/4HloYoj67pf
https://mp.weixin.qq.com/s/TgQ2Rro3cttDiwRTXSPWSg
最后,欢迎扫码下载「开源中国 APP」
阅读海量技术报告、程序员极客分享