新V观海外:生成式AI走入“大”和“小”的分岔口
创始人
2024-02-19 14:53:28
0

原标题:新V观海外:生成式AI走入“大”和“小”的分岔口

陈沛/文最近生成式AI发展路线的分岔情况愈演愈烈,“大”和“小”的路线之争正在登上舞台中心。

在“大”的路线上,OpenAI的CEO抛出了7万亿美元的筹款计划,筹建满足未来AI开发算力需求的半导体工厂。7万亿相当于全球GDP的近十分之一,耗这么大投入全给AI,至于吗?很明显,OpenAI的CEO认为至于。

而在“小”的路线上,前两年的谷歌Gopher、英伟达MT-NLG这些高达几千亿个参数的大模型似乎没了更新,反倒是谷歌最近发布了面向个人AI开发者的函数库localllm,开发者只要在谷歌云开发环境中使用本地CPU和内存就能执行量化模型,免去对GPU计算资源的依赖。同时,华为也发布了面向移动设备端的10亿参数小模型的研究成果。

怎么看待这一趋势变化背后的深意?一味追求更大规模模型的发展路线要转向了吗?

其实没有转向,因为模型本身的性质就决定了大参数的表现要更好。在GPT-1出来之前,业界通常能做一个百万至千万参数级别的模型,那会像谷歌的BERT模型能做到1亿参数量就让人觉得是天量了。直到后来GPT-3直接做到千亿级别,模型的输出才实现了质的飞跃。

但是这么大参数的模型的开发运行就意味着更大的成本,预训练阶段一次就是几千个GPU运行十几天,而到推理阶段又是几十个GPU维持日常推理需求。结合云GPU服务商现在3至4美元一小时的价格,再粗略算上日常运营的基础成本,一年的成本至少就奔着数百万美元去了。

所以在实际的成本情况下,再考虑到还看不清楚的投入回报,是否还要一味追求更大规模的模型,就会出现迟疑和权衡。

目前的现状是,现在ChatGPT的应用让用户和企业都看到了生成式AI在商业领域的可能性,但付费用户除了日常不定期使用再没找到增加用量的机会,企业试用后还没有充分印证投入回报比,对于性能表现和数据隐私方面的疑虑也没有被完全打消。

也正是因为这种现状,才让各方积极推动生成式AI模型在移动设备和个人开发平台上的适配,把模型做小做快,在性能上进行折中,降低开发门槛,期望能出现新的杀手级应用。

我能观察到,大模型和小模型之间的竞争合作将会构成生成式AI发展进程中的双重引擎。大模型在持续引领和扩展技术边界,小模型则以轻量高效和专注特定任务的能力体现应用价值。这种动态竞争也为应用开发者提供了多样化的选择,加速推出更智能、更个性化的生成式AI应用。

相关内容

热门资讯

四川人工智能产业投资洽谈会在成... 6月19日,四川人工智能产业投资洽谈会在成都举行。本次活动旨在贯彻落实四川省委、省政府深入实施人工智...
内蒙古发布十项科技“突围”代表... 6月19日,在包头召开的内蒙古自治区科技“突围”工程推进会上,内蒙古自治区科技厅集中发布了十项科技“...
MWC上海聚焦:AI WAN如... 通信世界网消息(CWW)智能IP广域网(AI WAN)作为人工智能与IP广域网双向赋能的新型网络形态...
打造素质教育新名片!鲁山县研学... 6月18日,“启梦童行”研学基地揭牌仪式在鲁山县淮源学校开幕。 活动现场,智能机器人灵活舞动,精准响...
C919国产大飞机在郑州机场开... 大象新闻记者 夏萍 仝新丛 蔡泽 实习生 张帆 6月20日10时28分,由南航C919国产大飞机执...
波长光电涨4.62%,成交额4... 6月20日,波长光电涨4.62%,成交额4.29亿元,换手率15.04%,总市值72.28亿元。 异...
重庆移动护航“魅力重庆”无人机... 6月17日晚,“魅力重庆”无人机灯光秀以11787架无人机组成的双编队飞行表演,成功挑战“最多无人机...
原创 喜... 喜事!中国空间站迎来了一个令人振奋的好消息。总设计师杨宏透露,未来将研发并择机发射空间站的扩展舱段。...
华能南山电厂扩建2台燃气发电机... 记者黄媛艳 6月19日,华能南山电厂6号燃气发电机组顺利通过168小时满负荷试运行,各项性能指标均达...
美年健康携手港仔机器人布局人形... 记者获悉,6月16日,国内健康体检行业龙头美年健康(002044.SZ)与港仔机器人(00370.H...
选矿数字孪生技术的开发与应用 来源:矿权资源网 数字孪生技术作为一种可以实现物理世界与信息世界交互融合的技术手段,是实现数字化转型...
刘强东宣布发力稳定币,大厂找到... 稳定币火了。 它或许是整个6月份,在AI之外最热门的科技概念。互联网大厂们对稳定币的热情,让其重回...
余承东:鸿蒙 6启动开发者Be... 深圳商报.读创客户端记者 陈姝 6月20至22日,华为开发者大会(HDC2025)在东莞举行。在20...
莘庄工业区,连续四年“双超千亿... 在莘庄工业区,航天双创中心“我想上太空”飞行影院通过自主研发的裸眼4D技术,带来沉浸式航天探索体验。...
豆包搜索排名:影响因素分析 豆包搜索排名的影响因素分析可以从多个维度进行探讨。搜索排名不仅仅是一个数字,而是影响品牌曝光度与流量...
荣耀申请短距离通信相关专利能减... 金融界 2025 年 6 月 20 日消息,国家知识产权局信息显示,荣耀终端股份有限公司申请一项名为...
十七冶取得长度可调节锚杆专利,... 金融界2025年6月20日消息,国家知识产权局信息显示,中国十七冶集团有限公司取得一项名为“一种长度...
在课程的苗圃里听见花开的声音 大象新闻记者 徐超 通讯员 李相儒 史云霞/文图 5月28日至6月16日,以“课后服务嘉年华 我的成...
31岁程序员搞副业,6个月喜提... 新智元报道 编辑:Aeneas 【新智元导读】服完兵役的31岁程序员Shlomo,一边旅行一边搞了个...
东北大学王国栋院士团队:探索钢... 新华社沈阳6月20日电 题:东北大学王国栋院士团队:探索钢铁生产的AI新路径 新华社记者王莹 走进鞍...