联想CTO芮勇:大模型的下一步是智能体丨数字思考者50人
创始人
2024-04-23 18:17:46
0

原标题:联想CTO芮勇:大模型的下一步是智能体丨数字思考者50人

钛媒体特别专题策划《数字思考者50人》:探访中国50位独具代表的数字化思考者。我们理解的“TechThinker” ,涵盖了中国数字化浪潮中的技术践行者、政策制定者与投资决策者。在这场长达10年的乘风破浪中,我们每个人都在分享技术进步的果实,却鲜有人知道结果背后的故事。我们期待通过《50人》,还原中国数字化推进过程中的关键决策,同时也为你呈现数字思考者们的管理与经营之道。

本文根据联想集团首席技术官、高级副总裁芮勇博士在2024联想创新科技大会上发言整理,授权发布

大模型能力令人惊艳,但局限性有待改进

大模型的出现可以说是AI历史上一个重要的里程碑,它开启了人工智能发展的新纪元,在过去的16个月里,由大模型引领的人工智能技术日新月异,模型参数从百亿到迁移,再到万亿;模型类型从语言模型到视频模型,再到音乐模型,涵盖了生活工作的方方面面。

我认为,AI历史发展至今,没有任何一个技术可以像今天的大模型一样强大。

图片来源:芮勇博士演讲PPT

但是,当我们觉得大模型要“一统天下”的时候,它的局限性也逐步显现出来。例如,小学时我们就学过的“鸡兔同笼”的数学问题,如果直接提问给大模型,即使它做对了,人们也不知道大模型是真正理解了问题,还是仅仅是记住了训练的数据。

通过这个例子可以看出,今天的大模型没有真正理解语言,没有真正理解世界,也没有真正具备推理和规划的能力。现在的大模型仅仅是根据高维语义空间和联合概率分布,将它训练的数据中的海量片段进行简单的逻辑性的连接。而这种状态下的大模型虽然很强大,但局限性也很强。

要想突破这种局限性,我们不能再单纯地利用大数据+大算力+大网络的方式,堆砌大模型,而是要超越大模型,探索更接近人类思维方式和行为方式的人工智能。

大模型的下一步是智能体

基于上述观点,我认为,大模型发展的下一步是:基于大模型的智能体。大模型的优势与缺点都很明显,优势是具备强大的能力,缺点是局限性很强。

基于此,我们要“扬长长短”。“扬长”是要持续发挥并不断增强大模型的能力;“长短”是要打造基于大模型的智能体技术,真正能解决应用场景中遇见的问题。而这也是联想的发展理念,左手抓大模型,右手抓智能体,两手都要抓,两手都要硬。

图片来源:芮勇博士演讲PPT

在“左手”——增强大模型方面,从技术角度出发。增强大模型方面有四个混合技术方向:

首先,小模型不会消失。未来一定是基于大模型和小模型混合的“意图理解”技术。信息论里熵entropy是度量信息量的单位,越有序,熵越小,越无序,熵越大。使用交叉熵cross entropy损失最小化原则,将意图理解任务最优地分配给大模型和小模型,从而兼顾精准度和复杂性。

第二,未来一定是基于CPU、GPU、NPU混合调度的异构计算的天下。如今,大模型的训练和推理过程中,瓶颈往往不在于芯片算力,而在于数据传输。通过同时优化计算负载和数据传输的方式,使总体执行时间缩短。

第三,基于模型微调(SFT) 与检索增强(RAG) 混合的“智能问答”技术是最佳选择。模型微调(SFT) 与检索增强(RAG) 各有利弊,通过协同优化的方式,让模型微调(SFT) 与检索增强(RAG) 相向而行,从而达到最优结果。

第四,基于硬件加密与全栈可信架构的混合“隐私安全”技术。在安全领域,仅靠硬件不够,仅靠软件业不够,尤其是在后量子时代,通过在高维实数空间里进行因式分解进行加密将成为未来安全的重要趋势。

而这四类混合技术就需要云边端的协同,需要软硬件的协同,需要传输与计算的协同。

图片来源:芮勇博士演讲PPT

在“右手”——智能体方面,如何打造智能体是我们面临的问题。虽然大模型不是万能的,但是没有大模型是万万不能的。未来,大模型将占据“C位”,作为整体的控制中枢,但仅依靠大模型又远远不够。

怎么做呢?首先,要让智能体具有知道自身能力边界的能力,就好像人一样(人也是一个智能体),每个人都知道自身能力的边界。例如,你问我“茴”字如何写?我能告诉你,草字头,下面是个“回”。因为这个在我能力边界内。但如果问我“茴”的四种写法,这就超过了我得能力边界,我会通过查字典,上网查询等方式,查找答案。

回到大模型领域,不具备认知自身能力边界的能力,就使得大模型有时候会非常自信地告诉人们错误答案。

除了自我认知的能力,一个完整的智能体还要具备包括主动感知,意图理解,复杂任务分解,以及长短期记忆机制等在内的多种能力。

综上,大模型的下一步是智能体,智能体基于大模型而又超越大模型。

相关内容

热门资讯

智能眼镜能否引爆移动终端革命? 2007年6月29日,初代iPhone在美国正式发售,从此揭开“掌上革命”的大幕。智能手机作为终端之...
VR+沉浸声,数字“复刻”整座... 挂着相机,化身记者,追随意大利青年Alex的时光足迹,在1930年的南京大戏院(上海音乐厅前身)前按...
1.24亿大单背后:人形机器人... ► 文 观察者网心智观察所 近期,一则消息在具身智能圈子激起涟漪:智元机器人、宇树科技拿下中移(杭...
华源证券:首次覆盖远航精密给予... 华源证券股份有限公司赵昊,万枭近期对远航精密进行研究并发布了研究报告《精密镍基导体材料“小巨人”,受...
江南合金机械取得阀板生产抛光装... 金融界2025年7月15日消息,国家知识产权局信息显示,宜兴市江南合金机械有限公司取得一项名为“一种...
喜讯 | 我院成功签约河北省数... 近日,河北省数智病理中心互联网医联体签约暨肿瘤病理诊断大模型发布仪式在石家庄隆重举行,我院受邀参会并...
黄仁勋来华首次回应大热天穿皮夹... 快科技7月15日消息,据央视新闻,应中国贸促会邀请,英伟达CEO黄仁勋将于7月16日出席第三届中国国...
国网辽宁电力:“电数据”精准赋... 随着农业生产向规模化、智能化迈进,高标准农田对电力供应的稳定性和数据管理的精细化提出了更高要求。国网...
纽威石油申请水下球阀专利,能够... 金融界2025年7月15日消息,国家知识产权局信息显示,纽威石油设备(苏州)有限公司申请一项名为“水...
1ms城市算网,加速释放杭州智... 潮新闻客户端 记者 张云山 7月11日,1ms城市算网中国行专家座谈会和专题探访活动在浙江省杭州市举...
首届超声医学前沿应用及人工智能... 来源:市场资讯 (来源:网易科技) 封面新闻记者 柴枫桔 近年来,人工智能与医学影像的深度融合正重构...
科技巨头逐鹿AI编程,亚马逊入... 21世纪经济报道记者董静怡 上海报道 7月15日,全球云计算巨头亚马逊旗下云服务AWS部门正式推出了...
英伟达 CEO 黄仁勋回应大热... IT之家 7 月 15 日消息,据中国新闻网报道,近日,英伟达 CEO 黄仁勋再次一身皮夹克亮相北京...
小程序制作平台有哪些,做小程序... 选择靠谱的 SaaS 小程序制作平台需兼顾技术适配性、服务完整性与成本可控性。 小程序制作平台有哪些...
小米取得终端设备专利,提高终端... 金融界2025年7月15日消息,国家知识产权局信息显示,北京小米移动软件有限公司取得一项名为“终端设...
言短意长|我被公共场合短视频声... 在公共场合看报纸和刷短视频有区别吗? 这里面的区别大了:看报纸基本上没啥“负外部性”,但是拿着手机刷...
天舟九号货运飞船发射任务取得圆... 央视网消息(新闻联播):7月15日凌晨,搭载天舟九号货运飞船的长征七号遥十运载火箭在我国文昌航天发射...
永州冷水滩:迎峰度夏 电力使出... 今日永州讯(通讯员 王庚娣)随着夏季气温持续攀升,电网负荷不断加大,为确保供电安全稳定,国网冷水滩区...
H20“恢复销售”或仅售库存 ... 来源:财联社 财联社7月15日讯(记者 付静 王碧微)今年4月起受到出口限制的H20芯片有望恢复在中...
北京市怀柔区实现人工智能健康检... 新京报讯(记者周怀宗)记者从怀柔区获悉,近日,该区12家医疗机构完成23台多模态智能检测仪和AI智能...