智谱AI CEO张鹏:智谱AI的GLM-130B是达到世界靠前水平的自主研发产品
创始人
2024-03-15 04:59:15
0

原标题:智谱AI CEO张鹏:智谱AI的GLM-130B是达到世界靠前水平的自主研发产品

“如果说一年前的那一天我们是在爬山,那么经过了这一段时间的攀登,我们有了更多的积累,现在我们可以比较自豪地说,我们已经积累了非常丰富的研发经验和积淀。”3月14日,在智谱AI媒体小型沟通会上智谱AI CEO张鹏表示,站在当时的那个时间点看,智谱AI的 GLM-130B已经达到了世界比较靠前的水平,但更重要的一点是完全自主可控的,是自己从零到一研发的。

3月14日,由央视网“人人都爱中国造”品牌助力行动和智谱AI联合主办的“智领,万象新生”智谱AI媒体小型沟通会在北京搜狐网络大厦举办。总台央视网主持人常婷介绍,“人人都爱中国造”品牌助力行动是2020年在国家相关部委指导下发起的,以“支持国货,赋能品牌”为核心。“中国制造”到“中国智造”的创新热潮方兴未艾,中国创新的的浪潮已经席卷到每一个人的身边。在不久前刚刚召开的全国两会上,“人工智能+”这个概念被首次写入到了政府报告当中。新质生产力引擎开启,万象新生时代正在来临。活动还通过总台央视网、小央视频视频号以及智谱AI视频号同步直播。

大模型(人工智能)三个阶段

首先,智谱AI的CEO张鹏向大家回归了大模型(人工智能)三个阶段:从2017年谷歌提出Transformer开始迅速席卷了整个人工智能领域的研究和产业,成为自然语言处理等相关研究的一种最主要的方法,2018到2020年这段时间先后出现了像谷歌的BERT、GPT-1/GPT-2/GPT-3、T5等基于大规模无标注数据自监督学习方法的预训练模型。当时尤其是BERT在十多个自然语言理解任务当中大大地超越传统的机器算法的精度,掀起了一种全新的研究范式;一直到2019年GPT-2的实现,它提供了自然流畅的文本内容的生成能力,彼时GPT-2的应用Talk2Transformer确实让大家很惊艳,当然对比现在的ChatGPT以及我们自己的ChatGLM等一系列的应用来说还是比较粗糙的,但正因为这些技术坚定了我们投身生成式人工智能的决心;到2020年谷歌的T5将自然语言的翻译、分类、回归、摘要等一系列任务统一成了一个简单的Text-to-Text的任务。

张鹏强调,可以说2018-2020是大模型的原始算法创新的一个阶段。也是在这个阶段里边,智谱AI也从0到1开发了自己的具有完全独立知识产权的预训练模型,我们叫它 GLM(General Language Model),它采用了自回归填空的方式,综合了GPT和Bert这几种优秀的预训练框架的优点。

大模型与小模型的讨论

张鹏认为,在当时国内学术界和产业界都对大模型的发展和产业化没有形成共识,有很多的讨论,甚至很多人提出成本这么高,我们不应该发展大模型,而应该专注于发展所谓的“小”模型。

“说实话在那个时间段,我们自己内部也有很多的思考和讨论,也有一些争论,正如大家所知,这件事情的投入成本非常高、非常大的,作为一家刚刚建立不久的创业型企业,我们如何来支撑这么大的资源,而且我们的研发人员团队是否能支撑这样一个任务?”张鹏说,外部市场对于大模型的认知少,对这个概念还非常陌生,各方面都处于一个非常艰难的情况和境地,换而言之,其实当时的智谱是有那么一点孤注一掷的意思,大家的压力,尤其是研发人员的压力是非常大的。大家最近可能也听说了 OpenAI 团队内部的一些非常卷的故事的一些情况,其实我们当时的情况甚至比他们更严重,非常类似。

GLM-130B唯一来自亚洲被列入评测的对象

张鹏说,2022年我们在训练自己的千亿模型的时候,我们的研发团队、我们的算法工程师甚至是7*24小时的盯着我们的GPU集群,凌晨三点多的故障,我们可以在5分钟之内我们的算法人员先发现,然后通知远程的运维人员,让他们及时解决问题,10分钟、15分钟之内就能解决这样的一个掉卡甚至是硬件故障的问题,这是非常难的一件事情,也都是我们亲身经历的经过。

“所以在2022年我们推出并且开源了基于GLM算法训练的千亿基座模型GLM-130B,这是我们研发团队心血的积累,当时也引起了非常广泛的关注,尤其是在国外,包括像斯坦福、谷歌、OpenAI、Apple、Meta这些非常知名的研究机构和大型的科技公司都对我们的模型进行了深入的研究、分析和评测。2022年11月斯坦福大学发布了一个大模型的评测报告,报告的名称缩写叫HEOM,对全球的几十个开源和闭源的模型进行了深入的评测,有幸我们的GLM-130B作为一个唯一来自中国,甚至唯一一个来自亚洲的这样一个模型被列入评测的对象,并且从评测的结果上来看,在一些指标,比如准确性、公平性等很重要的核心指标上与当时最先进的GPT-3 175B的模型是持平或者是接近的,在有一些特殊的指标,比如说像鲁棒性、校准偏差和无偏性等方面甚至要比它们表现的更好。”张鹏介绍说,这个成绩一出来,整个团队都非常激动。我们八九个月的辛苦得到了回报,也证明了我们团队有这个能力、有这个实力、更有这个激情去做到这样一件事情。所以站在当时的那个时间点看,智谱AI的 GLM-130B已经达到了世界比较靠前的水平,但更重要的一点是什么?是这一切是在我们完全自主可控的,是我们自己从零到一研发的。

ChatGLM是国内最早可以线上测试使用的千亿级的对话模型

张鹏介绍,2022年11月30日OpenAI发布了ChatGPT真正让大家认识到大模型能做到什么样的事情,大模型也开始出圈,扩散到整个社会、全球,让所有人都认识到大模型。一夜之间,几乎所有人都对必须发展大模型都达成了一个高度的共识。大模型的发展不再仅限于模型技术的发展和模型训练本身,更重要的是如何实现模型的产业化应用,这个问题已经提上大家的日程。

“大模型开始在各个领域尝试落地生根,在金融、互联网和教育等众多行业当中开始落地,也得益于我们GLM-130B基座模型的优秀能力,我们很快在2023年2月份就研发出了第一代ChatGLM,这也是我们去年3月14号发布的这个产品的基座,这应该是国内最早可以线上测试使用的千亿级的对话模型,基于它我们开发了刚才大家看到的演示当中的智谱清言这样一款C端的应用,并在8月第一批通过了国家的备案认证,正式的面向公众上线使用。”张鹏说,这个是我们在2023年取得的一些成绩,我们实现了2000+生态合作伙伴、1000+大模型规模化应用、200多家企业跟我们进行了深度的共创,解决它们的问题,切切实实的、潜移默化的在改变着每一个客户的业务、效率,甚至更深度的改变着客户的业务范式和组织架构,这是我们所希望看到的。

相关内容

热门资讯

安洁科技获得发明专利授权:“一... 证券之星消息,根据天眼查APP数据显示安洁科技(002635)新获得一项发明专利授权,专利名为“一种...
2015年6月28日:猎鹰9号... 今日6月28日 一枚身价数千万美元的火箭,在佛州晴空下炸成碎片。而这一切,只因为一个不到百元的零...
剪草坪的欧洲中产白男,被中国公... 出品|虎嗅商业消费组 作者|周月明 编辑|苗正卿 题图|Navimow 在电影《怦然心动》中有一个桥...
华中最大自动化农作物种质资源库... 原标题:智能机器人巡守湖北超级“种子银行” 华中最大自动化农作物种质资源库试运行 “JYH01……”...
英威腾获得发明专利授权:“一种... 证券之星消息,根据天眼查APP数据显示英威腾(002334)新获得一项发明专利授权,专利名为“一种工...
格力电器获得发明专利授权:“烹... 证券之星消息,根据天眼查APP数据显示格力电器(000651)新获得一项发明专利授权,专利名为“烹饪...
山东机器人产业:2027年规模... 【山东印发机器人产业发展计划,力争2027年产业规模破500亿】日前,山东省工信厅等25部门联合印发...
国家能源集团:千亿级发电行业大... 据国家能源集团消息:今日,国家能源集团正式发布千亿级发电行业大模型——“擎源”发电大模型。该模型以“...
“科学学全球伙伴计划”搭建全球... 近日,在“浦江创新论坛——科学学上海论坛·2025科技创新智库国际研讨会”现场,“科学学全球伙伴计划...
永祥硅材料取得硅芯包装平台专利... 金融界2025年6月28日消息,国家知识产权局信息显示,四川永祥硅材料有限公司取得一项名为“一种硅芯...
迈金科技取得一种电子变速器专利... 金融界2025年6月28日消息,国家知识产权局信息显示,青岛迈金智能科技股份有限公司取得一项名为“一...
珠海冠宇获得发明专利授权:“一... 证券之星消息,根据天眼查APP数据显示珠海冠宇(688772)新获得一项发明专利授权,专利名为“一种...
小火龙拜访土星朋友之旅 ■西安经开第七小学四年级一班 宋佳骏 在浩瀚的宇宙中,在有着八大行星的太阳系中,在美丽的地球上,居住...
汇智聚力优化创新生态 近年来,上海以建设国际科技创新中心为战略使命,聚焦强化科技创新策源功能主线,从政策赋能、机制突破、未...
学术破界,科普惠民,这场医学大... 6月28日,首届“浦江-明道”普外学术大会暨“浦公英”健康科普驿站普外专场在上海举办。这场以“学术引...
珠海冠宇申请一种极片及电池专利... 金融界2025年6月28日消息,国家知识产权局信息显示,珠海冠宇电池股份有限公司申请一项名为“一种极...
小米申请充电控制相关专利,提高... 金融界2025年6月28日消息,国家知识产权局信息显示,北京小米移动软件有限公司申请一项名为“充电控...
AI技术赋能 西安音乐项目获文... 文化和旅游部科技教育司、全国艺术科学规划领导小组办公室近日公布了17项2025年度国家社科基金艺术学...
这一星象时隔36年再现,明晚记... 6月29日,太阳系中的行星海王星与土星相合,上演“星星相吸”。届时如果天气晴好,我国感兴趣的公众可在...
双向奔赴!乐源智慧农业产业园在... 6月28日,乐源智慧农业产业园开工奠基仪式在重庆市武隆区白马工业园区举行。项目的落地,为武隆工业经济...