AI大模型专家访谈|约翰·霍普克罗夫特计算机科学中心林洲汉:未来国内应用大模型或走在国际前列
创始人
2024-01-08 13:15:11
0

原标题:AI大模型专家访谈|约翰·霍普克罗夫特计算机科学中心林洲汉:未来国内应用大模型或走在国际前列

促进数字技术与实体经济深度融合,已成为近年来最火热的议题之一。ChatGPT的面市又将人工智能大模型推向了高潮。

2023人工智能大模型基准测试科创发展大会暨中西部数字经济大会(下称“大会”)将于12月28日在成都市正式举办。大会旨在为行业发掘出更优质的大模型,并提供资源对接。

大会举办之前,大模型基准评测专家委员会专门为大模型评测研制开发了自动测试平台,取名“OpenEval”,意为开放评测。

对此,专家委员会成员——来自上海交通大学约翰·霍普克罗夫特计算机科学中心的林洲汉教授在接受红星资本局专访时提到,“得益于国内更多样化的应用场景,在应用大模型的方式方法上,国内的大模型落地应用,未来甚至是大概率可以走在美国前面的。”

国内应用场景更多

未来应用大模型的或走在国际前列

红星新闻:2022年底,OpenAI推出人工智能聊天原型ChatGPT,在国内及全球掀起了AI浪潮。能跟我们讲讲AI和大模型的关系吗?大模型是如何形成,如何分类的?

林洲汉:相对于大模型,AI是一个更广泛的概念。但是现在,以ChatGPT为代表的大模型取得重大突破并出圈,AI和大模型也就似乎成了同义词。但实际上,在大模型之外,AI还有很多其他的重要工作。

大模型并非凭空而来。模型结构作为模型训练中的一部分,最早出现在2016~2017年左右,加拿大的蒙特利尔实验室先后做了attention和self-attention两个attention的机制,紧接着谷歌在self-attention的基础上做了transformer。这些模型结构上的前期技术积累,扫清了神经网络在模型结构上走向大规模化的技术障碍。不过当时包括谷歌在内的众多研究机构都只是用这些模型去训练一些只有几十、几百兆的小模型。直到OpenAI将Transformer模型大规模化到175B的程度,模型效果才量变引起质变,有了质的飞跃。

另外一个重要要素是预训练。刚开始,模型训练就是每一个任务对应一个单独的模型,后来慢慢发展成用巨量的语料去预训练,这种训练模式能够利用预训练好的单个模型,通过后期的微调训练,将各种任务统一到一个基础模型上。OpenAI则是利用GPT-3高达175B的大模型,不光彻底统一了绝大部分的自然语言处理任务,还在模型的通用性、对新任务的适应速度等方面做到了全新的高度。做出了指令微调、in-context learning等的新形式。

红星新闻:目前,国内大模型主要应用在什么领域?已经发展到了什么阶段?

林洲汉:在大模型的落地应用方面,其实国内外没有太大的差距。甚至得益于国内更多样化的应用场景,在应用大模型的方式方法上,未来甚至是大概率可以走在美国前面的。

至于典型的应用场景,我可以想到的就是常见的网络会议场景和电商客服场景。大模型可以自动生成会议概要、自动回复客户问题。甚至语言模型也可以接上一些外部的工具。

在基础模型研发方面,目前还没有其他公司的产品能够超越ChatGPT。因此可以说,这不光是中美之间的差距,也算是OpenAI与世界的差距。

医疗问诊、在线教育、办公软件等都会用上大模型

未来各个模态会融合起来

红星新闻:对于我们每天都会接触到的手机软件,哪些运用了大模型?运用的何种大模型?大致原理是什么?

林洲汉:像我前面提到的会议软件,以及办公交流软件,比如飞书、钉钉,大多是会用到大模型的。

另一个典型就是现在的电商服务机器人。我们可以看到,像淘宝天猫这些电商平台,部分店铺的自动回复相较于以往已经明显更智能,并且在售前售后服务方面替代真人客服。这些使用大模型的店铺,会使得用户的交互更智能,真人客服也将更少参与。

另外,在医疗问诊、在线教育等领域也会用到大模型。比如医疗问诊,当患者遇到排号紧张,自身患病不严重的情况就可以选择互联网问诊。

但总的来说,现阶段来看,大模型的应用基本就是“两条路”。一条就是调用OpenAI的ChatGPT,但ChatGPT能够给到使用者的定制化应用相对较少,因为它只能直接输出文本。另一种就是定制化程度更高的私有化部署,这种情况可以选择用开源模型或者合作方自有的模型,在私有领域专门微调定制。

红星新闻:我们了解到,机器学习和自然语言处理这个方向上,有包括机器翻译、聊天机器人等离日常生活很近的应用,目前有没有更新的领域正在开拓?

林洲汉其实自然语言处理有了像ChatGPT这样的大模型后,相当于给了AI各个领域之间一个互通的通道。目前,大模型可以拓展的领域很多,在往多模态的方向发展,不限于前面的纯文字。比如文生图,图生文,甚至是视频生成等。不过目前视频类还处于起步阶段。

最近,信雅达(600571.SH)因“女儿概念股”受关注,正是基于信雅达实控人郭华强之女郭文景创立了Pika,Pika目前是AI文本生成视频领域的明星公司,可以根据AI模型生成和编辑动漫、电影、3D动画、等不同风格的视频。

所以视频类也是有前景的,未来各个模态或许都会融合起来,可能未来就不存在单独的计算机视觉领域或者自然语言处理领域了。

高级思维活动需要人来负责

AI难以替代

红星新闻:在高校计算机领域科研方面,您认为AI在ChatGPT出现后有什么变化吗?

林洲汉:像ChatGPT这样的大模型出来之后,对于高校科研人员而言,有挑战也有机遇。

挑战是面临科研成本进一步升高。过去小模型对于硬件要求不高,但现在一个模型要跑起来,动辄几十万上百万的机器。

机遇是有了去探讨一些更高更难问题的机会。以往,计算机生成的语言很难保持长篇流畅的文本,更不用去谈事实准确性、语言得体、前后逻辑一致等高级的问题了。现在有了大模型后,我们基本解决了流畅生成长文本的问题,所以可以腾出手来去解决上面提到的更高层面上的问题。甚至可以去考虑模仿专业科学家、律师说话,使用何种专业词汇,以及语言中的前后逻辑等。

红星新闻:随着人工智能应用到各行各业,关于“人工智能是否会代替更多的职业”这样的担忧也越来越多,在这个问题上您怎么看待?

林洲汉:我不觉得替代是一个好的方式,事实上AI也做不到替代。

把AI用到任何一个领域,比如自动驾驶、代替医生问诊、代替记者写稿,AI都没法做到把人替换掉。现阶段,AI只能帮人解决一些脑力上的脏活累活。

以自动驾驶为例,AI能做的就是让车保持在车道内行驶,但是在有交通事故的关键时刻,是需要人介入的。再比如记者写稿,大模型可以帮助记者生成文章内容,但文章的主旨需要人拍板。

因此最重要的一点是,目前高级思维活动还是需要人来决定和负责。

不过,技术的发展很难预知,在未来,AI最终拥有高级思维,实现所谓的通用人工智能(AGI),是完全有可能的。但就目前来看还没有办法做到完全替代人。

红星新闻记者 邓凌瑶

编辑 杨程

相关内容

热门资讯

从“会读书”到“会创造” 浙大... 中新网杭州5月15日电(曹丹)在浙江大学(下称“浙大”)机器人与智能装备学生创新实践基地,一台四轮驱...
科森科技获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示科森科技(603626)新获得一项实用新型专利授权,专利名为“...
2025年图书馆学术指数发布 近日,由“图书馆学术评价课题组”研发的2025年图书馆学术指数(Library Index of S...
海外AI编程赛道并购潮起,火热... 图片来源@pixabay 市场对生成式AI编程助手的兴趣正日益浓厚。 相较于销售、客服等领域,生成式...
固化举办地和举办时间 今年服贸... 2025年中国国际服务贸易交易会的首场新闻发布会于今天(5月15日)上午举行。自本届服贸会起,将固化...
组图丨守护生命的“黑科技” 1吨级无人直升机,可用于应急通讯、医疗救援、搜救等应急任务。 红网时刻新闻5月15日讯(记者 秦楼)...
南兴股份获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示南兴股份(002757)新获得一项实用新型专利授权,专利名为“...
新华视点|新青年职业图鉴:解锁... 随着时代发展,新一代青年以多元职业选择书写奋斗答卷。他们扎根不同领域,或赋能非遗传承,或深耕基层治理...
新研究揭示提升癌症免疫疗法有效... 新华社耶路撒冷5月14日电(记者王卓伦 陈君清)以色列理工学院近日发布公报说,该院研究人员发现一种T...
日科化学:公司目前主要产品为A... 证券日报网讯 日科化学5月15日在互动平台回答投资者提问时表示,公司目前主要产品为ACR和ACM系列...
原创 高... 5月15日,高通技术公司正式宣布推出最新的第四代骁龙7移动平台(骁龙 7 Gen 4),旨在增强用户...
黑科技!都江堰人民渠灌区首次利... 近日,四川省都江堰水利发展中心人民渠第一管理处,首次利用定位浮标开展干渠流程测验,成功对人民渠干渠一...
片仔癀“熄火”!12万股民睡不... 01 深圳要打造机器人之城? 2025年5月12日,深圳的空气中弥漫着不寻常的热潮。 这座曾经以“三...
骁龙7 Gen4震撼登场:全新... 高通近日隆重推出了骁龙7系列的新成员——骁龙7 Gen4,这款新品专为追求高端体验的手机用户设计,旨...
广工为什么一次两个学科跻身全球... 近日,科睿唯安最新发布的ESI(Essential Science Indicators,基本科学指...
游戏虚拟化平台:好用、性能好的... **一、远程控制手机:打破系统壁垒的云平台** 云手机技术的核心之一在于实现跨系统远程控制。无论是安...
杭州玉之泉申请波长特异性调控器... 金融界 2025 年 5 月 15 日消息,国家知识产权局信息显示,杭州玉之泉精密仪器有限公司申请一...
江苏栋源木业取得齐头切锯装置专... 金融界2025年5月15日消息,国家知识产权局信息显示,江苏栋源木业有限公司取得一项名为“一种齐头切...
中企云通产业促进中心落地增城 ... 近日,中企云通产业促进中心在增城经济技术开发区核心区正式启用。作为为入驻企业量身定制的超配服务载体,...
中拉互联网发展与合作论坛在西安... 央广网西安5月15日消息(记者陈锵)为推动中拉互联网领域交流合作,落实中国-拉美和加勒比国家共同体论...