微众银行人工智能首席科学家范力欣:基于内容严谨的数据库查询和校验,可防范大模型“幻觉”
创始人
2024-07-04 21:21:54
0

每经记者:张宏每经编辑:廖丹

7月2日,微众银行“大模型时代AI前沿与金融应用”主题活动在北京举办。

会上,微众银行人工智能首席科学家范力欣表示,模型越大,能力越强,随之而来的问题是高成本,尽管现在“百模大战”,用户成本可能越来越低,但使用和训练大型模型的成本实际上并没有降低,这为大模型应用落地带来挑战。

会后,《每日经济新闻》记者(以下简称“NBD”)就如何防范和纠正大模型“幻觉”、银行业大模型落地面临的挑战、数据要素与大模型之间的关系等问题专访了范力欣。

图片来源:每经记者 张宏 摄

基于内容严谨的数据库查询和校验可防范大模型“幻觉”

NBD:在金融机构中,数据精准度至关重要,因此有人认为生成式AI不适合应用在金融机构的核心部门。针对生成式AI可能出现的“幻觉”问题,你认为可以如何进行防范和纠正?

范力欣:在技术层面,可以基于内容严谨的数据库查询和校验。目前,这一过程已经在实际应用中得到实施。

首先,在生成内容之前,(生成式人工智能)需要先查询信息。当查询来源为网络时,信息的可靠性参差不齐,查询结果的准确性并非总是能够得到保证。但在(金融机构的)实际应用中,所依赖的是内容严谨的数据库,这构成了第一层保障。

其次,生成的内容需要再次与数据库进行校验,以确保生成的内容与数据库之间不存在矛盾。这是技术层面上的第二层校验。

在流程层面上,我们的系统并不直接面向实时生成业务。以客服为例,客服背后有一个庞大的数据库支撑。以往遇到的问题是,数据库中一个问题对应一个答案。随之而来的难点是如何将同一问题千变万化的问法与数据库中的答案对应。现在,(有了生成式人工智能)可以扩展问题的表述范围,使其能够覆盖用户未来可能的表述,从而达到答案与问题的“多对一”匹配。由于数据库是离线的,并且可以人工审核,从应用层面避免了“模型幻觉”问题。

NBD:刚刚你提到的数据库是银行内部的私域数据库吗?

范力欣:是的。实际上,包含两个数据库:第一个是事实材料库,也称为背景库,它用于查询和联合校验。第二个数据库是面向服务端客服的问答库。这个问答库原本是一问一答的模式,现在已经发展为多问一答的模式。

NBD:校验的过程由模型完成,还是由人工完成?模型在校验过程中会不会出现“幻觉”?

范力欣:大模型校验。但最终会由人工审核,就像一支人机混合的足球队,大模型是前锋,攻城拔寨,人工审核是后卫守门员,保证不失一球。

投入产出比为大模型应用落地带来挑战

NBD:人工智能的发展对金融机构人员专业占比有没有影响?

范力欣:微众银行拥有超过50%的科技人员。在这些科技人员中,涵盖了我们通常所说的ABCD各个方面,即人工智能(AI)、区块链(Blockchain)、云计算(Cloud)以及大数据(Big Data)。目前,这些技术领域已经基本融合。

NBD:大模型落地目前还面临哪些挑战?

范力欣:虽然大模型在技术上有广阔的想象空间,但我们必须考虑投入产出比。小型模型可能能力不足,而大模型可能具有质的飞跃,但随之而来的问题是成本也可能有质的飞跃。银行是高度数字化和信息化的,理论上完全可以使用该技术。然而,银行必须计算投入产出,许多小企业也同样关注这一比率。任何企业首先考虑的是生存问题,而成本控制是首要的考虑因素。

目前,大模型带来的微小收益可能已经被其额外的成本所抵消。因此,现阶段我们只能筛选那些产出大于投入的业务。对于其他业务,我们可能会进行简单的尝试或评估,以确定是否可行。当大模型到达另一个阶段,能力更强、成本更低的时候,将有更多可能的业务亟待拓展。

NBD:目前哪些应用在投入产出比上有优势?

范力欣:目前在投入产出比上具有优势的应用主要包括生成视频、生成图像以及营销领域。除此之外,还有对客户进行评估和判断的相关应用。这些都是可以进一步开发的领域,但有时候不一定要使用大模型。

NBD:你提到联邦大模型,借助联邦大模型似乎可以达到数据可用不可见。数据要素市场建设有没有可能与人工智能相融合形成1+1>2的效果?

范力欣:我们的理解是,关键不在于数据要素,而在于模型要素。为什么这么说呢?数据本身如同原油,可以提炼为柴油、汽油等多种形态,只有当数据被纳入一个有效的模型中,数据才具有可用性。虽然这个比喻可能略显粗糙,但可以理解为,原始数据有多种潜在用途,在具体用途不明确的情况下,我们无法对数据进行准确的定价,只能根据数据的规模和大致质量进行初步估计。

然而,更精确的定价应当面向应用。只有当我们明确了数据的使用目的,以及它在实际应用中带来的帮助,我们才能评估其真正的价值。否则,同样的数据对某些人可能毫无价值,而对另一些人可能非常有用。

这种应用价值的评估需要通过模型来实现,即通过训练或微调,使数据得以有效利用,从而揭示其真正的价值。从这个角度来看,实际上是模型赋予了数据价值,就像羊吃了草之后,我们是对羊定价,并向客户提供羊的使用价值。

每日经济新闻

相关内容

热门资讯

品质消费浪潮下,电视行业的破局... 近年来,在政策支持、市场需求和技术革新的多重推动下,我国银发经济蓬勃兴起。据测算,中国银发经济规模到...
一等奖!广州理工学院学子拿下这... 近日,第二十七届中国机器人及人工智能大赛全国总决赛在苏州落幕。作为中国高等教育学会官方认证的全国普通...
上城区发布首批十大AI机会场景 本报杭州8月18日讯 (记者 张梦月 通讯员 褚陈静 李凌婧 王豪文) “您的咖啡到了。”18日下午...
鸿蒙生态快速发展,鸿蒙5终端突... 近日,余承东参加《对话》栏目。节目中,余承东表示,鸿蒙5终端突破1000万是一个历史性的时刻。国家需...
原创 地... 今天咱来唠唠地球磁场那些神秘事儿。你们知道不,地球磁场这玩意儿,看似稳如泰山,实际上却像个有漏洞的 ...
重大技术突破!纯度达“99.9... 近日,安徽万瑞冷电科技有限公司(以下简称万瑞冷电)自主研制的低温精制及脱氖装置在陕西延安天然气提氦项...
科森科技获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示科森科技(603626)新获得一项实用新型专利授权,专利名为“...
瑞迈特家用呼吸机获多国权威认证... 近日,国家药监局发布《医疗器械网络销售质量管理规范》,这一新规对医疗器械网络销售提出更严格的质量管理...
数字化时代,AI大模型搭建成焦... 在数字化的时代浪潮之中,特别是到了最近这两年,有关AI大模型搭建的话题,嗯,街头巷尾都能听到些许讨论...
山东章鼓获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示山东章鼓(002598)新获得一项实用新型专利授权,专利名为“...
原创 传... 8月19日消息,据韩国媒体Digital Daily报导,晶圆代工大厂台积电预计将要在接下来三四个月...
数字文化产业激活万亿蓝海 不久前,2025世界人工智能大会在上海举办。在这场人工智能全球高级别会议上,文化成为重要板块,吸引众...
原创 鼎... “未来企业的竞争力取决于AI应用密度。” 在“2025鼎捷数智新书创想会”上,鼎捷数智执行副总裁刘波...
星星云手机:性价比之选,流畅体... 随着科技浪潮的不断推进,云手机作为一种创新的数字化服务,正逐渐受到广大用户的青睐。云手机,这一基于云...
超速致4死2伤,28岁小米车主... 8月18日,河南省临颍县人民政府新闻办公室发布情况通报: 8月17日,部分媒体在网上发布或转发“小米...
亿迪生精密科技取得改良蓄电池专... 金融界2025年8月19日消息,国家知识产权局信息显示,亿迪生精密科技(赣州)有限公司取得一项名为“...
原创 美... 一个美国网友在网上抛出个火药味十足的问题:如果中国不让美国加入天宫空间站,美国有没有权利直接把它给打...
云百科技:让“数智因子”渗透制... 从物联网到新能源汽车数字化,从智能网联到低空经济,广东云百科技有限公司(下称“云百科技”)的每一步布...
ST数源获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示ST数源(000909)新获得一项实用新型专利授权,专利名为“...
美的集团获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示美的集团(000333)新获得一项实用新型专利授权,专利名为“...