AI赋能游戏:问答机器人的设计与实现
创始人
2024-06-26 12:01:53
0

AI发展快速,最适合的应用场景,应该是游戏了。光是NPC的问答、选项,就有很多可以操作的空间。本文从游戏行业出发,分析了问答机器人的实现原理和语料的经验,供大家参考。

随着AI这两年的快速发展,游戏厂商跃跃欲试如何让AI融入游戏。

半年前,我们也在游戏内嵌社区中,上线了一款以大语言模型为核心打造的问答机器人,旨在满足玩家快速获取攻略的需求。

这篇文章,将以游戏行业产品经理的角度,分享这款问答机器人的实现原理,及其语料的制作经验。

一、为什么需要问答机器人

问答机器人所落地的游戏,是一款三国策略类游戏。游戏中玩家被随机分到魏蜀吴中的一个国家,并通过一系列玩法攻城略地,扩展疆土。玩家可以招募各色三国英雄,并给英雄搭配不同装备、学习不同技能以提升战力,并可以组建不同的英雄阵容去挑战别的玩家以及掠夺别国的城池。因此,游戏玩法的自由度给予了玩家很多策略探索的可能。

起初,我们只是搭建了一个问答社区,供用户发表问题与分享攻略心得。随着玩家人数增加及赛季的深入,玩家对攻略的需求日益明显。官方发布的攻略,不一定能满足玩家快速获取攻略的需求。有时候玩家只想找一个答案,却要看完一整篇攻略。因此,我们想通过智能问答机器人的形式,满足玩家快问快答的痛点,以提升玩家的游戏体验。

我们的智能机器人名为“诸葛先生”,以H5的形式开展对话。对用户来说没有复杂的功能,只要提问,机器人就会回答。

(页面样式这里用原型图代替了哈)

二、机器人技术原理:大语言模型RAG的应用

在介绍问答机器人的原理前,先说一个前提,就是我们的大语言模型的语料库中,有一种语料是QA形式的,即一问(question)一答(answer),与一般的段落形文章有所区别。关于语料库的介绍,下边章节会继续细说。这里将继续讲机器人的运行原理。

如下图,在用户提出问题后,我们的机器人分有两个答案输出逻辑。首先,用户提问的问题都会先进行内容检索,通过检索模型检索出与用户提问相关的内容。当检索到用户提问有匹配的QA时(即玩家提问匹配到语料库中预设的Question),则程序会直接输出Answer;另一种逻辑是,当检索模型没有检索到匹配的QA,那程序就会继续检索其他内容(如文章段落),并产出一条带内容的提示词(prompt)输入到大语言模型中,由大语言模型生成答案。

举个例子,假设用户提问了“赵云怎么培养”,则程序会通过检索模型,先检索是否存在与“赵云怎么培养”接近的question,存在则输出对应answer,否则找出“赵云培养”相关的内容。我们比拟程序找到的相关内容为AABB,此时给到大语言模型的提示词(prompt)就是:“AABB,请根据上述内容回答:赵云怎么培养。”大语言模型则根据上述提示词生成答案。

为什么我们不直接使用大语言模型,而是前置一步加入检索模型呢?

我们知道,大语言模型基于神经网络模型,使用大量的语料库进行训练,比如互联网上的大量文本数据。因此,大语言模型能高效准确地回答通用知识类的问题。而游戏属于专有领域,如何让大语言模型直接回答专有领域知识,则它给出的答案必定会差强人意(答非所问或是回答不出)。因此我们会先前置一步进行内容搜索,通过内容来约束大语言模型的生成。这样的技术逻辑也称为RAG(Retrieval-Augmented Generation,检索增强生成)。

RAG其实就是对大语言模型的检索能力及联想能力的外扩,让大语言模型在可控范围内生成更准确高精的回答,尤其适用于专有领域的问答工具。RAG的原理如下图:

图片源自《Chatbot从0到1》(第2版),作者李佳芮、李卓桓

RAG 系统的起点一般是一个文本文档的语料库,简单看起来是这样的: 把文本分割成块,然后把这些分块嵌入到向量与transformer编码器模型,把所有这些向量建立索引,从而查询出与用户提问相关的上下文,最后创建一个带上下文的大语言模型提示语,让模型回答用户的查询。

我们可以对比有无检索模型对回答的差别:

大语言模型同样是ChatGPT3.5,提问“赵云要怎么培养”,单纯使用大语言模型,而没有检索模型的约束时,回答的内容就和游戏不沾边(左图)。而使用了检索模型,让大语言模型的回答就完全贴合游戏了(右图)。

三、问答质量的打磨调优

为了提升机器人的回答准确率。我们的调优有几个方面:

增强对用户提问的理解

对于用户的提问,除了分词切割,我们还有错字甄别、同义词判定等逻辑,希望程序能尽量清晰理解用户的意向。

增强检索模型的召回质量

在众多语料中如何找到最匹配玩家的内容呢?我们的检索算法,会在对用户提问进行分词后,会先用BM25算法根据关键词对文档进行第一次评分,然后根据评分阈值提取top-k文档进行第二次评分,还有问题和文档稠密向量的相关性评分等。每一步都可能影响检索的内容及LLM的回答结果。

选择更智能的语言模型

机器人上线初期,使用的模型是国内的ChatGLM2.0。但通过拉取用户的实际问答数据,我们发现答案质量并不理想,答案中存在较多答非所问、胡编乱造的问题。并且在多次调优检索模型后(提高召回文档的相关性),答案质量仍然不佳。

于是我们考虑更换大语言模型。我们找来了两款智能体做对比,分别是ChatGPT3.5及Google旗下的Gemma。三者对比后我们发现,ChatGLM2.0的幻觉问题较其他两个模型会更为明显。意思就是,如果检索模型召回的文档中不存在用户提问的相关内容(相关性低),则ChatGLM2.0会一本正经胡说八道。即便是检索模型召回的文档中有用户所需的内容(相关性高),ChatGLM2.0也可能会回答失准。

最后我们选择了ChatGPT3.5。对比下来,ChatGPT3.5在对话生成的流畅度、连贯性以及上下文理解方面的表现都更出色,能够生成更加精准和自然的回答,对于无法回答的问题,也会更直接地告知用户它不清楚。

四、语料的构成

如果说模型是问答机器人的肉躯,那语料就是血液。语料足够多,覆盖面足够广,问答机器人才会更具活力。

我们的语料有几个部分构成:

  • 游戏内所有呈现给玩家的文案,包括道具名称、说明及玩法简介。这类内容属于短内容,只有单个句子或单一段落。
  • 发布于官网、论坛的游戏攻略。这类内容属于长内容,由多个段落构成。
  • QA问答对。一问一答的固定内容。

如前所述,我们机器人分了两个答案输出逻辑,如果检索模型命中QA,则会更快给玩家产出答案。基于此,我们加大了QA问答对的产量,以提升问答效率。QA来源于玩家的真实提问,我们提取了高频问题,以及部分刁钻的提问,做成了问答对。

制作问答对比较费人工,因为answer都是人工写的,有时候还要玩一下游戏验证写的answer是否正确。为了节约工时,我们又借用了AI工具协助我们生产问答对。这里AI工具的作用不是帮我们快速生成答案,而是提前生成玩家可能问到的问题并产出答案。我们给AI喂入上述语料中的2-攻略长内容,并让AI根据文章内容中生成QA。不过,虽然生产速度提高了,但内容的实用性却并不高。AI生成的问题并不像玩家的提问,更像是老师出的考题,需要再二次修改问答对的内容。因此,目前的问答对维护还是集中在人工生产。

五、问答机器人的未来创想

我们的问答机器人还有很多优化空间。目前,虽然它在提升玩家体验方面已经取得一定成效,但仍存在一些需要改进的地方。例如尚未开发连续对话,玩家无法追问,造成对话交互不够自然流畅。此外,随着游戏内容的不断更新,我们的语料库也需要持续地维护和扩充,这也是需要不断消耗人力的工作。

不过我相信,问答机器人将在未来的游戏世界中扮演更加重要的角色,为玩家带来更加精彩和便捷的游戏体验。

欢迎在评论区一起探讨问答机器人的更多可能~

作者:杨桃,游戏行业B端产品经理,爱用文字记录观察及想法。

本文由 @杨桃 原创发布于人人都是产品经理,未经许可,禁止转载。

题图来自 Unsplash,基于CC0协议。

相关内容

热门资讯

湖南锂资源创新应用大会在临武举... 中新网郴州6月18日电(记者 鲁毅)湖南锂资源创新应用大会18日在郴州临武县举行,大会展示了5项锂电...
荣耀CEO李健官宣:新一代AI... 6月19日,在2025上海世界移动通信大会上,荣耀CEO李健发表了名为《开放共生,众木成林 让AI走...
浙江天和取得装配式建筑支撑加固... 金融界2025年6月19日消息,国家知识产权局信息显示,浙江天和建筑设计有限公司取得一项名为“一种装...
6G将开启“内生智能”新纪元 本报记者 李迅典 被誉为“全球移动通信行业发展风向标”的2025世界移动通信大会(上海)6月18日在...
正式签约 “星算”计划总部项目... 封面新闻记者 罗田怡 2025年06月18日,“投资成都”全球招商大会在成都开幕,主题为“合作·创新...
小米雷军:美的、海尔都是非常优... IT之家 6 月 19 日消息,小米创办人,董事长兼 CEO 雷军今日发文称:“美的、海尔都是非常优...
AI 技术:驱动时代变革的核心... AI 技术:驱动时代变革的核心力量 在当今科技飞速发展的时代,人工智能(AI)技术如同强劲的引擎...
“星舰”静态点火测试中发生爆炸... 6月18日,马斯克的太空探索技术公司(SpaceX)“星舰”S36飞船在测试时发生爆炸。 视频画面显...
无人机巡检新纪元:通信基站勘查... 在哈尔滨,一场基站巡检的革命正在悄然发生。香坊劳动公园站点的铁塔下,不再是工作人员辛苦攀爬的身影,取...
小屏党的梦中情机!REDMI ... 一、前言:被遗忘的小钢炮 安卓高性能小尺寸平板何时归来 在安卓平板电脑市场,大屏化趋势愈演愈烈,12...
天津港南疆35千伏变电站开启无... 昨天,天津港南疆35千伏变电站正式开启无人化运行的新阶段,这标志着天津港首座35千伏级公共主站实现了...
黄浦江游轮5G新突破:下行峰值... 在上海市经济和信息化委员会的精心策划下,一场聚焦5G-A技术的实地测试活动近日在黄浦江上一艘名为“君...
欧几里得开启了一个宇宙信息宝库... 2023年7月,欧几里得空间望远镜发射升空。它将对宇宙中数十亿个星系进行成像,以探索占宇宙95%的暗...
华为电信再联手,“智聚大上行”... 6月19日,在2025年上海世界移动通信大会(MWC)上,中国电信携手华为公司在上海举办了5G-A“...
对标DeepSeeK!Mini... 6月17日,国产大模型初创公司MiniMax(希宇科技)宣布推出了全球首个开源的大规模混合架构的推理...
李书福对话王兴兴:一场关于AI... 【大河财立方消息】据吉利控股集团消息,近日,吉利控股集团董事长李书福与宇树科技创始人王兴兴首次同框,...
上影节开启“科技创制单元” 上... 上海6月18日电 (记者 王笈)第27届上海国际电影节科幻电影周“科技创制单元”开幕仪式暨上海科技影...
“人工智能辅助写作”讲座在广外... 6月18日下午,“人工智能辅助写作:阅读与写作改变人生”讲座在广东外语外贸大学中国语言文化学院举行。...
唯速智驾发布全国首套自动驾驶模... 2025年6月18日,北京唯速智驾科技有限公司(以下称“唯速智驾”)重磅发布全国首套自动驾驶模块化汽...
中国飞机强度研究所2025年度... 为推动中国飞机强度研究所(以下简称强度所)科研外协质量,促进产学研合作创新与协同攻关,让高水平研究团...