杨笛一新作:社恐有救了,AI大模型一对一陪聊,帮i人变成e人
创始人
2024-04-09 15:50:55
0

原标题:杨笛一新作:社恐有救了,AI大模型一对一陪聊,帮i人变成e人

机器之心报道

编辑:陈萍、杜伟

在社交活动中,大语言模型既可以是你的合作伙伴(partner),也可以成为你的导师(mentor)。

在人类的社交活动中,为了更有效地在工作和生活中与他人沟通,需要一定的社交技能,比如解决冲突。

然而,社交技能的练习环境对于大多数人来说通常是遥不可及的。特别是由专家训练这些技能时,往往耗时、投入高且可用性有限。现有的练习和反馈机制很大程度上依赖专家监督,使训练难以扩展。此外,经过专业培训的教练也缺乏,而大多数可以提供定制化反馈的教练无法帮助大量有需要的人。

近日,在由斯坦福助理教授杨笛一为共同一作的论文《Social Skill Training with Large Language Models》中,研究者认为,借助大语言模型可以使得社交技能训练变得更容易、更安全、更有吸引力,并在现实、虚拟练习空间中提供量身定制的反馈。

论文地址:https://arxiv.org/pdf/2404.04204.pdf

具体来讲,研究者提出了以下两种社交技能训练框架。

第一个训练框架是 AI Partner,它可以通过模拟练习为体验式训练提供可扩展的解决方案。此前已经有研究表明,人类角色扮演可以有效地教授沟通、合作和领导技能。与 on-the-job 训练相比,模拟可以让学习者承担更少的风险和机会成本。而通过模拟,AI Partner 将减少进入专业领域的社会经济障碍。

第二个补充训练框架是 AI Mentor, 它将根据领域专业知识和事实知识提供个性化反馈。

这两个训练框架(合称为 APAM)都可以将体验式学习与现实练习、定制反馈相结合。研究者呼吁通过跨学科创新来解决 APAM 的广泛影响。

论文作者杨笛一表示:「学习社交技能对大多数人来说是遥不可及的,我们如何才能使社交技能训练变得更容易实现?基于此,我们推出 APAM,其利用 LLM 通过现实实践和量身定制的反馈进行社交技能训练!」

她接着表示:「在 APAM 中,当用户想要学习一项新的社交技能时,AI Partner 可以帮助他们通过模拟对话来练习相关场景。AI Mentor 可以在模拟的关键时刻提供基于知识的反馈。」

APAM 架构概览

该研究提出了一个通用框架专门用于社交技能训练,该框架包括 AI Partner 和 AI Mentor(两者简称 APAM),并且这两者至关重要。当用户想要学习一项新的社交技能时,AI Partner 可以通过模拟对话帮助他们练习相关场景。AI Mentor 可以在模拟的关键时刻提供基于知识的反馈。

然而,构建和部署 AI Partner 并非易事,比如很难保持模拟人物的风格、行为和情感特征的一致性。而开发 AI Mentor 在很大程度上依赖于领域专业知识、情境感知和反馈效率等因素。

为了解决上述问题,研究者提出通过 LLM 进行社交技能训练的通用方法,分四个步骤完成:

  1. 了解如何解决问题的技能(例如,解决冲突);
  2. 设计一个 AI partner 来模拟对话,让学习者(即用户)接触目标过程,进行练习;
  3. 创建一个 AI mentor 来提供反馈;
  4. 将这两个智能体集成到模拟环境中,以便用户学习。

研究者表示,APAM 框架的理想受众是初学者,但是有经验的人也可以使用 APAM 系统来刷新他们的知识。

APAM 可以在许多领域提高学习者的技能,表 1 列举了一些应用场景,例如如何倾听、心理健康咨询等。不过 APAM 框架不仅限于这些典型的例子,论文第 6 节有更多的介绍。

虽然 LLM 作为社交技能训练工具潜力巨大,因为它们可以生成连贯且自然的文本。然而,这种灵活性往往伴随着有限的可控性。

出于安全考虑, APAM 框架为如何应用 AI 提供了一系列措施,他们将使用过程分解为一个连续体:AI Partner 连续体以及 AI Mentor 连续体,每个连续体都由三个模型完成(如图 1 所示)。

评估结果

AI partner 和 AI mentor 的评估是一个重大挑战,基于 APAM 的工具涉及复杂的计算系统以及与不同需求和背景的用户的交互。

为了将这些训练工具开发为一个领域,评估措施需要超越自然语言处理中传统的指标,转而采用来自多个相关领域和利益相关者的方案。纳入多学科视角将有助于评估此类系统的实证性能、基于用户角度的可用性以及对用户和社区的长期影响。

目前,文本生成的研究主要集中在内在评估上,即通过预定义的规则或交互来评估输出的质量。

在下表 2 中,研究者主要划分为全自动评估和用户驱动评估。基于参考的指标(如困惑度或 Kullback-Leibler 散度)通常用于系统质量自动评估,它们既简单又允许通过演示对所需行为进行丰富的定义。

表 2 详细列出了以往工作中适用于 APAM 系统的内在和外在评估程序。目前,自然语言处理从业者主要关注对系统的内在评估。本文中,研究者强调使用既定的教育成果衡量标准来评估 APAM 系统的重要性。

更多细节请参阅原论文。

相关内容

热门资讯

北上 | 来自铁路上的他们! 白山黑水间,青春热望与北疆辽阔相遇。这片土地以包容开放姿态,托举青年理想,而青年正以滚烫赤诚回应时代...
从太空轨道到未来神话的伦理危机 在技术飞速发展的当代,人工智能、宇宙移民与生命工程的讨论已从专业学界延伸至公众视野,技术如何改变生命...
AI浏览器新挑战:Perple... 在AI技术日新月异的当下,一场关于如何重新定义上网体验的商业竞争正悄然升温。近期,备受瞩目的美国AI...
智元机器人入主上纬新材:三步走... 近日,资本市场迎来了一则引人注目的消息:智元机器人拟入主A股上市公司上纬新材(688585),这一消...
蓝海视界取得CELL双工位检测... 金融界2025年7月9日消息,国家知识产权局信息显示,深圳市蓝海视界科技有限公司取得一项名为“一种C...
“双轮驱动”打通 页岩油开发的... 新的成就标志着新疆油田在非常规油气开发领域取得重大突破,更彰显了开发者们齐心协力“把这件事干成”的坚...
格力申请一种BMC材料组合物等... 金融界2025年7月9日消息,国家知识产权局信息显示,珠海格力新材料有限公司;珠海格力电器股份有限公...
中银国际:产业催化在即 重视A... 智通财经获悉,中银国际发布研报称,AI眼镜、AI手机等AI端侧产品正在进入加速落地期,国产消费电子龙...
走在前、挑大梁•产业链上的山东... 近日,2025年市工业企业“一企一技术”研发中心名单发布,威高采血耗材有限公司入围。作为国内采血耗材...
超导量子比特相干时间创一毫秒新... 新华社赫尔辛基7月9日电(记者朱昊晨 徐谦)芬兰阿尔托大学8日宣布,该校研究人员将超导量子比特的最长...
格力电器获得发明专利授权:“空... 证券之星消息,根据天眼查APP数据显示格力电器(000651)新获得一项发明专利授权,专利名为“空调...
汉仪股份涨2.46%,成交额2... 7月9日,汉仪股份涨2.46%,成交额2.08亿元,换手率6.03%,总市值47.02亿元。 异动分...
新技术赋能大豆中耕作业更智能高... 仲夏的垦区大地上,科技夏管如火如荼。北大荒农业股份八五二分公司的万亩大豆田里,一株株豆苗舒展新叶,在...
惠泰医疗:获批PFA产品,20... 【7月9日消息,华西认为波科获批新适应症,惠泰医疗PFA产品放量可期】 2024年12月,惠泰医疗的...
存力觉醒、AI未来!2025全... 2025-07-09 17:21:54 作者:狼叫兽 7月9日,全球存储行业的目光聚焦南京,202...
“技术加速主义”遭遇理想与现实... 编者按:技术加速主义,是一种主张通过技术进步推动社会变革的理念和思潮。眼下,它在美国的“试验”正在遭...
浩亭电子申请具有锁定系统的圆形... 金融界2025年7月9日消息,国家知识产权局信息显示,浩亭电子有限公司申请一项名为“具有锁定系统的圆...
填补国内空白!绿菱气体溴化氢(... 天津北方网讯:近日,天津经开区企业天津绿菱气体股份有限公司(以下简称绿菱气体)年产1000吨溴化氢(...
三年亏超6亿元,驭势科技讲不好... 出品 | 创业最前线 魏帅 2017年,L4级自动驾驶解决方案提供商驭势科技第一次开始了与中国香港...
落户井陉!工业无人机全球第五强... 日前,井陉县与工业无人机全球第五强企业——成都纵横自动化技术股份有限公司(简称纵横股份),就深耕低空...