旧版AI模型出现认知衰退迹象
创始人
2025-02-19 21:41:29
0

参考消息网2月19日报道据美国趣味科学网站2月16日报道,与人类一样,旧版聊天机器人也出现了认知障碍迹象。在一项通常用于人类患者的测试中,它们在几个重要指标上都不达标。

人们越来越依赖人工智能(AI)进行医学诊断,因为这些工具能以极快的速度和极高的效率,从病史、X光片和其他数据集中发现异常和警示信号,而这些往往是人眼难以很快察觉的。但2024年12月20日发表在《英国医学杂志》上的一项新研究引发了担忧:与人类一样,大语言模型和聊天机器人这样的AI技术,会随着时间推移出现认知能力下降的迹象。

论文作者写道:“这些发现挑战了AI将很快取代人类医生的假设,因为领先的聊天机器人明显存在的认知障碍可能会影响其在医学诊断中的可靠性,并削弱患者的信心。”

科学家使用蒙特利尔认知评估(MoCA)测试,对开放使用的由大语言模型驱动的聊天机器人进行了测试,包括开放人工智能研究中心(OpenAI)的聊天生成预训练转换器(ChatGPT)、Anthropic公司的“十四行诗”(Sonnet)AI模型和“字母表”公司的“双子座”(Gemini)AI模型。MoCA测试包含一系列任务,神经科医生常用它来测试注意力、记忆力、语言、空间技能和执行心理功能等。

MoCA最常用于评估或检测阿尔茨海默病或痴呆症等疾病患者的认知障碍。受试者需要完成的任务包括在钟面上画出特定时间、从100开始连续减去7、尽可能多地记住测试人员说出的单词等。对人类来说,从总分30分中得到26分就算通过测试(即受试者没有认知障碍)。

尽管对测试所使用的大多数大语言模型来说,命名能力、注意力、语言和抽象能力等测试似乎较为容易,但它们在视觉/空间技能和执行任务方面表现欠佳,有几个模型在延迟回忆等方面的表现比其他模型差。

关键是,尽管最新版本的ChatGPT得分最高(26分),但较旧的Gemini 1.0大语言模型仅得16分。这使研究人员得出结论:较旧的大语言模型出现了认知衰退迹象。

论文作者指出,他们的发现仅是观察性的,由于AI与人类的思维方式存在关键差异,该实验无法进行直接比较。但他们警告称,这可能指向他们所说的“重大薄弱领域”,有可能阻碍AI在临床医学中的应用。具体而言,他们反对在需要视觉抽象和执行功能的任务中使用AI。

这也引出了一个颇为有趣的设想:人类神经科医生开拓一个全新市场——为那些出现认知障碍迹象的AI“看病”。(编译/刘白云)

相关内容

热门资讯

原创 罗... 虽然罗永浩创办的锤子手机倒闭了,但是之前每次锤子手机的发布会,即便收门票,依然有不少人愿意前往,除了...
【IPO前哨】工业机器人龙头赴... 近日又有多家A股公司在港交所递交招股书,包括埃斯顿(002747.SZ)、豪威集团(603501.S...
涵盖95个重点产业化载体,成都... 如果说工业是经济发展的“压舱石”,那么空间载体就是工业发展的“硬支撑”。如何做强产业化载体的承载功能...
亚马逊、谷歌、微软等60家公司... 多知7月1日消息,据 Axios 消息称,美国政府周一宣布了一项“人工智能教育承诺”,超过 60 家...
自研技术畅通物流微循环——九识... 早上5点,在内蒙古河套平原巴彦淖尔磴口县,货箱上标注“九识ZELOS”的无人车装满近千票货物出发,向...
江苏畅颌取得一种独立式冷镦夹钳... 金融界2025年7月1日消息,国家知识产权局信息显示,江苏畅颌汽车零部件有限公司取得一项名为“一种独...
荣缘石化取得伸缩式鹤管专利,提... 金融界2025年7月1日消息,国家知识产权局信息显示,连云港市荣缘石化设备制造有限公司取得一项名为“...
2025年中国无人机竞速联赛第... 6月30日,2025年中国无人机竞速联赛(苏州站)在苏州市相城区苏州国际会议酒店隆重开幕!国际航联模...
压缩图片文件怎么弄?七个方便高... 在当今数字化时代,图片的使用场景愈发广泛,无论是用于社交分享、工作文档还是网站建设,图片文件的大小常...
AI智能体遭遇责任壁垒,Mix... 企业在关键应用中部署AI智能体面临挑战时,一种更加务实的新模式正在兴起,该模式将人类重新置于控制地位...
子洲县中药材智慧大棚育苗:科技... 阳光讯(郑懿 记者 高小雨)在子洲县,一座占地 500 多平方米的中药材智慧大棚正悄然改变着传统的育...
铜陵有色获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示铜陵有色(000630)新获得一项实用新型专利授权,专利名为“...
合成化学研究新范式:当AI“大... ·用人工智能(AI)来设计实验甚至在某些场合取代化学家的“直觉”,用机器人等自动化技术来高效做实验,...
原创 人... 咱生活的地球,一直在以大约 29.783 千米 / 秒的速度绕着太阳公转,差不多每 365 天就能转...
AI医疗重磅!华为+瑞金医院宣... 数据是个宝 数据宝 投资少烦恼 6月以来,AI医疗相关事件重磅不断。 6月30日,上海瑞金医院携手华...
小米16系列影像模组设计曝光 ... 【CNMO科技消息】7月1日,有数码博主曝光国产新旗舰的影像模组设计并透露了部分影像信息。根据网友猜...
疯狂挖人的扎克伯格推“超级智能... Meta首席执行官扎克伯格。图片来源:视觉中国 界面新闻记者 | 宋佳楠 当地时间6月30日,...
某OS连夜上线“苹果主题”?安... 十八年前苹果推出了第一款智能手机,从此iPhone稳坐手机行业的高端地位。可以说是流水的安卓,铁打的...
原创 在... 如果一名宇航员在太空中牺牲,他的身体漂浮在无边的宇宙中,身上穿着那套坚不可摧的宇航服。你觉得他会腐烂...
天正电气获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示天正电气(605066)新获得一项实用新型专利授权,专利名为“...