ChatGPT们,正在污染学术圈
创始人
2024-08-01 08:20:55
0

智东西

编译 | 陈骏达

编辑 | Panken

智东西7月31日消息,根据顶级学术期刊《自然》(Nature)昨日报道,生成式AI在学术写作中的使用已迎来爆发式增长。相关研究显示生物医学领域最大数据库PubMed上10%的论文摘要都有AI写作嫌疑,相当于每年15万篇论文中都有AI的参与。

德国柏林应用科技大学的研究表明,主流AIGC检测工具的平均准确率仅有50%,还很容易将人类写作内容判定为AI生成。而不少AI生成的论文却能轻易地通过转述、同义词替换等方式瞒天过海。此外,英语母语者的AI工具使用更难被检测出来。

虽然AI工具此前就在学术界广泛应用,但利用生成式AI直接输出论文或者代笔写作仍引起争议。AI工具让剽窃行为更容易了,还有可能造成版权内容的滥用。

AI辅助写作并非一无是处,不少学者因为使用生成式AI辅助写作而避免了用不熟悉的语言发表论文的麻烦,能将精力专注于科研本身。有不少期刊都允许了生成式AI工具的使用,但要求作者必须在论文中详细披露使用情况。

一、AI可能参与15万篇摘要写作,非英语母语者更易被发现

自ChatGPT于2022年底发布以来,AI在学术写作中的使用呈爆发式增长。来自德国图宾根大学的研究显示,2024年上半年生物医学论文中至少有10%的摘要使用了AI进行写作,按年计算约为每年15万篇论文。

这一研究团队分析了2010年-2024年生物医学领域数据库PubMed中1400万篇论文的摘要,他们发现以ChatGPT为代表的生成式AI工具的出现后,特定修饰性文体词汇的使用量出现异常的激增。研究团队用这些词汇的出现频率估计了使用AI写作的摘要的比例。

研究人员还发现,AI写作工具的使用在不同国家间也有差异。他们的数据显示,来自中国和韩国等国家的论文使用AI写作工具的频率比英语国家的论文更高。

▲学术写作中文体词汇使用量激增(图源:《自然》)

据该研究团队分析,英语国家的论文作者使用AI的频率可能也和其它国家接近,但他们的使用方式可能更难以发现。

其实在这波生成式AI浪潮出现之前,AI已经在药物发现、蛋白质结构预测等领域投入使用,这些使用并未引起过大的争议,其背后原因可能是在这类应用中,AI很明显扮演的还是辅助的角色。

生成式AI在学术写作中的应用带来了两大问题。一方面,剽窃因生成式AI而变得更容易了。剽窃者可以让生成式AI用学术期刊的风格转述他人研究,而转述后的文本与原文相似程度一般都较低,因此很难被判定为抄袭。

此外,AI模型在训练过程中消耗了大量版权内容,而模型极有可能将版权内容在没有任何提示的情况下输出给用户。《纽约时报》就曾发现OpenAI的AI聊天机器人ChatGPT曾直接输出过《纽约时报》报道中的原话,并未标注来源。他们也因此起诉OpenAI侵权。

二、猫鼠游戏中检测工具落败,可轻易规避还容易误判

为应对日益泛滥的AI工具使用,有不少企业推出了AIGC内容检测工具,但这些工具在和生成式AI的“猫鼠游戏”中纷纷落败。

去年年底,德国柏林应用科技大学的几名学者发表研究,他们发现学术界中经常使用的14种AI检测工具中只有5个实现超过70%的正确率。而平均识别正确率仅有50%-60%。

▲市面上主流AIGC检测工具表现不佳(图源:Weber‑Wulf et al. )

这些AIGC检测工具在面对人工编辑、机器转述后的AI生成内容时表现更差。仅需经过同义词替换和调整语序等简单操作,AIGC检测工具的正确率就将降低至50%以下。研究认为AIGC检测工具的综合识别准确率仅有50%。

▲图中05、06分别为AI生成后人类编辑和机器转述后的文本,AIGC检测工具在这两类文本上的表现很差(图源:Weber‑Wulf et al. )

数据显示,市面上的AIGC识别工具在识别人类写作论文时的准确率很高。但如果作者先用自己熟悉的语言撰写原创论文,然后让翻译软件翻译为另外一个语言,就有可能被识别工具误判为AIGC。这可能对学者和学生的学术声誉造成极为负面的影响。

三、辅助写作与学术不端界限模糊,AI写作工具也有其价值

不过,生成式AI工具的使用确实给部分研究者带来了便利。利雅得沙特国王大学(King Saud University)的信息技术研究员亨德·哈利法(Hend Al-Khalifa)分享道,在生成式AI工具出现前,许多不精通英语的同事在论文写作时都面临很大的障碍,而现在,这些学者可以专注于研究本身,不必再写作上耗费太多时间。

AI辅助写作与学术不端行为之间的界限很难划定。马里兰大学计算机科学家索海尔·费兹(Soheil Feizi)认为,使用生成式AI来转述现有论文的内容显然是抄袭。

但使用AI工具来辅助表达观点的行为不应该受到惩罚。在主动披露AI工具使用的前提下,研究者可以使用详细的提示词生成文本,或是利用AI工具编辑草稿。

多本期刊也规范了AI工具在学术写作中的使用,并未直接禁止。顶级学术期刊《科学》(Science)规定AI不可被列为合著者,而作者应披露所使用的AI系统和提示词,并对内容准确性和是否涉嫌抄袭负责。

▲学术期刊《科学》对AI使用的相关规定(图源:学术期刊《科学》官网)

学术期刊《自然》则规定研究者应该在“研究方法”部分记录生成式AI工具的使用。统计数据显示,截至2023年10月,100本排名靠前的期刊中,有87本都制定了使用生成式AI工具的指南。

结语:AI工具并非洪水猛兽,改变学术导向才能治本

在刚刚过去的大学毕业季中,有不少国内高校也在毕业论文答辩和评审过程中引入了AIGC检测工具。然而,这一指标的引入并未有效遏制与AI工具相关的学术不端行为。市面上还出现了专门降AI率的各种服务,在被误判为AI生成后,不少学生的论文因降AI率而变得面目全非。

对学术研究中的生成式AI工具采取对抗性态度或许很难根治这一问题。来自德国柏林应用科技大学的学者在总结研究时也强调,AI在学术写作中的滥用问题光靠AIGC检测很难完成,调整以论文和结果为导向的学术风气才是解决这一问题的关键。

来源:《自然》

相关内容

热门资讯

【2025数博会】数博会交流活... 8月26日,2025年中国国际大数据产业博览会媒体吹风会举行。记者从吹风会获悉,本届数博会交流活动预...
联影医疗:公司自主研发光子计数... 本报讯 (记者金婉霞)8月26日,记者从上海联影医疗科技股份有限公司(以下简称“联影医疗”)获悉,由...
原创 马... 《Her》是曾经上映的一部电影,讲述了有血有肉的人类和一堆代码构成的人工智能之间的爱情。 最近, ...
世界互联网大会文化遗产数字化论... 8月26日,2025年世界互联网大会文化遗产数字化论坛新闻发布会在北京召开。陕西网记者从会上获悉,世...
马斯克新公司:“巨硬”!硬刚微... 来源:市场资讯 (来源:智东西) 智东西 作者 王涵 编辑 漠影 智东西8月25日消息,两天前,马...
解码数字金融时代的保险新基建 大象新闻记者 于艳彬 在北京稻香湖的科技园区,有一座隐形的“科技之城”正在崛起。 这里没有鳞次栉比的...
小米16系列定档9月!四款机型... 设计革命:直屏+3D打印中框引爆行业 曲面屏时代正式终结!小米16全系回归直屏,标准版黑边压缩至1...
花江峡谷大桥荷载试验背后的“贵... 原标题:从“桥梁博物馆”走来的技术输出者 花江峡谷大桥荷载试验背后的“贵州智慧” “花江峡谷荷载试验...
赛力斯公布无人机加氢控制专利 ... 松果财经讯,天眼查App显示,8月26日,赛力斯汽车有限公司申请的“无人机加氢控制方法、车载氢能供给...
罗永浩火速澄清:并未拉黑俞敏洪... 8月26日,罗永浩发博澄清,并未拉黑俞敏洪与王自如,而是拉黑了两个“起哄”的网友。 罗永浩表示,“你...
云端上的高性价比云手机是什么? 你有没有因为手机内存不够用而头疼?或者担心重要数据丢失或者隐私泄露?还有,是不是因为手机配置不够,玩...
活动回顾 | 峥嵘岁月忆初心•... 峥嵘岁月忆初心•童心巧手颂祖国 8月23日,由市文广体旅局主办、市图书馆承办的“追寻红色记忆•点亮爱...
原创 墨... 玛雅文明在整个人类进化史上占据着极为重要的地位,其诞生与衰亡都充满了神秘色彩,至今仍然是令人困惑的谜...
2025数智美食生态大会在丰台... 新京报讯(记者姜慧梓)8月25日,2025中关村论坛系列活动—2025数智美食生态大会在北京丰台开幕...
重磅好消息,来自地下700米! 江门中微子实验大科学装置正式运行 2025年8月26日,江门中微子实验(JUNO)成功完成2万吨液体...
国星宇航更新招股书:AI智算卫... 近日,港交所文件显示,中国民营商业航天企业成都国星宇航科技股份有限公司(以下简称"国星宇航")更新招...
腾讯会议上线AI纪要,实时捕捉... 2025-08-26 14:14:04 作者:狼叫兽 8月25日,腾讯会议更新,正式上线“AI纪要...
XR眼镜如何成为工业现场的生产... 工业制造领域始终面临着诸多挑战。精密设备的维护复杂度持续增加,生产环节的质量控制要求愈发严格,物流仓...
vivo Y500系列官宣9月... 今日上午,vivo手机官宣“国民旗舰”新机 vivo Y500 将于9月1日19时正式发布。 按照官...
捉到“幽灵粒子”,江门中微子实... 捉到“幽灵粒子”,江门中微子实验正式运行 江门中微子实验中心探测器内部的有机玻璃球及光电倍增管。...