原创 科研人员标识的应用研究及对策建议
创始人
2025-05-07 21:41:23
0

本文刊载于《中国科学院院刊》2025年第3期"政策与管理研究”

韩阳1 彭杰1 李东2 贾雷坡1*

1 国家自然科学基金委员会 科学传播与成果转化中心

2 国家自然科学基金委员会 信息中心

随着国外主流科研人员标识的发展及其日益占据主导地位,国内各方逐渐认识到构建自主可控的科研人员标识的重要性。科研人员标识作为识别科研人员学术身份和关联科研要素的媒介,对高效管理科研数据、建立科学数据更新机制、构建多源学术信息知识图谱具有重要意义。文章运用文献调研与网站调研相结合的方法,剖析科研人员标识的应用现状与存在的不足,避免在我国构建科研人员标识的过程中出现姓名消岐方法、数据质量控制和隐私安全等常规性问题,结合我国实际情况,统筹国内各方力量,在标准制定、功能完善、系统互操作、数据质量控制和应用推广等方面通力合作,构建面向开放科学、服务科学研究的科研人员标识体系。

随着科研活动的日益频繁及与网络信息技术的交互融合,科学研究已迈入以数据密集型和开放性为特点的科研新范式,科学数据成为驱动科研范式变革的重要基础和推动开放科学发展的重要组成部分,其核心囊括了科研人员在全科研生命周期中所产生的科研项目和科研成果,例如科学数据、科研方法、学术文献等。然而,在科学数据快速推动科学发现和知识创新的同时,数据质量参差不齐、多源异构问题普遍存在,这对数据清洗、集成、检索和管理带来一定挑战,制约开放科学环境下科学数据共享流通。科研人员作为科学数据的创造者、管理者和应用者,在促进数据高效集成与共享方面发挥着关键作用。

据经济合作与发展组织(OECD)统计,截至2024年,世界科研人员数量已突破8 900万人,我国具备中级及以上职称或博士学位的研究人员全时当量达226.9万人年,且呈不断增加趋势;2022年,全球科学引文索引(SCI)收录文章量达278万余篇,SCI收录来自中国的文章量达78万余篇。在增量式科学时代下,科研人员和科研成果数量激增、科研人员姓名重复和格式不一等现象突出,以及科研人员流动规模日益加剧等情况,增加了网络环境下通过科研人员姓名进行快速、准确检索其学术信息的难度,阻碍了科学数据的高效管理和科研成果的广泛传播,制约了开放科学环境下的学术交流与合作。

为解决以上问题,早在1998年,Gary Cleveland就指出数字图书馆中分配科研人员唯一标识的重要性。之后,又有学者分别从建立不同数字对象之间的关联、规范引文和版权管理、提高学术信息检全率和检准率、提升科研人员学术能力评估的公平性和公开性、便捷科研项目申报与管理、构建基于科研人员唯一标识的图书馆身份认证服务系统等多角度分析了科研人员标识的重要作用。

尽管学术界对科研人员标识的关注度日益加强,但仍存在较多问题亟须解决。例如,科研人员标识的标准化和互操作规范缺乏,数据安全和隐私保护重视度不足,数据质量控制标准缺少,我国科研人员标识体系发展缓慢等。为此,本文在分析科研人员标识发展驱动因素和国内外主要科研人员标识发展现状的基础上,深入剖析科研人员标识应用中面临的挑战,为构建我国自主可控的科研人员标识提出相应的对策建议。

一、科研人员标识发展的驱动因素

科研人员标识作为识别科研人员学术身份和关联科研要素的媒介,对高效管理科研数据、建立科学数据更新机制、构建多源学术信息知识图谱、强化科研诚信与学术规范、助推数据共享应用与开放科学具有重要意义。

科研人员标识是解决论文作者姓名歧义的有效方式。在学术出版和科学研究领域,由于全球范围内作者姓名的多样性、拼写差异及同名同姓情况,导致难以准确识别论文与作者之间的归属关系,造成检索结果与实际需求不符,降低学术数据的质量和可用性。针对作者姓名歧义问题,通过为每位科研人员分配一个独特的、持久的数字标识符,对存在姓名歧义作者的论文集合进行划分,将科研成果正确归属给相应的科研人员,不仅能提升成果检索效率,也是准确构建科研人员学术画像、开展学术趋势分析的前提。

科研人员标识对高效管理科研数据、建立科学数据更新机制具有重要作用。面对当前科研成果爆发性增长态势,数据来源复杂、数据格式和标准参差不齐等问题不断涌现,为科研数据的整合、分析和管理带来一定难度。通过科研人员标识将科研生产链中的实体有效关联,有助于消除数据冗余、提升数据整合的准确性与数据的互操作性,从而建立实时有效的数据更新、共享机制。

二、国内外科研人员标识应用与发展现状

鉴于科研人员标识在科研数据管理中的重要作用,已有大量学者对科研人员标识进行了系统性概述。本部分在梳理国内外主要科研人员标识的基础上,重点分析科研人员标识的特点和主要差异。

2.1 国外科研人员标识

国外科研人员标识起步早、规模大。2006年,爱思唯尔(Elsevier)对在Scopus数据库索引期刊上发表文章的作者分配了唯一标识Scopus Author ID;随后科睿唯安数据分析服务公司(Clarivate Analytics)、汤森路透信息服务公司(Thomson Reuters)和自然出版集团(Nature Publishing Group)、日本国立情报学研究所(National Institute of Informatics)又分别构建了Researcher ID、Open Researcher and Contributor ID(ORCID)、Researcher Name Resolver(RNR)。目前,国外主流科研人员标识应用规模较大,其中,Scopus Author ID、Researcher ID和ORCID的个人用户规模分别达到1700万人、350万人、1575万人(表1)。

表1 国内外主要科研人员标识

国外科研人员标识的赋码方式各有不同,存在一人多码的情况。Scopus Author ID是根据归属机构、联系地址、研究领域、出版物名称、出版日期、合著者等信息分配赋码,当科研人员变更归属机构或同一归属机构出现不同表达方式时,会为同一位科研人员再分配新的Scopus Author ID,并显示变更前后的归属机构,出现一人多码情况。而Researcher ID、ORCID、RNR则需要个人主动注册申请。据统计,ORCID约有20%的注册用户处于非活跃状态,即“僵尸账号”,这削弱了ORCID的可靠性、信任度和完整性。

国外科研人员标识应用场景丰富。

① 关联科研要素,创建个人主页,导入成果信息。Scopus Author ID、Researcher ID和ORCID不仅提供通过DOI、PubMed ID等的多种成果快速添加方式,还支持不同科研人员标识之间的关联,进而通过数据库关联导入成果,提升科研人员维护个人主页的效率,确保成果汇聚的全面性和准确性。

② 提供学术信息分析服务。Scopus Author ID和Researcher ID同时提供多指标信息分析服务,如文献与引文趋势、合著者统计、H-index(衡量科研人员学术产出与学术影响力)、作者影响力射束图等,力求全面、客观反映科研人员的学术贡献。

值得注意的是,ORCID具有更广泛的开放性、国际性、包容性和跨学科性。

① ORCID与期刊出版商建立合作关系,提升科研要素汇聚能力。截至2021年10月,全球已有112家期刊出版商与ORCID签署了“最佳实践协议”,要求作者在投稿时提供ORCID,并将论文与ORCID关联。然而,有学者指出,尽管这些期刊出版商强制要求作者在投稿时提供ORCID,便于投审稿流程管理,但在未与更广泛作者群体磋商的前提下,实施强制性政策,对没有注册ORCID的作者带来了隐性压力。

② ORCID与基金资助机构、学(协)会、大学(含图书馆)等建立会员机制,通过应用程序编程接口(API)连接科研管理系统、基金管理系统,实现数据的自动推送。2013年,美国国立卫生研究院(NIH)与ORCID开展合作,支持SciENcv与ORCID连接,要求科研人员在申请部分基金项目时提供ORCID,简化简历创建流程,未提供ORCID的申请将不予受理。2018年,NIH与ORCID开展“ORCID减轻负担,提高透明度”(ORBIT)项目,旨在扩展ORCID数据模型,收集科研人员学术档案信息,提升基金资助效率。除NIH外,瑞典研究委员会(SRC)、奥地利科学基金会(FWF)、爱尔兰科学基金会(SFI)也相继授权使用ORCID。在ORCID广泛应用的同时,也存在一定的问题,例如利用ORCID进行学术欺诈、为虚假个人和/或由虚假个人建立ORCID账户,给公平、公正的学术环境带来潜在威胁。

2.2 国内科研人员标识

近年来,国外科研人员标识快速发展,获取了我国大量科研人员的信息,带来一定的数据垄断风险,对我国科技安全造成一定威胁。为此,国内各方逐渐认识到构建自主可控的科研人员标识的重要性,并先后付诸实践。例如,清华大学图书馆构建的Tsinghua University Researcher ID(ThuRID),中国科学技术协会构建的Science and Technology ID(STID)和国家自然科学基金委员会构建的Basic Researcher ID(BRID)(表1);中国科学院文献情报中心和中国科学技术信息研究所也在不断探索科研人员标识的生态构建与应用。

国内科研人员标识正值起步阶段,处于多方各自建设的局面。2009年,清华大学图书馆创建ThuRID,着手建立以清华学者为中心的知识服务系统,即“清华大学学者库”,旨在全面梳理并维护清华学者及其学术产出之间的精准关联。截至2022年10月,清华大学学者库已服务53个院系和机构,为3700余名清华学者建立了个人学术主页。2023年,中国科学技术协会和国家自然科学基金委员会分别对外发布STID和BRID,部署在中国科协智慧评审系统和国家自然科学基金大数据知识管理服务门户及科学基金网络信息系统中。其中,BRID是按照我国国家标准《科技资源标识(GB/T 32843—2016)》构建的基础研究科研人员标识,将在以下4个方面发挥作用:

① 服务科学基金项目全过程管理。科研人员可在项目申请、进展报告填报、结题报告填报等工作中,通过BRID调用科学基金项目资助成果,减轻信息填报负担,优化信息系统服务功能,提升工作的便捷性。

② 服务依托单位追踪科研产出。国家自然科学基金依托单位通过BRID追踪本单位科研人员的科研产出,查询发文量与被引量等数据信息,方便对科研人员进行学术评价和服务。

③ 构建高效科研数据生态,提升信息化服务水平。国家自然科学基金委员会以BRID为纽带,与期刊出版商、图书馆、学术资源数据商等构建长期有效的科研数据更新机制,汇集科研人员多维度的学术成果,为科研活动参与主体提供便捷、高效的信息化服务。

④ 服务社会公众查询、追踪前沿学术动态。社会公众将可通过BRID查询科研人员的学术成果信息,实时、有效追踪最新科研成果,洞悉学术动态。

国内科研人员标识缺乏有效的数据关联机制。与国外科研人员标识丰富的应用场景相比,我国科研人员标识仅停留在为科研人员创建学术主页,缺乏在数字化环境下与期刊出版平台、引文数据库之间的关联,缺乏有效的数据汇聚共享机制,这将在一定范围和一定阶段限制国内科研人员标识的应用和发展。

三、科研人员标识应用发展中的不足与挑战

3.1 姓名消歧方法仍存在一定局限性

科研人员标识的直接作用是姓名消岐,即解决“谁是谁”的问题,主要利用计算机自动消岐技术实现。计算机自动消岐技术主要包括2类:

① 基于特征(文本特征和语义特征)的姓名消岐——通过人工对文本属性进行建模或建立无监督语言模型,判断待消岐论文是否属于同一个真实世界研究者,为同一作者赋予唯一科研人员标识,建立科研人员与成果之间的对应关系;

② 基于连接的姓名消岐——利用网络拓扑结构所蕴含的丰富高阶语义信息实现作者姓名消岐。这2类计算机自动消岐技术各具特点和优势,且在应用中已取得一定进展,但仍存在一定局限性。例如,仅单一利用论文文本和语义特征或关系属性,没有充分挖掘并融合多类型特征,忽略待消岐任务之间可能存在的联系和全局网络关系。武南南等提出融合多空间特征的网络对齐模型,但此模型从理论到具体应用仍存在诸多挑战。

由于数据源的复杂性和消岐技术的局限性,计算机自动消岐结果总是存在一定误差,在此基础上发挥科研人员的主观能动性,对个人科研成果记录进行真实性认证是一种有效可行的补充方法,但若缺乏严格的监督机制,科研人员标识系统将可能成为科研人员装饰其科研成果与科研水平的场所,丧失其应有的意义与价值。

3.2 数据质量控制和隐私安全保护重视度不足

科研人员标识系统亟待加强对元数据质量和标准的控制。高质量的数据是整合各类学术信息、构建学术交流平台、提供高效信息检索服务的核心要素和前提基础,故提升数据质量控制水平、降低数据信息缺失发生率至关重要。缺乏对科研人员所输入元数据的质量监督,势必会产生大量虚假信息,降低数据有效性,还会为元数据更新带来困难。此外,现有科研人员标识系统存在元数据字段和标准不一致的情况,这不仅影响标识系统之间的互操作,还限制对元数据的开发与应用。

大数据时代个人隐私数据泄露已成为全球重大的社会问题,科研人员标识系统在汇聚融合科研人员和科研成果等学术信息的同时,还需要重视个人信息的授权公开和保护。科研人员将个人信息提交至标识系统,意味着这些个人信息将全部公开,这需要科研人员对标识系统和系统使用者的双重信任,确保个人信息不会被泄露和非法使用。科研人员信息外流将对我国科技安全造成一定威胁,因此我国日益重视对科研人员信息的保护。

3.3 国内多方各自建设,缺乏有效的数据共享机制

我国科研人员标识系统建设处于起步阶段,面临诸多困难挑战,主要表现为3个方面:

① 各自建设,尚未形成规模化应用。清华大学、中国科学技术协会、国家自然科学基金委员会等均建有本系统特色的科研人员标识,人员覆盖存在一定重叠,易出现一人多码的情况,科研信息整合度不高,不利于全面提高学术信息资源的利用效率。

② 未实现与外部数据库关联,成果汇聚不全面,时效性差。目前,国内科研人员标识系统仅停留在为科研人员创建个人主页,依靠科研人员主动上传或认领科研成果,成果汇聚的时效性和全面性较差;尚未建立完善的标识解析系统,缺乏与外部数据库的互操作性,一旦科研人员标识脱离各自的系统,将成为无意义的字符串。

③ 科研人员标识的可推广性不受重视。尽管科研人员标识在信息检索、知识传播与共享、学术评价等方面发挥了积极作用,但由于我国科研人员标识的构建仍处于起步阶段,许多功能尚未开发和应用,缺乏与高校图书馆、国内外出版商等之间的合作,这将直接导致其在推广应用中面临诸多挑战。

四、构建我国科研人员标识系统的相关建议

在全球开放科学迅速发展的背景下,快速且准确地检索科研人员及其科研成果已成为开展科学研究的迫切需求。科研人员标识既为此带来新的机遇,也面临一系列的挑战。加快构建我国自主、安全、高效的科研人员标识体系,既要从全球视角出发,积极融入国际主流科研人员标识生态网络,探索与国际期刊出版商和数据库的合作方式,又要以我国科研人员标识的具体应用场景为牵引,完善相关制度规范,加强数据质量控制与监督。

鉴于国际主流科研人员标识已逐步实现规模化应用,且国内各方对构建自主科研人员标识的积极响应,我们应采取相应措施,构建面向开放科学、具有一定引领作用的科研人员标识。为此,提出以下3个方面建议。

(1)统筹规划,凝聚各方力量,推进科研人员标识可持续管理

随着国内科研人员和科研成果的爆炸式增长,以及大数据和人工智能技术的飞速发展,数据科学的新范式逐步兴起。构建科研人员标识是一项涉及面广、影响深远的工程,要发挥我国集中力量办大事的新型举国体制优势,推动信息汇聚、元数据规范、软硬件集成开发、信息联通与服务等方面的协同合作。

① 出台国家层面的科研人员标识管理办法。通过制定相关技术标准,对科研人员标识及其元数据进行统一管理与维护,并针对数据隐私保护等问题进行明确界定;依托完备的科研人员标识管理办法,逐步建立跨行业、跨机构的科研人员标识关联与应用生态,实现多元学术价值增值和知识共享。

② 建立有效的科研人员标识运行管理机制。加强对标识系统构成属性的管理,例如科研人员标识构成规则、注册与分配规则、数据存储空间、数据许可原则等;加强对标识系统服务属性的管理,如API数据检索接口管理、国内科研人员标识系统集成、国外科研人员标识系统关联等。

③ 构建高效的科研人员标识运行模式。例如成员机构准入资格和共同决策原则、良好的公众监督与信息反馈制度等。这些措施将加速我国科研人员标识体系建设进程,推动科研人员标识的可持续发展。

(2)完善科研人员标识系统的功能与互操作

① 依托多方需求,构建定制化科研人员标识服务平台。科研人员标识系统应以服务开放科学环境中的科学研究为导向,针对不同群体的需求开发个性化服务窗口和定制化模块,为科研人员、科研机构、科研资助机构、期刊出版商等提供量身定制的服务。例如,科研人员注册标识后,可以维护个人科研主页;科研资助机构和期刊出版商可以将标识嵌入各自的工作流程,消除姓名歧义、减轻工作负担、提升成果关联度;科研机构可以利用标识系统中的数据更新本地数据库,降低数据库管理与维护成本,营造公平公正的科研评价体系。

② 构建基于科研人员标识的数据互联互通与更新机制。科研人员标识系统的数据更新是一个持续动态的过程,除了科研人员主动更新数据外,还需要通过数据接口与外部数据库及其他科研人员标识系统建立关联,实现系统间数据共享与复用,充分发挥各类系统的潜在价值,推动学术交流,促进知识创新。

③ 国内相关组织应积极参与国际标识项目与实践,在交流和实践中逐步完善我国科研人员标识体系。

(3)强化科研人员标识宣传、推广与应用

科研人员标识的广泛应用需要科研人员、科研机构、科研资助机构、期刊出版商等各方的共同努力。

① 根据具体应用场景,制定科研人员标识使用规范。要求科研人员在有关工作流程中提供个人标识,提升标识的可见度和影响力。

② 通过采取激励机制,鼓励科研人员和相关机构积极参与科研人员标识的推广与应用。例如,可以通过邮件或其他方式将与科研人员标识关联的成果数据推送给科研人员或相关机构,推动期刊出版商在学术出版过程中嵌入科研人员标识,加强科研人员标识的宣传力度,促进其推广与普及。

作者简介

韩 阳 国家自然科学基金委员会科学传播与成果转化中心助理研究员。主要研究领域:开放获取,开放科学,科技资源标识建设与管理等。

贾雷坡 国家自然科学基金委员会科学传播与成果转化中心副研究员。主要研究领域:开放获取,开放科学,科技成果转化等。

文章来源

韩阳, 彭杰, 李东, 等. 科研人员标识的应用研究及对策建议. 中国科学院院刊, 2025, 40(3): 552-560.

DOI: 10.16418/j.issn.1000-3045.20240509002.

本刊发表的所有文章,除另有说明外,文责自负,不代表本刊观点。

相关内容

热门资讯

西安市雁塔区:确保人工智能创新... 本报讯(实习记者 刘嘉伟)5月7日,西安市委宣传部、市政府新闻办举行“‘深化六个改革’ 创新推进中国...
对比不同品牌的微重力旋转细胞培... 以下是美国Sy系统与中国Kilby Gravite微重力三维细胞培养系统, (北京基尔比生物科技公司...
原创 曝... 据博主@i冰宇宙 独家爆料,三星的旗舰机开始往轻薄化方向发力,会从电池轻薄化入手,让机身继续减薄,其...
小米汽车致歉!回应SU7 Ul... 5月7日晚间,小米汽车官方发布《关于大家关心问题的回答》一文,回应小米SU7 Ultra最近引发广泛...
为何大脑越用越灵?那得问那只改... 文 | 追问nextquestion 2024年7月的一个雨天,蒂姆·布利斯(Tim Bliss)...
宇树科技回应机器狗Go1存在后... 红星资本局5月8日消息,针对此前一些博主声称“宇树科技的Go1机器狗存在后门漏洞”的情况,宇树科技公...
上海普力通申请热硫化胶面用胶粘... 金融界2025年5月7日消息,国家知识产权局信息显示,上海普力通新材料科技有限公司申请一项名为“一种...
一季度增速全省第一!来看眉山工... 看企业生产——四川省钢构智造有限公司眉山基地生产车间里,焊花如繁星般闪耀,机械的轰鸣声交织成一曲奋进...
苹果高管预测:未来十年,iPh... 在近期一场备受瞩目的听证会上,苹果公司的服务业务掌舵人艾迪·库发表了一项引人注目的言论。他预测,随着...
苹果要用AI搜索 郭明錤:谷歌... 苹果要在Safari中加入AI搜索 凤凰网科技讯 北京时间5月8日,苹果公司考虑在Safari浏览器...
被代码照亮的“逆袭”人生 在商务软件解决方案项目的赛场上,每一步都是突破极限的挑战。在代码与需求的“迷宫”中反复穿行,为了一个...
谷歌发布I/O版Gemini2... 【太平洋科技快讯】5月7日消息,谷歌在 I/O 全球开发者大会前夕,发布了 I/O Edition ...
井下巷道隔爆器升级改造 筑牢安... 近日,晋能控股集团阳泉燕龛公司程庄煤矿抽采队顺利完成井下巷道隔爆器升级改造工作,将原有隔爆水袋全面更...
南宁今年将落地一批“人工智能+... 无人机定期巡查航拍,有效识别并标注出建筑工地上的不规范行为;引入机器人、无人机提供末端配送服务,探索...
OpenAI计划将“星际之门”... 据英国金融时报报道,OpenAI表示计划通过在海外投资扩大其价值5000亿美元(IT之家注:现汇率约...
广东:大力发展新型消费 推进“... 中新网广州5月7日电 (记者 程景伟)广东省人民政府官网7日公布《广东省提振消费专项行动实施方案》(...
原创 黄... 5月7日消息,据CNBC报导,人工智能(AI)芯片大厂英伟达CEO黄仁勋于当地时间周二(5月6日) ...
思科推出量子网络纠缠芯片 通信世界网消息(CWW)据外媒报道,思科最近宣布推出其量子网络纠缠芯片,这是一个研究原型,据了解,其...
陕西华诚科技取得网络交换机外壳... 金融界 2025 年 5 月 7 日消息,国家知识产权局信息显示,陕西华诚科技发展有限公司取得一项名...
2025 年,SpaceX 发... SpaceX 再次希望通过一年进行 175 至 180 次的惊人发射数量来打破纪录 —— 而这还仅仅...