缩略图

重庆市科技项目系统查重功能及其技术浅析

作者

郝森 喻敏 王雪萌

重庆生产力促进中心 四川外国语大学 重庆 400000

摘要:科研诚信是科技创新的基石,是实施创新驱动发展战略、建设世界科技强国的重要基础。诚信管理坚持以信任为前提,遵循客观公正、科学合理,鼓励创新、宽容失败,统一标准、分级分类,强化监督、奖惩并举的原则,着力培育诚信意识,营造诚信氛围,构建符合科研规律、适应创新需求的科研诚信体系。对基于大数据人工智能技术的科研项目管理查重与查新功能服务,其最主要的应用场景为科研项目的查重与查新。本文主要针对科研项目重复申报的问题,研究基于大数据、人工智能等信息化技术运用于科技计划项目的查重与查新,揭示科研失信行为规律。

关键词:科研诚信;大数据;人工智能;

近年来,党中央、国务院高度重视科研诚信建设工作,相继出台了一系列政策文件,在全社会营造了诚实守信、鼓励创新、宽容失败的良好氛围。为进一步推进我市科研诚信建设,营造诚实守信的科技创新环境,规范科技计划项目责任主体的诚信管理,根据中共中央办公厅、国务院办公厅《关于进一步弘扬科学家精神加强作风和学风建设的意见》、《关于进一步加强科研诚信建设的若干意见》(厅字〔2018〕23号)、《关于进一步弘扬科学家精神加强作风和学风建设的意见》(中办发〔2019〕35号)、《科研诚信案件调查处理规则(试行)》(国科监〔2019〕323号)等规定,我市科技系统认真贯彻落实总书记有关科研诚信的重要指示精神,以科研诚信建设为抓手,重点围绕构建以信用为核心的新型监管机制,强化治理诚信缺失突出问题,深化守信联合激励和失信联合惩戒,从机制上对科研主体进行了约束和规范,从源头上预防和遏制了科研不端行为,确保全市科技创新活动有效开展。对标对表中央和市委市政府的决策部署,建制度“扎笼子”,强管理促创新,严惩戒守底线,全面加强科研诚信管理体系和机制建设,保障全市科技创新活动蓬勃开展。

重庆市科技局发布了《重庆市科学技术委员会科技计划信用管理办法(试行)》(渝科委发〔2014〕57号),明确了四类责任主体:项目承担单位包括项目牵头单位和项目参与单位。项目组成员包括项目负责人和主要参与人。科技专家是指接受市科技局及其他政府部门委托或受托第三方机构邀请,对科技计划项目组织实施与管理全过程相关事项提出评审、评估、咨询、论证意见,供管理部门决策参考的专业技术人员或综合管理人员。第三方机构是指接受市科技局委托、指导和监督,制定项目管理、经费审计和绩效评价等工作方案,独立开展完成相应工作内容,向市科技局提交工作报告,并对报告内容与结果负责的独立法人组织。2019年,由市科技局牵头制定,中共重庆市委全面深化改革委员会科技体制改革专项小组印发了《关于进一步加强科研诚信建设的实施意见》(科技体改〔2019〕1号)也强调“科研人员要恪守科学道德准则,遵守科研活动规范,践行科研诚信要求,不得弄虚作假,不得多头重复申报,骗取科技计划(专项、基金等)项目、科研经费以及奖励、荣誉等”。近两年来,市科技局建立了以信任为前提的科研项目管理机制和科研信用评价工作体系,实施科研诚信管理,实现科研信用与全市社会信用信息共享和联合奖惩,科研诚信管理建设成效显著。

但是,当前重庆市的科研诚信体系化建设整体上仍存在薄弱环节,违背科研诚信要求的行为时有发生。如何提高重庆市科研信用评价工作的科学性和有效性,分析影响科研信用相关主体信用评价的关键环节、关键要素和关键控制点,建立科研项目评价与失信监管指标体系,研制一系列规范科研信用评价的关键技术标准,为揭示科研失信行为提供有力的参考依据,从而提高科研失信防治能力并降低防治成本。

另外随着我国科学技术的持续不断发展,科研的投资规模和强度在不断加大,各种类别的科研项目的数量也在逐年快速增加。随着科研项目数量日趋增多,对科研诚信的要求越来越高,诚信建设的目标越来越明确,而科研项目重复申报、重复立项的问题迄今为止没有得到妥善解决。根据申报部门的不同,可以分为多头申报和重复申报;根据申报内容的重复程度不同,可以分为完全重复申报、部分重复申报和变相重复申报;根据申报的主体不同,可以分为单独重复申报和交叉重复申报;根据重复的种类不同,可以分为文字上的重复申报和思想上的重复申报:根据获资助与否,可以分为未获资助的重复申报和获资助的重复申报。基于以上要求,本项目组经过深入研究,提出以下对策建议:

一是构建符合“全市一体化政府服务平台”要求的项目管理平台。按照市政府“迁移上云”、部门内部信息系统整合、数据资源共建共享以及统一接入“全市一体化政府服务平台”的要求,依托科研诚信管理系统平台,利用项目管理系统项目信息资料,以用户为中心,构建全新系统架构,开发科研项目的查重系统,实现查重模块建设有查重对比、查重报告、自助查重、综合对比、热词分析、判断、结果可视化、后台管理等配套功能,同时保证管理和查询过程信息可记录、可追溯、可统计。

二是查重系统建设应注重顶层设计,分层次拟制设计方案。针对“文本处理”和“相似性”比较两个关键环节,引入已成熟应用的技术进行个性化定制开发,建立我市科技局独有的样本库和查重平台。该方式针对性强、实施效率较高,数据安全,但查重范围局限于资源共享平台自有的历史科研项目等数据。

三是细化各功能,明确主要工作流程与要求。查重对比功能应实现从预处理的标准文本中挖掘出能全面描述项目内容并能区别其他项目的特征向量,一般由特征词和权重组成。通过对特征向量进行整合,建立准备描述项目内容的模型的过程,生成查重报告。如新申报项目查重结果不符合要求,则由系统终止该项目提交申报。

查重报告功能应结合领域专家的综合分析和判断能力,从少量的疑似项目候选集中甄别出重复性项目。综合对比功能将查重报告结果纳入立项评审阶段的评审专家资料中,同时提供查重报告中相似度最高的3-5个项目的相关资料。由评审专家站在专业的角度,在充分考虑查重报告结果的前提下,提出项目是否确立为重复申报的建议。

四是科学合理构建模块架构,统筹各功能信息流向,明确关键流程和节点,规范系统操作。

建议按下图分层构建系统架构。

五是构建技术加资源合作方式扩大查重范围。未来在完善当前项目数据库基本查重功能基础上,可增加对接合作方的科技报告、成果、国家级项目数据等资源,可较快实现更广范围的查重,但涉及待查项目数据交换,存在数据安全问题。

查重与查新功能的完善,是对科研诚信管理系统功能进一步升级,夯实了工作基础,为决策部门提供重复项目排除、相似项目择优、定题项目不同研发团队优势资源整合等立项决策支撑,可提高科研管理部门的工作效率,协助科研人员,更好地为科研工作服务。