博鱼在线登录官网入口数据服务理念下高校机构知识库建设之路

  新闻资讯     |      2024-05-13 19:06

  博鱼体育中国入口高等学校作为教育教学和科学研究的主体,每年都产出大量的教学科研学术成果,越来越多的高校引入并建设机构知识库(Institutional Repository,IR)。高校机构知识库收集并保存高校教师和科研人员的教学科研成果与各类知识资源,提供数据资源的采集、存储、管理、展示、检索和开放共享服务,日益成为支撑高校学术研究的基础设施,成为推动高校科研活动的积极开展的重要工具。

  高校开展机构知识库建设是大势所趋,2020年的数据表明66%的“双一流”高校均建设了不同规模和功能的机构知识库。但是,高校机构知识库在学术交流中仍未发挥出期望的价值,数量的快速增长与其建设发展的低质量形成巨大的反差,呈现出“雷声大雨点小”的态势。从我国高校机构知识库普遍利用率低、发展迟缓的现状来审视,主要存在三个方面的问题:

  我国高校机构知识库采用的建设模式大多是由图书馆作为发起和负责部门,独自进行机构知识库的规划建设、政策制定和系统管理维护等工作。然而,图书馆作为高校服务保障部门不具备相应的科研信息管理职能,在政策的制定和执行方面,只能基于无任何约束力的作者的自愿和自觉方式进行,其建设效率和效果往往不能很快取得预期的效果,多存在内容提交率和认同率低的问题。同时图书馆部门很难将机构知识库建设重点关注到数据质量建设和共享服务方面。因此,不少高校机构知识库依然停留在文献资源组织和保存层面,服务模式有待拓展。

  目前国内高校机构知识库普遍面临数据不全面、不准确的问题。数据不全主要体现在传统的机构知识库主要依赖数据爬虫技术从WOS、CNKI等数据库中爬取研究最终成果(论文、著作、专利等),但科学研究过程中的数据资源,也称为“灰色资源”的采集和管理并未全面纳入机构知识库的管理范畴。数据不准主要是指由于技术限制,成果机构署名不标准、不准确或作者重名等原因导致机构知识库向学者推送、需要学者认领的数据准确度不高,会让学者对机构知识库产生不信任感。

  由于功能单一、交互性能差、用户参与度低等问题,我国高校机构知识库的建设在服务创新方面存在较大局限性。

  高校机构知识库建设初期便应明确建设需求和建设目标,明确机构知识库的功能不能局限于成果数据的存储,面向的用户也不应仅局限于校内学者,还应充分考虑学者、院系以及职能部门三类用户的真实需求,将数据服务作为最终落脚点,围绕成果收集、管理、展示,数据服务和决策支持的建设目的,建设可持续发展的服务型机构知识库。

  高校信息化建设管理部门是其公共数据平台的建设管理单位,以信息化建设管理部门为中心来牵头高校机构知识库的建设和数据服务,具有天然的优势。在基于数据服务理念的机构知识库中,不同身份的用户有不同需求,高校机构知识库可采用多部门共建的模式,由图书馆或信息化部门牵头,联合学部院系、科研管理、人事管理、学科建设、发展规划等部门,根据各部门和用户的实际需求,制定符合高校实际情况的机构知识库功能设计方案,为全方位服务的开展奠定良好的基础。

  通过多种途径收集分散的学术成果数据,形成完整、准确、权威的学校学术成果仓储并实现数据与其他系统共用,为学校职能部门和领导决策提供数据服务,为用户解决实际问题,如满足人事年度考核、科研绩效评估、科研信息统计分析、学科竞争力分析、二级单位成果汇总等功能博鱼在线登录官网入口,解决教师反映强烈的“重复填表”问题。

  大连理工大学机构知识库于2017年开始建设,2018年9月正式上线年进行了两次优化升级。学校在建设过程中,结合本校特点形成了一套较为完善的学术成果数据管理维护流程,有效提升了学校学术成果数据质量,并开展了多项数据分析、数据推送等数据服务探索,取得了良好成效。

  基于上述建设思路,大连理工大学机构知识库系统整体包含成果管理中心、系统管理中心、个人管理中心、机构知识库门户、数据服务五大模块,系统架构如图1所示。

  较高的数据质量是开展数据服务的基础。在探索如何提升机构知识库数据质量的过程中,学校进行了多种方式的实践:

  在系统设计初期,考虑到数据应用涉及到各类评价、分析指标,结合管理部门及业务部门的统计决策等需求,通过丰富数据标准和结构,使其能够满足日后不同口径、多维度灵活可变的统计分析场景,例如,成果所属学科标定时不仅采用了国际国内通用学科体系,而且参考了学校学科建设办公室制定的学科体系和成果所属学科认定规则,使得不同层面的成果学科标定可在同一平台上实现统计。

  为保证数据完整性,除了自动对公开发表的数据进行抓取外,还可通过公共数据平台数据同步的方式从学校“科研系统”、“知识产权系统”、“博硕士论文库”中获取了科研项目、获奖成果、专利、学位论文等相关信息。同时,学校“人事业绩系统”中积累了教职工自行填报的各类成果信息有明确的产权确认关系,将此部分数据通过分析、解析、去重、合理导入到机构知识库,充实和完善机构库的数据,减少今后用户进行成果认领的工作量,为上线后学者大规模认领工作打下基础。

  采用作者与署名机构相结合的自动匹配算法,首先通过抓取到的学校全量数据获得所有二级机构署名的拼写方式,通过聚类算法和人工整理相结合将所有署名拼写变形对应到我校的各二级机构中,形成机构变形库;同时允许用户在个人中心维护个人常用发文地址和个人姓名英文缩写变形库。

  机构变形库的维护将学校成果数据自动匹配率从60%提升至80%以上。在系统开放后博鱼在线登录官网入口,用户认领维护数据的工程中,自动匹配算法引入机器学习,设置多个判断维度,不仅仅考虑作者姓名变形要素,还加入作者署名地址、合作者、研究方向等因素,不断调整作者消歧算法,提高推送精准度。

  采用多角色分层管理模式,引入二级部门管理员(包括学部学院和机关部处)和成果类型管理员角色共同进行数据管理。二级部门管理员分管各自部门的数据,负责审核本部门老师提交的成果,并可以管理、指认、导出本部门成果数据。

  同时,各管理部门可设置人员为成果类型管理员,按照成果类型(论文、著作等)查看和管理某一类型的数据。分层管理模式使数据管理更加细致精确,分散了数据管理的压力,提升了工作效率。学院以“自上而下”的方式,“激励”教师参与成果认领和成果提交,同时审核这些数据,保障了数据的可靠性,使得管理部门更加认可机构库的数据,为后期开展数据服务奠定了坚实基础。

  对于教师学者而言,机构知识库不仅是数据管理工具,更是一个展示自我、学术交流的平台。我校机构知识库向教师提供更多增值服务,在细节上体现附加价值。

  个性化学者名片:用户可以个性化定制个人学术主页展现的内容选项,如可以设置个人基础数据某一项是否展示;还可以对不希望展示的个人学术成果进行隐藏博鱼在线登录官网入口,符合教师的个性定制需求。

  学者关注:用户可以对其他学者进行关注操作,关注学者后,该学者的成果会显示在“个人管理中心”中。

  投稿指南:面向校内用户开通投稿指南服务,通过对机构已有成果数据的分析,可发现对机构比较友好的期刊清单,学者可按照自己关心的机构、学科、分区等属性进行了解,进而提升教职工投稿的录用率。

  大连理工大学机构知识库系统内嵌成果数据统计分析平台(图2),可对整个机构、机构内院系/科研团队/机关单位、学者个人成果进行多维度细分统计,包括时间、成果类型、收录类型、部门、关键词、学科、来源等指标,支持统计口径的自定义组合配置,每年为科研院、技术开发院、发展规划处等相关职能部处、领导提供个性化数据分析。

  学术成果的数量和质量是教工工作量年度考核、职称评聘、履职考评、导师遴选时的重要依据。为了避免数据重复采集,真正解决学校教职工重复填表的问题,学校机构知识库系统已作为学校学术成果数据的权威来源,通过公共数据平台向各职能部门提供各位教工的成果数据,不再允许各业务系统或审批流程单独采集教职工的各类成果数据。

  机构知识库为多部门多业务提供数据支持,使孤立的数据资源活起来,具体体现在:

  (1)在教师个人主页系统、门户个人数据中心平台中,教师个人用于展示的“科研成果”数据包括论文、著作、专利等信息列表均来自机构知识库;(2)机构知识库中的各类数据已应用于人事管理中的职称评审、年度考核等工作,教师在填报职称评审数据时,不用再重复填写学术成果信息,人事业绩系统直接调用已在机构知识库认领的数据;(3)通过院系一张表平台,为院系各项管理工作提供数据支持,机构知识库数据已应用于各学部院系博士生导师招生资格审核、新增博士研究生指导教师申请、综合业绩绩效量化等业务中。

  根据学科建设办公室需求,基于机构知识库的学术成果数据和爬虫技术,构建了学科评估服务平台(图3),实时监控ESI、NATUREINDEX等评价体系相关指标、大学排行相关公布网站,自动采集学校各个排行榜排名以及相关指标,及时更新整合到学科评估服务平台,并利用这些数据开展优势学科分析、学科绩效统计、学科竞争情报等数据服务。

  服务创新已成为高校机构知识库未来建设和发展的重点工作,在未来的机构知识库服务拓展方面,计划在以下几个方面做出进一步探索:

  (1)继续围绕用户需求,提供更多数据增值服务,并增强对机构知识库的宣传与推广,让学者用户不仅仅在“政策强制”“绩效驱动”下使用机构库,而是真正认可、依赖并乐于使用机构知识库;(2)增进机构知识库与科研管理系统的数据联动,实现机构知识库中的成果数据与科研管理系统的项目基金信息相关联,为项目基金管理和科研成效评价等提供便利;(3)持续关注开放获取知识库联盟(COAR)发布的相关技术、标准和协议,拓展机构知识库的多校联合发展模式,为未来学术环境全面开放做好准备。

  基金项目:大连理工大学基于信息化手段的高校科研管理水平提升与服务创新研究(DUT22JC27 )