兰州大学机构知识库十年蝶变：从数据孤岛到全球化学术枢纽

问题——从“沉睡档案”到“可用数据”的现实需求高校科技创新与“双一流”建设不断深化背景下，学术成果的归集、确权、展示与复用成为基础性工程。长期以来，学位论文、科研报告、专利与论文分散在不同载体和系统中，既存在纸质或零散电子存档难以检索的问题，也存在不同平台口径不一、重复统计、更新滞后等痛点。对科研人员而言，成果展示与对外传播依赖手工填报；对管理部门而言，数据取用需要多头汇总，影响决策的及时性与准确性。原因——数据来源复杂、标准不统一、系统壁垒突出一上，科研成果来自国际国内多种数据库与校内业务系统，元数据格式、字段标准和更新节奏差异较大，传统依赖人工导入、复制粘贴、去重匹配，不仅耗时耗力，也容易产生遗漏与错配。另一方面，作者署名、机构名称存在多种写法，尤其是拼写差异、缩写、合署单位等情况，导致“同人成多名、成果难归属”。同时，科研、人事、教学等系统往往各自建设，接口不畅带来“数据孤岛”，难以形成贯通的科研画像与治理闭环。影响——效率、质量与开放度共同决定学术竞争力兰州大学涉及的实践表明，机构知识库不只是“存储仓库”，更是支撑科研治理的底座。通过面向多源数据库的自动化采集与校验，成果汇聚速度与准确度大幅提升，过去需要大量人工处理的流程被系统化替代，减少重复劳动的同时降低错漏风险。通过作者与机构规范化处理，历史成果得以回溯补全，科研人员的学术履历更加完整，成果“找得到、归得准”。通过与业务系统互联，成果数据能够反向服务项目管理、个人主页更新、资源采购与教学安排等场景，推动管理从“事后统计”向“过程可视化、动态可追踪”转变。对策——以标准化、自动化、互联化提升知识库“可用性” 据介绍，兰州大学在机构知识库建设中突出三项抓手：一是提升自动采集能力。通过插件与定制化抓取工具，对接WOS、CSCD、IEEE等数据源，实现新收录元数据的定时抓取、查重与入库，形成常态化更新机制，减少人工搬运带来的不稳定因素。二是强化智能认领与规范体系。围绕作者别名与机构规范名建立规则库，采用模糊匹配与校验机制，并辅以人工复核，尽可能消解署名差异带来的归属问题，使分散成果“回到”作者与学院名下，提升统计与展示的可信度。三是打通关键业务系统，扩大数据服务半径。通过接口与人事、科研等系统建立联动，教师院系职称等信息实时同步，项目与成果相互关联，个人主页自动生成与更新。同时，向校园应用开放接口，使教务、图书、管理等系统能够按需调用，实现“数据多跑路、师生少跑腿”，推动校内数据共享从“可连通”走向“可复用”。前景——从“存得下”到“用得好”，走向更深层次治理能力建设业内人士认为，机构知识库的下一阶段竞争点在于知识组织与决策支持能力。兰州大学提出将深入拓展数据类型，完善语义检索、学术影响力分析及面向政策与学科建设的评估模型，推动平台由“资源汇聚”升级为“知识发现”。同时，通过社区共建、学者交流等方式，提高科研人员参与度，促进从“被动入库”向“主动分享”转变。随着开放接口持续完善，知识库有望在跨校合作、成果传播与国际学术交流中发挥更大作用，推动高校学术资源以更规范、更可持续的方式融入全球知识网络。

机构知识库的建设不仅是技术升级，更是管理理念的革新。通过标准化、互联互通和开放共享，实现数据的高效利用。在高校数字化转型过程中，如何确保每项成果被准确记录、便捷调用和持续赋能，将成为提升创新效能的重要课题。