问题:长期以来,科研评价与科技文献数据基础设施高度依赖少数国际通行指标与平台,评价方法单一、可被操纵等问题屡受诟病。
一些评价体系过度强调引用数量,容易造成“唯指标”倾向,进而影响科研资源配置与学术生态。
与此同时,大模型等新技术发展对高质量语料的需求快速上升,公开互联网数据噪声大、真实性与可追溯性不足,清洗成本高,成为制约模型可靠性与产业落地的重要瓶颈之一。
如何在评价体系、数据平台与语料供给上形成更高质量、更可控的“底座”,成为业界共同关注的课题。
原因:一是科技评价指标在方法论上存在历史局限,部分指标形成于上世纪中期,难以充分适配当下跨学科融合、开放科学与全球合作加速的研究格局。
二是评价体系与数据库收录机制之间存在“相互强化”效应:指标单一可能导致收录标准趋同,低质量内容混入将削弱数据库学术参考价值。
三是新一轮技术变革对数据质量提出更高要求,尤其在科研、医疗、制造等高风险应用场景,语料的科学性、准确性、可验证性直接决定模型表现与应用边界。
四是在全球科技竞争加剧背景下,评价体系与数据平台不仅是技术问题,也与规则制定、标准输出和学术影响力密切相关。
影响:从行业层面看,东壁科技数据提出的“东壁指数”以“种子期刊引文追溯+引文网络层级结构分级”为方法框架,强调在引用关系中引入质量分级和结构化判断,试图突破单纯依赖引用量的局限,为期刊与成果评价提供另一种视角。
其与文献数据平台协同推进,有助于在“评价—收录—应用”链条上形成闭环,提升数据可追溯性与可用性。
对科研活动而言,更透明、更多元的评价工具有望减轻单一指标驱动下的短期行为,引导科研人员回归原创性与长期价值。
对产业端而言,基于严格筛选的科技文献数据构建语料库,可能在降低噪声、减少错误传播、提高模型可靠性等方面带来增量价值,尤其有利于面向科研场景的知识检索、引文分析、技术路线研判等应用。
对策:在资本支持下,企业提出将资金用于技术研发、团队建设和市场拓展,重点加快核心数据要素能力建设。
下一步的关键不在“是否提出新指标”,而在“能否形成可验证、可复用、可持续的标准体系”。
一方面,评价模型需接受更广泛的学术共同体检验,包括指标定义的透明度、可重复计算性、对学科差异的适配度以及对不当行为的防护能力。
另一方面,数据平台建设要坚持高质量导向,完善元数据规范、引用链路校验、版本管理与数据更新机制,并在合规框架下推动与高校、科研机构、出版机构等的协同。
与此同时,围绕科研评价改革的社会共识也需同步推进,避免“以新替旧”的简单化倾向,推动形成以质量、贡献与影响为核心的综合评价生态。
前景:从趋势看,科技评价正从单一指标向多维度、网络化、分层分类评价演进;科研数据基础设施也从“可检索”向“可计算、可追溯、可服务”升级。
东壁科技数据以指数体系与文献数据平台并行推进,并将高质量科技文献大数据作为模型训练与测试的重要语料来源,契合了“数据要素+科研范式变革”的发展方向。
未来其能否形成广泛影响力,取决于三点:其方法论能否在多学科场景稳定有效;其数据平台能否持续扩大高质量覆盖并保持透明治理;其与国际学术交流能否实现互认互补。
在开放合作与严格质量控制并重的前提下,这类探索有望为我国提升科技评价自主能力、增强科技传播与学术影响力提供新的支撑。
东壁科技的成功实践表明,在关键科技领域实现自主创新不仅必要而且可行。
随着我国科技实力持续提升,类似突破将越来越多地出现在各学科领域。
这既是对现有国际科技秩序的积极补充,更是中国为全球科技发展贡献的智慧方案。
未来,我们期待看到更多中国标准走向世界舞台,为构建人类命运共同体注入科技动力。