古籍数字化迈入人机协同新时代 3.7万志愿者助力15亿字文献高效整理

古籍整理是中华文明传承的重要环节,但长期以来面临效率低下的困境;传统古籍校勘工作依赖于人工比对,学者需要穷极一生进行版本校对,这种方式不仅耗时耗力,而且容易出现录入错误,进而增加后期校勘成本。随着计算机技术的应用,虽然文本录入速度有所提升,但仍未从根本上解决古籍整理的效率瓶颈。 近年来,光学字符识别技术和人工智能发展为古籍整理工作带来了革命性转变。北京大学中文系教授杨海峥指出,OCR技术成为古籍文字提取的核心工具,其高准确率为文本利用奠定了基础。更为重要的是,AI技术可以在短时间内完成文本标点、专名识别、多版本自动对齐等工作,过滤形近字错误,生成结构化校勘记录,使学者能够将精力集中在关键译文的判断和分析上,从而大幅度节约校勘时间。 为运用新技术的优势,全国高等院校古籍整理研究工作委员会主办了"我用AI校古籍"项目。自2024年启动以来,这一目在"识典古籍"智能整理平台支持下,吸引了全国1450余所高校的2万名大学生及1.7万名社会公众志愿者参与,累计完成15亿字的粗校工作,约覆盖2万部古籍。此成果充分表明了人机协同的强大力量。 AI技术的应用显著降低了古籍整理的专业门槛,使更多热爱传统文化的人士能够参与其中。首都师范大学敦煌学博士生方晓辰在参与《康熙字典》校对时发现,平台的图像识别功能可以精准捕捉复杂字形的笔画细节,配合在线字典数据库,几秒钟就能完成生僻字的录入和校对。这种便捷性使原本枯燥烦琐的整理工作变得轻松有趣,激发了参与者的热情。在机场工作的志愿者张晓波虽然从事行业与古籍无关,但通过参与《永乐大典》精校整理,接触到诗词、列传、府志、祭文、历法等多个领域的知识,对古籍的热爱与求知欲不断增长。 这一变化反映了一个深层的文化现象:AI技术正在将古籍从"遥远的、被玻璃罩起来的文化符号"转变为可以被广泛接触和理解的活态文化资源。参与者在校对过程中不仅完成了文献整理工作,更在与古籍的互动中实现了文化传承的代际接力。全国高等院校古籍整理研究工作委员会秘书长卢伟表示,AI技术不仅大幅提高了古籍校对效率,还弥补了传统人力校对处理海量文献的局限,为古籍整理开辟了人机协同新途径。 当前,数字化转型已成为文化传承的必然趋势。通过建立更加完善的AI辅助平台,扩大参与范围,优化激励机制,可以继续推动古籍整理工作的规模化、制度化发展。同时,应加强对参与者的培训和指导,确保校对质量,建立科学的质量评估体系,使AI技术真正成为传统文化传承的有力助手。

古籍包含着文明记忆,整理工作关乎学术根基与文化自信;当技术分担了繁琐工作,人的价值更应体现在深度思考与创新转化上。古籍数字化不仅是将书籍"搬上网",更是在数字时代重建与经典对话的桥梁。让更多年轻人和社会成员有序参与,才能真正激活古籍的生命力,使其成为面向未来的共同财富。