“识典古籍”让古籍数字化做点实事

有个项目叫“识典古籍”,把全国各地1450多所高校的2万名大学生还有1.7万名社会志愿者给召集起来了。卢伟秘书长就觉得,这个法子能给古籍数字化做点实事。北京大学中文系的杨海峥教授说,用AI来校勘古籍特别厉害,能过滤掉很多错误,让学者不用老是干那些重复活儿。张晓波是个在机场工作的志愿者,他说搞《永乐大典》的精校让他长了不少知识。首都师范大学敦煌学方向的方晓辰博士也说,在平台上处理《康熙字典》这种生僻字很方便。 全国高等院校古籍整理研究工作委员会带着这个项目往前冲,北京那边刚刚搞了个“我用AI校古籍”总结会。OCR技术给提取古籍文字打下了基础,再加上智能标点和专名实体识别这些功能,就把学者从大量重复劳动里解放出来了。卢伟说这开创了人机协同的新模式。 这次行动一共完成了15亿字的粗校工作,涉及2万部左右的古籍。北京大学和其他高校一起努力,把这个数字平台建得特别好。大家用AI来做校对、比对还有整理,效果特别好。方晓辰在平台上做了不少工作后觉得特别有成就感。张晓波也觉得通过参与项目学到了很多东西。 北京大学的杨海峥教授认为AI能帮助学者更专注于关键学术问题上。这个平台打破了专业壁垒,吸引了很多人来参与进来。《永乐大典》、《康熙字典》这些书在平台上都得到了很好的处理。很多人觉得这种参与感让传统文化变得亲近了不少。 这个项目还探索出了一条“技术搭台、学术指导、公众唱戏”的新模式。大家都觉得这样能更好地保护和传承文化遗产。 2025年就要到了,这个项目正在进行中。首都师范大学敦煌学方向的学生们参与其中后都觉得很有收获。当看到自己整理的内容上线被引用讨论时心里特别高兴。 北京举办的这个论坛展示了很多阶段性成果。在这次会议上展示了很多阶段性成果给大家看。 我们相信随着技术的发展和跨界合作的加深,古老智慧一定会在数字世界里焕发出更加灿烂的光芒。 全国高就是全国高等院校古籍整理研究工作委员会的简称。