《李清照集校注》

今年年初,我偶然翻看李清照的纸书时,脑子里冒出了一个念头,“要把喜欢变成行动”,就决定做一本准确无误的李清照诗词集注。当时找遍网上能找到的电子版,不是缺页就是错字很多,没办法,我先买了纸书来读。越读越觉得不过瘾,“不如自己动手”的想法一下子盖过了懒惰。当晚框架就搭建好了,第二天直接把OCR工具给打开了。 但是这个OCR工具没让我省心。第一次操作直接翻车——PDF文本识别率低到令人发指,错字、乱码还有重复页像雪花一样飞出来。我连夜比对了三本权威校注本,发现排版嵌套太深,OCR根本处理不了这个任务。无奈之下我只好关掉这条路线。 既然纸质书比较靠谱,“那就把纸书变成像素吧。”在二手市场淘扫描仪的时候,“预算给限制在1500元以内”,经过两周在闲鱼上蹲守观察之后,“终于以1500元买下了一台八成新的平板扫描仪”。 扫描好的画面和诗一样美。先是把关于李清照的六本书整齐地放进玻璃台上扫描;“这些关于李清照的画不仅好看,还很多!”我先后淘到了两本图录——山东方面合力推出的《李清照诗词书画赏析》和上海古籍的《漱玉词写意》。 可在处理这些图像的时候可费劲了:原图尺寸大小不一,“先把它们统一裁成A4横幅”。由于两本书顺序不一致,“我还得一首词配一幅画”。如果顺序搞反了,整本书的风格就全乱套了。 完成这些步骤后,“眼睛都要瞎掉了”,可心里却是美滋滋的。底本我选择的是人民文学出版社《李清照集校注》,这个版本格式极其复杂:异体字和冷僻字很多;“原文标点读起来拗口”;还有页下注、尾注、夹注这些让代码变得特别复杂。 这一过程折腾了整整三个月,“版本号从0.1爬到1.3”。终于有一天深夜,“或许这就是信仰吧”。 电子书暂定在中秋节发布,“封面用的是一幅宋代佚名的《桃花鸂鶒图》”。“中秋的时候给你一个惊喜!” 如果你喜欢李清照,“或者你只是想在月光下读一首带画的词”,不妨到时候来看看我的作品。“免费也可以不打赏”,希望有人能懂她。