如果有人突然对《楚辞》感兴趣,想在线查看电子文本和影印版,过去可能要在不同的网络检索半天,当下有了一个新的选择。
近日,由北京大学—字节跳动数字人文开放实验室研发的古籍数字化阅读平台“识典古籍”测试版正式上线。目前,该平台涵盖390部经典古籍,主要来自《四部丛刊》,共计3000多万字,未来三年将陆续上线一万种儒释道经典书目,免费开放也是它的特点之一。
“识典古籍”项目负责人现场讲解
如果说像《楚辞》这类大众耳熟能详的古籍,很多商业网站也能查询到,那么如果有人想看《六臣注文选》《广成集》《朱文公校昌黎先生集》这些经典但相对冷门的古籍,选择就会少很多。而要在线免费查阅到权威准确的影印本,更是难上加难。
个中原因不难理解。要满足看似简单的古籍在线阅读需求,其实需要一系列高难度的前提条件叠加:要有权威的古籍资源,要有先进的数字化技术,要有专业的学术把关“翻译”能力,这些条件和所耗费的资源显然不低。说白了,这只能是一项超越市场逻辑的公益事业。
“识典古籍”平台的价值,由此可见一斑。超越直接的经济计算,从文脉传承、文化责任的维度考量,才能诞生这样的平台。
中国人向来重视文脉传承,传承的当然不只是古籍的物质载体,而是要让先贤的智慧洞见润物无声地内化进一代一代国人心里。保护纸质载体,最终其实也是为了给更多人阅读提供可能。基于此目的,降低获取门槛,让更多人能便利地看到古籍内容,就是古籍保护的自然逻辑。
古籍数字化,是古籍保护的重要内容,也是降低古籍获取门槛的必要策略。数字时代早已开启,越来越多人的阅读习惯已经更替,读书再也不能狭隘地界定为看纸质书,通过电脑或者手机屏幕,一样可以进行深度阅读。这种习惯的更替趋势是不可逆的,适应全新的阅读习惯,才能更好地传承古籍。
数字化为古籍的开放创造了条件,但要确保开放的效果,仅仅免费还远远不够。因为古籍本身还有阅读门槛,对于多数普通人甚至是一些古籍爱好者来说,要流畅阅读那些繁体的没有标点的古籍,难度并不低。所以在数字化的过程中,还得考虑如何改善“阅读体验”,让开放平台的效果最大化。
“识典古籍”页面截图
“识典古籍”有字节跳动专业的数字化技术加持,有北大领军的学者和文献专家团队审核和校对,是阅读体验能不断改善的保障。当然,目前来看平台还有提升空间。比如典籍数量相对较少,文字识别、标点错误率还需进一步改善,机器学习能力还有待加强等。这有赖于数字化技术提升,学术人员的持续参与贡献,以及平台大数据处理“经验”的不断迭代升级。
古籍数字化过程视频截图
所幸,“开放”已成为这个平台的底色,在平台的设计中,不仅向社会开放古籍阅读检索功能,还鼓励拥有文献的学者自行上传文献,用户甚至可参与再创作和再阐释。这也就意味着,古籍的规模会越来越大,“纠错”能力越来越强,对普通读者的友好度也会越来越高。
相对于传统的纸质古籍阅读,数字化的优势显而易见,比如可以储存更久,可以触达更多读者,可以全方位降低阅读门槛等。这是一个多方力量汇聚的平台。当古籍保护拥有了公益和开放的底色,中华文脉也就自然可以得到更好的传承。