王涛
2019年,国家图书馆制造了一个新闻。它宣布将收藏2000亿条公开发表的微博。典藏乃是图书馆的分内之事,但国家图书馆将微博内容进行收藏,则是一个标志性的事件。微博是数字化时代“用户生产内容”的典型代表,是天然具有“数字”血统的信息;它也很容易被贴上大数据的标签,让我们对海量信息有了更直观的认知。
从历史研究的角度来看,这个事件至少有两个层面的意涵。首先,典藏微博数据意味着,史料的范畴得到了扩充。今天发的微博,明天可能就成了史料。2000亿条微博涵盖了21世纪初期中国社会、政治、文化、思想史的方方面面,它们还都是开放获取的。史学家梦寐以求的“史料自由”似乎即刻兑现了。
其次,史料自由固然是一件好事,但随之而来有一个非常现实的问题。研究者如何利用2000亿条微博展开严肃的学术研究呢?2000亿是一个天文数字,使用传统的方法对材料进行检索、梳理显然力不从心。
国家图书馆的事件让我们对数字化生存的状态有了更直观的感悟,也让我们深刻意识到,如何培育面向未来的史学人才,已经是迫在眉睫的任务。
作为南京大学历史学院的教师,笔者曾在2016年为历史专业的学生开设“数字史学”为主题的课程,具有一定的探索性。2018年,笔者在《图书馆论坛》刊发了一篇回顾性文章,阐明了这门特色课程的内容设计、教学理念,也特别反思了在教学过程中遭遇的问题。
跟四年前笔者还要吆喝“数字史学”的必要性不同,2020年作为不平凡的一年,已经让更多学院派的专家更容易体会技术便捷的价值。彼时,笔者在南京大学开设的课程还要特意强调数字史学的工具性,以至于课程名当中“数字工具”这个关键词略显突兀;此时,如果没有网络基础设施建设的保障,如果没有各种便宜又好用的工具,2020年的大学课堂教学活动