缩略图

从“旁搜博采”到“数字化聚合”:中国历史资料整理方法的范式变迁研究

作者

赵秀敏 王新宇

1 吉林省社会科学院 吉林长春 130033 2 东北师范大学 吉林长春 130024

1. 传统的基石:“旁搜博采”与古典学术理路

中国传统的历史资料整理并非简单的材料堆积,而是一套深嵌于古典学术体系之中,有着明确方法论指导的学问。其核心可概括为“旁搜博采,考订汇纂”,其背后蕴含着独特的学术理路与价值追求。“旁搜博采”体现了资料搜集的全面性与竭泽而渔的理想。古代学者和官方机构致力于搜罗一切可能存在的文献踪迹,无论是正史、档案,还是野史、笔记、碑铭、家谱,乃至断简残编,皆在网罗之列。清代修《四库全书》便是这一理念的极致体现,通过官方力量在全国范围内征书,试图构建一个包罗万象的文献帝国。然而,这种搜集并非无的放矢,其背后受儒家思想与史学正统观的深刻影响,对文献的去取褒贬有着严格的标准,这也导致了部分所谓“异端”文献的湮没。

在“博采”之后,更为关键的是“考订”与“汇纂”。这形成了传统资料整理的方法论核心:

(1)校勘: 对同一种文献的不同版本进行比对,纠正传抄刊刻中的讹误,力求恢复文本的原貌,即所谓“无错字之书”。乾嘉学派将此法臻于极致。(2)辨伪: 考订文献的作者、成书年代及真伪,剔除后世伪托之作,以保证史料来源的可靠性。(3)辑佚: 从类书、古注等文献中钩沉索隐,将已散佚古书的碎片重新拼接起来,力图恢复亡书之概貌,如《古小说钩沉》等。(4)汇编: 将相关史料按特定体例编排成书,形成诸如“丛书”、“类书”、“史料汇编”等成果。例如《宋会要辑稿》是从《永乐大典》中辑出的宋代史料巨帙。

这套方法的哲学基础是“实证”与“复古”,其最高理想是无限接近历史的“本来面目”。其成果形态是线性的、静态的、以印刷文本为中心的书籍。它塑造了持续千年的中国古典学术传统,为后世留下了极其丰厚且经过初步加工的文献遗产,但其工作周期漫长、个人色彩浓厚、信息检索困难的局限性也显而易见。

2. 近代的转型:科学化、机构化与方法的革新

晚清以降,西学东渐的浪潮猛烈冲击着中国传统的学术体系。历史资料整理工作也开始摆脱古典范式,逐步走向近代化与科学化。这一转型主要体现在理念、方法与组织形态三个层面。

(1)在理念上,传统的“稽古右文”观念开始与近代民族主义、科学主义思想相结合。资料整理不再仅仅是尊崇古道,更被赋予了“保存国粹”、“开启民智”、服务现代学术研究的新使命。傅斯年提出“史学便是史料学”,号召“上穷碧落下黄泉,动手动脚找东西”,极大地提升了史料发掘与整理在现代史学中的核心地位。史料的范围也被空前扩大,甲骨、简牍、敦煌文书、内阁大库档案的发现与整理,彻底刷新了人们对史料的认识。(2)在方法上,西方实证主义史学方法与中国传统考据学相结合,形成了更具科学色彩的现代方法论。一方面,传统的校勘、辨伪方法被继承并发扬光大,如陈垣总结的“校勘四法”;另一方面,引入了更为系统的分类体系、科学的考古发掘方法、语言比较方法等。整理工作强调客观、中立,尽量减少主观臆断,注重对史料来源、背景的说明,增强了成果的科学性。(3)在组织形态上,资料整理从以学者个人或官方修书机构为主,转向机构化、协作化的现代学术工程。中央研究院历史语言研究所、北平图书馆、禹贡学会等现代学术机构的成立,成为资料整理的主力。它们组织大规模、有计划的集体项目,如史语所对安阳殷墟的考古发掘、对内阁大库档案的整理;北平图书馆对敦煌遗书的编目;以及《中国近代史料丛刊》等大型汇编项目的出版。这些项目通常有统一的规划、分工合作的工作模式以及公开出版的成果形式,效率远胜从前。

这一阶段的转型,标志着中国历史资料整理从古典学术的余绪迈入了现代学术的殿堂。它为历史研究提供了大量经过科学整理的、系统化的新材料,奠定了中国现代史学发展的资料基础。其成果形态虽仍是纸质出版物,但已为下一阶段的数字化革命埋下了伏笔。

3、当代的革命:数字化聚合与范式的颠覆

二十世纪末至今,计算机与互联网技术的迅猛发展,催生了历史资料整理领域的第二次革命,即从“近代化”迈向“数字化”。这并非仅仅是技术工具的升级,更是一场深刻的范式革命,其核心特征是从“汇编”走向“数字化聚合”。

“数字化聚合”范式体现在以下几个维度:(1)底层逻辑之变:从实体到数据。 传统整理的对象是物理实体(书籍、档案),成果是新的物理实体(汇编成的书)。数字范式下,所有文献被转化为统一的数字编码(文本、图像数据),其本质是创建一个脱离物理载体的、可计算、可深度操控的数据海洋。(2)方法之变:从考据到加工。在校勘、标点等基础之上,产生了全新的数据加工方法:深度标引(对人名、地名、官职、事件等实体进行标记)、元数据(Metadata)著录(描述数据的数据,如作者、年代、格式等)、数据结构化(将非结构化的文本转换为结构化的数据库或 XML/TEI 格式)。这使得计算机能够“理解”和处理史料内容。(3)成果形态之变:从书籍到平台。整理的最终成果不再是印刷出版的书籍,而是数据库(如《中国基本古籍库》、《全国报刊索引》)、数字档案馆(如台北史语所的“内阁大库档案”数据库)、以及各类专题知识库平台。这些平台支持全文检索、高级查询、数据可视化、异版比对等前所未有的功能。(4)研究模式之变:从阅读到挖掘。 “数字化聚合”催生了“数字人文”研究新范式。学者可以利用文本挖掘(主题建模、情感分析)、社会网络分析(SNA)、地理信息系统(GIS)等计算方法,从海量史料中发现人工阅读难以察觉的模式、关联与趋势,提出新的历史问题,实现了从“问题驱动”到“数据驱动”与“问题驱动”相结合的转变。

然而,新范式也带来新挑战:数字资源的长期保存问题、数据标准与互操作性问题、版权与开放获取的伦理困境,以及“技术黑箱”可能导致的研究结论偏误等。

综上所述,从“旁搜博采”到“数字化聚合”,中国历史资料整理的范式变迁是一条从个体经验到集体协作、从手工操作到智能计算、从文献汇编到数据创造的演进之路。每一次范式革命都并非对前一次的彻底否定,而是层累地拓展了资料整理的能力边界,持续为历史学家提供更强大的“望远镜”和“显微镜”,从而不断重塑着我们与过去对话的方式。

参考文献

[1] 陈垣 . 校勘学释例 [M]. 上海 : 上海书店出版社 , 1997.

[2] 傅斯年. 历史语言研究所工作之旨趣[J]. 中央研究院历史语言研究所集刊 , 1928, 1(1).

[3] 杜泽逊 . 文献学概要 [M]. 北京 : 中华书局 , 2001.

[4] 王晓光 . 数字人文 : 数字时代的知识与批判 [M]. 武汉 :武汉大学出版社 , 2020.