「漢達文庫」: 結合傳統與現代 中國古籍數碼化

「漢達文庫」: 結合傳統與現代 中國古籍數碼化

分享
列印

 

自古以來,從事國學研究最艱巨的工作,莫過於處理浩如煙海的文獻資料。從前,天資聰敏、識力過人的學者,光靠習誦記憶,可以董理古籍而條貫於胸,全祖望《鮚埼亭集》記述清初學者顧炎武「或徑行平原大野,無足留意,則於鞍上默誦諸經注疏,偶有遺忘,則即坊肆中發書而熟復之」,可見顧炎武不惟可以隨意背誦《論語》、《孟子》等《十三經》經文,還熟讀《十三經注疏》。今天,研究人員已將《十三經注疏》輸入電腦,經電腦核算,得知《十三經注疏》合計達870多萬字;現代社會生活繁忙,實在無法想像古人這種非凡的記憶力。可惜,像顧炎武一類潛心學問的讀書人,畢竟千載難逢;常人研習國學,為求掌握文獻資料,只得借助電子檢索工具。

全港首個古文獻資料庫

利用電子科技,系統地整理中國傳世古籍,必須依賴學術機構長期的構建和參與。在香港,大規模的古籍整理研究工作,為數甚少。香港中文大學於1989年開展古文獻電子資料庫的建構工作,將自先秦以至魏晉六朝的一切傳世文獻,合共超過3000萬字,悉數輸入電腦,然後利用程式,進行文獻之排比與檢索。在文獻輸入之前,研究團隊仔細比對不同版本,選擇其中舊刻善本又未經後人改動的,然後重新標點,並記錄其他版本異文、傳統類書引文,及其他文獻所見重文。整理過程並非僅將文獻資料由「書本形態」轉變為「電腦可讀形態」,而是一次有系統的文獻整理工作。

上世紀90年代起,互聯網應用日漸普及, 中心決定將歷年所建中國古籍及出土文獻資料庫,包括甲骨文、金文、竹簡帛書等載體,總合結集而成「漢達文庫」(Chinese Ancient Texts Database,簡稱CHANT),並編製網上檢閱程 式,於1998年成功建設於互聯網上,並向全球學者開放使用,以便學者在互聯網上隨意檢閱逾千種傳世古籍及出土文獻。「漢達文庫」乃香港首個古代文獻網絡資料庫,至今已建成7個資料庫, 包括「先秦兩漢文獻」、「魏晉南北朝文獻」、「竹 簡帛書文獻」、「甲骨文」、「金文」、「傳統類書」 及「古代詞彙」,共收錄超過8000萬字。文庫涵蓋上古時期中國文化的輝煌歲月,兼及不同地域文化,齊魯秦楚,吳越淮南,兼收並蓄;涵蓋時代由殷商到魏晉六朝,舉凡傳世典籍以及出土文 獻,乃至唐、宋、元、明所編類書,皆所庋藏。 我國遠古的璀璨文明,讀者可以彈指之間,從容瀏覽。

全球學術界廣泛使用

目前,世界各地已建立不同的中國古代文獻資料庫,唯有「漢達文庫」願意投放大量人力及時間於文本整理工作上;典藏舊籍、吉金文辭,皆依善本;校讎比勘,對比異同,鉅細無遺。古籍中心更一再拓展研究範圍,成功將古籍詞彙數據化,建成「古代詞彙資料庫」。研究人員利用詞彙資料庫,更推翻了學術界一些被視為「必然」的學術定論。1973年,在河北省定縣出土的竹簡《文子》,學者普遍認為成書年代在戰國中後期。筆者在1998年發表論文,率先發現竹簡《文子》提及「朝請」一詞,利用詞彙資料庫,得見「朝請」其實漢朝律例,表示諸侯春、秋兩季朝見漢帝的律則,從而證明出土竹簡《文子》不可能成書於戰國時期,而必為漢初成書的典籍,相關論點獲全球《文子》研究學者廣泛引用。

30載深耕細作,學術研究最終轉化為教研工具,植根香港的「漢達文庫」,今天已廣泛為全球學術界使用,作為付費使用的文獻網站,文庫訂戶來自亞洲、歐洲和北美洲等15個國家,哈佛、耶魯、普林斯頓、牛津、劍橋、北大、清華、台灣中研院等80多間歐美及中國重點學府,均為文庫的長期用戶。過去一年,文庫點擊率逾40萬次。研究中心不斷改進系統介面,以協助中國古代文化的教研工作。近年完成架構重建工程,增設跨文獻載體(甲骨、金文、竹簡、紙本)、年代(上古、西周、戰國、秦漢、六朝)的檢索功能,圖文對照,並致力涵蓋更多古籍,以期擴大學術影響力。

 

何志華
香港中文大學卓敏中國語言及文學教授

 

文章在2024129日於星島日報刊