20150116《漢魏六朝碑刻異體字典》筆畫檢字表數位化完成
2014年12月26日下午在「中和堂」購買《漢魏六朝碑刻異體字典》(全2冊)。內容是漢之後唐代之間的文字重要的資料,可讓我們在研究文字演進時多了一些參考輔助依據,雖然這樣的碑刻拓本資料庫在京都大学人文科学研究所「拓本文字データベース」已經製作完成,但像這樣整理的紙本資料的還算是少見。所以還是有數位化的必要。
書中的碑刻名稱是以阿拉伯數字代號,如:0039代表「乙瑛碑」,這樣代號的檢索也是有必要數位化的,筆者將一併製作。(見後「《漢魏六朝碑刻異體字典》碑刻拓片目錄索引」)
和一般文字編不同的是,此書的筆畫檢字表是將字先以部首區分然後加上部首之外的筆畫來排序,這樣在OCR處理時,會多了一些不必掉的資訊,因此,筆者先將筆畫檢字表的圖檔先用PS作了處理,把不必要的內容先去除。在「字」的筆畫數方面,筆者並沒有人工的逐字算筆畫,而是使用「Excel計算中文字筆劃」,這樣就省下許多時間,不過筆畫字數有時並沒有所謂的「標準」,有時算起來會多一劃或少一劃,因此在查字方面還是以直接輸入文字查詢最方便,也避免算錯一個筆畫而找不到字。
上冊(1-742)
下冊(743-1270)
碑刻拓片目錄(1271-1308)
筆畫檢字表(1312-1335)
總列數 5024
缺字 3
筆者校正處:
筆畫檢字表1319頁「壢」原始頁碼處空白,補上頁碼「524」
筆畫檢字表1328頁s119-043「(米荅)」原始頁碼處空白,補上頁碼「137」
筆畫檢字表1333頁「靳」原始頁碼處空白,補上頁碼「431」
---------------------
「《漢魏六朝碑刻異體字典》碑刻拓片目錄索引」數位化完成
除了筆畫檢字表,筆者也將此書的「碑刻拓碑目錄」數位化完成,編號0001至1414(編號1232空缺,見1271頁說明),時間從西元前158年至西元581年,將近有七百多年的時間。可能是版面設計的顧慮,書中對於拓本的出處使用「數字代號」,想要再深入瞭解是哪個碑刻,就必須再翻閱下冊的「碑刻拓片目錄」,檢索時間上又會增加不少。自此,使用者就可以直接在「引得市」中快速查詢。透過筆者的整理,在引得市可以將一千多種碑刻隨即作時間的先後排序,從這樣的數據內容可以找出更多隱藏在文獻中的資訊。
舉例來說:筆者考察出「西元532年這一年中就有37種碑刻問世」,其中11月19日這一天出產最多,共有14種。雖然傳統的研究方式,對於這樣的資訊並不難「算」出來,但是透過這種方式,先把文獻「活化」後,才能容易讓研究者自由的找出想知道的內容。可能在數位化之前,知道總數量或各朝代的碑刻數量的只有原作者一人,經過筆者的數位化,就可輕易的把各朝代的碑刻數量顯示出來。(如下所示):
代號 朝代分類 數量
1 西漢 15
2 東漢 157
3 漢代 7
4 三國-魏 16
5 三國-蜀 1
6 三國-吳 7
7 西晉 37
8 東晉 38
9 南朝-後趙 2
10 南朝-前燕 1
11 南朝-前秦 4
12 南朝-後燕 1
13 南朝-後秦 2
14 南朝-宋 8
15 南朝-齊 7
16 南朝-梁 23
17 南朝-陳 2
18 北涼 1
19 北魏 560
20 東魏 154
21 西魏 24
22 北齊 270
23 北周 76
總數量: 1413
之後從事碑刻的研究者,可依據這樣的內容繼續深入的對於這樣的數據作分析或者其他研究,相信對研究應該有正向成長進步的助益。資料中若有任何錯誤,也請朋友來信指正。
【使用說明】
進入引得市,上方選單「工具書▼」→「語文辭典」
網址:http://www.mebag.com/index/List.asp
【填寫表單】
Google表單https://forms.gle/ss9TbHtQJDi6N2xm7
騰訊問卷https://wj.qq.com/s2/8216629/4766/
《漢魏六朝碑刻異體字典》碑刻拓片目錄【使用方式】
進入「引得市」,選單「出土文獻→碑碣石刻→漢魏六朝碑刻異體字典.碑刻拓片目錄」,或輸入網址:http://www.mebag.com/index/hanweiliuchao/list.asp
---
毛遠明,《漢魏六朝碑刻異體字典》(全2冊),北京:中華書局,2014年5月。
(上冊:1-742。下冊:743-1270)
沒有留言:
張貼留言