2013年9月25日 星期三

創建「引得市」的意義——寫在成立一週年之際(草稿)

創建「引得市」的意義——寫在成立一週年之際(草稿)

原帖:http://blog.yam.com/ebag/article/70195456
(天空部落格已經關站)


⊙古文字的通盤檢索


    一般的文字查詢檢索在目前來說其實並不稀奇,網路上的資料庫多如牛毛,但能夠因應「古文字」當中的「缺字」則屈指可數,我們所說的「缺字」是指電腦輸入法無法輸入以及顯示的字,這類的字在古文字佔了相當多的數量,若不能提供檢索,則資料庫的便利性就打折扣。例如:《楚文字編》4893個字例中,缺字就有2162字,佔了幾乎是一半的字量。筆者有鑑於此,早在2004年構想建立「先秦璽印分域資料庫」時,就同時建構了「印學缺字資料庫」,利用一個「缺字資料庫」來分享支援給日後所建立的各類古文資料庫。

    「印學缺字資料庫」係以「214」個基本的部首作為編號,無法用部首分類的圖形文字則歸類在「215」,「009-001」代表「人」部的第一個字,依此類推。資料庫十年來已超過二千餘的缺字,且依照古文字書籍(出版品)即時的更新增補缺字。目前最多的缺字部首是「邑」部,已高達163字,若沒有「構字式」的輔助查詢,即使資料庫將該部首全部列表顯示,但逐字查閱對照也是相當耗損「眼力」與考驗「記憶」的事。

    多年來累積的「印學缺字資料庫」所包含的缺字已不止限於印學方面,擴及所有古文字的領域(甲骨、金文、簡牘等),故將改名為「古文缺字資料庫」。筆者將參考中央研究院歷史語言研究所的「漢字構形資料庫」,讓未來新增的「古文缺字資料庫」,可以利用「構字式」來查詢缺字,例如:輸入「手比」來檢索,就可檢索到「批」字。

    除了「構字式」查詢的便利之外,查得的缺字也能知道其「編號」,以此編號就可再查詢「引得市」內的其他文獻,使用者可以知道,這個缺字曾在哪一份文獻中的第幾頁。這就是「古文缺字資料庫」與「引得市」完美整合的展現,這種「效果」,也是過去的研究不容易達到的,並非傳統方式做不到,而是可能沒有研究者願意逐字逐頁翻查文獻,作此等苦工了。

    或許有人會問,既然「漢字構形資料庫」已經有這項技術,為何我們不直接使用該資料庫?其原因是:該資料庫其實並沒有專人負責處理更新以及維護,原先成立是以研究案經費所建立的。筆者曾比對過,該資料庫還欠缺「印學缺字資料庫」所沒有的字,高達四百多個。既然沒有專人負責維護,所以並無法即時造字因應研究者的需求,資料庫若不能即時更新,其參考性就打折扣了。


⊙古文字文獻的索引更新最快、訂正內容最多


    一般出版的文字編或字詞辭典等文獻,出版之後,若沒有學者專文討論,則不容易再出版列示其書中錯誤之處,我們製作檢字表的過程中,逐字的與原書對照,故能發現許多原本出版品的錯誤,而在「引得市」中將其錯誤與正確的版本列示在網頁中。

「引得市」所有文獻的訂正內容,詳見「資料來源」:www.mebag.com/index/source.asp


⊙古文字的文獻種類最齊全


    自2012年7月成立以來,已製作超過40本的文獻索引資料,分成「古文字」、「楚文字」、「書道」、「辭典」、「其他」等五類,日後再將「通假」項目從「古文字」中獨立出來,除一般出版的文字編、通假字典、辭典之外,亦有最新的博碩士論文等文獻。

    「引得市」所提供的不只是文字編的索引而已,還包含古文字通假這一類的工具書,甚至還有一般的研究專書,例如:《當代中國簡帛學研究(1949-2009)》,而筆者製作這本書籍的理由是此書是目前為止,全面把各地出土的簡牘內容與數量明確整理與說明,雖然有些沒有註明簡牘資料的年代,也會附上原始出土的資料來源,讓研究者方便溯源考察。於欄位中輸入簡牘名稱查詢,或者直接列表顯示,都能包含筆者附加的時代分期,而這樣的列表,應該就是目前為止,完整的簡牘墨跡文字的列表了。


⊙古文字的材質與字體最齊全


墨跡文字:玉石、竹、木等。
非墨跡文字:甲骨、青銅、石、磚、瓦等。

字體:篆、隸、楷、行、草。


⊙古文字的時代涵蓋最久遠


    自有文字以來,字形演進一直是持續不中斷的,書寫者在傳抄文字當中,刻意或非刻意的留下個人對於該字的理解,同樣的字若以不同「筆順」書寫之下,拉長時間來看就會有明顯的差異,如果我們把時間只縮限在「戰國至漢代」,有些字其實變化的程度並不容易觀察出來。所以,我們盡可能拉長時間,整理補足漢代以後的墨跡文字。近期筆者就以華東師範大學鄭婕博士的論文:《魏晉南北朝簡牘文字研究》115至230頁的「魏晉南北朝簡牘文字構形分析表」作為索引。


⊙改變研究者查詢工具書的方式(習慣)


    大多數研究者還是以紙本逐字查閱工具書,一次只能查詢一本書籍,使用「引得市」的檢索,則一次可檢索數十本文獻書籍,達到所謂「秒查」的速度。優勢還不止是查詢的速度,目前為止,古文字相關的資料庫中,仍以「引得市」的數量最多,也最為齊全。

    因為有這般速度,以前不容易執行或者必須花費太多時間作基礎工作的研究內容,因為「引得市」檢索的便利,就可以順利在短時間內的完成,例如筆者以戰國時代至漢代的簡牘墨跡文字的研究中,透過資料庫的查詢後,能夠將同一字依照時間(時代分期)順序,形成的文字演進表就能證明論點。

    在台灣若有人需要遠行(北到南或南到北),在有一定的預算之下,會選擇快速的交通工具,應該會利用「高鐵」而不會是「台鐵」。因為大部分的人必定是想要「早點又舒適地到達目的地」。而「引得市」的作用也是如此,當我們能夠在一秒可以知道的訊息,就不會多花一秒;不會想多花時間來達到一樣的目的。

    古文字演進的研究中,筆者會先有一個假設,再以「引得市」快速便利的搜尋方式取得印證,研究者在思考中,隨即又輸入另一字查詢,這種即時的回饋與解惑,也改變了過去研究的模式。 研究者只要拿著能上網的手持裝置(手機、PAD),隨時連上「引得市」就可以查詢古文字,隨想隨得的便利性,勢必會改傳統的研究習慣。


⊙未來「引得市」資料庫檢索方式


1.方式一:每次一個字,同時搜尋多部字典。(目前)
2.方式二:每次多字,同時搜尋一部字典。
3.方式三:每次多字,同時搜尋多部字典。

※每次的搜尋結果都可下載成為xls檔案格式。


⊙因「引得市」又衍生的新檢索資料


    有時候原作者並沒有製作筆畫檢字表或者沒有附錄在論文中,筆者為了檢索的便利,就自行製作了PDF格是的筆畫檢字表,如以下文獻:「嶽麓秦簡字形比對表」、「秦封泥文字編」、「魏晉南北朝簡牘文字構形分析表」等,也都提供自由下載。


小結:

    綜合上述,「引得市」針對古文字共有:「通盤檢索」、「文獻的索引更新最快、訂正內容最多」、「文獻種類最齊全」、「時代涵蓋最久遠」、「改變研究者查詢工具書的方式(習慣)」等幾項重要的變革。而「文獻索引的建立」也是讓學術研究更為精進的一項重要工作,不只需要對研究有相當的熱忱,也要有獨立冷靜思考的能力,雖是如此,還是希望更多有志之士加入這個行列。

    對「引得市」索引文獻建立有興趣的朋友,或者有其他更好的想法意見,也歡迎來信:ebag2007@gmail.com

謝謝


〈文獻的索引數位化製作與應用研究-以「引得市」為例〉,刊《書畫藝術學刊》第十三期,185-212頁,臺北:國立臺灣藝術大學書畫藝術學系,2012年12月。
全文PDF:http://www.mebag.com/20/pdf/2012-02.pdf

INDEX 引得市 資料來源一覽表

()內為完成時間

古文字

古文字詁林(2013.4.19)

秦印文字彙編(2012.7)
簡牘帛書字典(2012.7)
馬王堆簡帛文字編(2012.7)
戰國秦漢簡帛古書通假字彙纂(2012.7)
秦簡牘文字彙編(2012.7)
古文字類編‧增訂本(2012.7)
古文字通假字典(2012.7)
睡虎地秦簡文字編(2012.7)
侯馬盟書(2012.12.4)
傳抄古文字編(2012.12.16)
秦簡文字編(2012.12.29)
銀雀山漢簡文字編(2013.1.4)
張家山漢簡文字編(2013.3.26)
關沮秦簡文字編(2013.5.13)
秦簡牘文字編(2013.5.21)
武威漢代醫簡文字編(2013.5.24)
長沙走馬樓三國吳簡‧竹簡(貳)文字編(2013.5.24)
說文新證(2013.6.5)
秦封泥文字編(2013.7.11)
嶽麓秦簡字形比對表(2013.8.2)
秦漢金文字匯(2013.8.14)


新金文編(上中下)(2012.11.11)
甲骨文字編(2012.11.11)
新甲骨文編(2013.4.17)


楚文字
楚文字編(2012.7)
上博藏戰國楚竹書字匯(2013.4.4)
上海博物館藏戰國楚竹書第八冊文字編(2013.4.6)
浙江大學藏戰國楚簡(2013.4.7)
新蔡葛陵楚簡文字編(2013.6.26)
清華大學藏戰國竹簡(壹)(2013.6.29)


書道
中國草書大字典(2012.7)
中國隸書大字典(2012.7)
中國正書大字典(2013.4.21)
魏晉南北朝簡牘文字構形分析表(2013.8.15)


辭典
中國書道文化辭典(2012.7)
中國歷史文化事典(2012.7)

其他
《漢魏石刻文學考釋》(2013.1.21)
《漢碑全集(1-6卷)》(2013.1.22)
《當代中國簡帛學研究(1949-2009)》(2013.7.26)
《秦出土文獻編年》(2013.7.30)
《秦漢金文彙編》(2013.8.14)

20240315阿良人的研究LIFE __閒談「說文解字」的規整化(影音記錄)

20240315阿良人的研究LIFE __閒談「說文解字」的規整化 (影音記錄)   知乎: https://zhuanlan.zhihu.com/p/687396300 【開場白】 前一次錄影記錄了:阿良人的研究 LIFE __ 「引得市·說文解字」資料庫介紹,整體效果還不錯。...