20181009《里耶秦簡(貳)》釋文索引數位化完成
知乎:https://zhuanlan.zhihu.com/p/4634554020140321《里耶秦簡(壹)》釋文全文檢索完成
http://ebag2007.blogspot.com/2014/03/20140321.html
※20190808起,我們將(壹)(貳)釋文資料庫合併在一起!!
網址是原來(壹)的位置,如:http://www.mebag.com/index/liye/List.asp
之後(貳)的資料庫網址,可能會適時的刪除,敬請注意。
【資料來源】
word檔由王森兄提供,原始釋文建立者是南開大學李建雄。
【製作過程】
原始檔案為*.docx格式,三千多列的簡牘釋文,字數約在4-5萬之間。內容中有缺字或符號都是用圖檔呈現,這樣的資料形式若要作為「引得市」資料庫的檢索,勢必得大幅度的調整。因為是「圖檔」,所以必須人(眼)力一列一列的檢查處理,過程簡述如下:
‧先調整改變所有文字顏色,利用對比清晰的顏色容易分辨是「圖」或符號字
‧將原來的圖形改為可輸入的「符號」如:「┘丿㇏└〼╱▂⊠◎□.↵」,以【遣】呈現「□+遣」的樣貌。※檔案中以「↵」符號作為斷行記號,但前端不會顯示這個符號,會如同釋文編排直接斷行。
‧補上缺字編號並新造73多字,以及圖形字的編號(如:t003-0005-001)
‧簡號0019、0020、0295各有文字表格,資料庫無法顯示,僅能以文字列示如:「biaoge-1、biaoge-2、biaoge-3」(如圖示)。
‧將釋文轉貼至excel(釋文斷行以「↵」此符號表示)
‧簡號與「釋文」、「紅外線圖」對照頁碼輸入
從開始製作到今日完成上線,前後大約花了二個星期的工作天,時間大都花費在手動調整修改上,或許直接ocr再來校正修改可能都不用花這麼多時間。因此,更突顯資料數位化前,有個清楚的「正規化」執行規範(或SOP)是多麼重要。無論如何,還是相當感謝有心人能夠建檔製作內容。
引得市全文檢索資料規範(正規化):https://hackmd.io/s/B12dVycq7
目前引得市中簡牘釋文全文檢索,可支援缺字、圖形字的顯示及斷行,游標點擊「簡號」或「釋文」等同複製該內容等功能,都是瑾昀兄不斷地修改程式的幫助,筆者相當感謝。此次《里耶秦簡(貳)》製作的同時,順便把《里耶秦簡(壹)》原先一百多處的缺字補完,現在(壹)、(貳)的釋文都可在引得市完整的檢索使用。透過這樣快速便利的工具,期盼研究者可從中梳理出更多隱藏在簡牘中的各種資訊。
※《里耶秦簡(壹)》、《里耶秦簡(貳)》皆支援「開卷助理」。
rmp檔名請設定為:里耶秦簡(壹).rmp與里耶秦簡(貳).rmp
※完整呈現原始釋文編排位置與內容樣貌
【校正、補充說明】
以下簡號無字,原因如下:0380(無字)、0487(與0295綴合)、0527(與0526綴合)、0902(與0901綴合)
原釋文word檔
缺0118釋文(遺漏)
缺0580釋文(遺漏)
缺0589釋文(遺漏)
缺0611釋文(遺漏)
缺0688釋文(遺漏)
缺0727釋文(遺漏)
缺1371釋文(遺漏)
缺3272釋文(遺漏)
另,原書多一處簡號3418釋文「□□□郵」,亦有部份釋文以簡體字呈現經筆者修改。
【使用方式】
進入引得市→⑬簡牘選單「《里耶秦簡(貳)》釋文全文檢索」或直接輸入網址:http://www.mebag.com/index/liye2/list.asp
【《里耶秦簡(貳)》凡例】
一 湖南龍山里耶秦簡根據簡牘出土地層單位分五輯整理出版。
二 第一輯包含第五、六、八層出土的簡牘,第二輯為第九層,第三輯為第七、十、十一、十三層,第四輯為第十二、十四層,第五輯為第十五、十六、十七層以及二○○五年十二月護城壕第十一號坑出土簡牘。
三 圖版據簡牘原大影印,按簡牘整理號編排。圖版下對應標明簡牘出土登記號。出土登記號是按層位號加序號編排。封泥匣出土時自為系列編號,編號方式是在層位號和序號後加「封」字。護城壕十一號坑出土簡牘編號為K1-K51。整理時將無字簡撿出,所以報告中的標本出土登記號不完全連屬。個別簡牘受版面限制,略有縮小,我們註明縮小比例;還有的截成兩段排版,我們另付全形圖於圖版之後,可參閱。
四 釋文據圖版順序編排,簡號注於釋文之末。釋文一般頂格排印。簡文提行書寫的,釋文也分行排列;簡文轉行的,釋文連排,在轉行處加標「┘」符號。有些簡文雖然從文義上可以判斷出是轉行,因殘斷過甚,釋文一律作提行處理。簡文分欄書寫的,在每一欄釋文末括注「第一欄」、「第二欄」等。簡牘正、背面都有文字時,則在釋文後括注「正」字和「背」字;個別簡牘側面有文字,釋文後括注「側」字。簡文一般按時間順序由右向左書寫,有些簡牘並未嚴格按照這種格式,中間行的書寫時間在左行之後,釋文不作調整。
五 簡文殘泐無法辨認的字,釋文用「□」號表示,一字一「□」;簡文漫漶,如能確定字數的,釋文也用「□」號表示,不能確定的用「……」號表示;存疑的字外加「□」號;簡文被削除處,釋文以「⊠」號表示;簡文殘斷處,釋文用「〼」號表示。木牘的情況較複雜,或兩側殘缺(兩側殘缺者不作說明),或上下殘斷,或一面殘斷,或一角殘斷,或中間部分殘斷,如果簡文有殘缺,同樣用「〼」表示,有殘斷而簡文文義完整,不使用「〼」表示。簡牘上的圖案,釋文中一般不體現,僅以括號標出「圖案」字樣。
六 簡文間留有空白,如果語意相連,釋文連排。語意不相連的,不論空白多少,釋文一律祇空出一個字位置。殘簡上的文字根據其位於上下殘斷處距離長短,仿照上說情況,釋文與斷在號「〼」號之間空一個字。
七 釋文一般按照原文字形釋寫,重文、合文和通假字不注出所重、所合和所通假之字。簡文「七十」均為合文,形態較特殊,為排版方便,逕釋為「七十」。簡文「吏」與「事」、「叢」與「最」、「薄」與「簿」等不分,釋文也按照原文字形釋寫,不加區別。不識之字照原樣摹寫。但有些異體字,為了印刷排字方便,釋文用通行字寫出,例如「女叉」作「奴」,「獾尹」作「獲」,「𥤊尹」作「穫」,「宀䊪」作「竊」,「𣉻」作「智」等等,不嚴格隸定。
八 簡文所用的符號,釋文儘量保留,如「.」、「└」、「丿」、「少(圖)」等,符號都祇佔一個字的字空。簿籍類文章日所條列的單項後多有符號「丨(圖)」,有長有短,或斜或彎曲,釋文時均以「丨(圖)」表示,祇佔一個字字空。釋文不另加標點。簡牘之首和封檢、楬之上端塗墨者和簡牘上表示分欄的墨線,釋文時取消,也不作說明。特殊現象也在釋文後加以說明。
九 簡牘有刻齒者,刻齒的數位萬、仟、佰、拾、個,各有特定的形態,釋文後另加說明。說明原則:刻齒位置的左或右,「萬」、「仟」、「佰」、「拾」、「個」位的刻齒數,並據簡文擬加數量單位。
---
湖南省文物考古研究所:《里耶秦簡(貳)》,北京:文物出版社,2017年12月。ISBN:978-7-5010-5369-8
20140321《里耶秦簡(壹)》釋文全文檢索完成
http://ebag2007.blogspot.com/2014/03/20140321.html
三處無法呈現表格內容,暫用biaoge-1~3表示
excel
里耶秦簡(貳)圖形字
里耶秦簡(壹)缺字
里耶秦簡(壹)圖形字
里耶秦簡(貳)缺字
沒有留言:
張貼留言