2014年3月21日 星期五

20140321《里耶秦簡(壹)》釋文全文檢索完成

20140321《里耶秦簡(壹)》釋文全文檢索完成



原帖:http://blog.yam.com/ebag/article/73171498
(天空部落格已關站)

    今天這個資料庫,又在一個莫名的期待之下完成了,原始的書籍是陳姿貝同學幫忙掃描的,筆者先將圖片檔案釋文的部分以「尚書七號」做OCR辨識,然後逐字校正。另一方面圖版的部分,從原頁面依照編號一個一個編輯剪出另存一個檔名。接著,把完成校正的文字檔在EXCEL編輯,並加入頁碼等其他資訊,前後花費約一個禮拜左右。


    並不是自誇能力,而是筆者從不隱藏任何文獻資訊處理的方法,都是希望研究者可以藉此瞭解,研究若能夠學習到這些工具軟體或技巧,絕對可以節省許多時間與精力的,《里耶秦簡(壹)》可以這麼做,其他的文獻當然可以「比照辦理」。否則辛苦了幾年所做出的成果,可能因為技術的延宕而被其他人早先發表發佈,這樣的情況也是有可能的。


   資料庫可以用「編號」或「釋文」搜尋,透過結果列表可以點擊瀏覽該編號的簡牘圖版,只是礙於版權問題這部分在前端並沒有開放。即使使用者無法「享用」如此便利的功能,但光是全文的釋文索引(檢索),就可以補足《里耶秦簡文字編》還沒問世的缺陷,或許目前也有研究者早已在進行中,透過多人的使用檢索,就能給予資料庫的再校正。


    從這本書的凡例中可以知道,未來還有四緝要出版,時間未定,目前資料庫的設定是可以配和之後第二三四五輯的內容格式來增補。不過,到時候是否還有時間與能力繼續補充還是未知數。


    衷心的希望研究者若覺得這個資料庫好用,請在文章中註明引用自「引得市」,並不是筆者想藉此彰顯自己的成就,而是若透過文章的引用宣傳,就會有更多人知道這個索引資料庫,會有更多人可以加速研究的時程,省掉一些不必要花費的時間。


    筆者一人的力量有限,能維持多久無法保證,資料庫的營運與更新還是需要大量的時間與成本,雖然筆者多年來一直以興趣作為前提,把這些因素盡可能的排除,但畢竟還是得面對實際的生活現實面,也一直很希望有足夠的經費或資助讓資料庫保持更新與即時更新,否則,今天很正常,明天忽然的消失,網站網址沒能續約,因此連線不上也都是有可能的。


    有使用、喜歡用的朋友,請盡量的透過各種管道幫忙宣傳,增加網站的影響力,或者,排除各種著作權上的問題,讓網站能有收入,透過這些收入維持基本的營運花費。又或許需要有一些學界重量級「大咖」或「名人」的加持推薦吧?


    回到資料庫的說明,筆者盡量保持原始釋文的編排位置,有些符號顯示的問題,就有一些調整或者因應(請見「替代符號」說明),也有一百多處需要造字的部分還沒完成(20181009補完),筆者還會持續的增補。釋文內容錯誤難免,還有許多修改的必要,也朋友請多到FB或微博(http://weibo.com/ebag)留言交流使用情形。

 「引得市」
http://www.mebag.com/index/



【使用方式】

進入引得市→⑬簡牘選單「《里耶秦簡(壹)》釋文全文檢索」
或直接輸入網址:http://www.mebag.com/index/liye/list.asp

----


湖南省文物考古研究所,《里耶秦簡(壹)》,北京:文物出版社,2012年1月。
ISBN:978-7-5010-3350-8


《里耶秦簡(壹)》凡例

一  湖南龍山里耶秦簡根據簡牘出土地層單位分五輯整理出版。

二  第一輯包含第五、六、八層出土的簡牘,第二輯為第九層,第三輯為第七、十、十一、十三層,第四輯為第十二、十四層,第五輯為第十五、十六、十七層以及二○○五年十二月護城壕第十一號坑出土簡牘。

三  圖版據簡牘原大影印,按簡牘整理號編排。圖版下對應標明筒牘出土登記號。出土登記號是按層位號加序號編排。封泥匣出土時自為系列編號,編號方武是在層位號和序號後加『封』字。護城濠十一號坑出土簡牘編號為K1-K51。整理時將無字簡撿出,所以報告中的標本出土登記號不完全連屬。個別簡牘受版面限制,略有縮小,我們註明縮小比例;還有的截成兩段排版,我們另付全形圖於圖版之後,可參閱。

四  釋文據圖版順序編排,簡號注於釋文之末。釋文一般頂格排印。簡文提行書寫的,釋文也分行排列;簡文轉行的,釋文連排,在轉行處加標『蘭符號。有些簡文雖然從文義上可以判斷出是轉行,因殘斷過甚,釋文一律作提行處理。簡文分欄書寫的,在每一欄釋文末括注『第一欄』、『第二欄』等。簡牘正、背面都有文字時,則在釋文後括注『正』字和『背』字;個別簡牘側面有文字,釋文後括注『側』字。簡文一般按時問順序由右向左書寫,有些簡牘並未嚴格按照這種格式,中間行的書寫在左行之後,釋文不作調整。

五  簡文殘泐無法辨認的字,釋文用『□』號表示,一字一『□』,簡文漫漶,如能確定字數的,釋文也用『□』號表示,不能確定的用『……』號表示;存疑的字外加『□/』號;簡文被削除處,釋文以「因』號表示;簡文殘斷處,釋文用『⊠』號表示。木牘的情況較複雜,或兩側殘缺(兩側殘缺者不作說明),或上下殘斷,或一面殘斷,或一角殘斷,或中間部分殘斷,如果簡文有殘缺,同樣用『□/』表示,有殘斷而簡文文義完整,不使用□/表示。簡牘上的圖案,釋文中一般不體現,僅以括號標出『圖案』字樣。

六  簡文間留有空白,如果語意相連,釋文連排。語意不相連的,不論空白多少,釋文一律衹空出一個字位置。殘簡上的文字根據其位於上下殘斷處距離長短,仿照上說情況,釋文與斷茬號『□/』號之間空一個字。

七  釋文一般按照原文字形釋寫,重文、合文和通假字不注出所重、所合和所通假之字。簡文『七十』均為合文,形態較特殊,為排版方便,徑釋為『七十』。簡文『吏』與『事』、『冣』與『最』、「薄』與『簿』等不分,釋文也按照原文字形釋寫,不加區別。不識之字照原樣摹寫。但有些異體字,為了印刷排字方便,釋文用通行字寫出,例如『奴』作『奴』,『Q』作「獲』,『Q』作「穫』,『Q』作『竊」,『𣉻』作「智』等等,不嚴格隸定。

八  簡文所用的符號,釋文儘量保留,如『‧』、『└』、『丿』、「少』等,符號都衹占一個字的字空。簿籍類文書所條列的單頊後多有符號『丨』,有長有短,或斜或彎曲,釋文時均以『丨』表示,祇占一個字字空。釋文不另加標點。簡牘之首和封檢、褐之上端塗墨者,釋文時取消,也不作說明。特殊現象也在釋文後加以說明。

九  簡牘有刻齒者,刻齒的數位萬、仟、佰、拾、個,各有特定的形態,釋文後另加說明。說明原則:刻齒位置的左或右,『萬』、「仟』、『佰』、『拾』、『個』位的刻齒數,並據簡文擬加數量單位。










沒有留言:

張貼留言

20220429《新華大字典》(第3版.彩色本)索引數位化完成

 20220429《新華大字典》(第3版.彩色本)索引數位化完成 知乎: https://zhuanlan.zhihu.com/p/507157904 【資料庫訂閱制】 20210903「語文辭典」2021.9.6(一)實施訂閱制 Blog: https://ebag2007.b...