2014年3月29日 星期六

20140329《金石大字典》索引數位化完成

20140329《金石大字典》索引數位化完成

http://blog.yam.com/ebag/article/73373141

    《金石大字典》在書法或篆刻創作,相信無論是初學或老手都經常使用,也是筆者20年前,接觸篆刻的第一本工具書。使用過的朋友都知道,某些字跡不清楚,筆畫與卷頁的查詢其實並不方便,因此,若將索引數位化,使用效率一定會更好。

    《金石大字典》索引頁共29頁,每頁約有128字(8列,每列約16字),筆者處理前段數頁與最後頁,其他分配給30同學,每位同學負責6行(96字),利用「漢文博士」處理其中罕用字或者查驗是否有缺字,最後由筆者作最後校正。同樣科系的上屆學長姐,曾共同處理完成了一萬五千多筆的索引資料校正(《北京圖書館藏中國歷代石刻拓本匯編》)。此次,每個人輸入不到百字的資料,算是牛刀小試,在一個工具軟體的小小練習實作。

    字典本文1968頁,文字索引:3639列,2個缺字。


參與檢字表文字輸入的名單:
台北科技大學 文化事業發展系


陳雅群、楊笠琳、洪琪毓、楊于慧、徐元元、高芷鈴、王詩云、梁翔瑋、范姜萍、潘京愛、張辰、陳靜芬、張惠偵、陳芹嬅、王逸萱、曾珮樺、楊覲昀、張佳靜、李立方、黃筱丰、廖珮宜、林佳儀、藍俐琳、謝青螢、江曉薇、梁亞璇、房玉琴、薛佳蓉、黃滋萱、江耿慧。

短時間內同學們共同完成了這項「任務」,書法篆刻史也應該記上一筆。

感謝參與的同學。

汪仁壽:《金石大字典》,碧梧山房石印,1926年。



「引得市」
http://www.mebag.com/index/

進入「引得市」後,點選右上方「書道」

「引得市」臉書粉絲團:
https://www.facebook.com/INdex201207


「漢文博士」使用介紹
http://blog.yam.com/ebag/article/60218630


20140124《北京圖書館藏中國歷代石刻拓本匯編》-索引數位化完成
https://ebag2007.blogspot.com/2014/01/20140124.html

2014年3月21日 星期五

20140321《里耶秦簡(壹)》釋文全文檢索完成

20140321《里耶秦簡(壹)》釋文全文檢索完成



原帖:http://blog.yam.com/ebag/article/73171498
(天空部落格已關站)

    今天這個資料庫,又在一個莫名的期待之下完成了,原始的書籍是陳姿貝同學幫忙掃描的,筆者先將圖片檔案釋文的部分以「尚書七號」做OCR辨識,然後逐字校正。另一方面圖版的部分,從原頁面依照編號一個一個編輯剪出另存一個檔名。接著,把完成校正的文字檔在EXCEL編輯,並加入頁碼等其他資訊,前後花費約一個禮拜左右。


    並不是自誇能力,而是筆者從不隱藏任何文獻資訊處理的方法,都是希望研究者可以藉此瞭解,研究若能夠學習到這些工具軟體或技巧,絕對可以節省許多時間與精力的,《里耶秦簡(壹)》可以這麼做,其他的文獻當然可以「比照辦理」。否則辛苦了幾年所做出的成果,可能因為技術的延宕而被其他人早先發表發佈,這樣的情況也是有可能的。


   資料庫可以用「編號」或「釋文」搜尋,透過結果列表可以點擊瀏覽該編號的簡牘圖版,只是礙於版權問題這部分在前端並沒有開放。即使使用者無法「享用」如此便利的功能,但光是全文的釋文索引(檢索),就可以補足《里耶秦簡文字編》還沒問世的缺陷,或許目前也有研究者早已在進行中,透過多人的使用檢索,就能給予資料庫的再校正。


    從這本書的凡例中可以知道,未來還有四緝要出版,時間未定,目前資料庫的設定是可以配和之後第二三四五輯的內容格式來增補。不過,到時候是否還有時間與能力繼續補充還是未知數。


    衷心的希望研究者若覺得這個資料庫好用,請在文章中註明引用自「引得市」,並不是筆者想藉此彰顯自己的成就,而是若透過文章的引用宣傳,就會有更多人知道這個索引資料庫,會有更多人可以加速研究的時程,省掉一些不必要花費的時間。


    筆者一人的力量有限,能維持多久無法保證,資料庫的營運與更新還是需要大量的時間與成本,雖然筆者多年來一直以興趣作為前提,把這些因素盡可能的排除,但畢竟還是得面對實際的生活現實面,也一直很希望有足夠的經費或資助讓資料庫保持更新與即時更新,否則,今天很正常,明天忽然的消失,網站網址沒能續約,因此連線不上也都是有可能的。


    有使用、喜歡用的朋友,請盡量的透過各種管道幫忙宣傳,增加網站的影響力,或者,排除各種著作權上的問題,讓網站能有收入,透過這些收入維持基本的營運花費。又或許需要有一些學界重量級「大咖」或「名人」的加持推薦吧?


    回到資料庫的說明,筆者盡量保持原始釋文的編排位置,有些符號顯示的問題,就有一些調整或者因應(請見「替代符號」說明),也有一百多處需要造字的部分還沒完成(20181009補完),筆者還會持續的增補。釋文內容錯誤難免,還有許多修改的必要,也朋友請多到FB或微博(http://weibo.com/ebag)留言交流使用情形。

 「引得市」
http://www.mebag.com/index/



【使用方式】

進入引得市→⑬簡牘選單「《里耶秦簡(壹)》釋文全文檢索」
或直接輸入網址:http://www.mebag.com/index/liye/list.asp

----


湖南省文物考古研究所,《里耶秦簡(壹)》,北京:文物出版社,2012年1月。
ISBN:978-7-5010-3350-8


《里耶秦簡(壹)》凡例

一  湖南龍山里耶秦簡根據簡牘出土地層單位分五輯整理出版。

二  第一輯包含第五、六、八層出土的簡牘,第二輯為第九層,第三輯為第七、十、十一、十三層,第四輯為第十二、十四層,第五輯為第十五、十六、十七層以及二○○五年十二月護城壕第十一號坑出土簡牘。

三  圖版據簡牘原大影印,按簡牘整理號編排。圖版下對應標明筒牘出土登記號。出土登記號是按層位號加序號編排。封泥匣出土時自為系列編號,編號方武是在層位號和序號後加『封』字。護城濠十一號坑出土簡牘編號為K1-K51。整理時將無字簡撿出,所以報告中的標本出土登記號不完全連屬。個別簡牘受版面限制,略有縮小,我們註明縮小比例;還有的截成兩段排版,我們另付全形圖於圖版之後,可參閱。

四  釋文據圖版順序編排,簡號注於釋文之末。釋文一般頂格排印。簡文提行書寫的,釋文也分行排列;簡文轉行的,釋文連排,在轉行處加標『蘭符號。有些簡文雖然從文義上可以判斷出是轉行,因殘斷過甚,釋文一律作提行處理。簡文分欄書寫的,在每一欄釋文末括注『第一欄』、『第二欄』等。簡牘正、背面都有文字時,則在釋文後括注『正』字和『背』字;個別簡牘側面有文字,釋文後括注『側』字。簡文一般按時問順序由右向左書寫,有些簡牘並未嚴格按照這種格式,中間行的書寫在左行之後,釋文不作調整。

五  簡文殘泐無法辨認的字,釋文用『□』號表示,一字一『□』,簡文漫漶,如能確定字數的,釋文也用『□』號表示,不能確定的用『……』號表示;存疑的字外加『□/』號;簡文被削除處,釋文以「因』號表示;簡文殘斷處,釋文用『⊠』號表示。木牘的情況較複雜,或兩側殘缺(兩側殘缺者不作說明),或上下殘斷,或一面殘斷,或一角殘斷,或中間部分殘斷,如果簡文有殘缺,同樣用『□/』表示,有殘斷而簡文文義完整,不使用□/表示。簡牘上的圖案,釋文中一般不體現,僅以括號標出『圖案』字樣。

六  簡文間留有空白,如果語意相連,釋文連排。語意不相連的,不論空白多少,釋文一律衹空出一個字位置。殘簡上的文字根據其位於上下殘斷處距離長短,仿照上說情況,釋文與斷茬號『□/』號之間空一個字。

七  釋文一般按照原文字形釋寫,重文、合文和通假字不注出所重、所合和所通假之字。簡文『七十』均為合文,形態較特殊,為排版方便,徑釋為『七十』。簡文『吏』與『事』、『冣』與『最』、「薄』與『簿』等不分,釋文也按照原文字形釋寫,不加區別。不識之字照原樣摹寫。但有些異體字,為了印刷排字方便,釋文用通行字寫出,例如『奴』作『奴』,『Q』作「獲』,『Q』作「穫』,『Q』作『竊」,『𣉻』作「智』等等,不嚴格隸定。

八  簡文所用的符號,釋文儘量保留,如『‧』、『└』、『丿』、「少』等,符號都衹占一個字的字空。簿籍類文書所條列的單頊後多有符號『丨』,有長有短,或斜或彎曲,釋文時均以『丨』表示,祇占一個字字空。釋文不另加標點。簡牘之首和封檢、褐之上端塗墨者,釋文時取消,也不作說明。特殊現象也在釋文後加以說明。

九  簡牘有刻齒者,刻齒的數位萬、仟、佰、拾、個,各有特定的形態,釋文後另加說明。說明原則:刻齒位置的左或右,『萬』、「仟』、『佰』、『拾』、『個』位的刻齒數,並據簡文擬加數量單位。










20210921益師益友.這裡才有――928教師節訂閱優惠

 20210921益師益友.這裡才有――928教師節訂閱優惠 知乎: https://zhuanlan.zhihu.com/p/412367369 感謝老師的辛勤教導,教師節期間(9.21~9.28)申請帳號有特別優惠。 已經訂閱的朋友,仍可利用此優惠延長訂閱時間。 學生老師二人...