2014年3月29日 星期六

20140329《金石大字典》索引數位化完成

20140329《金石大字典》索引數位化完成

http://blog.yam.com/ebag/article/73373141

    《金石大字典》在書法或篆刻創作,相信無論是初學或老手都經常使用,也是筆者20年前,接觸篆刻的第一本工具書。使用過的朋友都知道,某些字跡不清楚,筆畫與卷頁的查詢其實並不方便,因此,若將索引數位化,使用效率一定會更好。

    《金石大字典》索引頁共29頁,每頁約有128字(8列,每列約16字),筆者處理前段數頁與最後頁,其他分配給30同學,每位同學負責6行(96字),利用「漢文博士」處理其中罕用字或者查驗是否有缺字,最後由筆者作最後校正。同樣科系的上屆學長姐,曾共同處理完成了一萬五千多筆的索引資料校正(《北京圖書館藏中國歷代石刻拓本匯編》)。此次,每個人輸入不到百字的資料,算是牛刀小試,在一個工具軟體的小小練習實作。

    字典本文1968頁,文字索引:3639列,2個缺字。


參與檢字表文字輸入的名單:
台北科技大學 文化事業發展系


陳雅群、楊笠琳、洪琪毓、楊于慧、徐元元、高芷鈴、王詩云、梁翔瑋、范姜萍、潘京愛、張辰、陳靜芬、張惠偵、陳芹嬅、王逸萱、曾珮樺、楊覲昀、張佳靜、李立方、黃筱丰、廖珮宜、林佳儀、藍俐琳、謝青螢、江曉薇、梁亞璇、房玉琴、薛佳蓉、黃滋萱、江耿慧。

短時間內同學們共同完成了這項「任務」,書法篆刻史也應該記上一筆。

感謝參與的同學。

汪仁壽:《金石大字典》,碧梧山房石印,1926年。



「引得市」
http://www.mebag.com/index/

進入「引得市」後,點選右上方「書道」

「引得市」臉書粉絲團:
https://www.facebook.com/INdex201207


「漢文博士」使用介紹
http://blog.yam.com/ebag/article/60218630


20140124《北京圖書館藏中國歷代石刻拓本匯編》-索引數位化完成
https://ebag2007.blogspot.com/2014/01/20140124.html

2014年3月21日 星期五

20140321《里耶秦簡(壹)》釋文全文檢索完成

20140321《里耶秦簡(壹)》釋文全文檢索完成



原帖:http://blog.yam.com/ebag/article/73171498
(天空部落格已關站)

    今天這個資料庫,又在一個莫名的期待之下完成了,原始的書籍是陳姿貝同學幫忙掃描的,筆者先將圖片檔案釋文的部分以「尚書七號」做OCR辨識,然後逐字校正。另一方面圖版的部分,從原頁面依照編號一個一個編輯剪出另存一個檔名。接著,把完成校正的文字檔在EXCEL編輯,並加入頁碼等其他資訊,前後花費約一個禮拜左右。


    並不是自誇能力,而是筆者從不隱藏任何文獻資訊處理的方法,都是希望研究者可以藉此瞭解,研究若能夠學習到這些工具軟體或技巧,絕對可以節省許多時間與精力的,《里耶秦簡(壹)》可以這麼做,其他的文獻當然可以「比照辦理」。否則辛苦了幾年所做出的成果,可能因為技術的延宕而被其他人早先發表發佈,這樣的情況也是有可能的。


   資料庫可以用「編號」或「釋文」搜尋,透過結果列表可以點擊瀏覽該編號的簡牘圖版,只是礙於版權問題這部分在前端並沒有開放。即使使用者無法「享用」如此便利的功能,但光是全文的釋文索引(檢索),就可以補足《里耶秦簡文字編》還沒問世的缺陷,或許目前也有研究者早已在進行中,透過多人的使用檢索,就能給予資料庫的再校正。


    從這本書的凡例中可以知道,未來還有四緝要出版,時間未定,目前資料庫的設定是可以配和之後第二三四五輯的內容格式來增補。不過,到時候是否還有時間與能力繼續補充還是未知數。


    衷心的希望研究者若覺得這個資料庫好用,請在文章中註明引用自「引得市」,並不是筆者想藉此彰顯自己的成就,而是若透過文章的引用宣傳,就會有更多人知道這個索引資料庫,會有更多人可以加速研究的時程,省掉一些不必要花費的時間。


    筆者一人的力量有限,能維持多久無法保證,資料庫的營運與更新還是需要大量的時間與成本,雖然筆者多年來一直以興趣作為前提,把這些因素盡可能的排除,但畢竟還是得面對實際的生活現實面,也一直很希望有足夠的經費或資助讓資料庫保持更新與即時更新,否則,今天很正常,明天忽然的消失,網站網址沒能續約,因此連線不上也都是有可能的。


    有使用、喜歡用的朋友,請盡量的透過各種管道幫忙宣傳,增加網站的影響力,或者,排除各種著作權上的問題,讓網站能有收入,透過這些收入維持基本的營運花費。又或許需要有一些學界重量級「大咖」或「名人」的加持推薦吧?


    回到資料庫的說明,筆者盡量保持原始釋文的編排位置,有些符號顯示的問題,就有一些調整或者因應(請見「替代符號」說明),也有一百多處需要造字的部分還沒完成(20181009補完),筆者還會持續的增補。釋文內容錯誤難免,還有許多修改的必要,也朋友請多到FB或微博(http://weibo.com/ebag)留言交流使用情形。

 「引得市」
http://www.mebag.com/index/



【使用方式】

進入引得市→⑬簡牘選單「《里耶秦簡(壹)》釋文全文檢索」
或直接輸入網址:http://www.mebag.com/index/liye/list.asp

----


湖南省文物考古研究所,《里耶秦簡(壹)》,北京:文物出版社,2012年1月。
ISBN:978-7-5010-3350-8


《里耶秦簡(壹)》凡例

一  湖南龍山里耶秦簡根據簡牘出土地層單位分五輯整理出版。

二  第一輯包含第五、六、八層出土的簡牘,第二輯為第九層,第三輯為第七、十、十一、十三層,第四輯為第十二、十四層,第五輯為第十五、十六、十七層以及二○○五年十二月護城壕第十一號坑出土簡牘。

三  圖版據簡牘原大影印,按簡牘整理號編排。圖版下對應標明筒牘出土登記號。出土登記號是按層位號加序號編排。封泥匣出土時自為系列編號,編號方武是在層位號和序號後加『封』字。護城濠十一號坑出土簡牘編號為K1-K51。整理時將無字簡撿出,所以報告中的標本出土登記號不完全連屬。個別簡牘受版面限制,略有縮小,我們註明縮小比例;還有的截成兩段排版,我們另付全形圖於圖版之後,可參閱。

四  釋文據圖版順序編排,簡號注於釋文之末。釋文一般頂格排印。簡文提行書寫的,釋文也分行排列;簡文轉行的,釋文連排,在轉行處加標『蘭符號。有些簡文雖然從文義上可以判斷出是轉行,因殘斷過甚,釋文一律作提行處理。簡文分欄書寫的,在每一欄釋文末括注『第一欄』、『第二欄』等。簡牘正、背面都有文字時,則在釋文後括注『正』字和『背』字;個別簡牘側面有文字,釋文後括注『側』字。簡文一般按時問順序由右向左書寫,有些簡牘並未嚴格按照這種格式,中間行的書寫在左行之後,釋文不作調整。

五  簡文殘泐無法辨認的字,釋文用『□』號表示,一字一『□』,簡文漫漶,如能確定字數的,釋文也用『□』號表示,不能確定的用『……』號表示;存疑的字外加『□/』號;簡文被削除處,釋文以「因』號表示;簡文殘斷處,釋文用『⊠』號表示。木牘的情況較複雜,或兩側殘缺(兩側殘缺者不作說明),或上下殘斷,或一面殘斷,或一角殘斷,或中間部分殘斷,如果簡文有殘缺,同樣用『□/』表示,有殘斷而簡文文義完整,不使用□/表示。簡牘上的圖案,釋文中一般不體現,僅以括號標出『圖案』字樣。

六  簡文間留有空白,如果語意相連,釋文連排。語意不相連的,不論空白多少,釋文一律衹空出一個字位置。殘簡上的文字根據其位於上下殘斷處距離長短,仿照上說情況,釋文與斷茬號『□/』號之間空一個字。

七  釋文一般按照原文字形釋寫,重文、合文和通假字不注出所重、所合和所通假之字。簡文『七十』均為合文,形態較特殊,為排版方便,徑釋為『七十』。簡文『吏』與『事』、『冣』與『最』、「薄』與『簿』等不分,釋文也按照原文字形釋寫,不加區別。不識之字照原樣摹寫。但有些異體字,為了印刷排字方便,釋文用通行字寫出,例如『奴』作『奴』,『Q』作「獲』,『Q』作「穫』,『Q』作『竊」,『𣉻』作「智』等等,不嚴格隸定。

八  簡文所用的符號,釋文儘量保留,如『‧』、『└』、『丿』、「少』等,符號都衹占一個字的字空。簿籍類文書所條列的單頊後多有符號『丨』,有長有短,或斜或彎曲,釋文時均以『丨』表示,祇占一個字字空。釋文不另加標點。簡牘之首和封檢、褐之上端塗墨者,釋文時取消,也不作說明。特殊現象也在釋文後加以說明。

九  簡牘有刻齒者,刻齒的數位萬、仟、佰、拾、個,各有特定的形態,釋文後另加說明。說明原則:刻齒位置的左或右,『萬』、「仟』、『佰』、『拾』、『個』位的刻齒數,並據簡文擬加數量單位。










2014年3月7日 星期五

20140308《漢代銅鏡銘文文字編》檢字表數位化完成

 20140308《漢代銅鏡銘文文字編》檢字表數位化完成

http://blog.yam.com/ebag/article/72894019


Blog:https://zhuanlan.zhihu.com/p/459194588


【製作說明】

索引內容來自「第二部分 漢代銅鏡銘文文字編」,筆者製作後放上引得市。



字例 588

缺字 0

總字例 588


PS:《漢代銅鏡銘文文字編》原筆畫檢字表數字加上「14」才是實際頁碼。




【《漢代銅鏡銘文文字編》凡例】

1、本字編的選字對象為筆者從建國以來所出版的專書和期刊中所選取的字跡比較清楚的624面漢代銅鏡。

2、本字編字頭排列以大徐本《說文解字》為序,每部先列見於《說文解字》者,後列不見於《說文解字》但可隸定者。無法隸定者或者存疑者列於“附錄一”中。

3、本字編共收錄字頭588個,每個字形都通過手工裁剪粘貼,然後電腦掃描而得。為求體例統一和字跡清楚,對一些字形做過適當的縮放處理。

4、每個字形下有六位編碼,其中前兩位表示該銅鏡所屬的銅鏡大類,中間兩位表示小類,最後兩位表示序號,可對應“附錄二”查找相關的銅鏡信息。如:“[文字圖片]030101”表示“[文字圖片]”來源於“03草葉紋鏡類”中“0301四乳草葉紋鏡”中的1號鏡。

5、每個字頭下的字形按照編碼從小到大排列。

6、“附錄二”中銅鏡分類標準主要參考孔祥星、劉一曼的《中國古代銅鏡》,同時根據我們所搜集到的材料有所調整。我們將624面銅鏡分為十五類,分別是蟠螭紋鏡類、蟠虺紋鏡類、草葉紋鏡類、四乳銘文鏡類、連弧紋銘文鏡類、重圈銘文鏡類、四乳禽獸紋鏡類、博局紋鏡類、多乳禽獸紋鏡類、連弧紋鏡類、變形四葉紋鏡類、神獸鏡類、畫像鏡類、夔鳳(雙夔)紋鏡類、龍虎紋鏡類。“附錄二”後附有具體銅鏡分類說明。

7、“附錄二”中詳細記錄了所選銅鏡的各項信息,包括直徑、重量、銘文釋讀、出處和年代。在銘文釋讀上,我們結合學術界的相關研究成果,最大限度地對原釋文中的錯誤進行了更正。由於原釋文中的錯誤比較多,所以對勘誤之處不做標記,而是直接錄入正確的釋文。銅鏡銘文著錄中小括號內表示本字,如:“竟(鏡)”表示在該銘文中,“竟”的本字是“鏡”。銘文出處中的專書一律用簡稱,如:“上海28”表示《上海博物館藏青銅鏡》圖28。“附錄二”後附有出處簡稱對照表,方便查閱。

8、字編後附有檢字表,檢字表按筆畫順序排列。


【使用說明】

進入引得市,上方選單「工具書▼」→「語文辭典」

或輸入網址:https://www.mebag.com/index/main/list.asp


---

張丹,《漢代銅鏡銘文研究概況及文字編》,吉林大學碩士論文,2013年4月。

(徐正考教授指導)《漢代銅鏡銘文文字編》15-147頁

20240315阿良人的研究LIFE __閒談「說文解字」的規整化(影音記錄)

20240315阿良人的研究LIFE __閒談「說文解字」的規整化 (影音記錄)   知乎: https://zhuanlan.zhihu.com/p/687396300 【開場白】 前一次錄影記錄了:阿良人的研究 LIFE __ 「引得市·說文解字」資料庫介紹,整體效果還不錯。...