2016年10月4日 星期二

20161004《北京大學藏西漢竹書・蒼頡篇》全文檢索資料庫完成

20161004《北京大學藏西漢竹書・蒼頡篇》全文檢索資料庫完成

http://blog.yam.com/ebag/article/173426738


此全文資料庫公開使用前,約略有四個過程:

一:以字形練習本出版為目的所製作的數位摹本,依據是600dpi的紅外線圖版。
二:釋文整理時,筆者以書籍原釋文為基礎,再分析考察秦漢字例,也斟酌參考瑾昀兄、西風兄的資料與意見。
三:彩色圖版與數位摹本編排與單字剪裁輸出圖檔。(資料庫中的圖示是原始300dpi寬330高140像素png圖檔格式,再縮小50%,銳利化處理。)
四:所有文字資訊與圖檔整合於「引得市」上線使用。


GOOGLE搜尋「引得市」進入後,點選「西漢竹書・蒼頡篇」或:

《北京大學藏西漢竹書・蒼頡篇》全文檢索資料庫網址:
http://www.mebag.com/index/beida_cangjie/list.asp

資料庫幾種使用方式:
1.「章名」選單瀏覽
2.「釋文」選單右側空格輸入關鍵字查詢
3.「簡號」選單右側空格輸入關鍵字查詢(「01_01」代表地1號簡的第1字)

字列 1362
缺字 9
總字列 1371

    經筆者整理後《北京大學藏西漢竹書・蒼頡篇》總字列為1371列,缺字9處,「□」殘字12處,超過二次以上的字例有:二(3)、八(3)、十(3)、五(2)、內(2)、六(2)、廿(3)、四(2)、氐(2)、宇(2)、宇(2)、百(11)、決(2)、帛(2)、雨(2)、姪(2)、室(2)、胡(2)、兼(2)、悝(2)、𨾙(2)、幣(2)、漢(3)、端(2)、鄙(2)、請(2)、錯(2)、闊(2)、離(2)、顓(2)、𣝪(2)、𥂹(2)、鶡(2)、齎(2)、𢹎(2)等字。

對於資料庫的內容,使用者若有任何意見,也歡迎來信討論。

--------------------
69、75號簡圖版比例有問題。

69號簡字之後必須放大110%才是正確比例
經與兩種彩色圖版對照之後「合」字之後的簡牘寬度相差約0.1cm。
經過調整後發現文字上下的間隔與彩色圖版的比例還是有些差距,可見,此書一定是在某個圖版編輯的環節中出了問題。此外,75號簡彩色圖檔或紅外線圖版的尺寸也是有問題。


--------------------------
北京大學出土文獻研究所編:《北京大學藏西漢竹書(壹)》,上海:上海古籍出版社,2015年9月。



01《□祿章》 1 5
02《□□章》 6 7
03《漢兼章》 8 11
04《闊錯章》 12 15
05《□□章》 16 18
06《□□章》 19 19
07《□□章》 20 21
08《□□章》 22 23
09《□□章》 24 26
10《幣帛章》 27 30
11《□□章》 31 31
12《□悝章》 32 33
13《□□章》 34 38
14《□□章》 39 41
15《齎購章》 42 43
16《□□章》 44 45
17《顓頊章》 46 52
18《室宇章》 53 55
19《□□章》 56 58
20《雲雨章》 59 62
21《□輪章》 63 67
22《鶡鴇章》 68 70
23《□□章》 71 79

-------------------

【預告】《北京大學藏西漢竹書.蒼頡篇》字形書寫練習本

    去年公開出版,北京大學藏的西漢竹書《蒼頡篇》是目前為止,字例清晰數量也最多的漢代教學識字書,時間約在西漢早期,整理編號至79,每支簡字數至多21字。雖然與《張家山漢簡》、《銀雀山漢簡》等簡同一時期,但學者認為應該較晚於《張家山漢簡》。

    筆者一般考察墨跡文字的相對時期,會以其字例的前後五十年作為判讀,等於字例會有一百多年至兩百年的寬容期。以這《蒼頡篇》中以「無」、「步」等關鍵字例的字形來考察,確實符合相應的時期。

    《蒼頡篇》與同時期的漢簡文字在結體上有明顯的差異,或許是目的作為教學識字的課本,在辨識度與一致性有所要求,因此筆者認為這應該算是一種有目的的控制與安排的書寫方式(似乎也相似於印面布局安排)。除了某些字的筆畫有開展,多數的文字都控制在寬0.9高約0.7公分左右,呈現一種扁平的文字字塊。雖然缺少秦漢簡牘率性自然的特色,但多了幾分謹慎與沈穆的穩定風貌。

    我們把600dpi的圖檔放大200%,螢幕上的視覺比例,就像是是把原先0.9公分寬的簡牘放大到將近15公分的尺寸。雖然,我們也可以放個透明描圖紙直接在書籍上簡冊圖版描摹,精準度或許就沒有那麼高,但字跡能保有筆順書寫的實際效果。電腦上描摹的字跡可以直接有多種用途,例如縮小50%成原寸的大小,或者再放大到6-9公分寬,作為毛筆書寫用的範本。

    筆者認為,硬筆臨摹的字例最好不要超過1公分,因為書寫速度無法快速順暢,寫單一個字花費的時間太多,不如寫更小的字,有更多書寫不同字例的機會,《蒼頡篇》原寸的字跡大小剛好適合,繼續整理後,除了研究其中的字跡演進,或許也能如之前的秦簡文字練習本一樣,也出版《北京大學藏西漢竹書.蒼頡篇》字形練習本。

    這樣的字形練習本,加上釋文的排版之後,作為筆者教授秦漢文字的教材或者自學者書法篆隸的練習應該都是很合適的,敬請期待。


筆者「西漢竹書.蒼頡篇」相關連結

https://www.facebook.com/600029217/posts/10154714798089218
《西漢竹書.蒼頡篇》字形書寫練習本試寫20160913
http://blog.yam.com/ebag/article/168790318

《西漢竹書.蒼頡篇》字形書寫練習本【推廣】
https://www.facebook.com/600029217/posts/10154709340514218

《西漢竹書.蒼頡篇》字形書寫練習本【推廣】
https://www.facebook.com/600029217/posts/10154709286929218

https://www.facebook.com/600029217/posts/10154706151174218
《西漢竹書.蒼頡篇》字形書寫練習本(20160910首發)
http://blog.yam.com/ebag/article/168075625

https://www.facebook.com/600029217/posts/10154636633659218
《西漢竹書.蒼頡篇》字形書寫練習本(初稿)20160821

https://www.facebook.com/600029217/posts/10154590477879218
「迷惑」《北京大學藏西漢竹書.蒼頡篇》字形試寫。

https://www.facebook.com/600029217/posts/10154590438854218
http://blog.yam.com/ebag/article/161383970
「獲得」《北京大學藏西漢竹書.蒼頡篇》字形試寫。

https://www.facebook.com/600029217/posts/10154578478099218
《北京大學藏西漢竹書.蒼頡篇》數位摹本

https://www.facebook.com/600029217/posts/10154578439829218
《蒼頡篇》去網紋比較

https://www.facebook.com/600029217/posts/10154577587109218
【預告】《北京大學藏西漢竹書.蒼頡篇》字形練習本

2016年6月21日 星期二

20160621《秦簡逐字索引》總檢字表數位化完成

20160621《秦簡逐字索引》總檢字表數位化完成

原始:http://blog.yam.com/ebag/article/152690495

「引得市」《秦簡逐字索引》總檢字表:
http://www.mebag.com/index/qinjian_zhuzi/list.asp






    總撿字表圖檔經「尚書七號」ocr處理,筆者逐字校正一次,請瑾昀兄校正並提供字頭修正意見。筆者再逐頁輸入右側各秦簡對應編號。若該字頭在該簡牘中沒有編號,則以「x」符號代替。其中發現原書470頁缺編號839「熒」字,應補入。18處新造缺字,77處取舊有缺字。總缺字計有95處。

秦簡逐字索引總檢字表(419-486)

字列 2144缺字 95總字列 2239


    完成的資料庫,除了以「字頭」檢索之外,使用者可善用右方「排序」功能,能選擇這五大分類的簡牘資料的編號順序。從書籍字頭印刷的字體來看,編輯者應該是使用剪貼的方式,總檢字表應該是沒有完整的電子檔,筆者也補上紙本書沒有的編號與頁碼的對照,這樣的數位化索引型態,檢索應該更加便利了。

    2016年過了一半,「引得市」以每年增加10種文獻的不成文的規定,還有36種才能達標,下半年六個月是否能做到呢?

2012 17種文獻
2013 27種文獻
2014 37種文獻
2015 47種文獻
2016 目前21種文獻(距離目標還有36...

使用方式:
「引得市」→專書→《秦簡逐字索引》索引
或直接進入網址:http://www.mebag.com/index/qinjian_zhuzi/list.asp








簡牘名稱 編號起迄 頁碼起迄
《睡虎地秦簡》 1-1824 19-115
《放馬灘秦簡》 1-1009 208-224
《周家臺秦簡》 1-611 327-364
《龍崗秦簡》 1-405 374-385
散見秦簡 1-305 405-413

-----------------
張顯成主編:《秦簡逐字索引》,成都:四川大學出版社,2010年12月。
ISBN 978-7-5614-5089-5









2016年1月6日 星期三

《上博藏戰國楚竹書字匯》缺字編號補完20160106

《上博藏戰國楚竹書字匯》缺字編號補完20160106

http://blog.yam.com/ebag/article/121853406





《上博藏戰國楚竹書字匯》是2013年4月完成的,收錄在「引得市」的「楚文字」項目中,原本七百多處的缺字(總字例2399),今日已全部補上缺字編號,為此新造了一百多字,「古文字缺字資料庫」來到新高達到9425字。資料庫中的《楚文字編》還有1990字需要補上編號,如果將時間完全投入處理,估計也需要32個工作小時以上。也因瑾昀兄一直催促,才得以早日完成類似這類的文獻。

聽朋友說,某單位有計畫編輯新的《楚文字編》,只是由哪方主導還沒決定。戰國文字、楚文字的檢索,「缺字」是最為關鍵的核心,能夠完全顯示輸入查詢缺字,資料庫才能發揮,目前「引得市」「楚文字」收錄內容在網路開放資料庫中,可說是更新最快且豐富全面。透過「古缺字庫」查詢缺字,連結到「楚文字」可以查詢更多古文缺字的內容。

近日,筆者會再發佈一部楚文字的字書索引,敬請期待。

---


饒宗頤,《上博藏戰國楚竹書字匯》,合肥:安徽大學出版社,2012年10月。
ISBN:978-7-5664-0381-0


上博藏戰國楚竹書字匯(2013.4.4)

「引得市-楚文字」
http://www.mebag.com/index/chu/list.asp

《上博藏戰國楚竹書字匯》的錯誤更正
http://blog.yam.com/ebag/article/81335399

「古文字缺字資料庫」
http://www.mebag.com/index/quezi/list.asp

臉書原文網址:https://www.facebook.com/photo.php?fbid=10153983028369218&set=a.111822834217.95159.600029217&type=3&theater

20181114《引得市》新功能介紹

20181114《引得市》新功能介紹 知乎: https://zhuanlan.zhihu.com/p/49854505   20181111《引得市》改版說明 Blog: https://ebag2007.blogspot.com/2018/11/2018111...