2013年4月18日 星期四

20130419《古文字詁林》部首檢字表處理中

 20130419《古文字詁林》部首檢字表處理中



原始發布處天空部落格(已關站):20130419《古文字詁林》部首檢字表處理中

http://blog.yam.com/ebag/article/61998992



    《古文字詁林》部首檢字表(一~十冊)。刊《古文字詁林》第十二冊的15頁至246頁,字例共有9832字。這份檢字表的電子檔是在「國學數典」下載,是某位熱心網友率先製作,並非本人創始。不過製作該書檢索表的構想在幾年前就已經有了,並且陸續也有一點執行動作。

2007《古文字詁林》索引資料庫建置計畫

http://blog.yam.com/ebag/article/11727815

(當時預估的整個資料數位化金額是17萬新台幣)



    既然有人完成,我們順勢就改的更完善些,所以把資料再重新整理,逐一加上了「筆畫」項目,還有把一些罕用字增加常用字以利檢索,如「雧」改成「雧(集)」等。並且把「部首」的資訊又增加編號,方便日後資料庫的排序。


例如:把部首「示」改成「003_示(礻)」


    若用一般方式,在EXCEL尋找取代,就得540次,時間需要多久?可想而知,我們藉由「彰化一整天」網友的程式,在不到30秒的時間下,就把9832處需要取代的地方處理完成。說是「變魔術」亦不為過。另外,在整理時,不知是否是EXCEL本身的問題,才九千多筆資料,跑起來電腦幾乎快當機一樣?


    這套書應該是研究古文字的同好必備的書籍,以傳統《說文解字》540部首的編排檢索方式,對我們這種非古文專業學系的人來說,以紙本翻頁查詢檢索上確實有點吃力,所以自己才會有想把書籍作一個檢字表數位化的想法。日後文字容易查得,相信會有更多人使用這套書。有時間的話,得再把11冊的檢字表處理一下才算完備。(看來這半年內可能沒時間?太多事情要執行了)


延伸閱讀:

《说文解字》网上检索系统

http://www.wenzi.cn/shuowen/index.HTM

20240422《中國語言學大辭典》分類詞目表索引數位化完成

 20240422《中國語言學大辭典》分類詞目表索引數位化完成 知乎: https://zhuanlan.zhihu.com/p/693938707 【製作說明】 這本書在33年前出版,正在看這篇文章的朋友可能都還沒出生?1991年那時候我在作什麼呢?就讀專科學校(美術工藝科),...