2019年3月5日 星期二

20190305「《說文解字》字頭構形」資料庫上線!

20190305「《說文解字》字頭構形」資料庫上線!




知乎:https://zhuanlan.zhihu.com/p/58417359

【前言】


今天,〈引得市〉公開了《說文解字》四種資料庫,所謂的四種是:

《說文解字》字頭索引(現有)
《說文解字》字頭構形(新增)
《說文解字》部首索引(新增)
《說文解字》部首構形(現有)

「《說文解字》字頭構形」與「《說文解字》部首索引」兩種新的資料庫。這一篇主要是敘述「《說文解字》字頭構形」的製作緣由。

「《說文解字》540部首文獻索引資料庫」(原名),現改名為「《說文解字》部首構形資料庫」,提供部首之間「字形」和「字義」的切換,現在,不只是540個部首而已,範圍再擴大到《說文解字》所有的字頭,《說文解字》字頭索引資料庫包含9866個字頭,《說文解字》字頭構形資料庫則有11169列的內容。一萬多個字形圖檔可以線上即時瀏覽,同時比較多種版本,觀察分析字形之間的差異。


【《說文解字》字頭構形製作說明】


此資料庫和一般說文資料庫不同,不以字頭為基本索引單位,而是以「篆文圖檔」為本體,無收錄文本內容,但完整呈現了《說文》一字頭多種圖版的形式。列表中在右側有該字形的種類補充,如:篆文、古文、籀文、新附字、新修字、古文/秦刻石、秦刻石、奇字等。查詢後,可同時瀏覽各版本的《說文解字》字形是最大特色。搜尋條件包含:「字頭」、「字號」、「部首」、「筆畫」、「漢語拼音」、「文字種類」等

目前暫以北師大、陳昌治本、汲古閣本、小徐本、段注本等為基本資料庫內容,若時間許可,可再拓展補充其他說文版本。

陳昌治本圖版是筆者依據中華書局2015年出版的《注音版說文解字》,部份字跡殘損,有再參考其他版本字形再修補的必要(持續更新中)。這個版本的製作,前後花了相當多時間(過年前後數十天),從最開始圖版的裁切,殘損修飾,到表格整理等。透過這個專案,實實在在的把《說文》一字一字的看過並且標注種類。(過程步驟可參後)

其中最複雜的就是說文各個版本之間,字頭的差異。如果沒有的w兄的對照表,這個資料庫是不可能完成的。

【小結】


《說文解字》圖/文四種資料庫,以「字號」、「部號」、「部首」欄位內容作為切換,經由瑾昀兄的建議與程式修改,順利達成了筆者的構想。台灣有知名的「四海游龍」(鍋貼餃子連鎖店),現在,網路也上有個「四海遊文」(說文),四種資料庫自由切換,悠遊於《說文》文字形音義的宇宙中。


【後記】


「《說文解字》字頭構形」資料庫能夠上線,背後有許多朋友一起共同協作,筆者由衷感謝。如:w兄提供了大徐本(汲古閣本)、小徐本(祁寯藻刻本)、段注本(經韻樓本)的圖版支援以及對照表的提供。門馬兄在大徐本(汲古閣本)圖檔的命名與資料處理上給予幫助,瑾昀兄《說文》多種版本檔名對照轉換等。一直以來,這些朋友在《說文學》領域研究與資料建置上都投入了相當多的心力,而這個資料庫就是集結眾人累積研究的一個展示。

在使用上有任何意見或建議都歡迎私訊或來信,謝謝!


【《說文》圖版數位化執行的幾個步驟簡要說明】


筆者使用的「陳昌治本」是中華書局2015年出版的《注音版說文解字》。以「Firework」為編輯軟體,將1-315頁的字頭的篆形圖切割出來,一頁最多40字(上右5+上左5+下右5+下左5=40)。

接著圖檔與內容逐頁檢查對照是否有遺。並進行以下步驟:

⊙修正原始變形的圖版(另尋版本取代或原始檔調整)
⊙逐頁刪除圖檔雜點、調整色階。
⊙更改檔名,將原本只有流水號的檔名加上頁碼資訊,如:001_01(頁碼+流水號)
⊙匯出古文與籀文的圖檔並調整檔名
⊙修改excel字頭表格檔名等資訊
⊙比對其他版本說文修正檔名
⊙補充整理excel資訊內容
⊙以「ComicEnhancerPro」去背,上傳資料庫

以「字號」作為最終命名方式,例如:0001是篆文圖版,若還有古文或籀文則下一個命名為0001_2。最後,圖版總數量是11108個。






【《說文解字》字頭構形資料庫】圖檔版本


大徐本(北師大)
大徐本(陳昌治本)
大徐本(汲古閣本)
小徐本(祁寯藻刻本)
段注本(經韻樓本)


【使用方式】

進入《引得市》(http://www.mebag.com/index/list.asp)
工具書→說文解字→字頭構形
或直接輸入網址:http://www.mebag.com/index/shuowen_pic/list.asp



【小額贊助】

http://www.mebag.com/index/donate.asp


【四種《說文解字》資料庫切換操作說明】


當你在「字頭索引」時【字號】欄位可以相互切換
當你在「部首索引」時【部號】欄位可以相互切換

簡單來說:

【字號】欄位→是字頭與構形之間切換的Key
【部號】欄位→是部首與構形之間切換的Key
【部首】欄位→是字頭與部首之間切換的Key(圖對圖,字對字)

如果還搞不清楚?游標點點看,試個幾次應該就明白了!


【學術交流】


※關於「引得市」的各種查詢應用,網路上的教學影片或文章介紹的不多,因此,很多教授與研究者可能還不熟悉,像是「開卷助理如何用」、「電腦缺字」、「古文字輸入法的使用」等問題,筆者都很樂意詳細解說,只要時間允許,都歡迎個人或學校機關團體私訊或留言約時間地點,公開來討論交流。

---

東漢許慎:《注音版說文解字》,北京:中華書局,2015年6月。


【圖版修改備註】


38頁左上「衛」字有壓縮變形 原有調整
75頁左下「𪅟」字有壓縮變形 原有
81頁右下「䯤」字有壓縮變形 取代
85頁右上「䐄」字有壓縮變形 取代
86頁左上「剟」字有壓縮變形 原有
88頁右下「觸」字有壓縮變形 取代
94頁右下「簸」字有壓縮變形 取代
103頁右下「餧」字有壓縮變形 取代
123頁右下「𦤙」字有壓縮變形 取代
127頁右下「賵」字有壓縮變形 取代
134頁左上「曠」字有壓縮變形 取代
141頁左下「穫」字有壓縮變形 取代
142頁右下「䅭」字有壓縮變形 取代
144頁左上「䊮」字有壓縮變形 取代
148頁左上「寁」字有壓縮變形 取代
152頁左下「癉」字有壓縮變形 取代
173頁左上「𡱣」字有壓縮變形 取代
236頁左下「㶄」字有壓縮變形 取代
237頁左上「萍」字有壓縮變形 取代
244頁左下「鮑」字有壓縮變形 取代
260頁左上「媾」字有壓縮變形 取代
275頁左上「縟」字有壓縮變形 原有調整
295頁左下「鍛」字有壓縮變形 取代
300頁左上「鐜」字有壓縮變形 原有調整

---

《說文解字》字頭索引
http://www.mebag.com/index/shuowen/list.asp
《說文解字》字頭構形
http://www.mebag.com/index/shuowen_pic/list.asp
《說文解字》部首索引
http://www.mebag.com/index/shuowen_bushou/list.asp
《說文解字》部首構形
http://www.mebag.com/index/shuowen_bushou_pic/list.asp



【延伸閱讀】

20190305「《說文解字》部首索引」資料庫上線!

Blog:https://ebag2007.blogspot.com/2019/03/20190305.html
知乎:https://zhuanlan.zhihu.com/p/58417219


20180909「說文解字部首構形綜覽」資料庫上線

Blog:http://ebag2007.blogspot.com/2018/09/20180909540.html
知乎:https://zhuanlan.zhihu.com/p/44086698

WFG「《說文解字》字典」
http://fgwang.blogspot.com/2019/02/blog-post.html

沒有留言:

張貼留言

20240422《中國語言學大辭典》分類詞目表索引數位化完成

 20240422《中國語言學大辭典》分類詞目表索引數位化完成 知乎: https://zhuanlan.zhihu.com/p/693938707 【製作說明】 這本書在33年前出版,正在看這篇文章的朋友可能都還沒出生?1991年那時候我在作什麼呢?就讀專科學校(美術工藝科),...