2014年10月28日 星期二

20141028《清華大學藏戰國竹簡(壹-參)文字編》筆畫檢字表數位化完成

20141028《清華大學藏戰國竹簡(壹-參)文字編》筆畫檢字表數位化完成

知乎:https://zhuanlan.zhihu.com/p/52570048







http://blog.yam.com/ebag/article/80811364

    筆者曾在2013年6月完成《清華大學藏戰國竹簡(壹)》筆畫檢字表的數位化,近日有幸獲得新的資料,覺得應該優先處理。所以暫時將《楚簡帛通假彙釋》筆畫檢字表的處理暫停。大約二三天時間完成這份檢字表。此文字編大約又新增了三百多字的缺字,大約有一半是新造的缺字,一半是原始資料庫就已經有的。

字例 1093缺字 616總字例 1709


    《楚簡帛通假彙釋》若繼續處理,筆者估計可能還會再增加數百個缺字,總累積的缺字應該會突破六千字。這樣一來,不論是秦楚或其他系別的涵蓋量應該就算很大了。雖然一字一字的造字繁瑣耗時,但想到之後可以利用這樣的檢索,讓研究者省下不少時間,覺得幾天的工作量其實也不算什麼了。

    其實,這樣的缺字整理,不僅是便於網路上資料庫的檢索而已,此外,這樣將近六千的缺字本身可以是一個單一的「字型檔」,使用者可以像一般安裝字型的步驟一樣,安裝後,電腦就可輸入或顯示這些缺字,不只是論文文書上的使用,甚至未來若要出版印刷也是沒有問題。所以,一次把缺字的問題處理好,就會像是「倒吃甘蔗」一樣,越來越能體會它的便利性。

    筆者知道目前研究者大部分都是各作各的,每個學校機關都有其整理編製的研究資料,並不是那麼公開或自由交流。但是,如果有研究者需要這樣的檢索表電子檔,在能交流共享互惠的基本條件下,筆者會很樂意共享的。


    朋友們若對文字的整理或校正有興趣,請與筆者聯絡。只要利用一些軟體,不一定得要中文相關科系,也可以馬上上手,將這些文字內容校正數位化完成。


使用方式:


請搜尋「引得市」或輸入「http://www.mebag.com/index/」

點選右上方「楚文字」即可開始搜尋使用,若要搜尋缺字,建議先從「古文字缺字資料庫」查詢,再連回資料庫。


「古文字缺字資料庫」累積缺字已達5809字
「古文字缺字資料庫」http://www.mebag.com/index/quezi/list.asp

    「古文字缺字資料庫」是聯繫各個資料庫缺字的重要核心,古文字的研究者應該要好好的利用。所謂的「缺字」,在此是指目前出版的古文字相關字典或文字編中,電腦無法正常輸入或顯示的字,自2004年起,筆者根據古文字相關文字資料的內容,將這些缺字整理分類與編號,整理成一缺字資料庫。(前身:印學缺字資料庫)

其中也包含目前WIN8作業系統支援的擴張C或D等。為了讓使用者不必背誦編號,我們建議使用者以「構字式」,將原始缺字先拆字的方式來查回缺字,例如:若想查詢「㱕」(舉例,這字不是缺字)可以輸入「止帚」。

基本上這樣的構字式,筆者拆分以從左至右,從上至下的順序。並以目前容易輸入顯示的偏旁字元部件為主,不一定會拆分到最詳細的部件。

※缺字檢索小技巧:

若輸入「匚%戈」可以查到「匚+戈」中間任何一個字元或內容的缺字,即「%」這個符號可以代表任何字元,如果剛好遇到其中一部份的偏旁部件無法輸入,或不會打的情形,就可以用「%」這個符號代替。如圖所示。

再舉一例,輸入「宀%心」即可查到「宀+心」中間有任何一字元部件內容的缺字,這樣可以避免輸入太少的偏旁而有過多的內容。查缺字後,可點選右方五大類的資料庫連結,查回該缺字在文字編的頁碼。

※從缺字資料庫的缺字查詢其他文字編的內容

點選「楚文字」,即顯示該缺字在「楚文字」資料庫中,某一文字編的頁碼
















20240315阿良人的研究LIFE __閒談「說文解字」的規整化(影音記錄)

20240315阿良人的研究LIFE __閒談「說文解字」的規整化 (影音記錄)   知乎: https://zhuanlan.zhihu.com/p/687396300 【開場白】 前一次錄影記錄了:阿良人的研究 LIFE __ 「引得市·說文解字」資料庫介紹,整體效果還不錯。...