2015年12月23日 星期三

2016年「引得市」小改版說明


2016年「引得市」小改版說明

原始:http://blog.yam.com/ebag/article/119575923


 


「引得市」
http://www.mebag.com/index/

    近日「引得市」重新設計了新的Logo,基本上還是維持「引得市」三字的方正形體變形,採取高長方形的設計,這讓原本資料庫上端的空間多了一些,所以順便也在原始頁面最上端文字的排列做了一些調整。

    需要特別解說的是,右上角新增的「部件檢索」,這介面原作者係f.g_wang,提供此程式,讓引得市有更為方便的檢索介面。目前「引得市」共有「甲金文字」、「古文字」、「訓詁」、「古文字詁林」、「楚文字」、「書道」等六種項目提供這種索引方式。於每個項目的右上角都可直接點選「部件檢索」使用。

    這個介面可顯示:基本漢字、擴展A區、擴展B區、擴展C區、擴展D區、擴展E區、兼容、兼容擴展等共81146字。但這字數與顯示出的「文字」,並不代表這些字在「引得市」的資料庫中都有收錄。輸入單字或者偏旁部首、部件的搜尋,下方都會有列表結果,使用者都可以點選看看。


「部件檢索」功能介紹:

1.拆分功能
在搜尋框中,任一文字前增加「\」(斜線符號),即可以拆解文字,顯示於下方。可選擇複製使用。例:「\部」可拆分為「咅(立口)⻏」。有些字可透過這功能,拆分後再別的部件組合成別字,對於我們不知道發音,或者不知如何輸入的字,用這種方法就可以解決。

2.組字檢索
在搜尋框中,輸入任一「部件或文字」,下方自動會產生相映的文字。

3.點選部件
此頁面依筆畫排列提供部件,點選部件文字,即顯示於「搜尋框」中,可省略一些必要的輸入文字。部件中也包含「非漢字」的部件,如「」。

4.背景顏色:
文字的背景顏色代表字集如下:
(基本漢字)e0e0e0(灰色)
(擴展A區)c0e8ff(淺藍色)
(擴展B區)fff8d0(黃色)
(擴展C區)ffe0ff(粉紅色)
(擴展D區)ffe0b8(土黃色)
(擴展E區)ffd0d0(紅色)
(兼容)ffffff(白色)
(兼容擴展)ffffff(白色)


小結:

    2015年還有幾天,新的一年到來之前,調整新增一些功能,希望「引得市」符合潮流,有更方便使用者的搜尋介面,持續的更新文獻,繼續平穩的發展下去。


PS:請使用者注意,要能完全顯示所有字體,必須安裝「花園字型」,詳細的說明可參考:
中國哲學書電子化計劃「字體試驗頁」

http://ctext.org/font-test-page/zh

字體安裝後瀏覽此頁面,如果字體都能顯示,就正確了。


---------------------------


「部件檢索」
原作者f.g_wang網址:http://blog.xuite.net/fg_wang/twblog/363494138

 


 


 


 


 


 


2015年8月24日 星期一

20150824竭、渴字的「曷」形演進考察

20150824竭、渴字的「曷」形演進考察




曾經在某次秦簡文字考察過程中查詢了「竭」字,對右側下方的「凶」形的寫法有些在意,因為這樣的字形和我們目前使用的「竭」字字形差距很大。好奇心驅使之下,做了考察

a→b→c(演進示意,不一定是單線發展)

a[𠃊+勹]
b[工+勹]
c[匕+勹]

「曷」形的相關文字並不多,尤其是秦漢之際的墨跡文字,筆者暫以「竭」、「渴」二字為例。「竭」字有〈馬王堆漢簡‧養生方〉(非墨跡方面,三晉文字或秦陶文有字例,右下都是接近「凶」形。)「渴」字見〈馬王堆漢簡‧養生方〉或〈馬王堆漢簡‧老子乙〉。從秦漢至唐代,「曷」形上方的「日」形幾乎沒有什麼改變,因此,我們考察的重點是在下方的「凶」→「匃」形。

西漢東漢之際,「凶」形的「㐅」第二筆拉長右下彎形成「𠃌」,拉長的「㐅」形形成了「丿」「一」「亅」的「勹」形。「凵」形縮短成「𠃊」形。之後在魏晉南北朝的碑刻文字中,下方的「𠃊」形大致可分成a[𠃊+勹]、b[工+勹]、c[匕+勹]、三種。文字的演進並不會只有「一條單線」,必定是多線發展,而逐漸形成主要的,從唐代字形往前看,c種的似乎是較接近。「匕+勹」至「亾+勹」的改變,可能是c-1和c-2這兩種的筆畫順序形成的結果

2015年6月12日 星期五

〈聽見下雨的聲音〉秦簡文字20150612

〈聽見下雨的聲音〉秦簡文字20150612


近期寫的大件秦簡文字,第一次把「整首歌」寫在3X6尺的紙張上。而且能把款寫的那麼多,也是自己過去很難想像的。

用秦簡文字寫完喜歡的歌曲是很高興的事。從這張開始之後,在大面積的紙張上書寫秦簡文字已經越來越能掌握書寫的韻律了。

PS:「青靈」即「蜻蜓」(馬王堆漢簡有例)




2015年5月17日 星期日

20151017《戰國古文字典:戰國文字聲系》索引數位化完成

20151017《戰國古文字典:戰國文字聲系》索引數位化完成
原始:http://blog.yam.com/ebag/article/107840400


字例 4322
缺字 2278
總字例 6600


上冊:1-834
下冊:835-1563

本文(1-1461)
補遺(1462-1475)
合文(1476-1508)
附錄(1509-1563)
書刊簡錄(1564-1567)
筆畫索引(1568-1606)
後記(1607)

    《戰國古文字典:戰國文字聲系》是知名學者何琳儀先生的著作,是古文字研究相當重要參考文獻。「引得市」成立之後,本來很早就該數位化索引,礙於原書是手寫字,OCR文字辨識無法處理,重新打字又過於耗時費力,故一直沒有著手進行。近期筆者研究有考察的需要,順勢抽空就來處理看看。

●索引數位化的進行,大約有幾個階段:


1.依原書逐頁逐字增補,若為「缺字」則立即建立該字的「構字式」(數天)
2.依需要的內容造字(數天)
3.補充「筆畫檢字表」的頁碼及字頭的「筆畫」資訊(數小時)

    原始的資料是筆者向「小學堂」索取的,內容少了很多缺字,擴充字也沒有很完整,即使如此,也一定比重新打字來得快,筆者即依原書頁面逐字逐頁開始增補字頭。進行期間,華南師範大學的「偉明兄」很巧的MAIL傳來黃振亞、何春玲製作的「戰國古文字典」檢字表。

    看了內容,因為是初次索引數位化,還在摸索中,二千多個缺字自然是沒有辦法處理。僅以原書的「筆畫檢字表」來輸入建立,因此字頭也不完整(原書「附錄」的字頭並沒有放入筆畫檢索表中)。僅取用「筆畫檢字表頁碼」的資料,其餘還是以筆者自己建立的為主。過程中也時常勞煩「瑾昀兄」協助整理內容(正規表現),讓索引處理的進度大幅向前。

    缺字造字花了不少的時間,《戰國古文字典》龐大的缺字數量僅次於一年前處理的《戰國文字編》。幾天內大約又造了一千餘字,因此〈古文字缺字資料庫〉也來到了8533個缺字達到現階段最高峰。另外,「缺字」的「筆畫數」也必須輸入,沒有其他方式可以快速的完成,也得實際手動一筆一筆算出,2278個缺字也算了幾個小時,算筆畫感覺比校正內容還要累……,幸好還是完成了。

    因為筆者是以原書本文逐頁字頭輸入校正,因此字頭不容易遺漏,且頁碼有相當高的正確率,但是字頭與「筆畫檢字表」的對應則並沒有逐頁對照檢查,因此錯誤一定不少,而「筆畫檢字表的頁碼」會錯誤的另外原因係筆者字頭的筆畫數,是參照UNICODE的筆畫數,並不是原書的筆畫數。筆畫及筆畫檢字表頁碼欄位的資料,如果有朋友願意再校正,筆者亦可提供檔案。

    這是近期花了很多時間整理的索引資料,也是集合眾人之力所完成的,希望未來有更多朋友加入文獻索引建立的行列,讓研究能更為便利且更有效率。最後,筆者一如往常於「引得市」公開提供使用,也向原書作者及辛苦的學者們至上崇高的敬意。


Google搜尋:「引得市」
或網址列輸入:www.mebag.com/index/
即可查詢《戰國古文字典:戰國文字聲系》索引



PS:因為「引得市」程式的限制,一列一次只能顯示一個缺字,而剛好合文二字又都是缺字,因此筆者又多增一列來顯示第二個缺字。
內容列到數第二的[韋馬][韋隹]

[韋馬]s178-038
[韋隹]s178-012

PS:筆者原則上擴張CDE的字也都會造字處理,但會在缺字編號後面有個括弧,附上該擴張字。

---------------


※強烈建議※

戰國文字的「缺字」的檢索,一定要從〈古文字缺字資料庫〉開始檢索
www.mebag.com/index/quezi/list.asp

以下有圖參照:
例如,輸入「我邑」,然後點選「古文字」,即可知目前有二本文獻有此缺字。
分別在856與436頁。

※強烈建議※

《戰國古文字典:戰國文字聲系》
筆者更正處:
筆畫檢字表1580頁,10畫「𦕏」字,該頁漏此字。
筆畫檢字表1583頁,11畫「䓒」字,頁碼1123有誤,修正為「1124」」。



--------------------

何琳儀,《戰國古文字典:戰國文字聲系》,北京:中華書局,1998年9月。
ISBN:7-101-01625-1

《戰國文字編》筆畫檢字表數位化完成20141014
http://blog.yam.com/ebag/article/80243159

湯餘惠,《戰國文字編》,福州:福建人民出版社,2001年12月。
ISBN:7-211-03935-3

「小學堂」
http://xiaoxue.iis.sinica.edu.tw/

2015年4月1日 星期三

20150401「古文字缺字輸入法」開放免費使用

20150401「古文字缺字輸入法」開放免費使用

 ※本文原發布於「篆來撰去」

★各平台作業系統,皆可自由輸入顯示輸出一萬多字的電腦缺字。★


###請務必看到最下面(有更新)###
 
原輸入法程式:佛振
輸入方案設計:趙瑾昀
古文缺字來源:阿良人

PS:於「小狼毫輸入法」中切換各類輸入法的快捷鍵是:「F4」或「Ctrl+`」
 
 
缺字顯示方式:安裝特定輸入法以及字型檔,並以輸入編號方式來打出古文缺字。
 
 
前言:(可省略跳過直接看步驟一)
 
在電腦還沒普及的年代,資料大多以紙本呈現,文字的書寫與呈現並沒有多大的問題,不過近年電腦的文書編輯已經取代了許多「紙上作業」,而「古文缺字」的編輯與顯示也一直是從事古文字研究的人不可避免的問題。研究者竭盡所能,以自己方便的各種的處理方式來解決這個問題,筆者也是其中之一,在2004年開始因為製作「先秦璽印分域資料庫」的關係,必須處理許多缺字,因此開始著手製作缺字,當時是以coreldraw編輯製作在匯出成缺字圖檔。同時建構了「印學缺字資料庫」,利用一個「缺字資料庫」來分享支援給日後所建立的各類古文資料庫。直到2008年赴日留學時,認識上地宏一老師,介紹使用「glyphwiki」。才將原本一千多字的缺字,線上編輯成為可以轉成字型檔的缺字處理方式。
 
「印學缺字資料庫」係以「214」個基本的部首作為編號,無法用部首分類的圖形文字則歸類在「215」,「009-001」代表「人」部的第一個字,依此類推。資料庫十年來已超過七千餘的缺字,且依照古文字書籍(出版品)即時的更新增補缺字。目前最多的缺字部首是「邑」部,已高達361字,若沒有「構字式」的輔助查詢,即使資料庫將該部首全部列表顯示,但逐字查閱對照也是相當耗損「眼力」與考驗「記憶」的事。
 
「印學缺字資料庫」所包含的缺字已不止限於印學方面,擴及所有古文字的領域(甲骨、金文、簡牘等),故已改名為「古文缺字資料庫」。參考中央研究院歷史語言研究所的「漢字構形資料庫」,使得「古文缺字資料庫」利用「構字式」來查詢缺字,例如:輸入「手比」來檢索,就可檢索到「批」字。
 
今日,要在一般電腦中輸入與顯示並使用七千多個古文缺字,已經可以實現了,只要按照說明進行下列步驟。主要有安裝「小狼毫輸入法」與「字型檔」,然後在指定的資料夾中放入指定的兩個檔案即可。
 
 
「古文字缺字輸入法」使用解說:
 
請先至此下載「古文字缺字輸入法」壓縮包(8.8mb)
 
(請使用最新版)
 
※注意此壓縮包的輸入法為「Windows」版本,其他作業系統請至官網下載
下載解壓縮後,按兩下執行「weasel-0.9.30.0-installer.exe」安裝「小狼毫輸入法」
 
01輸入密碼


02下載壓縮包


03解壓縮

04安裝小狼毫輸入法

05選擇喜歡的風格

06安裝完成關閉視窗

07安裝seal字型檔

08在網址列中按下「%appdata%/rime」並按enter
(在檔案總管或資料夾上列,輸入:%appdata%/rime)

09將兩個檔案複製或移動至指定資料夾

10兩個檔案放入指定資料夾,完成示意圖

11修改輸入法設定
(開始→所有程式→「小狼毫輸入法」→「【小狼毫輸入法】設定」)

12勾選「古文字缺字輸入法」

13輸入法切換

14方案選單中選擇「古文字缺字輸入法」


15以編號輸入缺字

16輸入缺字後選擇seal字型

17缺字的呈現會和一般字型等高。(不須微調)

18缺字word檔轉成pdf
(轉成pdf格式之後,對方電腦即使沒有安裝seal字型,也能正常顯示缺字)

19缺字一覽表
(不定時更新,或者至「古文字缺字資料庫」查詢)

###請務必看到最下面(有更新)###

小結:
 
特別感謝趙瑾昀先生的幫助,在輸入法程式的應用下,實現了筆者多年來的夢想。當然,現在只是初步的成果,未來如果可以用更方便又直覺的輸入方式的話又會更好。

使用者若有其他意見都歡迎來信指教。
 
 
7169字「缺字一覽表20150401」下載
(請使用最新版)
-------------------
 
古文字缺字資料庫
 
 
也可至此下載最新的「小狼毫輸入法」
http://rime.github.io/
(提供Mac、Windows、Linux等版本的下載)
windows版本直接下載:http://dl.bintray.com/lotem/rime/weasel-0.9.30.0-installer.exe
 
其他版本下載(Windows Mac OS X Linux):
 
 
 
 
 
 
20160127
下載此檔案可支援至九千四百多字
(請使用最新版)
 
如果要以「筆劃」方式輸入缺字,請將「五筆輸入方式」資料夾內二個檔案,一樣也放入指定的資料夾。
 
在網址列中按下「%appdata%/rime」並按enter
(在檔案總管或資料夾上列,輸入:%appdata%/rime)
(開始→所有程式→「小狼毫輸入法」→「【小狼毫輸入法】設定」)
勾選「古文字缺字輸入法-五筆劃」
 
這樣電腦在開啟「小狼毫輸入法」時,就可以選擇「輸入缺字號碼」或「五筆劃」兩種輸入方式。
 
筆畫輸入法
 
五筆字型輸入法

以下還有內容,請見原文。

 ※本文原發布於「篆來撰去」

20180702《古文字釋要》拼音檢字表數位化完成

20180702《古文字釋要》拼音檢字表數位化完成 知乎: https://zhuanlan.zhihu.com/p/38888073 原始索引是彭偉明、余苑輝依據原書「拼音檢字表」所製作,筆者補上缺字,重新依照原書排序,但是由於時間關係,只有調整到45頁,...