2015年5月17日 星期日

20151017《戰國古文字典:戰國文字聲系》索引數位化完成

20151017《戰國古文字典:戰國文字聲系》索引數位化完成
原始:http://blog.yam.com/ebag/article/107840400


字例 4322
缺字 2278
總字例 6600


上冊:1-834
下冊:835-1563

本文(1-1461)
補遺(1462-1475)
合文(1476-1508)
附錄(1509-1563)
書刊簡錄(1564-1567)
筆畫索引(1568-1606)
後記(1607)

    《戰國古文字典:戰國文字聲系》是知名學者何琳儀先生的著作,是古文字研究相當重要參考文獻。「引得市」成立之後,本來很早就該數位化索引,礙於原書是手寫字,OCR文字辨識無法處理,重新打字又過於耗時費力,故一直沒有著手進行。近期筆者研究有考察的需要,順勢抽空就來處理看看。

●索引數位化的進行,大約有幾個階段:


1.依原書逐頁逐字增補,若為「缺字」則立即建立該字的「構字式」(數天)
2.依需要的內容造字(數天)
3.補充「筆畫檢字表」的頁碼及字頭的「筆畫」資訊(數小時)

    原始的資料是筆者向「小學堂」索取的,內容少了很多缺字,擴充字也沒有很完整,即使如此,也一定比重新打字來得快,筆者即依原書頁面逐字逐頁開始增補字頭。進行期間,華南師範大學的「偉明兄」很巧的MAIL傳來黃振亞、何春玲製作的「戰國古文字典」檢字表。

    看了內容,因為是初次索引數位化,還在摸索中,二千多個缺字自然是沒有辦法處理。僅以原書的「筆畫檢字表」來輸入建立,因此字頭也不完整(原書「附錄」的字頭並沒有放入筆畫檢索表中)。僅取用「筆畫檢字表頁碼」的資料,其餘還是以筆者自己建立的為主。過程中也時常勞煩「瑾昀兄」協助整理內容(正規表現),讓索引處理的進度大幅向前。

    缺字造字花了不少的時間,《戰國古文字典》龐大的缺字數量僅次於一年前處理的《戰國文字編》。幾天內大約又造了一千餘字,因此〈古文字缺字資料庫〉也來到了8533個缺字達到現階段最高峰。另外,「缺字」的「筆畫數」也必須輸入,沒有其他方式可以快速的完成,也得實際手動一筆一筆算出,2278個缺字也算了幾個小時,算筆畫感覺比校正內容還要累……,幸好還是完成了。

    因為筆者是以原書本文逐頁字頭輸入校正,因此字頭不容易遺漏,且頁碼有相當高的正確率,但是字頭與「筆畫檢字表」的對應則並沒有逐頁對照檢查,因此錯誤一定不少,而「筆畫檢字表的頁碼」會錯誤的另外原因係筆者字頭的筆畫數,是參照UNICODE的筆畫數,並不是原書的筆畫數。筆畫及筆畫檢字表頁碼欄位的資料,如果有朋友願意再校正,筆者亦可提供檔案。

    這是近期花了很多時間整理的索引資料,也是集合眾人之力所完成的,希望未來有更多朋友加入文獻索引建立的行列,讓研究能更為便利且更有效率。最後,筆者一如往常於「引得市」公開提供使用,也向原書作者及辛苦的學者們至上崇高的敬意。


Google搜尋:「引得市」
或網址列輸入:www.mebag.com/index/
即可查詢《戰國古文字典:戰國文字聲系》索引



PS:因為「引得市」程式的限制,一列一次只能顯示一個缺字,而剛好合文二字又都是缺字,因此筆者又多增一列來顯示第二個缺字。
內容列到數第二的[韋馬][韋隹]

[韋馬]s178-038
[韋隹]s178-012

PS:筆者原則上擴張CDE的字也都會造字處理,但會在缺字編號後面有個括弧,附上該擴張字。

---------------


※強烈建議※

戰國文字的「缺字」的檢索,一定要從〈古文字缺字資料庫〉開始檢索
www.mebag.com/index/quezi/list.asp

以下有圖參照:
例如,輸入「我邑」,然後點選「古文字」,即可知目前有二本文獻有此缺字。
分別在856與436頁。

※強烈建議※

《戰國古文字典:戰國文字聲系》
筆者更正處:
筆畫檢字表1580頁,10畫「𦕏」字,該頁漏此字。
筆畫檢字表1583頁,11畫「䓒」字,頁碼1123有誤,修正為「1124」」。



--------------------

何琳儀,《戰國古文字典:戰國文字聲系》,北京:中華書局,1998年9月。
ISBN:7-101-01625-1

《戰國文字編》筆畫檢字表數位化完成20141014
http://blog.yam.com/ebag/article/80243159

湯餘惠,《戰國文字編》,福州:福建人民出版社,2001年12月。
ISBN:7-211-03935-3

「小學堂」
http://xiaoxue.iis.sinica.edu.tw/

2015年5月7日 星期四

20150507《居延新簡文字編》筆畫檢字表數位化完成

20150507《居延新簡文字編》筆畫檢字表數位化完成


原帖:http://blog.yam.com/ebag/article/91016644
(天空部落格已關站)


此次處理的筆畫檢字表《居延新簡文字編》,是白海燕先生的博士論文,簡牘收錄詳細情形,請參見原書凡例說明。文字頁碼對應也有些修正,請參考筆者修正部分。


字例 2050
缺字 39
總字例 2089

本文(1-1014)
合文(1015)
附錄(1017-1019)
筆畫檢字表(1021-1039)

-----------------

白海燕,《居延新簡文字編》,吉林大學博士論文,2014年6月。

「引得市」查字最快的方式
http://www.mebag.com/index/


----------------

凡例(部分):

一、本字編所收錄的材料主要是,1972年至1974年甘肅省的文物考古工作者在甲渠候官遺址和甲渠塞第四燧所掘獲的簡牘,此外還包括1982年在甲渠候官治所採集散簡、甲渠塞第四燧採集散簡、1976年在居延都尉三十井塞次東燧獲簡、1972年居延地區採集散簡、1972年居延地區採集地點不明散簡,共計簡贖總數8409枚。字形圖片主要截取于甘肅省文物考古研究所、甘肅省博物館、中國文物研究所、中國社會科學院歷史研究所編著的《居延新簡一一甲渠候官》(下冊)簡贖照片。


----------------

「燧」注音ㄙㄨㄟˋ
 1.古代用以取火的器具。如:『木燧』。韓非子·五蠹:『有聖人作,鑽燧取火,以化腥臊。』
 2.古代邊防舉煙警示的訊號。墨子·號令:『比至城者三表,與城上烽燧相望。』

----------------

筆者校正修正部分:

《居延新簡文字編》
筆畫檢字表第1024頁第7畫「氏土」893頁,未見實際圖例,已刪除。
筆畫檢字表第1026頁第9畫「s050-004(工凡巾)」563頁,有誤,應為570頁。
筆畫檢字表第1027頁第9畫「𣐆」403頁,有誤,應為402頁。
筆畫檢字表第1028頁第10畫「s140-192(艸𣏲)」403頁,有誤,應為402頁。
筆畫檢字表第1030頁第11畫「s050-036(帣)」563頁,有誤,應為567頁。
筆畫檢字表第1030頁第11畫「𠅤」757頁,有誤,應為758頁。
筆畫檢字表第1033頁第13畫「𣖡」403頁,有誤,應為402頁。
筆畫檢字表第1033頁第13畫「s075-154(槖)」418頁,有誤,應為417頁。
筆畫檢字表第1034頁第14畫「s075-154(木𥑟)」418頁,與前重複,應刪除。
筆畫檢字表第1037頁第16畫「s120-205(糸广白十)」870頁,與前重複,應刪除。
筆畫檢字表第1038頁第18畫「s184-043(食艹一衣)」344頁,有誤,應為343頁。
筆畫檢字表第1038頁第18畫「s085-225(漸木)」404頁,有誤,應為403頁。

PS:原始資料452頁頁碼上端空白無資料,不知是否遺漏。


居延新簡文字編(2015.5.7)

20181114《引得市》新功能介紹

20181114《引得市》新功能介紹 知乎: https://zhuanlan.zhihu.com/p/49854505   20181111《引得市》改版說明 Blog: https://ebag2007.blogspot.com/2018/11/2018111...