2014年11月20日 星期四

20141121《清華大學藏戰國竹簡(肆)》筆畫檢字表數位化完成

 20141121《清華大學藏戰國竹簡(肆)》筆畫檢字表數位化完成


http://blog.yam.com/ebag/article/81846041


    原來書中筆畫檢字表只有343列(24畫「觀」字為止),筆者再自行增補合文、簡序數字等索引讓內容增加至473列。完成了這一本書,「引得市」目前出土的楚文字相關資料應該是很完整的了。


字例 387

缺字 86

總字例 473



【使用說明】

進入引得市,上方選單「工具書▼」→「語文辭典」

或輸入網址:https://www.mebag.com/index/main/list.asp



李學勤,《清華大學藏戰國竹簡(肆)》,上海:中西書局,2013年12月。

ISBN:978-7-5475-0264-8


PS:目前「古文字缺字資料庫」已經突破六千字,來到「6042」字。

http://www.mebag.com/index/quezi/list.asp

2014年11月6日 星期四

20141106《字源》(全三冊)筆畫檢字表數位化完成

20141106《字源》(全三冊)筆畫檢字表數位化完成





old:http://blog.yam.com/ebag/article/81183082


    今日完成了《字源》筆畫檢字表,45頁的內容除了逐字校正之外,主要時間是花在缺字的處理上,完成後很直覺的就想看看學者們對於「願」字的看法是如何。「願」字在《字源》分別是776與779頁,因為該書沒有針對字體有完整的考察(墨跡為主,其餘字類為輔),所以文中的分析之後,還是無法完全理解「願」字演進的原因。

    筆者認為是文字學者所使用的字典或文字資料涵蓋的層面不夠的原因,雖然有點老王賣瓜的嫌疑,但筆者不得不繼續說,如果研究者可以使用「引得市」的檢索,就能彌補這樣的問題,從單字仔細的考察,時段以「秦漢之間」即可,這樣下來,對於《說文解字》篆字形體的疑慮就可以獲得解決。

    去年年底曾對「願」字的演進作了初步考察(見文後連結),對《說文解字》「願」字的篆形有了質疑,個人認為應該是宋人以「楷」形所研判而成的「篆」形,從出土的文字與各類文字資料中,秦漢之際甚至到東漢都不曾有「原」+「頁」這樣的篆形。宋人偏旁拼湊而成的可能性相當的高,最後楷書形成的「原」形。研究的經驗告訴我,這種以「楷」而類推回「篆」形的例子不少,因此筆者其實不太願意相信《說文解字》所列出的的篆形。(篆形形體有誤的話,所分析的內容文字自然也是不會真)

    「願」字的偏旁「原」形,在秦漢以前是以近似「目一目大」或「貝貝大」這樣的形體呈現,經過幾百年的演進,在宋代時才形成目前我們所看到的「原」形,所以在許慎《說文解字》成書的時代(西元100年),甚至更早的秦代,篆形是不可能向我們看到現在看的《說文》版本的樣子。

    嚴格來說唐宋之後,許慎《說文解字》內容樣貌可能已經很難真實的呈現在世人眼前,多少內容是後人所「添加」,多少這樣未知的「成分」已經不容易分別出來。幸好,現在我們可以透過秦漢之間出土的墨跡文字來分析,把《說文解字》的字形形體與墨跡文字相較,就可以明白前者的問題在哪裡,只要研究者不要再落入篆隸字體的分別的矛盾中。

另外,衷心建議要研究或撰寫這類漢字演進的文章之前,還是要把《說文解字》先仔細的過濾一遍,其中形體的錯誤太多,會導致以《說文解字》形體分析漢字演進的研究者錯上加錯。若花了時間卻無法達到正確的研究是很可惜的。

《字源》
字例7867
缺字39
總字例7906

本文(1-1293)
筆畫檢字表(1329-1374)

PS:《字源》裡面有很多缺字是楷形簡體字呈現的的古文字,例如:「軨」(車令)變成「车令」,個人覺得並不大需要,這樣的列示意義不大。古文字學大致上應該還是以楷形繁體字為終點,近代的簡體字的改變與推動,和古文字的演進應該沒有關係了。



《字源》筆畫檢字表使用方式:
請進入「引得市」,點選上方「通假」即可檢索。
www.mebag.com/index












李學勤,《字源》(全三冊),天津:天津古籍出版社,2012年12月。(2013年7月重印)
isbn:978-7-5528-0069-2


筆者校正處:
《字源》筆畫檢字表第1341頁第9畫「𥁋」字非448,應改為447頁。


「願」字的演進(草稿)20131226
http://blog.yam.com/ebag/article/71726759

2014年10月28日 星期二

20141028《清華大學藏戰國竹簡(壹-參)文字編》筆畫檢字表數位化完成

20141028《清華大學藏戰國竹簡(壹-參)文字編》筆畫檢字表數位化完成

知乎:https://zhuanlan.zhihu.com/p/52570048







http://blog.yam.com/ebag/article/80811364

    筆者曾在2013年6月完成《清華大學藏戰國竹簡(壹)》筆畫檢字表的數位化,近日有幸獲得新的資料,覺得應該優先處理。所以暫時將《楚簡帛通假彙釋》筆畫檢字表的處理暫停。大約二三天時間完成這份檢字表。此文字編大約又新增了三百多字的缺字,大約有一半是新造的缺字,一半是原始資料庫就已經有的。

字例 1093缺字 616總字例 1709


    《楚簡帛通假彙釋》若繼續處理,筆者估計可能還會再增加數百個缺字,總累積的缺字應該會突破六千字。這樣一來,不論是秦楚或其他系別的涵蓋量應該就算很大了。雖然一字一字的造字繁瑣耗時,但想到之後可以利用這樣的檢索,讓研究者省下不少時間,覺得幾天的工作量其實也不算什麼了。

    其實,這樣的缺字整理,不僅是便於網路上資料庫的檢索而已,此外,這樣將近六千的缺字本身可以是一個單一的「字型檔」,使用者可以像一般安裝字型的步驟一樣,安裝後,電腦就可輸入或顯示這些缺字,不只是論文文書上的使用,甚至未來若要出版印刷也是沒有問題。所以,一次把缺字的問題處理好,就會像是「倒吃甘蔗」一樣,越來越能體會它的便利性。

    筆者知道目前研究者大部分都是各作各的,每個學校機關都有其整理編製的研究資料,並不是那麼公開或自由交流。但是,如果有研究者需要這樣的檢索表電子檔,在能交流共享互惠的基本條件下,筆者會很樂意共享的。


    朋友們若對文字的整理或校正有興趣,請與筆者聯絡。只要利用一些軟體,不一定得要中文相關科系,也可以馬上上手,將這些文字內容校正數位化完成。


使用方式:


請搜尋「引得市」或輸入「http://www.mebag.com/index/」

點選右上方「楚文字」即可開始搜尋使用,若要搜尋缺字,建議先從「古文字缺字資料庫」查詢,再連回資料庫。


「古文字缺字資料庫」累積缺字已達5809字
「古文字缺字資料庫」http://www.mebag.com/index/quezi/list.asp

    「古文字缺字資料庫」是聯繫各個資料庫缺字的重要核心,古文字的研究者應該要好好的利用。所謂的「缺字」,在此是指目前出版的古文字相關字典或文字編中,電腦無法正常輸入或顯示的字,自2004年起,筆者根據古文字相關文字資料的內容,將這些缺字整理分類與編號,整理成一缺字資料庫。(前身:印學缺字資料庫)

其中也包含目前WIN8作業系統支援的擴張C或D等。為了讓使用者不必背誦編號,我們建議使用者以「構字式」,將原始缺字先拆字的方式來查回缺字,例如:若想查詢「㱕」(舉例,這字不是缺字)可以輸入「止帚」。

基本上這樣的構字式,筆者拆分以從左至右,從上至下的順序。並以目前容易輸入顯示的偏旁字元部件為主,不一定會拆分到最詳細的部件。

※缺字檢索小技巧:

若輸入「匚%戈」可以查到「匚+戈」中間任何一個字元或內容的缺字,即「%」這個符號可以代表任何字元,如果剛好遇到其中一部份的偏旁部件無法輸入,或不會打的情形,就可以用「%」這個符號代替。如圖所示。

再舉一例,輸入「宀%心」即可查到「宀+心」中間有任何一字元部件內容的缺字,這樣可以避免輸入太少的偏旁而有過多的內容。查缺字後,可點選右方五大類的資料庫連結,查回該缺字在文字編的頁碼。

※從缺字資料庫的缺字查詢其他文字編的內容

點選「楚文字」,即顯示該缺字在「楚文字」資料庫中,某一文字編的頁碼
















2014年9月21日 星期日

20140922《燕文字編》筆畫檢字表數位化完成

 20140922《燕文字編》筆畫檢字表數位化完成


知乎:https://zhuanlan.zhihu.com/p/648168043


http://blog.yam.com/ebag/article/79144686








※原先的文章貼在「天空部落格」(已關站),今天在「燕文字編_張振謙」發布同時,「Blog」與「知乎」二處重新貼一次。


【前言】

    今天完成了《燕文字編》筆畫檢字表,總字列689,缺字120。接下來有空的話,應該就是處理《戰國文字編》或《齊文字編》了。2004年時自己就很希望把《古璽彙編》收錄的璽印個別分域,並做成資料庫以利研究。不過當時「缺字問題的處理方式」與「分域研究」並不是很到位。目前來看,如果把這些相關的戰國時代文字編都處理好的話,再以吳振武、施謝捷先生等人的璽印相關著作為主要參考文獻資料,這樣《古璽彙編》的數位化應該就可實現。


    資料庫的資訊內容不僅要正確,也要方便使用,未來《古璽彙編》若能完成數位化,戰國璽印的風貌與賞析研究也可以更便利了。




引得市

http://www.mebag.com/index

 

古文字缺字資料庫

http://www.mebag.com/index/quezi/list.asp





【《燕文字編》校正備忘】

《燕文字編》筆畫檢字表第297頁,第9畫「日州(𪰢)」字103頁,有誤,應是「113」頁。

筆畫檢字表第298頁,第10畫「(辶吝)」字,頁碼有誤且與前重複,應刪除。

筆畫檢字表第298頁,第10畫「臼灭(臼一火」字與前重複,應刪除。

筆畫檢字表第298頁,第11畫「角𡈼」字,頁碼70有誤,應是69頁。

筆畫檢字表第298頁,第11畫「率」字,頁碼205有誤,亦與前重複應刪除。

筆畫檢字表第298頁,第11畫「匚十豆」字,頁碼186有誤,應是187頁。第12畫「匚十豆」字,與前重複,應刪除。

筆畫檢字表第298頁,第12畫「爪衣刀」字,頁碼70有誤,應是69頁。

筆畫檢字表第299頁,第12畫「宀肉戈」字,頁碼125有誤,刪除此列。保留後13畫124頁正確部分。

筆畫檢字表第300頁,第17畫「𩫖」字除頁碼有誤之外,此字重複應該刪除。

筆畫檢字表第300頁,第18畫「駽」字除頁碼有誤之外,此字重複應該刪除。


2014年5月20日 星期二

「無」字的演進

「無」字的演進




「無」字的演進20140520

★補充:

    若要更精確的用字,「無」、「是」、「薄」這三字可以看一下「補充」圖示的說明。只不過在文字的演進中,兩種寫法時間一定是重疊的,所以那一種寫法都是可以。若把歷史分段考察,在其中百年間文字的結構變化是相當小的。另外「裝」字在秦簡中寫成「莊+糸」。

    此外,筆者順便也列示了「無」字的演進過程,篆隸字體間的「隸變」,並非由秦代石刻等(更非宋刻版本的說文小篆)再製文字的外形直接「跳」到東漢漢隸(俗稱「八分」)的字形。「隸變」較有可能產生於書寫墨跡文字中,傳抄之間書寫者不經意、沒有刻意改變文字的基礎下所產生的文字字形變化,其中的關鍵是「筆順」,筆順的改變影響了整個字的結構,墨跡文字以外所「產生」或「製造」的文字,往往沒有「筆順」或者不容易看出文字的筆順。例如我們可以從「無」字清楚的看出,隸書或楷書中底下的四點「火」形,其實是由交叉的兩個「木形」演進而來,其中曾經有形成兩個「木」(林形),底下的六點最後變成四點。

    學界在討論「隸變」時,多數研究者會把說文小篆的外形與東漢碑刻文字相較,沒有附帶墨跡文字來辯證,始得這樣的文字沒有演進過程,如此的論述相當空虛且沒有根據,多是個人意見或學界長期累積下來錯誤的看法,文字的演進絕對是「漸變」的。而「驟變」的文字比較接近我們所稱的「設計文字」(非墨跡文字為主),大多是文字製作者個人美感所形成的字體造形,不一定與文字的演變有直接的關係。

    我們從戰國時代到東漢甚至三國時代所留下的墨跡文字可以知道,文字字形的改變是緩慢且有一定條理的,即使其中書寫者刻意寫出很「特別」的字形,但在其他書寫(抄寫)者非刻意的書寫下,「特別」或「刻意」的字形字體常會掩沒在字海中,不一定會流傳下來。為何「傳抄」是造成文字改變的重要原因?需要大篇幅的申論與舉證說明,到這裡先簡單說一下,日後會寫一篇更清楚文章作「隸變」與「文字演進」等論述的說明。

2014年4月7日 星期一

20140308《宋代石刻篆文編》檢字表數位化完成

 20140308《宋代石刻篆文編》檢字表數位化完成


知乎:https://zhuanlan.zhihu.com/p/392069828

http://blog.yam.com/ebag/article/72888259





    近期完成了許多文字編,都是研究中必要的材料,因為論文中的文字編並沒有附上「筆畫檢字表」,所以筆者先OCR了頁面,再逐頁逐字訂正對照,花了一些時間製作了《宋代石刻篆文編》筆畫檢字表1-22頁,有了「筆畫檢字表」讓其他研究者也能方便檢索。

缺字 3

總字例 2055


請上「引得市」檢索www.mebag.com/index







《宋代石刻篆文編》「筆畫檢字表」PDF下載處:

http://yunpan.cn/Q4WDez7ddHnnx  密碼 d4c6


王冠一,《宋代石刻篆文研究》,吉林大學碩士論文,2013年5月。

(李守奎教授指導)第四章:《宋代石刻篆文編》44-416頁。



























【《宋代石刻篆文編》凡例】

一、字編共收錄字頭2058個,字形約6500個。

二、字頭按照大徐本《說文解字》十四卷順序排列。不見於《說文》者,按其所狀部首相應列於各部之後,不再列出小篆字頭。重文皆系於本字之後,并用括號注明,不單獨列出。

三、在不影響清晰度的前提下,根據編排需要對部份字形作了放大或縮小以及亮度上的處理。

四、每一字頭之下,先列出與《說文》小篆字形相一致的字樣;字形相同或相近的字樣,均排列在一起。

五、每個字形之後均注明該字形出於何碑,不再標注石刻材料的具體來源(可參見論文第二章《宋代石刻篆文表》)。

六、凡出自同一石刻而字形完全相同的字樣,只選取其中最為清晰完整者入編,其餘重複字樣均不收錄。

20240315阿良人的研究LIFE __閒談「說文解字」的規整化(影音記錄)

20240315阿良人的研究LIFE __閒談「說文解字」的規整化 (影音記錄)   知乎: https://zhuanlan.zhihu.com/p/687396300 【開場白】 前一次錄影記錄了:阿良人的研究 LIFE __ 「引得市·說文解字」資料庫介紹,整體效果還不錯。...