2015年8月26日 星期三

20150827《大漢和辭典》熟語索引校正(跳坑)說明

 20150827《大漢和辭典》熟語索引校正(跳坑)說明

http://blog.yam.com/ebag/article/100914175


    四十萬餘筆的《大漢和辭典》熟語索引,目前還不完整,搜尋「■」共有3248處,有PDF與RTF兩種格式,依照卷期順序分成七個檔案供校正(跳坑)者使用,每人選擇一個單位校正,有意者請下載並告知筆者校正的檔案名稱。


    校正過程中,如有電腦缺字無法輸入(擴張CDEF),可至「古文字缺字資料庫」以「構字式」檢索,或輸入「q」由筆者補充,謝謝!!


「古文字缺字資料庫」

http://www.mebag.com/index/quezi/List.asp




《大漢和辭典》全部熟語索引txt檔(25.45MB)

下載路徑:http://pan.baidu.com/s/1sjKGV8p


PDF RAR檔案(全部七個PDF檔案)2.1MB

下載路徑:http://pan.baidu.com/s/1mgMSXh2


包含

Index 引得市-大漢和辭典校正-01(15頁,500筆)340kB

Index 引得市-大漢和辭典校正-02(15頁,500筆)280KB

Index 引得市-大漢和辭典校正-03(15頁,500筆)400KB

Index 引得市-大漢和辭典校正-04(15頁,500筆)408KB

Index 引得市-大漢和辭典校正-05(15頁,500筆)408KB

Index 引得市-大漢和辭典校正-06(15頁,500筆)412KB

Index 引得市-大漢和辭典校正-07(8頁,248筆)280KB


※建議下載RTF格式,直接修改內容,修改之後EMAIL回傳筆者。


RTF RAR檔案(全部七個RTF檔案)760KB

下載路徑:http://pan.baidu.com/s/1jGAfQom


包含

Index 引得市-大漢和辭典校正-01(15頁,500筆)2.6MB

Index 引得市-大漢和辭典校正-02(15頁,500筆)2.6MB

Index 引得市-大漢和辭典校正-03(15頁,500筆)2.6MB

Index 引得市-大漢和辭典校正-04(15頁,500筆)2.6MB

Index 引得市-大漢和辭典校正-05(15頁,500筆)2.6MB

Index 引得市-大漢和辭典校正-06(15頁,500筆)2.6MB

Index 引得市-大漢和辭典校正-07(8頁,248筆)1.3MB


※建議下載RTF格式,直接修改內容,修改之後EMAIL回傳筆者。



引得市《大漢和辭典》熟語索引

http://www.mebag.com/index/daikannwa/list.asp


20150826《大漢和辭典》熟語索引(補充「卷別」與「頁碼」)開放使用

http://blog.yam.com/ebag/article/100729953


諸橋轍次[日],《大漢和辭典》(修訂版),東京:大修館書店,1986年7月(昭和61年7月1日)。


2015年8月25日 星期二

20150826《大漢和辭典》熟語索引(補充「卷別」與「頁碼」)開放使用

 20150826《大漢和辭典》熟語索引(補充「卷別」與「頁碼」)開放使用

http://blog.yam.com/ebag/article/100729953



20150112「大漢和辭典熟語索引」引得市介面

http://blog.yam.com/ebag/article/84268555



進入「引得市」點選「辭典」點選「《大漢和辭典》線上檢索」或網址列直接輸入:

www.mebag.com/index/daikannwa/list.asp


「《大漢和辭典》熟語索引」原始資料來源:「花園大學國際禪學硏究所, 川幡太一, 野村英登」網址:https://github.com/cjkvi/cjkvi-dict/blob/master/dkw-word.txt



「■」為原始資料的「#」,筆者補充了幾百筆,一人力量有限,希望線上使用者一起來補充內容。「x」(英文小寫x)為原書有編號但沒有錄入的,這部分不必處理。此外,缺字目前有兩處(以「s」可查詢)。


    《大漢和辞典》共12卷,索引於第13卷,相較於單字索引的數位化製作,名詞的索引已經有「花園大學國際禪學硏究所, 川幡太一, 野村英登」兩位研究者製作完成,我們只要補充上「卷別和頁碼」就可以讓使用者快速的查詢,或許也可以當作單字索引的替代方式,約四十多萬筆名詞在EXCEL透過一位網友「彰化一整天」的程式,批次尋找取代處理,程式跑了將近兩個小時才完成。


    原本兩位作者製作的的索引文字檔中有「字編號/流水號/名詞/總頁碼」,但是就沒有「卷別」與「頁碼」的資訊,一般我們查大套書,「卷別」和「頁碼」才是最關鍵的資訊,因此筆者在EXCEL作了一個對照表,然後再用上述的方式來尋找取代。舉例來說:「熟語」一詞是「07413」(總頁碼),筆者又補充上「07-0505」(卷別-頁碼)。


    原作者的索引資訊總數約「440972列」,因為筆者手邊的資料是1986年的(修訂版),因此只有製作到這個部分(407997列):「DW48894.0.0001.0 DP13757 龥號」


之後還有:


DW00001.0.H001.0 DPH0001 一飮三百杯

DW00001.0.H002.0 DPH0001 一榮一辱

DW00001.0.H003.0 DPH0001 一賀

DW00001.0.H004.0 DPH0001 一九

DW00001.0.H005.0 DPH0001 一丘土

DW00001.0.H006.0 DPH0001 一隅三反

DW00001.0.H007.0 DPH0001 一隅之見

DW00001.0.H008.0 DPH0001 一月之師

DW00001.0.H009.0 DPH0001 一弦

DW00001.0.H010.0 DPH0001 一言僨事一人定國

..............等

共有「32976」列沒有收錄在這次的處理。


    最後還是得處理目前文字檔案中呈現「■」符號的缺字,共有3759字。逐一檢查並造字才算是完成這次的索引製作。個人懷疑,這是原資料作者刻意將原本完整的內容作替換,如「彘」、「耦」、「伙」、「珩」、「蘅」、「貺」、「瓤」、「軺」、「篪」、「驁」、「摹」、「臬」、「賬」、「跗」、「佾」、「瑗」、「蓀」、「厝」、「騶」、「勰」、「毖」、「姝」、「墩」、「陘」、「踔」、「櫤」、「薌」、「諶」、「嬸」、「噱」、「啁」、「咻」、「唬」、「耦」、「坫」、「絝」、「畑」等字都是重複的變成「■」。



第一卷676頁「伯吁」有誤,應是「伯籲」。

第一卷678頁「伯塤仲■」有誤,應是「伯壎仲篪」。

第一卷965頁「儵■」有誤,應是「#」。

第二卷259頁「刺■」有誤,應是「#」。

第二卷388頁「勉■」有誤,應是「#」(02362-0021)。

第二卷423頁「勺水」有誤,應是「」(02494-0006)。



目前為止,「■」還有3248處,歡迎朋友校正回傳內容,讓資料臻於完善。

反饋可至「引得市」粉絲團留言,或寫信給筆者。



諸橋轍次[日],《大漢和辭典》(修訂版),東京:大修館書店,1986年7月(昭和61年7月1日)。


引得市《大漢和辭典》熟語索引

http://www.mebag.com/index/daikannwa/list.asp



大漢和辞典データベース

http://kanji-database.sourceforge.net/dict/daikanwa/index.html


「《大漢和辭典》熟語索引」原始資料來源:「花園大學國際禪學硏究所, 川幡太一, 野村英登」網址:https://github.com/cjkvi/cjkvi-dict/blob/master/dkw-word.txt




後記:


    在幾年前在日本期間,曾經掃描該套書,為了圖版品質,選擇300DPI灰階,從早到晚一冊大約掃了八小時以上,當時有這麼一股動力,但仍然沒辦法完全掃描完成,做了多少,也忘了,或許可能才完成二冊左右而已?這麼好的書籍文獻,不應該被時間遺忘,尤其是令人敬佩的學者畢生的著作。今日透過線上檢索,應該可以讓這樣的好書再一次被發現和廣為使用。



字編號-流水號

總頁碼

如何使用上的問題,請到

http://272586.blogspot.com

彰化一整天的Blog留言

或寄E-mail到imingho@gmail.com




進入「引得市」點選「辭典」點選「《大漢和辭典》線上檢索」或網址列直接輸入:

www.mebag.com/index/daikannwa/list.asp



塘槭?「槭」字疑

天𪊷?「𪊷」字疑

奄q

垢q

奏嚴?「嚴」字疑


注意:已將原始「衆」取代「眾」字。194處

注意:已將原始「爲」取代「為」字。943處

注意:已將原始「眞」取代尋「真」。797處。





------------------------------------


20150826處理:

「桮」「杯」


「鬭」「鬥」


扳儐蘅墊嬸珩暹璜汛鈺蓀瀹摹嘿洯仡噩瞀貺軺姝桌姍簋擄鄣讞鍛擗厫霉櫃賬盹驁睬篪摹夠瑗臬錁勰岵酗睽澈桅惕殮饔蠲盅跗佾埏陘騶梔痤薌瘼紼帳賾菇澌綃瞧碟忪鱭韙鏇歧卡厝咖屣藎絀膛劂楗炫鮞騭諶戩濞𦶜燝暹煜頊遴煊噶毖鍛掄踔掙軔塏您毖抿匭𥕢櫤圩姝箐墩豉剮陘櫃庳癉躒蒯釗譙坨鏜埕榫阽阼雯娣


2015年8月24日 星期一

20150828《敦煌俗字譜》筆畫檢字表數位化完成

 20150828《敦煌俗字譜》筆畫檢字表數位化完成


舊連結:http://blog.yam.com/ebag/article/101035997


    這本書是幾個月前在台師大借閱的,書籍老舊,原本的書頁和精裝外殼已經分離,屬於不能外借書,所以得在館內影印。前後去了幾趟才完成(影印時間長一趟完成不了,或少影印幾頁之類的。)作為文字演進研究的參考材料,只要是「墨跡文字」的部分,都是筆者想要要蒐集整理的文獻。



字例 3076

缺字 1

總字例 3077


本文(1-391)

筆畫檢字表(1-58)


20150824竭、渴字的「曷」形演進考察

20150824竭、渴字的「曷」形演進考察




曾經在某次秦簡文字考察過程中查詢了「竭」字,對右側下方的「凶」形的寫法有些在意,因為這樣的字形和我們目前使用的「竭」字字形差距很大。好奇心驅使之下,做了考察

a→b→c(演進示意,不一定是單線發展)

a[𠃊+勹]
b[工+勹]
c[匕+勹]

「曷」形的相關文字並不多,尤其是秦漢之際的墨跡文字,筆者暫以「竭」、「渴」二字為例。「竭」字有〈馬王堆漢簡‧養生方〉(非墨跡方面,三晉文字或秦陶文有字例,右下都是接近「凶」形。)「渴」字見〈馬王堆漢簡‧養生方〉或〈馬王堆漢簡‧老子乙〉。從秦漢至唐代,「曷」形上方的「日」形幾乎沒有什麼改變,因此,我們考察的重點是在下方的「凶」→「匃」形。

西漢東漢之際,「凶」形的「㐅」第二筆拉長右下彎形成「𠃌」,拉長的「㐅」形形成了「丿」「一」「亅」的「勹」形。「凵」形縮短成「𠃊」形。之後在魏晉南北朝的碑刻文字中,下方的「𠃊」形大致可分成a[𠃊+勹]、b[工+勹]、c[匕+勹]、三種。文字的演進並不會只有「一條單線」,必定是多線發展,而逐漸形成主要的,從唐代字形往前看,c種的似乎是較接近。「匕+勹」至「亾+勹」的改變,可能是c-1和c-2這兩種的筆畫順序形成的結果

2015年8月13日 星期四

20150813《皇甫誕碑》簽字筆描字檔案開放下載(71頁)

20150813《皇甫誕碑》簽字筆描字檔案開放下載(71頁)






★適合使用族群:楷書書法初學或認為寫字很難的人

書法的學習,有趣的方法比較重要。
有時方法也不重要,能讓書寫者一直有興趣繼續寫比較重要...


※圖形係19.5×27cm 300dpi掃描並合併成PDF格式,使用者可下載解壓縮後列印使用。


檔案描摹來源:
鄭聰明,《皇甫誕碑入門》,台北:蕙風堂,2009年2月。
ISBN:978-986-7678-88-1


google網路硬碟下載:https://reurl.cc/ZOAq5Q(PDF 63MB)

20240315阿良人的研究LIFE __閒談「說文解字」的規整化(影音記錄)

20240315阿良人的研究LIFE __閒談「說文解字」的規整化 (影音記錄)   知乎: https://zhuanlan.zhihu.com/p/687396300 【開場白】 前一次錄影記錄了:阿良人的研究 LIFE __ 「引得市·說文解字」資料庫介紹,整體效果還不錯。...