2018年9月20日 星期四

20180920《居延新簡集釋》(全7冊)詞條/簡號索引數位化完成

20180920《居延新簡集釋》(全7冊)詞條/簡號索引數位化完成

知乎:https://zhuanlan.zhihu.com/p/45044148



20150507《居延新簡文字編》筆畫檢字表數位化完成
http://ebag2007.blogspot.com/2015/05/20150507.html


今日完成了《居延新簡集釋》的索引數位化,除了研究需要之外,居延簡也蘊藏了各種許多耐人尋味的書法風貌,值得仔細的研究與探索,但是,紙本翻閱與簡號的查詢,無法滿足使用的需求。因此,筆者製作的動機就是想在龐大數量的簡牘中「大海撈針」,想看哪個字,就能快速的看到。在人力資源有限的情況下,不採取一般簡牘裁切與釋文輸入再校正等數位化的方式。詳細過程如下:

⊙數位化流程說明:


1.依序將每冊所載「簡號」輸入excel,也輸入「彩色圖」或「紅外線圖」兩種圖錄的頁碼。過程中需注意簡號是否有A、B甚至等編號。因為彩色圖與紅外線圖的編排位置是一樣的,所以只要完成一種圖的頁碼,另外一種可以利用函數,直接套用差頁,不必再翻閱查看與輸入。完成時大約九千多列。

2.將一~七冊最後的「詞條索引」Ocr,再校正內容。利用尋找/取代等規則運算式,把內容切分欄位,依據簡號(有沒有輸入錯誤,可再一次校正)把前面完成的「彩色圖」與「紅外線圖」兩種頁碼資訊利用excel函數,套用在這個資料列中。這個資料裡,就有了「詞條」+「彩色圖頁碼」+「紅外線圖頁碼」+「釋文頁碼」等資訊。共有三千多筆,書中僅是節錄簡牘部份詞條,並非收錄所有的全文內容。

3.第一項完成的資料列表裡,有了完整的「簡號」與「彩色圖/紅外線圖」兩種頁碼,但是少了「釋文頁碼」的資訊,透過excel函數,可以把第二項完成的三千多筆的頁碼資訊套入,但仍然還有六千多筆的「釋文頁碼」是空著的。因此筆者得再次的從頭到尾依序輸入缺少的頁碼內容,也順便校正簡號資訊。

透過以上三種流程,建立了兩種資料庫,放置在「⑬簡牘」中,不論使用者从簡號或詞條,都能快速的得知所在的冊別和頁碼,點選頁碼就可跳頁瀏覽內容(使用者必須自備pdf檔+「開卷助理」)。因為有多冊,rmp請各命名為:居延新簡集釋1~7。

建立「开卷助理」新的RMP档
https://zhuanlan.zhihu.com/p/32155043

《居延新簡集釋》詞條索引,網址:http://www.mebag.com/index/juyanxinjian_citiao/list.asp

《居延新簡集釋》簡號索引,網址:http://www.mebag.com/index/juyanxinjian_jianhao/list.asp




⊙結語:


書中羅列詞條只有三千多列,如果使用者想全面的查詢「居延新簡」,可以在「③秦漢文字」查詢《居延新簡文字編》,從內容得知簡號之後,再到《居延新簡集釋》簡號索引,輸入簡號查看。這樣,近似全文檢索,只是多了幾個步驟,而文字編是否有完整的錄入字頭,也是變數之一。既然完整的簡號都已經完成了,就歡迎有興趣的朋友,再依序錄入釋文。屆時就是真正的全文資料庫了。

研究經驗、文獻材料都得依賴時間累積與堆疊,目前已有257種文獻(資料庫),創辦以來筆者在引得市的角色都是校(市)長兼敲鐘。从資料庫規劃、打字、圖版處理、程式修改等包辦大小事。(幸有研發長兼技術長瑾昀兄的協助)。為了讓「引得市」更健全的發展,筆者擬定了一個斗內換鐘點教學的方式,敬請期待日後的發文公告。

下週就是中秋節了,快速的以居延新簡集字「中秋快樂」,敬請指教。

中」取EPF22:129
秋」取EPF22:153A
快」取EPT48:115
樂」取EPF22:69



⊙補記:


筆者研究時都會找最原始且清晰的圖版,由「使」字的圖例中可知《居延新簡文字編》的圖版並不是最好的。《居延新簡文字編》作為索引很方便,圖錄就是採用較新出版的《居延新簡集釋》。




「詞條」部份:

字列 3670
缺字 48
總字列 3718

「簡號」部份:

字列 9498
缺圖 25
總字列 9523


※錯誤或缺圖處:

破城子房屋一九EPF19:3(6冊219頁未見)
EPF19:3(第六冊,沒有這個編號)
EPT65:48第六冊「破城子探方六五」缺圖x(122-123頁未見)
ESC:173第七冊額濟納旗三十井次東隧(416頁未見)


第一冊「建武八年閏月/EPT20:2」頁碼有誤,應是:「474」
第四冊「叩頭白/EPT56:178」頁碼有誤,應是:「424」
第五冊「甲溝官/EPT59:639」頁碼有誤,應是:「410」

---

※最右側數值為資料庫該項目的列表,不代表實際簡牘量,有些簡號有A、B…。


1 EPT 破城子探方 1-68 7378
2 EPF 破城子房屋 8,16,19,22,25,31 1089
3 EPW 破城子塢内 154
4 EPC 破城子塢外灰堆 85
5 EPS4T1 甲渠第四隧探方一 38
6 EPS4T2 甲渠第四隧探方二 193
7 EPS4C 甲渠第四隧採集散簡 71
8 ESC 額濟納旗三十井次東隧 199
9 ES 一九七二年居延調查探集散簡 5
10 EP 一九七二年居延調查探集散簡 2
11 ET 一九七二年居延調查探集散簡 1
12 ES 一九七二年居延調查探集散簡 1
13 EN 一九七二年居延地區調查探集地點不明殘簡 14
14 82EPC 破城子一九八二年採集漢簡 23






-----

詞條索引


說明:一、本索引按拼音順序排列,收錄本書“集解”,部分所有詞條。
二、著錄格式:先詞條,次該詞所在簡之簡號,最後是該詞在本書中之頁碼﹔詞條釋義跨頁,則祇出首頁﹔每項間以斜錢“/”分隔﹔同一詞條多次出現,一併著錄,以“//”分隔。


前言(節錄)


從漢簡本身看,甘肅漢簡除武威漢簡出自墓葬外,其餘百分之九十九都出自河西邊塞烽隧遺址。邊塞有邊塞的特點:一是軍事屯戌文書居多,主要反映邊疆防禦、軍隊戌守、戌卒生活、後勤保障、武器配發、烽火警報、屯田水利、刑徒流放、農商民生等等﹔二是民族交往、和戰聚處。大凡月氏、烏孫、匈奴、美人等古代民族的流遷駐牧、歸義反叛的事件都有較多記載。三是郵驛交通。驛置分布、日常運轉、文書傳遞、使節來往、官員接待等內容占有很大比重。四是同西域的關係。西域屯田、日逐王歸降、都護府設立以及西域三十多個國家來中原朝拜、通使、和親、商貿、學習、納貢等材料都有較詳細的保存。五是中西交通和絲路貿易。中亞、西亞、南亞等國遣使通好、商貿往來的材料亦極為重要。

《甘肅秦漢簡續集釋》設定的目標一是原簡圖片的清晰度和欣賞性,二是簡牘文字釋讀的原始性和準確性,三是版式設計的科學性和合理性,四是簡文內容的研究性和集成性。

在原簡圖片的清晰度方面,本書的最大貢獻是公布發表了最清晰的紅外線掃描圖片,這在出土文獻整理尤其在竹木簡續的整理方面是一次革命。過去很多模糊不清、似是而非、簡牘變色污暗和文字筆劃輕重難以辨認的地方,在紅外圖片上即可一目瞭然。研究觀覽者有此一冊,日月乾坤盡在書中,不必千里來訪察看原簡。有些分冊尚未提供紅外照片者,或是由於簡面褪色、簡質損壞,紅外照片難以收到上述效果﹔或是由於固化在玻璃管裹一時難以操作。但這一部分數量較少,且我們從各個時期留下的照片中選用了最為清晰者作為補充,不影響正常釋讀。除了紅外照片外,本書同時出版了彩色圖片,原簡原色原大,實現了對簡牘使用的那個遙遠年代各類文書的直觀性和欣賞性。

所謂簡文釋讀的原始性,主要指的是依照原簡文字照錄原字,各種異寫異構不以現行通行字代替。如此,有利於異體字通假字的研究,有利於書寫習慣和字形變化的觀察。

居延漢簡三萬餘枚,大致分三個部分。一是一九三〇年西北科學考查團在今甘肅金塔縣和、內蒙古額濟納旗境內大約三十個地點發現的一萬零八百多枚漢簡,習慣上統稱為居延漢簡;二是一九七二年至一九七四年在額濟納旗甲渠候官遺址和第四隧出土的八千多簡,圖版釋文巳全部公布一九九四年由中華書局出版《居延新簡—甲渠候官》一書﹔三是肩水金關漢簡,一九七三年出土於甘肅金塔縣肩水金關遺址二萬一千多枚。

三部分中《肩水金關漢簡》後出轉精,原簡紅外照片和彩色照片同時刊出,釋文隨簡照錄,極便利用。目前正由上海中西書局陸續出版,分出五冊,預計二〇一五年全部出齊。此次《甘肅秦漢簡續集釋》主要選擇了《居延新簡》部分,重新公布紅外圖和彩色照片,釋文也作了校改注解,是叢書的重點部分。

至於現藏於台北中研院史語所的一九三〇年所出居延舊簡,據史語所同仁透露,亦有仿《肩水金關漢簡》之方式,以紅外圖版為主重新整理出版之設想。如此,則海峽兩岸珠聯璧合,居延漢簡圖版釋文水準的整體改觀望之有日矣。除上述三部分外,居延漢簡還包括一九九九至二〇〇二年內蒙古自治區文物考古研究所在上迷地區發掘的五百多枚和一九八六年甘肅文博部門在金塔地灣肩水候官遺址發掘的七百多枚,前者巳於二〇〇五年由廣西師範大學出版社出版《額濟納漢簡》一書刊布,并有孫家洲等人的《額濟納漢簡釋文校本文文物出版社,二〇〇七年)﹔後者我們也將盡快整理發表,公之於世。

甘肅簡牘博物館館長 張德芳
二〇一三年二月五日於蘭州


---




孫占宇:《居延新簡集釋》(全7冊),蘭州:甘肅文化出版社,2016年6月。978-7-5490-1112-4
白海燕:《居延新簡文字編》,吉林大學博士論文,2014年6月。


---------------------------------

附:一分鐘學會1秒查字典(引得市:查字最快的方式)
youtube影音連結:https://www.youtube.com/watch?v=D7ZOPVbq3vY
youku影音連結:http://v.youku.com/v_show/id_XMjg1NTA4NzYyNA==.html?spm=a2h3j.8428770.3416059.1


※「引得市」中顯示提供的的僅是書籍頁碼資訊,必須搭配「開卷助理」,最重要的,就是電腦硬碟中也需要有該文獻的電子檔(pdf格式)

如何使用「開卷助理」以及製作開卷助理的「rmp」格式,請參閱開卷助理(雙色版).pdf


⊙「開卷助理」程式與內容是W兄設計與製作,授權筆者開放自由下載。
⊙「引得市」頁面與「開卷助理」的程式連結是由瑾昀兄所設計製作。
⊙「引得市」沒有提供書籍文獻電子檔,請使用者自行建檔製作。
※「引得市」中顯示提供的的僅是書籍頁碼資訊,必須搭配「開卷助理」,最重要的,就是電腦硬碟中也需要有該文獻的電子檔(pdf格式)


「引得市」http://www.mebag.com
「開卷助理」下載:https://goo.gl/RoX2qp
「開卷助理」下載(百度):http://pan.baidu.com/s/1caV3T8 密碼:ijdf

2018年9月8日 星期六

20180909「《說文解字》540部首構形比較」資料庫上線

20180909「《說文解字》540部首構形比較」資料庫上線


知乎:https://zhuanlan.zhihu.com/p/44086698

近期,因為撰寫有關秦簡、《說文》、秦刻石的題目,有了交叉分析考察的機會。零星字頭的考察中,察覺《說文》部首構形有所差異,不僅是版本不同的差異,甚至同一個版本內,前後部首表的構形也不同。

9千多字,要比對的話,並不是作不到,而是目前的時間並不允許。所以只能先從部首下手,部首若能考察完整,其整體比例應該也能推敲。扣除北師大說文小篆,540部首三種《說文》版本,前後都有字形等於是540x3x2=3240,三千多張圖得在文章書寫過程中,臨時岔開來處理。

接著開始了圖版處理的無限迴圈,連續幾天徹夜不停的作業,終於結束。一個一個把圖版拖拉放入word表格中,540張圖七種(格)等於重複的動作也做了3780次。然後一字一列的辯察,把這一列中有幾種構形記錄下來,最後整理成引得市的資料表和格式。

「一目了然」的感覺真好,這就是做成資料庫的好處。如果還是word的表格形式(註1),只能存在於某篇期刊或論文集,紙本無法發揮最大效益,且沒有快速檢索的功能。

目前已經放在「引得市」的「說文」項目中,也可以直接點選下方連結進入。或許,日後會加上更多《說文》版本,或者秦簡文字……。

北師大說文小篆
陳昌治本
宋本(續古逸本)
日本文政九年本(日本早稻田大學收藏)
宋本(丁晏跋宋刻元修本)9.10增加

※註1:540列的數千張小圖,些微表格拉動編輯,電腦都得跑很久……

網址:http://www.mebag.com/index/shuowen_540/List.asp

-----------









「《說文解字》540部首構形比較」詳細數據如下:
7種 5字
6種 6字
5種 21字
4種 65字
3種 130字
2種 247字
1種 66字

2018年8月23日 星期四

20180824《金文形義通解》訂補索引數位化完成

20180824《金文形義通解》訂補索引數位化完成




知乎:https://zhuanlan.zhihu.com/p/42853411

    在《金文形義通解》索引完成後,接著處理「《金文形義通解》訂補」,數位化是論文下編的部份。為此新造36字缺字。使用既有的字頭排序,因此可比較快速的進行。編號的錯誤方面,沒有修正依原書錄入。

    朋友們若有推薦的文獻都可以來信,或在「知乎」、「Blog」留言。如果有整理好的資料要交流,也是很歡迎。



本文(175-470)
合文(471-473)


字列 1021
缺字 134
總字列 1155


------------

《金文形義通解》訂補內容的一些錯誤:

0359編號重複,見263、265頁
0363編號重複,見265、266頁
0423編號應為0403,自此開始多了20號。
0670編號應為0660,自此又多了10號。
0855立應改為0857立
1079斧應是1069斧,自此又多了10號。
473頁合文編號15應為27


【使用方式】

---

進入「引得市」(www.mebag.com/index)點選「①商周文字」項目中即可查詢。





合作提案(並非限於商業,任何形式的交流都很歡迎)
https://hackmd.io/s/HJ_qFWLNx


【學術交流】

※關於「引得市」的各種查詢應用,網路上的教學影片或文章介紹的不多,因此,很多教授與研究者可能還不熟悉,像是「開卷助理如何用」、「電腦缺字」、「古文字輸入法的使用」等問題,筆者都很樂意詳細解說,只要時間允許,都歡迎個人或學校機關團體私訊或留言約時間地點,公開來討論交流。

----
張世超.孫凌安.金國泰.馬如森:《金文形義通解》(全三冊),京都:中文出版社,1996年3月。
鞠煥文:《金文形義通解》訂補,東北師範大學博士學位論文,2014年11月。


瑾昀兄《金文形義通解》索引的製作過程是這樣的:2014年,poem老師出於分析金文聲旁的攷慮,製作了《金文形義通解》的字頭索引(知乎上找得到poem)從2015年開始補充䈎碼,同時覈對校訂字頭,直到2018年2月12日完成第三次校對。然後於8月25日,把最終版交給引得市上線。

20180823《金文形義通解》(全三冊)索引數位化完成

blog:http://ebag2007.blogspot.com/2018/08/20180823.html
知乎:https://zhuanlan.zhihu.com/p/42788942







20180823《金文形義通解》(全三冊)索引數位化完成

20180823《金文形義通解》(全三冊)索引數位化完成




知乎:https://zhuanlan.zhihu.com/p/42788942

    凌晨,完成了一份22年前出版的文獻,時間剛好是8月23日(某紀念日?)。回想22年前的今天,筆者還在小金門「南山頭」當兵。處在快速更迭的時代,各種資訊不斷的從四面八方撲來,電腦、手機沒幾年就得汰換更新,似乎什麼東西都保存不久。難得有一份文獻到現在還是很多人在使用。經典著作果然經得起考驗。

    《金文形義通解》索引是瑾昀兄製作的,也不知道擱置了多久,不斷的提醒下,筆者才又陸續的補充處理。在想22年前,瑾昀兄或許都還沒讀幼稚園吧?今日卻能一起完成這份研究著作的索引,只能說:「機緣巧合,世事難料」。

    依據瑾昀兄的檔案,筆者逐字逐頁的對照內字頭內容,修正錯誤,補上頁碼、缺字號碼與構字式。共有511個缺字,新造缺字有46字。字頭號碼1-2655號,合文1-92號。本文重頭到尾3156多頁全部看完,前後三天大概花了30多個小時以上吧?雖然眼睛有點不適,但心裡看了幾千頁的手寫字,也有種莫名療癒感。



    天快亮了,「合文」的部份晚點再來補上,完成後再來發開箱文。    此外,《金文形義通解》訂補,就等日後製作好再加上了。


※原書編號0886𥁏和0887盥位置前後顛倒。
編號0885盅與0887盥在1228頁
編號0886𥁏在1229頁


本文:1-3156
合文:3517-3533頁


字列 2234
缺字 513
總字列 2747


※補記:


瑾昀兄《金文形義通解》索引的製作過程是這樣的:2014年,poem老師出於分析金文聲旁的攷慮,製作了《金文形義通解》的字頭索引(知乎上找得到poem)從2015年開始補充䈎碼,同時覈對校訂字頭,直到2018年2月12日完成第三次校對。然後於8月25日,把最終版交給引得市上線。

★★此外,文字欄位字頭「/」斜線之後,代表原書「坿注」的字頭。★★★



------------

附上《金文形義通解》序言後半段:

《金文形義通解》抓住文字的形與義這兩個關鍵問題加以闡述,充分地掌握現有的研究成果,恰當地進行抉擇,是一部可供歷史學界、語言文字學界以至書法篆刻者充分利用的具有學術價值的工具書。

姚孝遂 
一九九四年八月於吉林大學


【使用方式】

---

進入「引得市」(www.mebag.com/index)點選「①商周文字」項目中即可查詢。


合作提案(並非限於商業,任何形式的交流都很歡迎)
https://hackmd.io/s/HJ_qFWLNx


【學術交流】

※關於「引得市」的各種查詢應用,網路上的教學影片或文章介紹的不多,因此,很多教授與研究者可能還不熟悉,像是「開卷助理如何用」、「電腦缺字」、「古文字輸入法的使用」等問題,筆者都很樂意詳細解說,只要時間允許,都歡迎個人或學校機關團體私訊或留言約時間地點,公開來討論交流。

----
張世超.孫凌安.金國泰.馬如森:《金文形義通解》(全三冊),京都:中文出版社,1996年3月。
鞠煥文:《金文形義通解》訂補,東北師範大學博士學位論文,2014年11月。










附上1995年入伍,政府單位送的車票照片。

20180824《金文形義通解》訂補索引數位化完成

blog:http://ebag2007.blogspot.com/2018/08/20180824.html
知乎:https://zhuanlan.zhihu.com/p/42853411

2018年8月20日 星期一

20180820《漢印文字字形表》檢字表數位化完成

20180820《漢印文字字形表》檢字表數位化完成


知乎:https://zhuanlan.zhihu.com/p/42505116




   此次製作的索引是李鵬輝博士著作《漢印文字資料整理與相關問題研究》,論文上編的《漢印文字字形表》。文獻由「於菟」提供,筆者將筆畫索引(1292-1312頁)數位化,字形表內容有單字到合文共1279頁,經過對照有一些索引有誤,與實際頁碼差了一頁。新造缺字約77字。因為時間的關係,並沒有把筆畫索引調整成本文內容的順序。根據筆者經驗,如果文獻中有超過三處頁碼上的錯誤,就有可能還會有錯誤...。所以,或許還有遺漏的地方,就等發現再來修改了。


字例 3294
缺字 196
總字例 3490


【使用方式】

---

進入「引得市」(www.mebag.com/index)點選「③秦漢文字」項目中即可查詢。


合作提案(並非限於商業,任何形式的交流都很歡迎)
https://hackmd.io/s/HJ_qFWLNx


【學術交流】

※關於「引得市」的各種查詢應用,網路上的教學影片或文章介紹的不多,因此,很多教授與研究者可能還不熟悉,像是「開卷助理如何用」、「電腦缺字」、「古文字輸入法的使用」等問題,筆者都很樂意詳細解說,只要時間允許,都歡迎個人或學校機關團體私訊或留言約時間地點,公開來討論交流。

----
李鵬輝:《漢印文字資料整理與相關問題研究》,安徽大學博士論文,2017年3月。上篇:漢字文字字形表(上)







2018年7月2日 星期一

20180702《古文字釋要》拼音檢字表數位化完成

20180702《古文字釋要》拼音檢字表數位化完成




原始索引是彭偉明、余苑輝依據原書「拼音檢字表」所製作,筆者補上缺字,重新依照原書排序,但是由於時間關係,只有調整到45頁,並沒有全部再逐列調整。基本還是拼音檢字表原來的排序。

字列 9826
缺字 5
總字列 9831


正文(1-1375)
筆畫檢字表(1376-1445)
音序檢字表(1446-1552)



【使用方式】

---

進入「引得市」(www.mebag.com/index)點選「④古文字」項目中即可查詢。


合作提案(並非限於商業,任何形式的交流都很歡迎)
https://hackmd.io/s/HJ_qFWLNx


【學術交流】

※關於「引得市」的各種查詢應用,網路上的教學影片或文章介紹的不多,因此,很多教授與研究者可能還不熟悉,像是「開卷助理如何用」、「電腦缺字」、「古文字輸入法的使用」等問題,筆者都很樂意詳細解說,只要時間允許,都歡迎個人或學校機關團體私訊或留言約時間地點,公開來討論交流。








----

李圃.鄭明:《古文字釋要》,上海:上海教育出版社,2010年10月。ISBN:978-7-5444-2751-7



2018年6月26日 星期二

20180626《簡明金文詞典》字頭索引數位化完成

20180626《簡明金文詞典》字頭索引數位化完成




word原始檔由偉明兄製作,筆者調整成資料庫格式,並整理缺字,新造四處缺字。


知乎:


字列 1068
缺字 29
總字列 1097



【使用方式】

進入「引得市」(www.mebag.com/index)點選①商周文字」項目中即可查詢。


合作提案(並非限於商業,任何形式的交流都很歡迎)
https://hackmd.io/s/HJ_qFWLNx


【學術交流】

※關於「引得市」的各種查詢應用,網路上的教學影片或文章介紹的不多,因此,很多教授與研究者可能還不熟悉,像是「開卷助理如何用」、「電腦缺字」、「古文字輸入法的使用」等問題,筆者都很樂意詳細解說,只要時間允許,都歡迎個人或學校機關團體私訊或留言約時間地點,公開來討論交流。






---

王文耀:《簡明金文詞典》,上海:上海辭書出版社,1998年12月。
isbn:7-5326-0323-7


20180920《居延新簡集釋》(全7冊)詞條/簡號索引數位化完成

20180920《居延新簡集釋》(全7冊)詞條/簡號索引數位化完成 知乎: https://zhuanlan.zhihu.com/p/45044148 20150507《居延新簡文字編》筆畫檢字表數位化完成 http://ebag2007.blogspot.co...