2018年7月2日 星期一

20180702《古文字釋要》拼音檢字表數位化完成

20180702《古文字釋要》拼音檢字表數位化完成




原始索引是彭偉明、余苑輝依據原書「拼音檢字表」所製作,筆者補上缺字,重新依照原書排序,但是由於時間關係,只有調整到45頁,並沒有全部再逐列調整。基本還是拼音檢字表原來的排序。

字列 9826
缺字 5
總字列 9831


正文(1-1375)
筆畫檢字表(1376-1445)
音序檢字表(1446-1552)



【使用方式】

---

進入「引得市」(www.mebag.com/index)點選「④古文字」項目中即可查詢。


合作提案(並非限於商業,任何形式的交流都很歡迎)
https://hackmd.io/s/HJ_qFWLNx


【學術交流】

※關於「引得市」的各種查詢應用,網路上的教學影片或文章介紹的不多,因此,很多教授與研究者可能還不熟悉,像是「開卷助理如何用」、「電腦缺字」、「古文字輸入法的使用」等問題,筆者都很樂意詳細解說,只要時間允許,都歡迎個人或學校機關團體私訊或留言約時間地點,公開來討論交流。








----

李圃.鄭明:《古文字釋要》,上海:上海教育出版社,2010年10月。ISBN:978-7-5444-2751-7



2018年6月26日 星期二

20180626《簡明金文詞典》字頭索引數位化完成

20180626《簡明金文詞典》字頭索引數位化完成




word原始檔由偉明兄製作,筆者調整成資料庫格式,並整理缺字,新造四處缺字。


知乎:


字列 1068
缺字 29
總字列 1097



【使用方式】

進入「引得市」(www.mebag.com/index)點選①商周文字」項目中即可查詢。


合作提案(並非限於商業,任何形式的交流都很歡迎)
https://hackmd.io/s/HJ_qFWLNx


【學術交流】

※關於「引得市」的各種查詢應用,網路上的教學影片或文章介紹的不多,因此,很多教授與研究者可能還不熟悉,像是「開卷助理如何用」、「電腦缺字」、「古文字輸入法的使用」等問題,筆者都很樂意詳細解說,只要時間允許,都歡迎個人或學校機關團體私訊或留言約時間地點,公開來討論交流。






---

王文耀:《簡明金文詞典》,上海:上海辭書出版社,1998年12月。
isbn:7-5326-0323-7


2018年6月15日 星期五

20170428《大書源》筆畫檢字表數位化完成

20170428《大書源》筆畫檢字表數位化完成

首發位置:http://ebag.tian.yam.com/posts/194897898

fb:https://www.facebook.com/ebag2007/media_set?set=a.10155528860014218.1073742180.600029217&type=3


此檢字表由筆者與:金佑安、吳軒菱、郭芷君、張家瑜、楊明峰、王薪雅、魏子芹、林子尹、李孟津、莊馥涓、董孟欣、許權璽、郭玉婷、王郁涵、謝昊恩、饒文馨、劉宜昀、施圓荷、高生甜、馬濟青、王舒婷、李竺軒、邱紹源、鄭智豪以上24位選課的同學共同製作。期中考後我們一起完成了這項內容!

檢字表一頁共有8列,每列27行(字)。因此,每頁多有216字。總共有53頁。

每人分配1-2頁,字數約在200-400字之間,剩餘頁數由筆者處理。主要藉由檢字表的數位化來實際練習使用「部件檢索」與「漢文博士」等工具軟體。

(北科大)
(文發系)
(書法產業)

經過筆者整合製作者的表格,校正內容,並逐頁檢視,補充原先書籍檢字表漏掉的部份(如圖)。這樣增補用處是,當輸入一字,可以同時再查到其他的異體字,如「寢」字在書中就有六例。目前還有2/3待增補。另外還有甲骨文的缺字三百多字待處理,這兩個部份大概是筆者近期想快點完成的,還有一些楚文字相關的文字編如:清華楚簡(陸)(柒)還在排隊中...。

筆者校正原書錯誤:
第2頁第四畫283頁,非「从」,應為「仌」字。
第3頁第四畫66頁,非「气」,應為「乞」字。


《大書源》上卷起訖:1-996中卷起訖:997-2004下卷起訖:2004-3034
字例 10991缺字 7總字例 10998



使用方式:
http://www.mebag.com/index/
請至「引得市」進入「書道」項目,選擇「大書源」。
※目前「書道」已經改為「今文字」

------
黒須雪子,《大書源》(上中下三卷),株式会社二玄社,2007年2月。
ISBN:978-4-544-12004-2

ps:《大書源》網路上還有這個檢索網站:
https://www.nigensha.co.jp/data/ad_sb/daishogen-search/index.html
不過收入的字頭並不全,可能製作的時間比較早,很多字也沒有收入。










2018年6月3日 星期日

20180603《金文詁林補》八冊(16卷)字頭索引數位化完成

20180603《金文詁林補》八冊(16卷)字頭索引數位化完成



知乎:https://zhuanlan.zhihu.com/p/37641242

20180116《金文詁林》字頭索引數位化完成、缺字補完
https://zhuanlan.zhihu.com/p/33001336

【製作說明】


原始索引來自〈小學堂〉,筆者去年索取,12月26日轉由周旭兄處理,今年2月20日回傳繼續製作。此套書分成:正文、附錄上、附錄下、補遺、續補遺等部份,原始索引本文之外只有編號沒有字頭,所以筆者在「補遺、別冊」之中逐頁補上字頭,未隸定的圖形字暫以「t」代替(208處),新造約28字。擴張C~F字集逐字比對「缺字庫」,再填入缺字編號。

近期從瑾昀兄學習了「正規表示式Regular Expression」的處理,在複雜的編號數字與文字之中分割、擷取部份的內容,然後填入需要的資訊。以前,就得一字一字的處理,一定又會花很多時間。自己為了能夠一條龍式的處理文獻,陸陸續續學會很多處理的資訊技術。

資料的處理有時候必須反覆作同樣的事情,這樣很容易產生疲勞、厭倦的情形,所以,把一個專案分割給不同製作者,或劃分階段來處理,都可以解決這樣的問題。我們在1月中旬先完成了《金文詁林》的索引數位化,將近五個月後終於又完成了《金文詁林補》索引的數位化,是多人協作的成果,感謝〈小學堂〉、周旭兄等諸多朋友的製作。

文獻的製作問題或交流合作,都歡迎來信或訊息。


※《金文詁林補》一樣也支援「開卷助理(Gopage)」的檢索使用。


字列 1717缺字 169總字列 1886



正文(第1-14卷)
附錄上(第15卷)
附錄下(第15卷)
補遺(第15卷)
續補遺(第15卷)
別冊(第16卷)

《金文詁林補》各卷頁碼起訖

卷1 89 334
卷2 335 686
卷3 687 1140
卷4 1141 1442
卷5 1443 1870
卷6 1871 2116
卷7 2167 2600
卷8 2601 2844
卷9 2845 3072
卷10 3073 3318
卷11 3319 3460
卷12 3461 3776
卷13 3777 3966
卷14 3967 4352
卷15 4353 5004
卷16 5005 5846


引得市《金文詁林》查詢與「數位助理」的應用示範(YouTube)
https://youtu.be/xKAFo7QYBGI

引得市《金文詁林》查詢與「數位助理」的應用示範(Youku)
http://v.youku.com/v_show/id_XMzMyMzg3MjAzNg==.html?spm=a2hzp.8253869.0.0

【使用方式】


進入「引得市」(www.mebag.com/index)點選:①商周文字」項目中即可查詢。
或直接點選網址:http://www.mebag.com/index/shangzhou/list.asp







合作提案(並非限於商業,任何形式的交流都很歡迎)
https://hackmd.io/s/HJ_qFWLNx

【學術交流】


※關於「引得市」的各種查詢應用,網路上的教學影片或文章介紹的不多,因此,很多教授與研究者可能還不熟悉,像是「開卷助理如何用」、「電腦缺字」、「古文字輸入法的使用」等問題,筆者都很樂意詳細解說,只要時間允許,都歡迎個人或學校機關團體私訊或留言約時間地點,公開來討論交流。

汉字科普网站推荐(八)—— 引得市(周旭 撰)
https://zhuanlan.zhihu.com/p/32516713

建立「开卷助理」新的RMP档
https://zhuanlan.zhihu.com/p/32155043

20180101「引得市」資料庫與「古文字缺字資料庫」更新及使用說明
https://zhuanlan.zhihu.com/p/32534740









---

周法高:《金文詁林補》(共八冊),台北:中央研究院歷史語言研究所,1982年5月。
isbn:978-5-6667-1250-4

周法高:《金文詁林》(共十五卷),香港:香港中文大學出版社,1975年。

〈小學堂〉網址:http://xiaoxue.iis.sinica.edu.tw/

【延伸閱讀】


20180116《金文詁林》字頭索引數位化完成、缺字補完
https://zhuanlan.zhihu.com/p/33001336

2018年5月31日 星期四

20180601《汗簡注釋》檢字索引數位化完成

20180601《汗簡注釋》檢字索引數位化完成

知乎:https://zhuanlan.zhihu.com/p/37576794

「檢字索引(555-586)」是州吁兄所製作(20170917),擱置了快一年了,近日瑾昀兄提醒後,再繼續處理完成,筆者增補空白列並逐列查詢補上缺字編號、校正。約新造缺字100字。紙本中的字體是楷體,OCR辨識並不容易,所以必須得重新打字。感謝州吁兄的製作,讓我們又可以快速的查詢文獻。在「傳抄古文」的領域的研究文獻拼圖,又補上了一塊。



字列 2768缺字 179總字列 2947



【使用方式】


進入「引得市」(www.mebag.com/index)點選⑤傳抄古文」或輸入網址:http://www.mebag.com/index/chuanchao/list.asp








合作提案(並非限於商業,任何形式的交流都很歡迎)
https://hackmd.io/s/HJ_qFWLNx


----

黃錫全:《汗簡注釋》(出土思想文物與文獻研究叢書:17),台北:台灣古籍出版有限公司,2005年1月。ISBN:986-7743-90-3







2018年5月28日 星期一

文字與數字分別取出以「EmEditor」處理

文字與數字分別取出以「EmEditor」處理


一般數位化文獻的檢索表時,OCR最後,通常會呈現文字與數字(頁碼)合併在一起的情形,如何快速的分割文字和數字(頁碼)分別貼在excel欄位中是個必須克服的問題。

只要在「EmEditor」,利用「尋找/取代」正規表示式可以解決這個問題。


我1
他2
你3

「\d」(數字)
「[^\d]」(文字)

如果想取代(刪除)數字,則輸入「\d」去取代。
如果想取代(刪除)文字,則輸入「[^\d]」去取代。

這樣,把兩次的結果分別貼到excel,這樣就不用一列一列去處理了。








2018年5月27日 星期日

【研究不要看#1】:20180527《引得市》的基本檢索

【研究不要看#1】:20180527《引得市》的基本檢索





針對初次使用《引得市》的老師、朋友們所錄製的示範影片,有其他問題請留言告訴我們。

※本集重點

1.每個資料庫項目都有其獨立的「部件檢索」界面。2.若想執行點字跳頁的功能時,「複製模式」不要打勾。3.電腦字「基本、A區、B區」,以外的都視為「缺字」。4.「缺字」使用構字式可在「古文字缺字資料庫」查詢。


背景音樂:Entire

2018年5月23日 星期三

20180523《秦簡逐字索引(增訂本)》全二冊,索引總檢字表數位化完成

20180523《秦簡逐字索引(增訂本)》全二冊,索引總檢字表數位化完成




知乎:https://zhuanlan.zhihu.com/p/37219652

ps.《甲骨文虛詞詞典》索引也完成了

兩年前筆者製作過《秦簡逐字索引》總檢字表的數位化,2014年原作者再出版了(增訂本)。這次的原始索引係偉明兄製作(20180223),筆者調整缺字字頭,新造約10字。藉此順道把新舊兩種版本的程式更新,支援了鼠標點選頁碼隨即開啟pdf的功能(Gopage開卷助理)。資料庫一樣放置在「⑯專書」中。(增訂本)的網址和前一個版本的網址差異是「_2014」,網誌是:http://www.mebag.com/index/qinjian_zhuzi_2014/list.asp

下面,列出了兩種版本的差異,使用者可以比較看看。

秦簡逐字索引(增訂本)總檢字表(1394-1487)

字列 2082
缺字 104
總字列 2186


秦簡逐字索引總檢字表(419-486)

字列 2144
缺字 95
總字列 2239







【補充說明】


今天同時也把偉明兄製作的《甲骨文虛詞詞典》索引放上引得市,已放在「⑪辭典」項目中。也把《三禮辭典》、《中國書法鑒賞大辭典》、《中國美學範疇辭典》、《中國書論辭典》等程式修正,都支援了「Gopage開卷助理」的使用。這回兩種文獻的增加,《引得市》的總文獻數量來到245種。

《甲骨文虛詞詞典》網址:http://www.mebag.com/index/jiaguwenxuci/list.asp

【使用方式】


「引得市」→專書→《秦簡逐字索引(增訂本)》索引
或直接進入網址:http://www.mebag.com/index/qinjian_zhuzi_2014/list.asp








-----

張顯成:《秦簡逐字索引(增訂本)》全二冊,成都:四川大學出版社,2014年12月。ISBN:978-75614-7260-6
張玉金:《甲骨文虛詞詞典》,北京:中華書局,1994年3月。ISBN:7-101-01216-7



合作提案(並非限於商業,任何形式的交流都很歡迎)
https://hackmd.io/s/HJ_qFWLNx


【學術交流】


※關於「引得市」的各種查詢應用,網路上的教學影片或文章介紹的不多,因此,很多教授與研究者可能還不熟悉,像是「開卷助理如何用」、「電腦缺字」、「古文字輸入法的使用」等問題,筆者都很樂意詳細解說,只要時間允許,都歡迎個人或學校機關團體私訊或留言約時間地點,公開來討論交流。







【延伸閱讀】


張顯成主編:《秦簡逐字索引》,成都:四川大學出版社,2010年12月。
ISBN 978-7-5614-5089-5

20160621《秦簡逐字索引》總檢字表數位化完成
https://ebag2007.blogspot.tw/2016/06/20160621.html

「引得市」→專書→《秦簡逐字索引》索引
或直接進入網址:http://www.mebag.com/index/qinjian_zhuzi/list.asp

20180702《古文字釋要》拼音檢字表數位化完成

20180702《古文字釋要》拼音檢字表數位化完成 知乎: https://zhuanlan.zhihu.com/p/38888073 原始索引是彭偉明、余苑輝依據原書「拼音檢字表」所製作,筆者補上缺字,重新依照原書排序,但是由於時間關係,只有調整到45頁,...