2018年11月14日 星期三

20181114《引得市》新功能介紹

20181114《引得市》新功能介紹

知乎:https://zhuanlan.zhihu.com/p/49854505

 

20181111《引得市》改版說明


 【前言】今天下午和瑾昀兄說了一個查詢功能的建議,晚上的時候,就已經付諸實施了。因此,需要即時的宣佈,告訴大家這個好消息!

近日新版的界面中,瑾昀兄已經帶給大家同時文獻多重圈選查詢的功能,讓檢索考察的效率從原來的50%晉升到85%以上,而現在的新功能,再度提昇了考察的便利性。身為古文字的研究者,平時資料庫檢索通常不會只找一兩個字,為了全面性的研究,考察的字數也都有一定的數量。


《引得市》在今天以前,是一個字去對應183種文獻,然後顯示在列表中,號稱所謂的「秒查百餘種文獻」。而這次的新功能,就是可以在原始的搜尋框中,查詢一字以上的字頭。例如說,以前查一字就是:「選擇文獻→輸入一個字→搜尋→結果列表→點選頁碼跳頁」。如果要查10個字,同樣的動作就要作10遍。

現在,就只要作一遍,真的就只要作一遍!!(如果說以前查一字是1秒的話,現在就是1/10秒)


【檢索示範】

舉例來說:我們選擇一種文獻如「包山楚墓文字全編」,在搜尋框中輸入「百 事 可 樂」(※請注意,字和字之間請用半形的空格來隔開),按下「搜尋」之後結果立即得知。四個字的檢索,就只需要一次動作。如果詞條或字串之間沒有隔開的話,就會產生「=== 抱歉!!目前尚未有資料 請重新搜尋===」的錯誤訊息。

這樣的新功能,讓古代詞彙研究者能夠在某種特定時代的文獻中,考察更為便利,還有,作為書法的創作者,也能把想查詢的「成語」、「詞彙」甚至「一首詩」快速的完成查詢與檢視。如此效率的提昇又是過去的數十倍以上。






※溫馨的建議,查詢時不要選擇太多的書籍文獻,然後又輸入太多的字頭,一來程式運行的速度會變慢,二來顯示的結果太多,其實並沒有彰顯這個新功能的特色。

做個錯誤示範,例如我們若文獻查詢條件設定「楚」,列出22種(筆)。然後輸入了「天 地 玄 黃」查詢,符合結果是64筆。瀏覽視覺上除了比較雜亂之外,種種訊息等也比較不夠細緻。所以,我們應該減少文獻的種類與數量(如圖)。這樣的結果就比較簡潔有利於使用。









【小結】


正確的查詢方式應該是:「選擇少量書(最好是選一本書)+査大量關鍵字」以及「選大量書+査一个關鍵字」,速度都能達到應有的水準。

以上是最新檢索功能說明,希望大家使用的愉快!

ps.字和字之間記得半形空格!


《引得市》(查字最快的方式):www.mebag.com/index

20181111《引得市》改版說明

Blog:https://ebag2007.blogspot.com/2018/11/20181111.html
知乎:https://zhuanlan.zhihu.com/p/49336600

楚竹書《周易》集字

為了教學,整理了一些內容,讓同學來書寫,幾個月後也可以寫成春條。






用行舍藏


楚竹書《周易》集字

《論語・述而》子謂顏淵曰:「用之則行,舍之則藏,唯我與爾有是夫!」

[八口口象](豫)讀為「舍」。
[宀爿戈口]即「壯」或「藏」字。

「大」通「泰」字
「逨」即「來」字
「不」通「否」字
「𨓹」即「往」字



#楚文字
#周易

2018年11月13日 星期二

《楚竹書.周易》字形書寫練習本終於快完成了

《楚竹書.周易》字形書寫練習本終於快完成了



這份《楚竹書.周易》字形書寫練習本,是我編輯製作的數位摹本,內容是上博收藏的楚竹書《周易》58支簡牘所有的放大圖版精準的描摹而成。

釋文內容包含「嚴式隸定」與「寬式隸定」。釋文以《上海博物館藏戰國楚竹書(三)》為主,又參考了李零〈讀上博楚簡〈周易〉〉及侯乃峰《《周易》文字匯校集釋》。

2018年11月12日 星期一

20181112《金石大字典》索引字頭補完

20181112《金石大字典》索引字頭補完


【前言】


這本書對筆者來說,有一種深厚的感情,算是接觸古文字的第一本工具書。當時就是用來查字排印、刻章。2014年與北科大多位同學一起把這本書的字頭數位化(見文後)。雖然過了這麼多年,許多新材料的發現,工具書不斷的出版,文字的考訂上也產生很多新的論證,有人或許會說,這書的參考價值似乎已經沒有這麼必要了。但筆者以為,即使內容已有錯誤,也一定還有存在的價值。

舉例來說:當我們在考察某些明清時代具有文字的文物時,取用的參考資料也一定要是明清時代為主的工具書,不要天真的以為每個製作者或工匠個個都是文字學高手,容易取得的工具參考書,當時他們習慣用、看到什麼字,就有比較多的可能採用那一類的字。

每本書籍的出版,都反應了當時研究狀態以及蒐錄材料的情形,就像筆者考察所知,知名的晚清篆刻家們,作品的取字多數都是從字典而來。這是有脈絡可尋的,明代有印譜與文獻資料整理,透過這些豐富的出版物,清代才能產生諸多有名的篆刻家。

因此,查字典是創作研究必要的過程,並不是任何創作能「憑空想像」、自發性的產出。只是,在這個時代,創作者必須有更多取材的管道,不能一招半式闖江湖…一本字典用到底。古人都不止參考一份資料了,現在網路上有各種資料庫或圖版可以參考,應該藉此多看多學習才是。



【整理說明】


前面就是感想文,回到主題,在過去整理的版本中,頁碼資訊是以原書「卷+頁」的形式呈現,如:「01-01」。這樣的數字數據並無法對應到正確的頁碼位置,所以,雖然數位化了字頭也輸入了頁碼,但是「開卷助理(Gopage)」還是無法支援。

因此,近期筆者就一頁一頁的重頭再校對一次,把排序改為原始本文(本來是筆畫檢字排序)。並且把字頭旁的相關字也一併補上,補充了一些原先的漏字及錯誤。最後比原始檔案多了5字(列)。現在,字頭已經完整,也可以點選頁碼自動跳頁了。

筆者總是藉著整理文獻的過程,從螢幕中瀏覽書籍,一次一次的欣賞古文字的造形,是「苦中作樂」還是「樂在其中」?也只有同道之人能理解了。

字列 3591
缺字 21
總計 3612





【使用說明】


進入《引得市》之後,點選「工具書」→「語文辭典」勾選:《金石大字典》
http://www.mebag.com/index/

※近日因為我們更新了檢索界面,建議使用者先仔細看完「20181111《引得市》改版說明」。另外,再提醒一下,目前在「語文辭典」檢索中,會記憶上一次的檢索範圍,所以你經常會跳轉查詢其他資料庫(如缺字庫等),記得查字前,先點擊「重置」一下,清除前一次的圈選範圍記憶,否則查詢的結果,可能會讓您誤判。(檢索前,眼睛描一下左上角「書名」)


汪仁壽:《金石大字典》,碧梧山房石印,1926年。


20140329《金石大字典》索引數位化完成
https://ebag2007.blogspot.com/2014/03/20140329.html


2018年11月11日 星期日

20181111《引得市》改版說明

20181111《引得市》改版說明

《引得市》網址:http://www.mebag.com/index/

【前言】

很高興的向大家分享這個消息,近期《引得市》在瑾昀兄的規劃實作下,與筆者協作,經過約三個星期的反覆調整,今天終於完成了改版的作業,不只是前端操作界面的調整,在後端的程式與資料庫也有一定程度的優化。詳細改變內容,在後面有分段的解說。



《引得市》網址:http://www.mebag.com/index/

【前端視覺操作界面方面】

從原本佔據大幅版面、分類混亂的全部資料庫連結表格,改成簡潔易用、分類清晰、明確主次的導航欄。該導航欄以「工具書」、「出土文獻」、「論文著作」、「幫助」作爲頂級菜單,同時並排放入了「部件檢索」、「缺字檢索」兩個用戶最常用的資料庫入口。其中:

⊙「工具書」放置工具書類文獻的字頭、詞頭索引,目前包含「語文辭典」、「說文解字」、「康熙字典」、「專科辭典」4部分。

「語文辭典」整合了原《引得市》商周文字、戰國文字、秦漢文字、傳抄古文、古文字、今文字、訓詁、俗語詞等八種常用資料庫的全部文獻,並冠名爲「語文資料庫」,意謂漢語言文字類的工具書皆匯於此。位於該資料庫的文獻均支持標籤檢索、多選文獻等新功能(見後文)。

「說文解字」和「康熙字典」兩個資料庫由於有特殊的欄位格式,所以儘管也屬於「漢語言文字」的範疇,但是仍然獨立於「語文辭典」之外。我們以後也有計劃設立與「說文解字」、「康熙字典」平級的「玉篇」、「廣韻」等資料庫。

「專科辭典」用於放置非漢語言文字類的工具書。這類文獻目前絕大多數與筆者本人專業興趣相關,按照性質暫時分爲「文史類」、「藝術類」、「外語類」三類;在各地網友的襄助下,以後隨着工具書索引種類的拓寬和加深,「專科辭典」的分類會根據情況隨時調整。

⊙「出土文獻」放置出土文獻著錄、釋文方面的專業資料庫,按照出土文獻的性質分爲「甲骨文」(目前尚無資料)、「金文」、「簡牘帛書」、「璽印封泥」、「磚瓦陶文」、「碑碣石刻」、「其他」等7類。

⊙「論文著作」放置非工具書類、非釋文著錄類文獻的論著,包括書後附有主題索引的「裘錫圭學術文集」、「文字學概要(修訂本)」、「古文字構形學(修訂本)」、「文字學術語規範研究」;而僅有目錄的文獻則統屬於「章句目錄」二級菜單下,以示區別。



⊙「幫助」包含「使用說明」、「文獻一覽」、「關於引得市」(附「站長作品」)、「聯繫我們」等。其中「文獻一覽」以列表的方式展現《引得市》目前收錄的文獻的詳細資訊,包括文獻名、標籤(僅支持「語文辭典」資料庫的文獻)、作者、出版時間及索引製作者等。「站長作品」放置站長(筆者)的一些小作品。

⊙「部件檢索」:(見後文)
⊙「缺字檢索」:(見後文)

【資料庫的調整方面】

去年這個時候,瑾昀兄以時間順序爲綱,爲《引得市》索引規劃了商周文字、戰國文字、秦漢文字、古文字、傳抄古文、今文字等分類,首次整理了《引得市》五花八門的文獻,使之趨於有序。

經過一年的實際使用,瑾昀兄廣泛聽取使用者的建議(問卷星問卷:https://www.wjx.top/jq/29010656.aspx),特別是對於文獻分類、查詢便捷度上面的需求,將原「商周文字」等八種資料庫併入「語文辭典」資料庫,並採用Bootstrap框架爲「語文辭典」資料庫設計了一個全新的前端界面。「語文辭典」引入了「標籤」的概念,使得文獻的分類更爲立體、細膩。在實際操作中,用戶只須輸入某個標籤,便可篩選出貼有該標籤的文獻集合,並且在該文獻集合的範圍內査詢索引。

目前「語文辭典」收錄183種文獻,爲每本文獻貼標籤的工作有賴王森兄和白石兄的大力支持,筆者在此表示感謝。


※操作介紹

使用者能夠自由選擇想要/需要的文獻組合進行自定義聯合檢索,這在過去是無法實現的,但是在「語文辭典」新界面中,這一切都變爲現實。


「語文辭典」的界面如上圖所示。


文獻選單目前支持複選,被選中的文獻後面會出現對鉤符號(√),而「書名」後的欄位會同步現實目前所選文獻的數量(※如果只選了一本文獻,則欄位中顯示的就是書名)。

文獻後面列出的灰色小號字爲該文獻所貼的「標籤」。使用者可以通過文獻選單上方的檢索框輸入「書名」或者「標籤名」定位/篩選到所需文獻,並通過挨個選擇或者一鍵「全選」的方式勾選上所需文獻。

在確認好查詢範圍(待搜尋的文獻組合)之後,用戶即可在右側提示有「請輸入關鍵詞」的檢索框中輸入內容進行查詢。值得一提的是,瀏覽器會自動記憶當前的查詢範圍和檢索關鍵詞,使用者在下次查詢時不必再重新填寫一遍查詢條件。當需要恢復默認的查詢設定時,記得按下「重置」按鍵。

舉例來說:若在文獻檢索框輸入「甲骨」,則會自動列出文獻名稱或標籤包含「甲骨」的所有文獻。以游標點選「全選」,左上方就會出現「已選9/183本文獻」。直接以這樣的方式檢索,或者取消某些文獻,再進行檢索。下圖中我們以「非」字進行檢索,共有12條列顯示。若還要查詢別字,繼續輸入不必重新設定查詢範圍就可以再查詢(如圖)。








【部件檢索的介紹】

部件檢索的原始功能如拆字,請見另文介紹。目前改版後,使用者能夠全數查詢或個別單一選擇文獻(※只能單選,無法複選)選擇後,右側會自動顯示該文獻的字數。

舉例來說:我們可以直接以「引得市」專用版來查詢,在「部件」檢索框中輸入「馬」(如果☑即時查詢有勾選),則立即列出了超過99筆的字頭內容。可以點選放大鏡符號「🔍」(即列出所有的字頭)。這時使用者若要以列出字頭的某一字來查詢資料庫,則可用游標點選字頭,程式就會連結到資料庫查詢。

※必須注意!※必須注意!※必須注意!(很重要所以說三遍!)若要執行查詢的功能,請勿勾選「□複製模式」。若有勾選,游標點選字頭即自動複製該字,而不會跳頁至資料庫查詢。




我們也可以針對某種文獻來查詢,在搜尋框中輸入「古文字」,此時會自動列出符合關鍵字的文獻。此時,只能選一種來查詢。若選擇「古文字詁林」專用版(22656字),再點選放大鏡符號「🔍」,這時就會列出這文獻中,「馬」部件的所有字頭(215字)。點選任何一個字頭,就會用該字頭查詢為條件,連到「古文字詁林」資料庫查詢頁碼。圖中的範例是「驘」「08_0499」(第八冊的499頁)。

所以,當使用者改變查詢條件(變換文獻內容)時,請再一次點選放大鏡符號「🔍」,讓程式重新查詢,否則只會停留在前一次的條件範圍。






※必須注意,個別選文獻,查詢的範圍當然是該文獻的字頭為主,若選擇是「引得市」,查詢的則是目前支援顯示的9萬多的漢字(基本漢字及擴張A~F等)。所以,列出顯示的字頭不一定是「語文辭典」內涵蓋的字頭,所以可能會有顯示「查無此資料」的訊息。






【缺字檢索的介紹】


「缺字檢索」即原始存在的「古文字缺字資料庫」,目前累計缺字15733個。基本功能不變。只將原始八種資料庫的連結,合併成單一的「語文辭典」。構字式與字型等文字尺寸加大,方便使用者查看瀏覽。



【小結】


《引得市》近20年的老舊程式,承載著數百種文獻,數十萬筆資料的查詢順利運行,瑾昀兄不嫌麻煩一點一滴、一步一步的修改調整,為各地廣大的使用者帶來更好的操作體驗,以現(限)有的資源作最大的展現。

⊙關於這次的改版,筆者簡單的總結了以下幾點:


1.複雜多樣的各式連結資料庫,字辭典文獻整合集中成單一窗口,利於查詢,其他分類讓使用者也容易理解。
2.資料庫與程式優化,改善使用者查詢效率。
3.缺字庫查詢後,單一點選「語文辭典」連結,查詢缺字在何種文獻的位置更為方便。
4.在近數百種資料庫的程式裡,修改插入頁面上下端的選單等內容,讓日後修改調整更容易。
5.CSS樣式設計,統一資料庫字型大小與風格。


期待大家持續使用《引得市》,並推廣介紹師長或同道朋友,如有其他需要改善的意見。請從這裡填寫問卷:https://www.wjx.top/jq/29010656.aspx,告訴我們。

謝謝大家!


【補記】


原本在「⑦說文」項目的《古文字詁林》內容移動至「語文辭典」中,並且增加了11冊的字頭內容,原始字頭1700多字,缺字佔了1000出頭,新造字390字。至此,終於實現了《古文字詁林》1~11冊完整的字頭檢索。

2018年11月8日 星期四

楚竹書「非學無以廣才.非志無以成學」(影音紀錄)

近日,委託秦簡書法班同學購買數百支竹簡(1x23cm),表面先以240號水砂紙研磨後試寫楚文字。
感覺在寬1cm的竹面上書寫簡單很多,因為實際出土的楚竹書才寬0.6cm左右,瘦小很多。

以現代人來說,這個比例尺寸算是可以接受的範圍。

非學無以廣才 非志無以成學 諸葛亮《誡子書》




2018年11月6日 星期二

在word輸入缺字的方式

word輸入缺字的方式


2015年製作缺字的紀錄 



(請先確認已經安裝了最新的引得市所提供的缺字字型)

方式1:直接複製缺字庫的缺字滑鼠在文字上點一下,然後貼到word的位置,如:右邊是缺字→(記得把字型改為seal



方式2:輸入缺字的編碼,然後按「alt+x」(記得把字型改為seal),如:右邊是缺字→U+可以省略)


※建議使用者還是採取插入「缺字圖檔」的方式,以免別人沒有安裝缺字字型,而讓該處內容顯示不出來!


20181020最新缺字字型發布(seal v2.3.1)
http://ebag2007.blogspot.com/2018/10/20181020seal-v231.html

【下載處】

⊙下載點A(Google雲端硬碟):https://reurl.cc/4mbnv
⊙下載點B(百度):鏈接:https://pan.baidu.com/s/167XNPXBnvSzPvKa3iSp-qA 提取碼: eqy4




古文字缺字資料庫

http://www.mebag.com/index/quezi/list.asp














2018年10月29日 星期一

20181029《曾侯乙墓竹簡文字編》與《曾文字編》索引數位化完成

20181029《曾侯乙墓竹簡文字編》與《曾文字編》索引數位化完成











知乎:https://zhuanlan.zhihu.com/p/47985885

【前言】


過去幾年,我們在楚系相關文獻的整理花了很多時間,尤其在缺字的整理編輯上,今日透過這兩種文獻,一併把「曾系文字」補足。大致戰國文字的缺字應當也整理的差不多了,除非再有新的出土文字,或者少數一字多形的字例。1.5萬多字的「缺字數量」也應當足夠研究者使用了。

【製作說明】


1.《曾侯乙墓竹簡文字編》筆劃索引原編輯者是偉明兄(3月初提供),筆者逐列對照調整原書排序,補充遺漏字並輸入字號、缺字編號等,新造約16字。

字列 356
缺字 190
圖形字 24(輸入t查詢可全數列示)
總字列 570

本文(1-191)
合文(193-196)
待考字(197-202)
殘字(203-205)




2.《曾文字編》筆劃索引原編輯者也是偉明兄(4月初提供),筆者逐列對照調整成原書排序,補充遺漏字並輸入字號、缺字編號等,新造約178字。

字列 1251
缺字 481
總字列 1732







【補記】


再60天左右,2019年又將到來,近期透過諸多研究同好的共同努力,《引得市》也將有全新的使用體驗,敬請關注期待!


【使用方式】

進入「引得市」(www.mebag.com/index)點選:②戰國文字」項目中即可查詢。


合作提案(並非限於商業,任何形式的交流都很歡迎)

https://hackmd.io/s/HJ_qFWLNx


【學術交流】


※關於「引得市」的各種查詢應用,網路上的教學影片或文章介紹的不多,因此,很多教授與研究者可能還不熟悉,像是「開卷助理如何用」、「電腦缺字」、「古文字輸入法的使用」等問題,筆者都很樂意詳細解說,只要時間允許,都歡迎個人或學校機關團體私訊或留言約時間地點,公開來討論交流。


-----

張光裕.滕壬生.黃錫全:《曾侯乙墓竹簡文字編》,台北市:藝文印書館,1997年1月。
孫啟燦:《曾文字編》,吉林大學碩士學位論文,2016年4月。


20181114《引得市》新功能介紹

20181114《引得市》新功能介紹 知乎: https://zhuanlan.zhihu.com/p/49854505   20181111《引得市》改版說明 Blog: https://ebag2007.blogspot.com/2018/11/2018111...