20210424「Seal缺字字型製作生成」的新方法暨最新版本釋出
知乎:https://zhuanlan.zhihu.com/p/367471915
方格子:https://vocus.cc/article/6083c534fd897800012bafa3
二話不說先【填寫表單】
Google表單https://forms.gle/ss9TbHtQJDi6N2xm7
騰訊問卷https://wj.qq.com/s2/8216629/4766/
【前言】
引得市最重要的資料庫:「古文字缺字資料庫」多年所累積的缺字,一段時間都會整理成一個字型檔,公開提供下載,最近的一個版本是(seal v2.3.3),於2019年12月14日發布,以往都是仰賴瑾昀兄的協助,將筆者在「字型維基」匯出的多個檔案再合併成單一字型,並調整高度,以適應細明體或宋體。
古文字缺字資料庫:http://www.mebag.com/index/quezi/List.asp
字型維基:https://glyphwiki.org/wiki
近日經過瑾昀兄的特別研究,改良缺字製作的方法,透過「TeamViewer」全部教授筆者過程方法。
今年四月初,「部件檢索」與「古文字缺字資料庫」都已經提供使用者自動把文字轉成圖形字並下載的功能(後有文章連結),因此每次字型更新時,附帶缺字png圖檔的慣例就暫時取消。使用者平時就可以自己下載需要的擴充字或缺字圖形,缺字圖檔的使用,讓撰寫的文章,不論從那一台電腦開啟都能完整正常的顯示文字。
或許有人也有疑問,既然有圖形缺字檔,那麼「Seal字型」存在的意義為何?是這樣的:字型文字具備有「複製」與「檢索」的功能,在缺字庫整理時,校正內容、對照圖檔會用到,而且是缺字庫的圖檔SVG與「字型維基」連動的,當「字型維基」網站當機或無法連線時,圖檔就看不到,這時「Seal字」就發揮作用,讓使用者還能顯示缺字字型。因此希望使用者安裝下載最新的缺字字型,現階段兩種缺字型式的並存似乎還是有其必要。
今天,就把字型產生的過程稍微的紀錄一下,和前一個版本差距也有一年多,期間又增加許多缺字(如《戰國文字字形表》等文獻索引),因此也順便開放最新的版本。
【Seal缺字字型的製作過程紀錄】A~B~C三階段
※急著安裝字型的朋友,就拉到文章最後,有下載點。
【A階段(缺字編號與Seal字的對應列表)】
打開缺字庫的excel檔,選擇1的部份,0是暫時無缺字的編號。
方式一:複製缺字編號,貼到「自動填Seal字」。這個Excel檔,能夠把缺字編號和「Seal字」自動對應。過去使用自動產生筆畫,或自動產生說文字號,都是一樣的原理,其實就是一段函數如:=VLOOKUP(B2,x!$A:$B,2,FALSE)
方式二:另外一種對應方式,個人認為比較複雜,也是學起來備用,是瑾昀兄傳授的,把兩個列表放在「EmEditor」,點選「製表符分隔」(這樣才能使用CSV→合併),選擇「唯一索引鍵」,將兩個csv合併,執行需要一段時間,合併後就成為我們需要的對應表。對缺字編碼有疑問的,可以複習一下以前的文章「引得市缺字字體編碼方案說明」(最下方)。
我們需要的結果是前列是「缺字編號」後一列是「Seal字」,這樣再執行尋找取代:
(.+)\t(.+)
替換成
[[\2 ebag_\1]]
完成後的結果,我們下一個階段就會用到。
【B階段(缺字字型分區段與缺字內容對應表貼入)】
瑾昀兄建議s215沒必要製作seal字型,從此次版本開始這樣處理,於「字型維基」預先把缺字編號001-214分成五個區間,這是因為一個表大概只能貼4700行。
*缺字區間 s001~s039
[[字表:ebag_seal-1]]
*缺字區間 s040~s071
[[字表:ebag_seal-2]]
*缺字區間 s072~s112
[[字表:ebag_seal-3]]
*缺字區間 s113~s149
[[字表:ebag_seal-4]]
*缺字區間 s150~s214
[[字表:ebag_seal-5]]
從A階段製作產生的文字檔,分批貼入「字型維基」,五種區間內容裡,最上方有「__no_font__」表示說,這個字表,暫時不需要匯集成為字形。每一個表在送出時,都要檢查看看「作字率」,是否達到100%,如果沒有,表示可能有對應不到的情形,需要個別檢查處理。目前若看到遺漏字,解決方式是前往造字編輯界面,把字形拆解,不套用unicode原字,無法對應的原因,還得再了解。我們最後再設立一個總表(ebag_seal)將這五區間的內容合併。
如果內容無誤,我們就點選「執行字體文件生成」,過程大約3分鐘,點選「下載」。
gw3228092.ttf這個檔案雖然可以安裝使用,但是還有最後一步驟要執行…。
★★★補【新增】★★★
因為新字型的製作有了一個小BUG,因此這裡需要要補上一段製作說明,主要是基线「winascent」和「windescent」的位置問題。經過瑾昀兄的研究後,現在已經可以解決。
●先修復glyphwiki下載的字型檔案。
1.使用一個原始字型檔案(上下位置都是正常的),要以這個當作基礎,匯入新版本的字型內容,這裡暫稱為「母檔」。
2.先刪除字型內舊有的缺字(Shift按住點第一個字與最後一字)。
3.打開新製作的缺字,檢查總共有多少缺字(數量)。
4.在「母檔」選單「insert」→「glyph」。對話匡中輸入「20572」(這次新缺字的數量),然後選擇「After last glyph」按下OK。
5.打開新版本的缺字字型,全選(Shift按住點第一個字與最後一字)。Copy複製。
6.在「母檔」選單「edit」→「paste special」,項目全部都勾選,按下OK。
【C階段(缺字字型高度調整)】
由glyphwiki生成的字型,使用前需要再經過調整才能與細明體或宋體左右高度一致。這裡調整Seal字型,我們使用的軟體是「High-Logic FontCreator 11」
1.開啟軟體後,我們把glyphwiki生成的字體「gw3228092.ttf」拖拉進來。
2.全選字(點第一個到最後一個,按住shift)
3.選單「tools→Transform Wizard→outlines→ move」
在vertical(垂直高度)數值上調整。
宋體(SimSun)調整-35,表示向下35
細明體(MingLiU)調整-80,表示向下80
最後,把高度調整後的字型分二批匯出,選單「File→Export Font→Export TrueType/OpenTrueType Font(Shift+Ctrl+E)」
我們調整製作了二個Seal字型版本。適合宋體命名為「seal-SimSun」,適合細明體的命名為「seal-MingLiU」,還有原來匯出的版本適合「花園明朝」,命名為「seal-HanaMin」,讓使用者自行選擇需要的版本。
【說明】
本「缺字字型」是筆者自2004年起,為「古文字缺字資料庫」的檢索顯示,和古文字文獻中電腦無法輸入/顯示的缺字,於「glyphwiki」網站造字,所累積衍生的內容。以一般可安裝字型檔(*.ttf)及PNG圖檔兩種形式呈現,多年來提供各界免費下載使用。
上一個版本是seal v2.3.3,在2019年12月14日所發布(17423字)。目前版本seal_20210424新增1752字,共19175字。前後版本相隔一年多,新增的缺字包含:《秦印文字彙編(增訂本)》、《戰國文字字形表》、《清華大學藏戰國竹簡(拾)》、《金文大字典》、《馬王堆漢墓簡帛文字全編》、《古代漢語通假字大字典》、《長沙五一廣場東漢簡牘(肆)異體字表》、《長沙五一廣場東漢簡牘(參)異體字表》、《東周鳥篆文字編》、《字辨百題》、《秦漢印章封泥文字編》、《郭店楚簡文字編》、《楚帛書詁林》、《說文部首通解》、《古字通假會典》、《《干祿字書》、《商代文字字形表》、《古音匯纂》、《增訂漢印文字徵》、《秦封泥集存》、《商周古文字源流疏證》、《說文解字句讀》、《甲骨文常用字字典》、《侯馬盟書字表_2016》、《聲韻語源字彙》、《肩水金關漢簡(貳)(參)文字編》、《漢隸異體字表》、《秦簡字形表》、《漢字源流字典》、《高麗大藏經異體字典》、《新出土戰國楚竹書研究》、《漢字學新論》、《戰國文字通論(訂補)》、《章草大字典》、《爨寶子碑》、《怎樣學習《說文解字》、《新編說文解字》、《說文》、《嶽麓書院藏秦簡》、《漢語變調構詞考辨》、《漢語大字典》、《漢語大詞典》、《辭源》、《山東出土金文字形全編》、《上博楚簡儒學文獻校理》、《嶽麓書院藏秦簡(壹)~(伍)》等四十六種文獻。
★注意事項★
1. 「seal-MingLiU.ttf」、「seal-SimSun.ttf」以及「seal-HanaMin.ttf」font-face均爲seal,三者分別適配了「細明體」、「宋体」與「花園明朝」的高度,除此之外完全一致。用戶只須安裝其中一種即可。
2. 若之前曾執行過SurrogateFallback.reg,後就不必再執行一次。
3. 若之前曾安裝過seal字型,請確保移除舊版字型檔後再安裝該版字型檔。若無法移除舊版請重新開機或者進入安全模式後刪除,以解除程式對字型檔的佔用。
★內容說明★
資料夾中包含:一個說明檔,一個reg檔,三個字型檔。
seal_20210424.xlsx:該版字型檔的清單,列有缺字編號、Seal字、構字式和Unicode編碼。
seal-MingLiU.ttf:適配「細明體」字型高度的Seal字型。
seal-SimSun.ttf:適配「宋体」字型高度的Seal字型。
seal-HanaMin.ttf:適配「花園明朝」字型高度的Seal字型。
SurrogateFallback.reg:機碼,進行字型串接的註冊設定。務必執行一次,這樣才能在其他文書程式中顯示缺字字型。
【seal_20210424下載處】
⊙下載點A(Google雲端硬碟):https://reurl.cc/4yzX8j
⊙下載點B(騰訊微雲):https://share.weiyun.com/3Ih6gqsR
二話不說先【填寫表單】
Google表單https://forms.gle/ss9TbHtQJDi6N2xm7
騰訊問卷https://wj.qq.com/s2/8216629/4766/
【小額贊助】
如果「引得市」曾經幫助到您、而您想以實際行動支持我們的話,歡迎透過以下小額贊助的方式表達支持與鼓勵。無論金額多少都足夠表達您的一份心意。謝謝!
請點擊這裡→→http://www.mebag.com/index/donate.asp
【延伸閱讀】
20191214最新缺字字型發布(seal v2.3.3)
知乎:https://zhuanlan.zhihu.com/p/97419643
Blog:https://ebag2007.blogspot.com/2019/12/20191214seal-v233.html
20210409〈引得市〉新版部件檢索的更新與介紹
Blog:https://ebag2007.blogspot.com/2021/04/20210409.html
知乎:https://zhuanlan.zhihu.com/p/363774635
引得市缺字字體編碼方案說明
沒有留言:
張貼留言