2021年5月17日 星期一

20210510《中國書畫文獻索引》筆畫查字表、《中國書畫全書》目錄數位化完成

20210510《中國書畫文獻索引》筆畫查字表、《中國書畫全書》目錄數位化完成








知乎:https://zhuanlan.zhihu.com/p/373109219


二話不說先【填寫表單】

Google表單https://forms.gle/ss9TbHtQJDi6N2xm7

騰訊問卷https://wj.qq.com/s2/8216629/4766/



【寫在開箱文之前】

此開箱文發布前,新型冠狀病毒肺炎(COVID-19)在台灣擴散,連續幾天的感染人數達到數百人…,台北與新北市進入了第三級警戒,政府建議民眾盡量待在家中,不要隨意外出。圖書館等公共空間也暫時關閉,不開放使用。對研究者來說,「引得市」的資料庫這時候應該最能幫上忙,因此迅速發布開箱文,告訴大家又有新的索引可以使用。


今天「部件檢索」原先放置的空間,已經不再支援,瑾昀兄下班後沒休息,緊接著幫忙轉移空間,又幫我增加新資料庫的選單,忙碌到剛剛才吃飯休息,感謝瑾昀兄的協助幫忙,讓資料能很快順利上線使用!


【前言】

《中國書畫文獻索引》購買之後,隨即掃描建檔,已過了十多年,當時為了追求查詢的便捷,製作了pdf之間的跳頁連結(見影片)。把一些知道或常用書畫專有名詞考察了一遍,並建立五千多列的列表。


還沒有「Gopage」以前,這份文獻在線下已經能享受到快速跳頁,查詢的便利性,但「獨樂樂不如眾樂樂」,也想讓大家都有這種方便,十年多年索引的製作經驗,萌生《中國書畫文獻索引》「筆畫查字表」數位化的構想。


《中國書畫文獻索引》「筆畫查字表」起訖6至33頁。還沒開始前,心裡已經描繪出大概的結果,點選畫面中的頁碼跳到指定的位置,這是「Gopage」的基本功能,引得市的使用者都已經知道的。


跳頁到達的頁面,也還是「索引」,不是文獻的真正內容,如果資料庫就這樣而已,並不夠完整,所以還得繼續串接另一頭內容文獻的部份。就是那十四冊的《中國書畫全書》。《中國書畫全書》方面,得設計另一個方便檢索跳頁的資料庫。


《中國書畫全書.後記》說道:

《中國書畫全書》自一九八七年開始編纂,在全體編纂人員的共同努力下,於一九九九年完成,共計十四冊二千餘萬字。全書除了保留專用名中的大量異體字,以繁體直行形式排印,盡可能地體現入選典籍的原生態之外,還特地採用了鉛字活版印刷方式。在印刷技術日新月異的今天,這也許更能顯示其濃厚的傳統文化品味。


的確,中文識讀瀏覽,直排的確會比橫排自然一點,不過這書上下各26行的小字,排在一起有點擁擠。十四冊二千餘萬字,如何快速查詢?是使用上最大關鍵。


開啟文字檔,回顧這套書曾經作過pdf書籤(2011.1.20凌晨紀錄)從頭到尾再比對一次,為了配合《中國書畫文獻索引》的部份,除了各冊的目錄索引合併之外,也把一至十四冊的頁碼列出在一個列表中,欄位一樣有著作、作者與朝代等。三種資料庫的使用方式下面繼續說明。



【製作說明】

筆者預計以三種資料庫作為此次索引數位化的呈現,可點選「link」切換位置。


[文獻索引]即《中國書畫文獻索引》筆畫查字表索引

[全書目錄]即《中國書畫全書》一~十四冊的著作目錄

[全書列表]即《中國書畫全書》一~十四冊的所有頁面列表


一、《中國書畫文獻索引》的部份

首先OCR《中國書畫文獻索引》筆畫查字表,字頭利用excel重複內容提醒的功能,再校正字頭,內容分成三編起訖分別是:「人名編(1-1829)」、「篇名編(1830-2894」、「術語編(2895-3073」,若無頁碼內容則一樣空白顯示。第六頁,筆畫三畫有一處圖形字(t029-1864-001)新造約七字。總共有4020列。


《中國書畫文獻索引》

上冊起訖:1-1518頁

下冊起訖:1519-3073頁


字列 4012

缺字 8

總字列 4020


二、《中國書畫全書》的部份

以「PdgCntEditor」分別把原先PDF書籤取出,PDF、excel檔案左右對照訂正,一至十四冊的目錄索引即製作完成,這是「全書目錄」的部份,「全書列表」的部份則開啟一個新的excel,依照每冊的頁碼數量產生列表,十四冊總計15293列。例如第一冊會有1至994的列表。頁碼之外,左側欄位各自補上著作朝代作者等資訊。


《中國書畫全書》,上下兩區塊各26行

書名 頁數

《中國書畫全書》 1 994

《中國書畫全書》 2 968

《中國書畫全書》 3 1282

《中國書畫全書》 4 1017

《中國書畫全書》 5 1240

《中國書畫全書》 6 1081

《中國書畫全書》 7 1078

《中國書畫全書》 8 1175

《中國書畫全書》 9 1115

《中國書畫全書》 10 1038

《中國書畫全書》 11 1058

《中國書畫全書》 12 1132

《中國書畫全書》 13 947

《中國書畫全書》 14 1168



【資料庫操作說明】

[文獻索引]即《中國書畫文獻索引》筆畫查字表索引

[全書目錄]即《中國書畫全書》一~十四冊的著作目錄

[全書列表]即《中國書畫全書》一~十四冊的所有頁面列表


如前面製作說明,我們製作了三種資料庫,各自的用法如下分別說明:


[文獻索引]:以輸入單字字頭查詢「人名編」、「篇名編」、「術語編」三種欄位,點選頁碼跳頁。


[全書目錄]:可輸入「作者」、「著作」、「朝代」查詢,是十四冊的個別目錄的合併,僅有二百多列,可作研究初期查詢,只能概略瀏覽十四冊中所包含的內容。適合想要把著作重頭讀到尾的使用者。此外,滑鼠游標在著作上方(出現手指形)點選左鍵,可複製整個內容,如:「清.嵇承咸《書畫續錄》」。


[全書列表]:需要與「文獻索引」配合,知道那個詞條位於那一冊那一頁,進到此資料庫時,於搜尋匡中輸入,即可顯示列表,點選頁碼即可快速跳頁。例如輸入:「1-0800」即代表第一冊的800頁,「10-0560」代表第十冊的560頁。冊和頁碼之間使用「-」減號,頁碼須用四碼。所以,這個資料庫的最重要、最主要的功能,就是提供使用者輸入冊別頁碼。


搜尋匡下方可切換為「筆畫」搜尋,輸入「15」,即檢索出第十四冊中「篇目索引」所有15畫的頁面,在「篇目索引」內容還沒完全數位化完成之前,這樣的應用可以作為替代。

隨機從「蘭石圖」來查詢比較《中國書畫文獻索引》「篇名編」共有12處:

6/692 上 7

6/696 下 13

6/699 下 26

6/799 下 7

6/805 下 23

6/829 下 21

6/858 下 13

6/891 上 26

8/656 上 16

8/679 上 22

12/432 上 14

12/492 上 13


《中國書畫全書.篇目索引》則僅有一處:

六.八五八.下


可知2005年出版的《中國書畫文獻索引》對於《中國書畫全書》的索引整理,應該是比較詳細完整的。



【《中國書畫文獻索引》製作備忘】

編號 筆畫 字頭 備註

33 3 t029-1864-001 作圖形字

466 7 該字為「東」,即「東王迓壽圖」

991 9 原始字形有誤,從「廼」改為「逎」

1284 10 原字形為「其十」,應改為「基」,即「基公塔銘」

2637 13 「缙」應改為「縉」

3042 15 「题」應改為「題」,與編號3606「題」同字。

3113 15 重出

3255 16 重出

3342 16 有二處

3385 16 「縉」應改為「縉」

3437 17 重出

3710 19 原書有誤,非「貝貝目」,應作「譻」

4007 27 重出

4016 29 重出



【小結】

要能好好利用這三合一的資料庫,發揮最有效率的查詢跳頁,使用者自己必須準備好相關檔案,RMP方面有兩種文獻都要配合設定,一是「中國書畫文獻索引」,另一則是中國書畫全書一~十四冊的部份。第一冊檔名設定為「01中國書畫全書」,第二冊則是「02中國書畫全書」,依此類推…。


此外,「Gopage」的定位只能至頁碼,無法更精確的定位到某一行。上下欄位或者行數就需要靠使用者的記憶,如果真的忘了,PDF瀏覽器切換過去瞄一眼,也就好了。


三種資料庫的製作,還是沒辦法完整的呈現《中國書畫全書》,最後一哩路是《中國書畫全書.篇目索引》,考量筆者的時間與成本,希望是用冠名贊助的方式,評估約3萬元新台幣,贊助者基本5000至10000元,最多6人為限。不限個人或團體,贊助者姓名或單位將顯示留存於資料庫。會再另外單獨發文,說明這個計畫,希望能夠成功執行。


例:《中國書畫全書.篇目索引》係王小明、陳美麗、廖添丁、章均亞冠名贊助製作。



【《中國書畫全書.篇目索引》】初步數位化

《中國書畫全書.篇目索引》起訖763至1166頁,共404頁。圈選OCR文字辨識範圍就花了3個多小時,幸好作業時旁邊有小女兒陪伴,一起畫畫又算算數學減法才不覺得枯燥。從404-190開始計算,算到了404-404才離開,留下紙張上密密麻麻的數學算式。




初步OCR整理後約有一萬八千多列。每頁上下欄各有26行,轉換到excel變成52列,校正處理每頁以15分鐘計算,404頁就要6060分,約一百小時左右,一週五天25小時作業的話,則需要四到五星期時間。這是全職、全心投入且最高效率的算法,實際執行起來應該還是有落差。


考量OCR辨識問題,篇目下方的頁碼採取另外輸入的方式,例如:


原始:二十八宿真形圖 一.八三四.下

輸入:二十八宿真形圖 1-834-2


即轉換為數字,冊別、頁碼、上下欄資訊以「-」減號隔開,上下代號各為1和2。如果篇目下方還有小字,則與篇目內容之間以「/」區隔,例如764頁上欄第17行的「二宜園圖/文衡山題」。


完成所有內容的校正之後,再結合目前剛發布的《中國書畫全書》[全書列表],可加上「作者」等其他資訊,視覺呈現與查詢上一定更方便了。


雖然還沒完成,已經能想像出那時後查詢狀況,輸入某某詞,點選頁碼隨即跳至該頁,在「二千餘萬字」的書畫寶庫中「瞬間秒查」!那是多麼令人期待的事?相較紙本得從頭讀到尾,應該能讓研究者比較能接受吧?


書畫藝術是自己藝術創作的主軸與養成根源,長期把精力用在古文字、文字造形的研究與文獻整理,為了讓更多人願意投入研究,不中斷書畫藝術的研究…。《中國書畫全書.篇目索引》的數位化,算是把考察與文獻數位化經驗,用在書畫領域上的一點小小回饋。



















【使用說明】

進入引得市,上方選單「工具書▼」→「專科辭典→「藝術類►」→「中國書畫文獻索引」

輸入網址:http://www.mebag.com/index/zhongguo_shuhua_wenxian/list.asp


進入引得市,上方選單「工具書▼」→「專科辭典→「藝術類►」→「中國書畫全書」

輸入網址:http://www.mebag.com/index/zhongguo_shuhua_quanshu/List.asp



【填寫表單】

Google表單https://forms.gle/ss9TbHtQJDi6N2xm7

騰訊問卷https://wj.qq.com/s2/8216629/4766/


【小額贊助】

如果「引得市」曾經幫助到您、而您想以實際行動支持我們的話,歡迎透過以下小額贊助的方式表達支持與鼓勵。無論金額多少都足夠表達您的一份心意。謝謝!

請點擊這裡→→http://www.mebag.com/index/donate.asp



【《中國書畫文獻索引》弁言】摘錄

為了方便廣大學人對中國書畫文獻的訪查使用,我們在16年前制訂了“三部曲”的龐大出版計劃︰第一部《中國書畫全書》,用完整收錄的方式匯編歷史上曾單獨成書的書畫專著;第二部《中國書畫文獻綜錄》,以文摘匯編的方式搜集散見於其它書籍和存世書畫作品中有關書畫的文字資料;第三部《中國書畫文獻索引》,則在前兩部的基礎上根據現代學術的要求編制分類索引。由於主客觀條件的限制,第一部雖於1999年出齊,第二部卻未能順利展開,於是,現在出版的第三部就僅僅對對《中國書畫全書》而成立了。


  本書共收入《中國書畫全書》關鍵詞573,276條,分別厘定為人名編、篇名編、術語編三大部分,其中人名編計365,093條,篇名編計171,,284條,術語統計36,899條。每一條關鍵詞都表明其所在的冊數、頁數、上下欄、行數情況。例如查篇名“七佛圖”,可見“1/139上23”、“2/76上22”、“8/616下3”、“14/293下10”諸條,即分別為1冊139頁上欄23行、2冊76頁上欄22行、8冊616頁下欄3行、14冊293頁下欄10頁。


關鍵詞如在同一頁同一欄中出現多次時,看是否在同一段落內,如是,則只錄一次,如換段,則再錄,如換欄,則不論是否在同一段落內,都另行錄。如某關鍵詞跨行時,則所標行數以前行為準。


同一關鍵詞由於出自不同的書籍,或者由於版本、校對等原因而出現不統一的情況,除了明顯的錯誤在入錄索引時加以糾正統一,如“吳萊"、“吳菜",一律統一為“吳萊",其他都以尊重原文爲原則,如“趙嵒",既保留“趙嵒"又保留“趙嵓"和“趙岩"為三查。“王穀祥",既保留“王榖祥",又保留“王榖祥",為二査。

人名編、篇名編、術語編索引關鍵詞的具體査閲方式略有不同,分別說明如下:


人名編

人名編涵蓋(中國書畫全書》中所有書畫家及與書畫文物活動有關者的姓名、字號、別名、謚號等。凡單名不錄,如“王蒙",出現“蒙"字時,則不錄,出現“王蒙"、“叔明",則錄。凡人名中出現身份、頭銜、職位等稱謂時,則簡括之。如:


董玄宰 董太史玄宰 5冊1158 頁上欄15行 汪砢玉《珊瑚網》

項元汴 項太學元汴 5冊1001 頁上欄7行 汪砢玉《珊瑚網》


篇名編

篇名編涵蓋《中國書畫全書》中有關的書畫作品、詩文題跋、書學畫學著述等。凡出現過長的篇名時,則取前幾字加以簡括。如:

吳縣鄉三老顧子明求送 吳縣鄉三老顧子明求送前縣尹張君德常改除嘉定州同知詩西


術語編

術語編涵蓋《中國書畫全書》中有關風格、技法、品評、流派等各種專業術語。如書畫風格術語:

燕家景致 11冊196頁上欄8行 彭蘊燦《歷代畫史彙傳》


本索引的編撰旨在從多個角度為讀者提供查閱原文的線索,因此,對歷代書畫文獻中所涉及的各類關鍵詞畫可能多予錄入。這項工作是浩繁而艱巨的。由於古代書畫文獻在歷代傳抄、翻刻過程中的訛誤以及《中國書畫全書》排印中的疏漏,加之本索引的編撰人手眾多,歷時久長,因此闕遺紕繆所難免,尚祈讀者批評指教,裨資補充修正。


【《中國書畫全書》後記】


《中國書畫全書》自一九八七年開始編纂,在全體編纂人員的共同努力下,於一九九九年完成,共計十四冊二千餘萬字。全書除了保留專用名中的大量異體字,以繁體直行形式排印,盡可能地體現入選典籍的原生態之外,還特地採用了鉛字活版印刷方式。在印刷技術日新月異的今天,這也許更能顯示其濃厚的傳統文化品味。

本書編纂過程中,上海圖書館陳先行、復旦大學吳格兩位先生在體例、資料、點校等方面始終予以熱情支持;潘景鄭、顧廷龍、謝稚柳、張政平等先生,以耋耋之年積極參與了審讀工作;參加點校整理工作的宗玄、楊靜、王慶元、吳永坤、金文明、梁穎、鄭明等眾多專家學者勤奮嚴謹的治學精神,一絲不苟的工作態度,都為本書的編纂,出版作出了卓越的貢獻。上海師大印刷廠和港東印刷廠茅瑛等同志,不計功利支持學術著作的印製,亦屬難能可貴,令人欽佩。

國家圖書館、上海圖書館、浙江、四川、陝西、福建、湖北等省級圖書館、北京大學、復旦大學、南京大學、華東師大、上海師大、武漢大學、東北師大、中央美院、中國美院等高校圖書館,以及上海博物館、臺灣中央圖書館、美國大都會圖書館等眾多海內外專業單位,在資料搜集上給予了有力的支持,此書底成,顧助甚多。

值此《中國書畫全書》付梓之際,謹向上述為此書作出貢獻的個人和單位,一併致

以深切謝忱!


中圖書畫全書編纂委員會


【延伸閱讀】

PDF檔案跳頁連結 以「中國書畫文獻索引」為例

https://www.youtube.com/watch?v=EwQyvEW7Ico






















---

盧輔聖:《中國書畫文獻索引》(上下冊),上海:上海書畫出版社,2005年12月。
ISBN:7-80672-463-X
中國書畫全書編纂委員會:《中國書畫全書》(一~十四冊),上海:上海書畫出版社,1993年10月。
ISBN:7-80512-363-2/J.295


沒有留言:

張貼留言

20220429《新華大字典》(第3版.彩色本)索引數位化完成

 20220429《新華大字典》(第3版.彩色本)索引數位化完成 知乎: https://zhuanlan.zhihu.com/p/507157904 【資料庫訂閱制】 20210903「語文辭典」2021.9.6(一)實施訂閱制 Blog: https://ebag2007.b...