2021年12月25日 星期六

20211225《殷墟甲骨文辭類編》索引數位化完成

 20211225《殷墟甲骨文辭類編》索引數位化完成




知乎:https://zhuanlan.zhihu.com/p/449820728


【資料庫訂閱制】

20210903「語文辭典」2021.9.6(一)實施訂閱制

Blog:https://ebag2007.blogspot.com/2021/09/20210903202196.html

知乎:https://zhuanlan.zhihu.com/p/406542561

支付訂閱費用方法管道與「捐贈方式」相同。另須截圖回傳告知,信箱為:index2012.7@gmail.com




【製作說明】

索引內容是筆者根據第十冊「釋文筆畫檢字表(13280-13304)」所製作,OCR之後,逐一對照校正,再補上「合文」、「數字相關」、「月名時間」、「動物」、「地名處所」、「田獵」、「祭祀」、「雨風」、「其他」等九個項目的字頭內容。大約新造90多個新缺字。頁碼欄位中「4_04638」,表示第四冊4638頁,如果設定好「RMP」,點選就可以正常連結開啟。(設定方式見後說明)



字列 3031

缺字 701

總字列 3732


《殷墟甲骨文辭類編》圖形字代號:t037


【補記】

如果有時間,或許可以像《甲骨文詞譜》、《甲骨文字形表(增訂版)》一樣,另外做成

「自然分類部首表」,提供連接跳頁的查詢檢索。


20171115《甲骨文詞譜》(共五冊)筆畫索引數位化完成

Blog:https://ebag2007.blogspot.com/2017/11/20171115.html

知乎:https://zhuanlan.zhihu.com/p/54136045


20210906《甲骨文字形表(增訂版)》索引數位化完成

Blog:https://ebag2007.blogspot.com/2021/09/20210906_78.html

知乎:https://zhuanlan.zhihu.com/p/407597325




【大聲疾呼.寒冬送暖】

整個十二月都在處理這份索引,是繼《出土戰國文獻字詞集釋》之後,又一龐大複雜的索引製作,今年筆者將心力全部投入在「引得市」的索引製作,因此經濟收入也只有依靠訂閱戶的費用。過去,我們開放斗內讓大家支持,今年九月起,我們採用訂閱方式讓使用者用這個方式來支持。九月至十月曾帶起一波訂閱人數。


冬至剛過,筆者所居住的高雄,直接從炎熱的天氣進入有感的低溫,近二個月也是訂閱的新低點,十二月二個星期之中,訂閱者只有一、二人。這樣的狀況讓筆者相當擔心往後的收入問題…。自己好像是賣火柴小女孩,點著火柴取暖,火柴一根根的燃燒殆盡…。


一份索引花費近一個月的時間製作處理,如果成本是4萬元新台幣,平均讓600人分擔的話,每人約66.66元。也就是一杯咖啡的錢,也近乎「引得市」年訂閱中一個月的訂閱費用。何況目前主站已經提供了300種文獻索引,以及高達2.1萬字的缺字庫作為查詢。內容可說是物超所值,目前似乎也沒有相近以及可以取代的學術平台。


藉索引的發布開箱宣傳一下,如果您已經是訂閱戶,請持續為我們推廣「引得市」,很迫切需要開發新的訂戶。目前為止,訂戶的約600人左右,每天平均200多人在線使用。現有訂戶即是「引得市」最佳的代言人,讓更多新血加入,活絡這個訂閱使用模式,若人人都可以幫忙宣傳推廣,相信明年中旬就可以突破千人,讓訂戶再向上提昇。訂閱戶越多,聚合與影響力就會更大。


請持續推廣「引得市」 麻煩各位師長朋友 感謝


引得市創辦人 陳信良

2021.12.25







【《殷墟甲骨文辭類編》字號、頁碼起訖】

第一冊:字號:0001-0787

第二冊:字號:0788-1043

第三冊:字號:1044-1366

第四冊:字號:1367-2271

第五冊:字號:2272-2963

第六冊:字號:2964-3317

第七冊:字號:3318-3707

第八冊:字號:3708-3891

第九冊:字號:3892-4149


第一冊:頁碼起訖:0001~1417頁

第二冊:頁碼起訖:1418~2855頁

第三冊:頁碼起訖:2856~4404頁

第四冊:頁碼起訖:4405~5809頁

第五冊:頁碼起訖:5810~7220頁

第六冊:頁碼起訖:7221~8630頁

第七冊:頁碼起訖:8631~9933頁

第八冊:頁碼起訖:9934~11455頁

第九冊:頁碼起訖:11456~12815頁

第十冊:頁碼起訖:12816~13329頁


★★★【RMP設定提醒】★★★

這次製作的索引共有十冊,每卷紙本的頁碼是連續的,而作為電子擋PDF的連接對應,必先有一個前製作業,相較一般RMP的設定可能有點複雜。不過,依照我們的說明,實際製作幾次,應該就可以理解。


因為是連續的內容,分成不同冊,所以我們需要將不同的冊別,設定成獨立RMP,請使用者先建立這幾個RMP擋(第十冊無字頭索引,無須製作RMP檔案):

殷墟甲骨文辭類編1.rmp

殷墟甲骨文辭類編2.rmp

殷墟甲骨文辭類編3.rmp

殷墟甲骨文辭類編4.rmp

殷墟甲骨文辭類編5.rmp

殷墟甲骨文辭類編6.rmp

殷墟甲骨文辭類編7.rmp

殷墟甲骨文辭類編8.rmp

殷墟甲骨文辭類編9.rmp


【各冊頁差設定說明】

例如,第二冊的主頁紙本上開始的頁碼是1418,若PDF檔第五個頁面是主頁,1418-5=1413,將「RMP」頁差設定成:-1413@…(…表示後面是使用者PDF檔案路徑與檔名)


例如,第三冊的主頁紙本上開始的頁碼是2856,若PDF檔第五個頁面是主頁,2856-5=2851,將「RMP」頁差設定成:-2851@…(…表示後面是使用者PDF檔案路徑與檔名)


例如,第四冊的主頁紙本上開始的頁碼是4405,若PDF檔第五個頁面是主頁,4405-5=4400,將「RMP」頁差設定成:-4400@…(…表示後面是使用者PDF檔案路徑與檔名)



※溫馨提醒

如果有使用「部件檢索」覺得很慢的朋友,是因為資料多,檔案稍大的原因,一直顯示「字庫加載中,請耐心等待」,就真的需要耐心等待。瑾昀兄建議:「初次使用部件檢索的人,建議打開網頁後,先去泡杯咖啡喝,等咖啡喝好了應該就加載出來了。」不過加載一次之後,接下來來使用應該就會快了。



【字形隸定差異備忘】

書中「㿝卩」即「皀人」


【校正修改備忘】

字頭 冊別_頁碼 構字式 修改備忘

𪪶 3_02916 「帝𠬞」改「𪪶」

s030-603 3_03043 未口攵,未呚 未口攵改未口攵

s115-063 4_04757 人秝,𠆢秝,𠆢禾禾,人禾禾 「入秝」改「𠆢秝」

s008-030 5_06259 永𩫏,永亠口日口十,永亯口十,永𬴘 「𩫏永」改「永𩫏」

s040-290 5_06474 宀𢌿,宀田廾 「宀甶廾」改「宀𢌿口」

s030-169 5_06625 𢌿口,田廾口 「甶廾口」改「𢌿口」

𬇾 5_07039 永克 「克永」改「永克」

s040-039 6_08382 宀鼓 「冖鼓」改「宀鼓」

s001-044(𫠨) 7_09183 𠃊𠂤二,𠃊𠂤一一 原「𠃊𠂤一」改「𠃊𠂤二」

s070-098 7_09204 方人丮𠂤冉,方𠂉丮𠂤冉,㫃丮𠂤冉 「𭤨亻𠂤𠇦」改「𭤨丮𠂤冉」


釋文筆畫檢字表【說明】

凡右上角加符號者為未列為字頭的重文,其中“☆"表示其甲骨文與此字為異體或同形字,“★"表示其甲骨文讀同或用同此字,“△"表示其甲骨文為此字初文。


【《殷墟甲骨文辭類編》前言】摘錄

《殷墟甲骨文辭類編》是一部匯集並釋讀全部已經著錄的殷墟甲骨文文辭,按字頭編排,以原文與釋文相對照的方式編纂的文本引得類工具書。

以往的此類工具書主要有兩種:一是出版於1967年,由日本島邦男先生編的《殷墟卜辭綜類》(以下簡稱《綜類》);二是出版於1989年,由姚孝遂、肖丁先生主編的《殷墟甲骨刻辭類纂》(以下簡稱《類纂》)。這兩種工具書出版後,由於極便査檢利用,向來爲甲骨文研究者的案頭必備書,對推動甲骨學廣泛而深入的研究起到了積極的作用。


《綜類》出版22年後而有《類纂》,而後者出版至今也已逾30年了。30多年來,無論是甲骨文新材料的發佈及舊材料的重新整理出版,還是甲骨文釋字的新成果與文辭釋讀的校訂,抑或是甲骨片的重新綴合與新字形的不斷發現等,較之以往皆有了長足的進步。這些新的材料與成果,亟須有一部新的引得類工具書將其整理匯纂成編,纔便於人們査檢利用。


因爲硏究工作的需要,我從1998年便開始了甲骨文文本的系統整理與數字化工作,至2003年底,大致建成了《甲骨文合集》的釋文語料庫。2004年的博士學位論文《甲骨文詞義研究》,便是在這一語料庫的基礎上完成的。博士畢業後回到浙江師範大學,教學之餘,我將大部分時間繼績投入到這一工作中。2008年我赴東京從事博士後合作研究,用不受任何干擾的兩整年時間,全身心投入到甲骨文文本的整理與數字化工作中,進行系統的釋讀整理,製作了甲骨文原文與釋文的矢量字體,錄入了當時能見到的全部甲骨文著錄材料中的文本。到2010年赴日合作課題結束後,在綫裝書局出版了《殷墟甲骨文摹釋全編》(全十冊。以下簡稱《全編》),這便是此項工作的最終成果。


由於編纂與出版的時間太過緊張,《全編》留下了一些遺憾。2010年,我承擔了國家社科基金項目“《甲骨文引得》編纂及其數據庫建設”,對原有成果進一步加以完善,主要做了以下五項工作。一是有計劃地將《全編》已錄入的甲骨文文辭逐片逐條重新進行了校訂,改正了一些釋讀有欠準確的條目;對部分字形重新造字,新造的甲骨文原文字形增加到近14000個,這樣與拓片上的甲骨文字形就基本上能夠一一對應了。二是對《全編》編成之後新發表的著錄材料進行釋讀與錄入,當然更少不了新造字。三是整理已綴合的甲骨片文辭,離析誤綴的甲骨片,繼續剔除重片。四是及時吸納甲骨文釋讀的新成果,調整字形總表與釋文。五是對辭條標注組類屬性。項目於2014年結題,並獲得了優秀結題等級。此後的幾年中,在繼續完善上述工作的同時,我也一直在尋找一家能夠出版此類工具書的出版社,希望早一些讓項目成果面世,以便學界利用。


2017年仲夏,經張涌泉先生介紹,我開始與四川辭書出版社的王祝英總編輯聯繫書稿的出版事宜。在看了我的書稿編纂計劃和樣稿後,出版社決定將《殷墟甲骨文辭類編》(以下簡稱《類編》)一書列入出版規劃,申報了2018年國家出版基金項目,並獲立項。此後,我與出版社多次就書稿的編纂內容與體例進行了商討,同時也徵求了部分專家的意見,進一步完善了編纂體例。在《類編》行將付梓之際,謹將具體編纂情況作一些説明。



【《殷墟甲骨文辭類編》凡例】

以下內容暫以「⊕」表示原始圖形字

本書是一部匯集並釋讀全部巳經著錄的殷墟甲骨文文辭,按字頭編排,以原文與釋文相對照的方式編纂的文本引得類工具書。本書共收錄了自《甲骨文合集》出版以來的37種殷墟甲骨文著錄材料與5種緩合材料。著錄類材料按其原著錄編號先後丹序排列並用拼音字母代稱,如“H00002"指《甲骨文合集》第2片;綴合類材料一般不單獨收錄,仍歸到原著錄材科書的某一片中,少數未著錄的綴合片則依繳合書作者自編片號收錄。所收錄材科的具體情況參見本書前言,出處與代稱見《所收甲骨文著錄材料代稱、出虞表》。


2.本書共分十冊,正文分編乃九冊,附錄與索引編為一冊。正文部分,字詞頭以按部首繫屬的字詞總表為序,同一字詞頭下的文辭按辭目為類編纂,每一條文辭均分片號、原文、釋文與組類四欄收錄。為方便檢索的需要,同一字頭下的同一條卜辭因不同的分類可能被歸入不同的辭目。附錄分為4種:《〈類編〉甲骨文重片與被綴合片整理情況總表》《〈類編〉未收錄“二告"“小告"等片號表》《〈類編〉未收錄“兆序"“殘字"等片號表》《〈類編〉所錄甲骨綴合片號總表》。索引分為3種:《字詞總表與辭目檢索》《釋文筆晝檢字表》《釋文拼音檢字表》。


3.字詞頭由編號、原甲骨文、釋文三部分結成。編號依據對字頭的整理而定,字頭的分合詳見本書前言,單字編號從0001至3909,合文編號從3910至4149。原甲骨文,列出本書提取的全部不同形態與構形的原文字形。釋文,附注拼音及用字情況。已釋字皆附注拼音,僅注其與甲骨文辭相關的參考讀音,如[2494]號“叜"字同“叟",同“搜”字初文,僅注sōu音,不注sǒu音;未釋字能夠隸定則列出隸定字(同一字頭下因原文構形相異而有不同的隸定字形),不能隸定的則不再列出原文。用字情況主要有三種:一是“同×",包括異體字、同形字與古今字中的今區別字三類,如[0113]號“伷"字附注“同胄"表示為異體字,[0450]號“女"字附注“又同母"表示启同形字,[0246]號“立"字附注“同位/涖"表示乃今區別字;二是“×之初文",如[0041]號“亟”字附注“極之初文"表示“亟”為“極"的初文;三是“又讀×",表示假借與通假,如[1250]號“白"字附注“又讀伯”,表示“白”,又為“伯”的假借字,[2228]號“魚”字附注“又讀漁/魯”,表示“魚"又通假乃“漁”“魯”。


4.辭目從具體文辭中提取,原則上具有相同語詞達到三條以上纔提取,但一些重要的專名,如“子名"“婦名"等,即便是僅有一條文辭亦加以提取。為了儘可能不遺漏相關辭條,同一辭目所繫屬的辭條,除特定專名外,一般名詞、動詞短語及其他結構等不追求嚴格對應。如:[0001]號“人"字中辭目“衆人"為一般名詞,除包括“衆人"之辭外,翌包含“衆……人"之辭;“羌/羗人"實際上是“名十數量詞"結構,包含“羌/羗+數詞+人”的全部辭條;“歸人"為動詞結構,包含“歸人”“人歸”“歸……人”等辭條。辭目一般依專名、動詞結構、偏正結構、介賓結構、數名結構、貞人等的先後次序排列。未能列入具體辭目的辭條與殘辭列為“其他”類,其中有部分殘辭也可能被列入其具體辭目。部分特殊辭目加以括注,如“厀人(時間詞)"“余一人(代詞)"等。部分專名辭目由於辭例大少,不足以完全確定,右加“?"號為記。


5.本書收錄全部甲骨文文本,不採用節錄的方式,即使是“貞”“卜"“王"等大量出現的辭例也不節錄。為避免大量重複,本書採用了辭目互相參見的方式。辭目首見於前面字頭的,在後出的字頭中重見時,不再出具體文辭,僅在辭目後括注見其先出的字號、字頭。


6.凡重片,僅錄其中一片之文辭,其餘則標明重見片號。若清晰程度相同,一律於後出之片號後標明其前出之重片號,如“H01017(H00933)";若清晰程度不同,一律於較不清晰之片號後標明其重片號,如“H01013(H19795)";若完全相同,僅標明片號;若大小不同,則於其大者片號前標以“<"(小於)記號,如“H01379(<H04917)"。本書重片的整理情況可從附錄《〈類編〉甲骨文重片與被綴合片整理情況總表》中查檢。


7.凡綴合片,於其片號後標以“*"記號;凡綴於他片者,則於其後注明其所綴合片號(仍以“*"號為記)。如“H0000l*"表示綴合片,“D00557(H00001*)"表示被綴合片。原著錄之誤綴片,本書做了文本離析工作,於其片號後標大寫字母“A""B"為記。如“H04510A""H04510B"。本書綴合片的整理情況可從附錄《〈類編〉所錄甲骨綴合片號總表》中查檢。


8.原文與釋文中,凡所缺字可能為一個字時,以“□"代替;凡所缺字可能不止一個時,以“…"代替;據殘字或辭例可以補足的字,皆外加“[]"號為記;可見但未能據以補足的殘字也以“□"代替,部分通假字、同形字等用字或在本字後以“()"加以括注;少部分因拓圖不清晰而釋讀可能有問題的字標注“?"為記;部分兩個字符記錄一詞以“{}"加以括

注。


9.“二告"“小告"“吉”“茲用"等兆辭皆空一格歸於其卜辭後,不能歸附的則單列,單列的“二告"“小告"“大吉"“吉”僅出片號。具體參見附錄《〈類編〉未收錄“二告”“小告"等片號表》。兆序數字則一律不錄;非干支習刻一般照錄,但干支譜或干支習刻一般不錄,僅於其片號後注明“干支"或“干支習刻”;僞片或部分僞刻皆於其片號後予以注明。具體參見附錄《〈類編〉未收錄“兆序"“殘字"等片號表》。


10.釋文中,已識之字原則上釋以本字,但當用字確定時,則釋以用字;未識之字能夠隸定者釋以隸定字,不能隸定者則出以原文;同形字分別以所釋字釋出,如⊕(卜)與⊕(外);用例較多的假借字徑以本字釋之,如“⊕"本“鳳”字,多借用為“風",用例少者於其原釋文後括注用字;凡合文,其釋文皆分書之;凡一字兩用者,如“⊕+⊕”(即“大甲甲申”)等,皆依其所讀釋出;凡誤刻者,一般以其正字釋出。釋文一般用通用的規範字形,但當舊字形與甲骨文原文所隸定之形較為吻合時則用舊字形,如“⊕"釋文作“爭"不作“争"、“⊕"釋文作“溫"不作“温"、“⊕"釋文作“兌"不作“兑"、“⊕”釋文作“內”不作“内"等。


11.本書對同屬一條文辭的正面與反面文辭,凡可確定者,巳作了文辭的合併整理,凡片號中標為“正反"者為進行了合併整理的辭條。一片之中各文辭的排列次序,有兆序者,依兆序為序;有干支記日者,一般依干支為序;無干支者,則以其所刻位置丹序,龜板一般自右往左、自上而下,骨板一般自下而上;凡對貞卜辭,一般正面貞卜在前,反面貞卜在後,排序有時也會根據貞卜內容而做出調整。


12.本書標注了大部分文辭的組類情況,僅有少部分殘辭及不能確定者及有標注。組類標注及其大體分期的具體情況參見本書前言。



【使用說明】

進入引得市,上方選單「工具書▼」→「語文辭典」

或輸入網址:https://www.mebag.com/index/main/list.asp


【延伸閱讀】

20211016《出土戰國文獻字詞集釋》(共十五卷)索引數位化完成

Blog:https://ebag2007.blogspot.com/2021/10/20211016.html

知乎:https://zhuanlan.zhihu.com/p/422186370



---

陳年福:《殷墟甲骨文辭類編》(全十冊),成都:四川辭書出版社,2021年9月。

ISBN:978-7-5579-0897-3

沒有留言:

張貼留言

20240422《中國語言學大辭典》分類詞目表索引數位化完成

 20240422《中國語言學大辭典》分類詞目表索引數位化完成 知乎: https://zhuanlan.zhihu.com/p/693938707 【製作說明】 這本書在33年前出版,正在看這篇文章的朋友可能都還沒出生?1991年那時候我在作什麼呢?就讀專科學校(美術工藝科),...