20180125《日本語文型辭典》索引數位化完成
https://ebag.tian.yam.com/posts/215006334
原始文章貼天空部落格,已關站多年
知乎:https://zhuanlan.zhihu.com/p/33303009
此書約在2009年購買,不久就數位化建檔以方便瀏覽使用,近日查詢比較頻繁,便決定用OCR軟體將索引部份處理成文字檔,再比對原書校正。本來認為很快就可以上線,但是,資料庫卻一直出現錯誤訊息...。
原來是「部份文字」存在一些資料庫不允許執行的內容。看起來一樣的字,在重新輸入後,似乎就可以正確的執行。在4233筆資料中,以每次500→300→200→100→50→30列,依序逐列檢查。花費幾個小時,「抓蟲」的時間還比製作索引的時間多了好幾倍。幸好,最後還是可以正常的上線使用。
《日本語文型辭典》「索引分類」有三種,因為分類的關係,同樣一筆資料可能會出現兩次,例如:「にたりない」在「50音順索引」與「末尾語逆引き索引」各有一次。字詞不重複的實際內容約2207筆。
「50音順索引」:「F~Z,あ~ん」有51種。
「末尾語逆引き索引」:「ある~ば」有17種。
「意味機能別項目索引」:「言い換え~話題転換」有114種。
以上共有182種。
書後的索引分成三個部份,有:「50音順索引(863-871頁)、末尾語逆引き索引(873-879頁)、意味機能別項目索引(881-891頁)」等。原來的「意味機能別項目索引」並沒有頁碼,為了更好使用,筆者依照日文內容逐列補上了頁碼。
第一次不知道從何找起的朋友,可以先點選「意味機能別項目索引」列表看看,然後回到檢索列中選擇「項目」,例如輸入:「期間」,就可以看到有關於「期間」的所有字詞及其頁碼。滑鼠點選列表中「文字」的其中一列,就有複製該列內容的效果。使用者可以先大致瀏覽,然後利用這個功能再來細部檢索(省去重新輸入日文的步驟)。在筆者檢索的過程中,發現紙本的頁碼有時候會有1頁的誤差,若與實際內容有出入,請再提醒筆者修正。
最後還要提醒朋友,這個檢索一樣也支持「開卷助理」(Gopage)的使用,想要了解如何使用「開卷助理」,請參考過去的相關教學內容。
※原先字詞與字詞間空白間隔的部份,我們用「-」符號替代。
【使用方式】
進入「引得市」(www.mebag.com/index)點選:「⑪辭典」→「辭典2」的選單項目「日本語文型辭典」中即可查詢。
進入「引得市」→上方選單→工具書→專科辭典→語言纇→日本語文型辭典
合作提案(並非限於商業,任何形式的交流都很歡迎)
《日本語文型辭典》索引與「開卷助理」應用結合示範:
【學術交流】
※關於「引得市」的各種查詢應用,網路上的教學影片或文章介紹的不多,因此,很多教授與研究者可能還不熟悉,像是「開卷助理如何用」、「電腦缺字」、「古文字輸入法的使用」等問題,筆者都很樂意詳細解說,只要時間允許,都歡迎個人或學校機關團體私訊或留言約時間地點,公開來討論交流。
汉字科普网站推荐(八)—— 引得市(周旭 撰)
https://zhuanlan.zhihu.com/p/32516713
建立「開卷助理」新的RMP檔step by step教學
http://ebag.tian.yam.com/posts/198556201
一分鐘學會1秒查字典(引得市:查字最快的方式)
http://ebag.tian.yam.com/posts/198539727
グループ・ジャマシイ、徐一平(翻譯):《日本語文型辭典》(繁體字版),東京:くろしお出版,2008年9月(第13刷)。
ISBN:978-4-87424-23 9・1
50音順索引(863-871)
末尾語逆引き索引(873-879)
意味機能別項目索引(881-891
沒有留言:
張貼留言