2024年5月20日 星期一

20180125《日本語文型辭典》索引數位化完成

 20180125《日本語文型辭典》索引數位化完成

https://ebag.tian.yam.com/posts/215006334

原始文章貼天空部落格,已關站多年

知乎:https://zhuanlan.zhihu.com/p/33303009


此書約在2009年購買,不久就數位化建檔以方便瀏覽使用,近日查詢比較頻繁,便決定用OCR軟體將索引部份處理成文字檔,再比對原書校正。本來認為很快就可以上線,但是,資料庫卻一直出現錯誤訊息...。


原來是「部份文字」存在一些資料庫不允許執行的內容。看起來一樣的字,在重新輸入後,似乎就可以正確的執行。在4233筆資料中,以每次500→300→200→100→50→30列,依序逐列檢查。花費幾個小時,「抓蟲」的時間還比製作索引的時間多了好幾倍。幸好,最後還是可以正常的上線使用。


《日本語文型辭典》「索引分類」有三種,因為分類的關係,同樣一筆資料可能會出現兩次,例如:「にたりない」在「50音順索引」與「末尾語逆引き索引」各有一次。字詞不重複的實際內容約2207筆。


「50音順索引」:「F~Z,あ~ん」有51種。

「末尾語逆引き索引」:「ある~ば」有17種。

「意味機能別項目索引」:「言い換え~話題転換」有114種。

以上共有182種。


書後的索引分成三個部份,有:「50音順索引(863-871頁)、末尾語逆引き索引(873-879頁)、意味機能別項目索引(881-891頁)」等。原來的「意味機能別項目索引」並沒有頁碼,為了更好使用,筆者依照日文內容逐列補上了頁碼。


第一次不知道從何找起的朋友,可以先點選「意味機能別項目索引」列表看看,然後回到檢索列中選擇「項目」,例如輸入:「期間」,就可以看到有關於「期間」的所有字詞及其頁碼。滑鼠點選列表中「文字」的其中一列,就有複製該列內容的效果。使用者可以先大致瀏覽,然後利用這個功能再來細部檢索(省去重新輸入日文的步驟)。在筆者檢索的過程中,發現紙本的頁碼有時候會有1頁的誤差,若與實際內容有出入,請再提醒筆者修正。


最後還要提醒朋友,這個檢索一樣也支持「開卷助理」(Gopage)的使用,想要了解如何使用「開卷助理」,請參考過去的相關教學內容。



※原先字詞與字詞間空白間隔的部份,我們用「-」符號替代。



【使用方式】

進入「引得市」(www.mebag.com/index)點選:「⑪辭典」→「辭典2」的選單項目「日本語文型辭典」中即可查詢。

進入「引得市」→上方選單→工具書→專科辭典→語言纇→日本語文型辭典


合作提案(並非限於商業,任何形式的交流都很歡迎)

https://hackmd.io/s/HJ_qFWLNx


《日本語文型辭典》索引與「開卷助理」應用結合示範:

https://youtu.be/0b71b1lvw-k


【學術交流】


※關於「引得市」的各種查詢應用,網路上的教學影片或文章介紹的不多,因此,很多教授與研究者可能還不熟悉,像是「開卷助理如何用」、「電腦缺字」、「古文字輸入法的使用」等問題,筆者都很樂意詳細解說,只要時間允許,都歡迎個人或學校機關團體私訊或留言約時間地點,公開來討論交流。


汉字科普网站推荐(八)—— 引得市(周旭 撰)

https://zhuanlan.zhihu.com/p/32516713


建立「開卷助理」新的RMP檔step by step教學

http://ebag.tian.yam.com/posts/198556201


一分鐘學會1秒查字典(引得市:查字最快的方式)

http://ebag.tian.yam.com/posts/198539727













グループ・ジャマシイ、徐一平(翻譯):《日本語文型辭典》(繁體字版),東京:くろしお出版,2008年9月(第13刷)。

ISBN:978-4-87424-23 9・1


50音順索引(863-871)

末尾語逆引き索引(873-879)

意味機能別項目索引(881-891

沒有留言:

張貼留言

「引得市」再度被學術期刊介紹

「引得市」再度被學術期刊介紹 知乎: https://zhuanlan.zhihu.com/p/8575990952 昨天搜尋「引得市」發現了山田崇仁先生寫的這篇文章。  台湾の陳信良氏が作成・運営する漢字・文献の検索サービス「引得市 index(https://www.meba...