2026年1月9日 星期五

眾裡尋他千百度:Right PDF Reader —— 數位人文工作流的唯一倖存者

眾裡尋他千百度:Right PDF Reader —— 數位人文工作流的唯一倖存者


此篇內容是我和「節墨吏」找了好幾個晚上,測試的結果,請它用1600字寫出來





—— 兼論 PDF 底層技術與學術需求的鴻溝

作者:阿良人(引得市創辦人) 日期:2026年1月9日

前言:迷霧中的幾個夜晚

在建構「引得市」資料庫的過程中,我們確立了一套嚴謹的數位化標準作業程序(SOP):從掃描、OCR、到使用「PDF補丁丁」進行底層結構的修復。然而,在最後一哩路——即「使用者端」的閱讀與書籤編輯工具上,我卻遭遇了意想不到的滑鐵盧。

為了尋找一款能同時滿足**「免費」「可編輯書籤」「正確支援邏輯頁碼」**的軟體,我耗費了數個夜晚,下載了市面上幾乎所有叫得出名字的 PDF 閱讀器。經歷了無數次的安裝、測試、失望與移除,最終在絕望邊緣發現了唯一的倖存者——Right PDF Reader(前身為 Gaaiho 文電通)。

這不僅是一次軟體海選,更揭示了當前軟體生態中,技術妥協與學術嚴謹性之間的巨大落差。

第一章:三大核心需求的不可妥協性

為什麼找一個軟體這麼難?因為這三個條件看似簡單,實則在技術與商業邏輯上充滿了矛盾。

1. 支援由「PDF補丁丁」修改的「頁面標籤」(Page Labels)

這是學術研究的靈魂。 一本學術著作,其「物理上的第1頁」通常是封面,接著是羅馬數字編碼的序言(i, ii, iii...),真正的「正文第1頁」可能位於檔案的第20或30頁。 透過老牌神器「PDF補丁丁」,我們能在檔案底層寫入標準的 PageLabels 字典,告訴閱讀器:「檔案第23頁叫做 Page 1」。 若軟體不支援此功能,使用者輸入「1」卻跳到封面,或者引用時看到的是「第23頁」而非「第1頁」,這在學術引用(Citation)上是完全不合格的。

2. 自由編輯書籤(Bookmarks)

這是知識的結構化。 數位典藏不只是掃描圖片,更需要建立詳細的目錄索引。研究者在閱讀過程中,需要隨時新增、修改、調整書籤層級。如果軟體只能「讀」不能「改」,那它就只是一個被動的顯示器,而非主動的研究工具。

3. 免費(Free / Freeware)

這是推廣的基礎。 「引得市」的使用者包含大量學生與獨立研究者。若推薦的標準工具需要昂貴的訂閱費(如 Adobe Acrobat Pro),將大幅墊高數位人文研究的門檻。

第二章:為何眾多軟體全軍覆沒?——技術視角的剖析

在測試過程中,我發現市面上的 PDF 軟體呈現兩極化的「技術斷層」。這也是為什麼我繞了一大圈,卻發現大部分軟體都無法使用的根本原因。

1. 輕量化引擎的代價:PDFgear、Chrome、Edge

測試結果:失敗。無法顯示邏輯頁碼。 技術評論: 近年來湧現許多標榜「極速」、「輕量」、「AI輔助」的 PDF 軟體(如 PDFgear)。它們大多基於 Google 開源的 PDFium 渲染引擎或類似的 Web 技術。 這些引擎的設計初衷是為了「快速顯示內容」,因此它們傾向於直接讀取檔案的物理頁序(Physical Index),而忽略了 PDF ISO 標準中較為複雜的元數據結構——即 PageLabels 字典檔。 對於這些軟體而言,PDF 只是一疊按順序排列的圖片,它們「看不懂」PDF補丁丁精心寫入的邏輯標籤。這就是為什麼無論怎麼設定,它們永遠顯示「第 1 / 300 頁」的原因。

2. 商業策略的閹割:Foxit Reader

測試結果:失敗。無法編輯書籤。 技術評論: Foxit 擁有與 Adobe 同級的強大自主引擎,因此它能完美讀取並顯示「邏輯頁碼」。然而,問題出在商業模式。為了區隔免費版與付費版(Editor),Foxit 在免費的 Reader 版本中鎖住了書籤編輯面板。你看得到書籤,卻改不了它。這是商業邏輯對功能的刻意閹割。

3. 時代的眼淚:JPdfBookmarks

測試結果:失敗。效能低落、亂碼。 技術評論: 這類基於 Java 開發的老軟體,雖然忠實遵循 PDF 標準(支援頁碼與書籤),但在處理現代高解析度古籍掃描檔(往往數百 MB)時,記憶體管理效率極差。加上對中文字型(CJK)編碼支援的不穩定,導致開啟卡頓、文字亂碼,完全無法滿足現代操作體驗。

第三章:唯一的倖存者——Right PDF Reader

在剔除了上述所有選項後,Right PDF Reader 成為了唯一的解答。這款軟體的前身是台灣知名的「文電通(Gaaiho)」,其背後的開發商 Zeon(隸屬台灣) 是全球極少數擁有獨立自主 PDF 核心引擎的廠商之一(與 Adobe、Foxit 齊名,而非使用開源引擎)。

這就是為什麼它能滿足所有條件的關鍵:

1. 核心引擎的勝利(支援頁面標籤)

因為擁有自主研發的專業引擎,Right PDF Reader 嚴格遵循 PDF ISO 32000 標準。當它開啟由「PDF補丁丁」處理過的檔案時,它會優先讀取 Catalog 下的 PageLabels 字典,而非偷懶去讀物理頁碼。 實測:封面顯示為 Cover,序言顯示為 ii,正文準確地從 1 開始。這證明了它與 PDF補丁丁 的完美相容性。

2. 佛心的功能開放(支援書籤編輯)

不同於 Foxit 的鎖定策略,Right PDF Reader 在免費版本中大方地開放了完整的書籤面板

  • 新增/刪除:一鍵完成。

  • 層級調整:支援直覺的滑鼠拖曳(Drag & Drop),可以輕鬆建立「章-節-目」的樹狀結構。

  • 目標設定:可以精確設定點擊書籤後跳轉的頁面與縮放比例。

3. 本土化的優勢

作為源自台灣的開發團隊,它對繁體中文環境的支援是原生的。無論是書籤的中文編碼、還是搜尋中文關鍵字,都不會出現亂碼或漏字的問題。

結論:數位人文研究的標準配備

這次的「軟體大長征」讓我深刻體會到,在數位工具便利的表象下,隱藏著多少技術細節的魔鬼。

PDF補丁丁 是我們在後端處理檔案的「手術刀」,負責底層結構的修復;而 Right PDF Reader 則是前端展示的「櫥窗」,負責將這些結構完美地呈現給使用者。

若沒有 Right PDF Reader,我們辛苦在 PDF補丁丁中設定的羅馬拼音頁碼、精心校對的邏輯頁序,在使用者端都將化為烏有。

因此,我正式將 Right PDF Reader 列為「引得市」與所有數位摹本研究者的標準推薦軟體。它不僅是一個閱讀器,更是連接「古籍數位化」與「現代學術引用」之間,最穩固的那座橋樑。

推薦評級

  • 邏輯頁碼支援:⭐⭐⭐⭐⭐ (完美支援 PDF補丁丁)

  • 書籤編輯能力:⭐⭐⭐⭐⭐ (免費版即全功能)

  • 中文相容性:⭐⭐⭐⭐⭐ (台灣原生開發)

  • 系統資源佔用:⭐⭐⭐⭐ (比 Java 軟體輕快許多)

(完)


### 阿良人博士的私人筆記(補充評論):

這次的尋找過程也提醒了我們,「開源(Open Source)」並不總是萬能藥。在 PDF 這種極度複雜、背負著 30 年歷史包袱的文件格式上,有時候**專業的商業引擎(Proprietary Engine)**反而在標準支援度上做得更好。

而 Right PDF Reader 最難能可貴的,是在擁有商業引擎的實力下,願意以免費形式釋出這些對研究者至關重要的功能

沒有留言:

張貼留言

眾裡尋他千百度:Right PDF Reader —— 數位人文工作流的唯一倖存者

眾裡尋他千百度:Right PDF Reader —— 數位人文工作流的唯一倖存者 知乎: https://zhuanlan.zhihu.com/p/1993035293109014667 此篇內容是我和「節墨吏」找了好幾個晚上,測試的結果,請它用1600字寫出來 —— 兼論 P...