EPUB工作瑣記

PDF、Sigil以及其他

Bobby Tung
3 min readMay 19, 2014

這陣子工作繁重,突然感覺自己有些老眼昏花,看來過了三十歲,身體開始從資產變成負債,得要好好調整修理一下了。

直到現在為止,好像還有人認為我做的工作就是「按一個鍵」就能完成的事。的確,如果說用Calibre或者Sigil、Pages這樣的工具,你會覺得製作EPUB真的就是按一個鍵,但最終得到的結果往往是悲劇一場。

除了拿文字檔案做基礎、PDF作為版面設計參考的從頭開始製作外,有時候也會收到只有PDF的案件,或者從其他轉好的EPUB調整成EPUB 3的案件,到現在為止,我都是以相同的方式計費,不過最近有些後悔。

PDF真是太糟糕了!

為什麼會這麼說?光就Bill McCoy的說法,還看不出個所以然來。讓我舉個實際的狀況。

首先,PDF文件裡頭的文字,不一定是以段落存在的,當你轉出時,每一行都會被區分成獨立的行。如此一來,當你要把一行行轉成段落時,代表你要逐行刪除分行,這就是相當累人的重複性動作。

然後,PDF轉出的文字檔案,裡頭會混有頁眉、頁碼等等,你也要手動刪除這些雜質。有時候因為樣式沒做好,也會看到乾坤大挪移,得要像拼圖一樣把這些段落組合回來。

有時候還會遇到缺字,像是「祢」這種在宗教書中常出現的字,在PDF轉出時,不曉得什麼原因,都會變成「.」。這代表,你在做以上問題的整理時,就得校稿過一遍。更別說強調、書名、對話、引言、詩詞等粗體斜體、不同字體等特別樣式,都得於整稿件時一併加入。可能比編輯處理起WORD檔案還痛苦。

請把PDF看成印刷用的「版」,是一個最終產品,且無法再利用。

然後我決定只提供PDF檔案要加價,花的工實在太累了。

Sigil也是餘孽

我曾轉換過遠傳、Hami系統生產出來的EPUB 2檔案⋯⋯老實說,真的會懷疑這些工程師在製作系統時,有沒有好好讀過EPUB Spec。但再怎麼樣,透過一些轉換,也能加速不少時間。

這些書雖然轉為EPUB 3很快,但當時在做成EPUB 2時捨棄的各種圖文配置、樣式等等,也還是要手動追加回來。等於還是要逐頁看過一遍。更恐怖的是當時在製作時就缺少校對,段落亂斷、錯置的狀況不少見。這也得比照PDF辦理。

既然人工不少,我想應該當作從頭做一本書來計算。

不過最可怕的,莫過於Sigil產製出的檔案。

一項好的工具,應該是在你還陌生的狀況之下,以通用的方式讓你做出合乎規範的結果。但Sigil不是,最主要的錯誤是:

  1. 樣式與內容預設不會分離:你幾乎都會看到寫在<head>裡頭的CSS。
  2. 使用Div太過頭,明明是段落為什麼要切成Div?然後span交錯複雜得亂七八糟。

讓我們告別Sigil。

電子書除了一些技術外,其實和一本書沒有什麼不同。我真的不認為「我們的電子書有編輯過喔!」是值得拿來說嘴的事情,一本書不經過編輯幾乎不能看,電子書也是。

我所想像的未來是:如何將這些技術整合到編輯流程中(其實概念一致!),讓編輯能同時掌握電子版與印刷版的品質,最後讓代製消失,但我還是相信,電子書設計會成為與書籍設計一樣的一門行業。

想像歸想像,回頭做代工。

--

--

Bobby Tung

W3C i18n invited expert, editor of "Requirements for Chinese Text Layout" (CLREQ), Evangelist. I provide consultancy of digital publishing in Taiwan.