2010年9月13日月曜日

ただいま絶賛蔵書の電子書籍化中!ただし・・・Clear Scanは・・・

一念発起して蔵書のPDF化を推し進めてます。

1、大型裁断機で裁断して

2、Scansnapでスキャンして

3、Acrobat Pro 9 でデータサイズ調整

この手順でお気軽なのですが、試行錯誤が必要なのが3の Acrobat Pro 9 でサイズ調整。

単純にPDFのサイズを小さくしたいなら、サイズの縮小でもいいのですが、 Acrobatシリーズには、文字認識機能によるサイズ縮小、さらに9 シリーズにはClear Scanによるサイズの縮小があります。

 Clear Scanも画像を含んだPDFを文字認識して、その中から「重複した文字フォントを統合?」したりなんかすることで、サイズ削減してるみたいですから、文字認識系サイズ縮小というこということに間違いはなさそう。
もちろん、PDFに対する文字検索も機能します。

さらに素晴らしいことにClear Scanは、今までの文字認識系サイズ縮小より多くサイズ削減でき、さらに対象デバイスではサクサク動きます。

ただ・・・、いいことずくめように思えるClear Scanにも欠点が。

それは変換処理が重いということ。それはもう時間がかかります。

考えて見れば、かなり高度な処理をPDFの1ページごとに行っているわけですから、重いのも理解はできます。

それでも、文字中心のモノクロ2色刷り、平均ページ数250~300ページの専門書96冊、データ量6GBをAcrobat Pro 9で一括処理で・・・

44時間 !!

時間がかかるだろうからと、普段使っていない(かなり古い!)PenD搭載のデスクトップで作業させてはいたのですが、これは驚き。

(それでも、変換後は6GB→2GBちょうどですから報われてる感じはします。)

そうういったわけで、気軽に実行するにはちょっと重いですね(汗)


ちなみに、文字中心の書籍PDFファイルには「ファイルサイズの縮小」はいまいち効果はないです。

逆に写真やイラスト等、グラデーションを多用した雑誌等では効果は抜群でした。
 ここいらの話は次の機会にでも。

0 件のコメント:

コメントを投稿