さて今回で自炊の最終回となる。ついに本を断裁した紙をスキャン(電子化)する。たいして難しくない。読み取って保存するだけである。
 
25
 まず、上がスキャナーの閉められるところを全部閉めた状態である。
 前に述べたとおり、Canon DR-C240は上のADF(オートドキュメントフィーダー、紙送り機)の部分が全開で、フタができない。
 PFUのScanSnap ix500は、ここが閉まるのがやっぱうらやましい。

50

 次に、ADFの紙支えを最大に伸ばし、手前の紙受けもメイチで引っ張りだした状態である。
 紙支えの上の部分が伸びるのがかわいい。
 また、紙受けの手前のストッパーがいい。ここはix500よりも優れている。
 注意点としては紙受けをカチッと鳴るまで引かないと、段差ができてここに紙が溜まってしまう。
 細かいが、最初悩んでいた。

 中央の青いボタンがパワーボタンで、押すと輝いてオンになる。もう一度押すと消える。
 オン状態で抛っておくとスリープ状態になり、ボタンが点滅する。これはいいね。

49

 紙をADFにセットする。まあファックスなんかと一緒である。
 方向は、設定できると思うが、初期値はページ数が小さい側を置くにし、天地を逆にする。

16

 最初に表紙(表1、表4、ベロ、帯)をカラーでスキャンする。
 大きさがまちまちなので、手差しで1個1個スキャンする。
 プログラムを本体側で指定できるので、奇数番をフルカラー、400dpiにしている。
 スタートボタンを押すとスキャンが自動で始まり、付属のソフトウェアCaptureOnTouchというのが起動する。
 これがお世辞にも使いやすいとは言いがたい。だいたいこの手のスキャナーとかプリンターについてくる日本製のソフトが良かった試しはない。これはとにかく取り込むのだけ使用する。

scan1

 上は表紙と帯をよみこんだところだ。本体側だけでなく、ソフト側でもスキャンの開始や停止ができるのが便利だ。
 ここで「完了」を押すとファイルが保存される。ぼくはPDFにしている。
 なおここでソフトを閉じて、警告にイエスと答えると読み込んだ結果がパーになってしまう。普通そこは保存がデフォルトだろうが! ちょっとわかんない設計だ。
 表紙のスキャンが終わったら1回PDFを作ってしまい、ソフトを終了する。普通は表紙はカラーモードで、本文はグレーモードでスキャンすると思うが、一度ソフトを終了しないと本体でプログラムをグレーに切り替えてもずっとカラーモードになってしまうのだ。これはバグなのか使用なのか。面倒くさい。

scan2

 表紙を読み終わったPDFをAdobe Acrobatで開いてみた。
 Acrobatはスキャナーについてこない。
 ScanSnapには以前ついていたが、こっちもバンドルをやめて変な自製ソフトに変えたそうで、アマゾンで酷評されている。
 アドビがライセンスの問題で、可能な限りオンラインのCCバージョンを買って欲しいと思っているのではないかと思う。
 (ぼくが思ってるだけだけど)
 ぼくはもともと単体のAcrobatを持っていた。これが高くて、2万円も3万円もする。
 ちなみに、ヤフオクで正規パッケージが安く売っている。
 ソフトウェアを箱ごと転売するのは別に問題ないと思うけど、どうなんだろ。
 PDFの仕様は公開されているので、フリーウェアを使ったり、なんなら自分で処理するプログラムを作ることもできる。
 有名なソースネクストから「いきなりPDF」というのも出てるけどどうなんだろうね。どうなんだろばっかりでスミマセン。

 ここでワンポイントだが、Adobe Reader(Acrobat Reader)を同じパソコンに入れていると、PDFダブルクリックでReaderが起動してしまう。関連付けをどういじってもダメだ。
 仕方ないからぼくは、Readerをアンインストールした。ReaderにできてAcrobatにできないことはないので、これでいいと思っている。

 続いて本文をスキャンする。
 本文は普通はグレースケールでスキャンすると思う。
 白黒とグレースケールは違いがよく分からないが、やってみると、白黒はクッキリして読みやすいが白飛びが起こる。ぼくはグレーにしている。
 グレーとカラーでは速さが全然違う。
 グレーだと会社のコピー機みたいにシャッシャッシャッ…という高速でスキャンされる。

 ただし、今回の『かんたんPerl』は本文も一応カラー(青黒2色刷り)なのでカラーのままにした。
 気をつけるのは「白紙をスキップする」という項目で、これをオフにする。
 そうでないと、本文の中に意図的に入った白紙が削除されて、見開きがバラバラになったり、ページ数が飛んだりする。

 DR-C240は性能が良くて、1回に150ページぐらい一気に読み込めるが、ぼくは用心して100ページずつ読んでいる。また、100ページごとにスキャンを終わって、ファイルを保存している。途中で重送などの事故が起こった時、被害を最小限に食い止めるためである。
 ちなみに1000ページぐらい一気に読んだら、ソフトがメモリー不足と言ってきた。まあぼくは32ビットのWindowsに4GBのメモリーでやっているからかもしれないが。

 重送(ジャム)は複数枚を一気にスキャンしてしまうエラーで、断裁や捌きが甘くて紙がくっついている時などに起こる。
 DR-C240はジャムを超音波で検知しているらしく、ものすごい精度で検知する。
 ジャムると、スキャンが一時停止するので、紙を取り除いてセットし直す。
 これがちょっとコツがある。
 まず、すでにスキャンされた紙を紙受けから取り除く。
 次に、これからスキャンする紙も紙送りから取り除く。
 こうしないと、スキャナーを開けた時に、一気にこれからスキャンする紙が流れだして、混ざってしまうのだ。
 細かい!

 次にスキャナーを開け、ジャムっている紙を慎重に取り除く。
 見事にグシャグシャになっていることが多いが、剥がして平らに伸ばす。
 もう一度スキャンすれば、わずかにシワは残るが、字は補正されてきれいに読めるようになっている。
 なお、画面上でどこまで正常に読めたかチェックし、これからスキャンする紙はちゃんとさばいておくことが大事だ。一度重送が起こると立て続けに起こる。
 ただ、ぼくは断裁がうまくなっているので今回は重送の写真が取れなかった。

scan3

 すべてPDF化した。
 まず表紙のPDFが1個、600ページの本なので、本文が100ページずつ6個できた。ファイル名は作った時刻になっている。写真とか取りながらダラダラやってるので、40分も掛かっているが、これぐらいの本だと10〜20分と言ったところか。慣れると他のことをしながらできる。

scan4

 で、これをAcrobatの機能で結合し、1つのファイルにする。
 このとき並べ替えを行うが、時刻のファイル名をそのまま使うと、表紙から本文がきれいに並ぶので手間なしだ。
 最初は表紙と裏表紙の間に本文を挟むようにしていたが、最初に裏表紙に書いてある情報を読んだほうがいいような気がするので、今はあまり考えないで表紙=>本文のファイルにしている。

scan5

 最後に「バインダ1.PDF」とかいう名前が勝手につくので、ここで書名をファイル名にする。ぼくはDropboxに格納している。

 あと、一手間かけて本のノンブル(印刷されたページ数)とPDFのページ数を一致させると扱いやすい。
 この形式で自炊すると最初に表紙が5ページくる。
 その次のPDFの6ページが、本の1ページ目のようである。
 大仰な本だと緒言とか、目次とか、謝辞とか、推薦の言葉とか、そういうのがローマ数字のノンブルでついていて、30ページ目ぐらいにようやくノンブルが始まったりする。

scan6

 で、このあとを1ページ目にするにはどうすればいいか。
 これは「セクション」というものを作る。表紙5ページ分をセクション1とし、6ページ目をセクション2の1ページにする。こうすると物理ページと論理ページが一致して便利だ。
 Acrobatのメニューからアドバンスト=>文書処理=>ページ番号メニューを選択し、開始ページを6、終了ページを最終ページにする。最終ページはページ番号ダイアログに「/ 603」と書いているので、603ページだと分かる。
 次に、ページ番号はデフォルトのまま、「新セクション開始」「スタイル(1、2、3…)」「接頭辞(なし)」「開始(1)」にして「OK」。
 これで100ページにジャンプを指定するとちゃんと100ページにジャンプするから、目次と一致し、便利である。

 ざっとこんな感じだ。わかんないことあったら聞いてクダサイ。