このスキャナは原稿を画像データとして取り込むわけですが、その後文字認識して、文字情報を(画像ではなく)テキストデータとして格納できます。
できあがるファイルは「透明テキスト付きのPDF」になります。画像データをページごとに配置したデータに、テキスト認識したデータが透明になって貼り付いているといったイメージです。
このテキストデータに対して検索がかけられるのですから助かります。ま、認識制度は
100%とはいきませんが、自分で入力することを考えると十分に妥協できます。
かたっぱしから本をデジタル化していきたいと思います。自宅の段ボール(に詰まった本)がすべてなくなるまであと何日かかるのでしょうか。
まあ、毎日 10冊くらいずつ少しずつコンスタントにやっていきたいと思います。