2007年11月04日

分厚い本(厚さ8センチ以上)の複写方法について

(あくまでも個人作業用のメモです。)

【目的】
できれば、OCR認識させて透明テキスト付きpdfにでもして保存したい。文字認識が駄目な場合は、最低限で画像で文章が読めるぐらいにする。


【試行錯誤】
(1)見開きで(2頁まとめて)スキャン → しばしばあるように中央が歪んで黒くなり、画像の質が悪い。OCRソフトで読み取らせても文字認識率が悪く、肉眼でも読み取れず、却下。
保存ファイルをJPEGからtiffなどに変更して試してみても、やっぱり認識できない。
スキャン画質を300dpiのグレーで実施。モノクロや解像度を変えても駄目。

(2)1頁づつスキャナの端を利用してスキャン → 端の文字が入りきらない。

(3)分厚い本の場合、製本を崩してバラバラにするのが最も良いのだが、借りてきた高価な本の為、それも不可。

(4)ネットで検索していてOKWAVEでデジカメスキャンの話題を見つける。元々はスキャナーを所有していない人の代替策としてのデジカメ利用だが、分厚くて綺麗にスキャンできない場合には、有用かも?と思いつく!

(5)デジカメのマクロ(接写)機能を利用し、三脚を使って撮影。どうしても中央部や端の部分には歪みが出るものの、十分に読めるのでOK。

(6)但し、歪みがあり、使用したテキストが日本語・英語・ラテン語等の混在であった為、認識率は低くて実用レベルにまでいかなかった。これは止むを得ないとして断念。
(文字認識を実用レベルで使うには、単一言語でスキャナー取り込みは必須であることを再確認)

【スキャン時の注意点】
・本をそのまま下に置いたのでは、三脚の関係でカメラのレンズと本は並行にならないので必ず歪むことを意識する。
・対処方法として、本の下に何かを挟んで傾斜をつける。そして本と並行になるようにレンズを傾斜させる。
・並行になっているか否かの目安は、撮影した本の文字の部分が平行四辺形になっているかどうかで判断する
・照明として蛍光灯のスタンドを利用したが、カメラのホワイトバランスで蛍光灯を選ぶと青白い画像となってしまう。そのままオートに任せた方が自然な発色。
・シャープネスの設定はシャープにしたが文字が細くなったのでノーマルがベター。
・撮影後に加工するのは時間の浪費なので、基本としてはいじらない。
・デジカメの画像は1024では小さ過ぎたので、やっぱり2MBぐらいにしておく。ファインなら、ノーマルぐらい。それでも一枚あたりの容量は600~900KBぐらい。
ラベル:コピー 複写
posted by alice-room at 19:47| 埼玉 ☔| Comment(0) | TrackBack(0) | 【備忘録B】 | 更新情報をチェックする
この記事へのコメント
コメントを書く
コチラをクリックしてください

この記事へのトラックバック