大量の資料をPDF化

本を編集するときにつかった資料は,その本のページ順にしてファイリングしている。ある本のファイルが20冊以上になってきたため,保管や取り扱いに苦労する。とりあえず,PDF化してみようと,余裕のあるときに少しずつ,紙の資料をPDFにしてきた。

コピー機でPDFにできるので,それでPDFにしたものをサーバーに保存。本のページやページ内のタイトルでフォルダーをつくり,コピー機が付けたファイル名のまま,それらのフォルダーに入れるように指示した。

MacOSXなら,PDFをプレビューできるので,このフォルダーで整理したものでも便利に使えそう。でも,今後のために,Perlで処理してHTMLをつくり,ブラウザで閲覧可能にしてみたい。

システム開発をしているものに依頼すれば,きっと簡単にできるのだろう。でも,彼らに頼むのなら,PDFファイルの追加,削除,移動などの管理や,検索もできるシステムにしたいが,多忙な彼らに,このようなシステム構築を頼める状況でもない。

そこで,ブラウザで閲覧できるくらいのものを,自分でやってみることにした。

しかし,Windowsで処理していたら,文字コードの問題に直面した。基本的には,utf-8を使いたい。でも,readdirなどで取得するディレクトリ情報はShift-JIS(cp932)になるため,文字コードがどうなっているのかわからなくなった。

結局,システム開発のものにレクチャを受けて,PerlIOレイヤを使うことになった。その内容は次にまとめたい。