PDFファイルの中身を一括チェックするツールを公開しました。
→
../software/pdf-checker/
詳細は上記ページの説明をご覧ください。
もともと、図書資料の電子化をやっていたときに数千件単位の納品ファイ
ルの山をランダムサンプルして手動でチェックするのも面倒だったので、
一括でバッチモードでチェックできたらよいな、、、と思っていたものの、
Adobe Acrobatなどには画像の解像度を取得するメニューが付いておらず、
テキストの情報などもふくめ、ひとつずつファイル保存してからチェック
しなければいけないなど、とても面倒だったので作ってみました。
昨年の
DRF軽井沢技術ワークショップにて、テーマのひとつとして取り組
んだものの時間切れになってしまって、積み残していた仕事だった。
# Javaを触りたくなくてiTextを試してみなかったのが敗因。。。
というわけで、ご意見・感想・質問などあれば、ご連絡いただけばと思い
ます。他にも似たようなことをしてくれるツールが既にあるよ、という報
告もお待ちしています。