2011年06月25日

PDFファイルから写真を抽出する方法

 
 画像がたくさん貼り付けてあるPDFファイルから写真を抽出する方法をご紹介します。

「Abobe Acrobat Professional」を使います。なお、無料の「Acrobat Reader」ではできません。下の方で、無料ソフトを使う方法も合わせてご紹介します。

 最近、PDF化したファイルをよく見かけます。事業誌など大きな本がよくPDFファイルになっています。このPDFファイルの中から、画像部分を画像ファイルとして一括して抜き出す方法をご紹介します。

 PDFファイルが、テキストとして認識されていれば問題ないのですが、スキャンしたファイルなどは、ページ全体が画像として認識されている場合があります。
 文字列を選択して、コピーできればこの処理は不要です。次のステップに進んでください。

 コピーできない場合は、文字列として認識されていません。この場合は、ページの中のテキストと画像とを分ける必要があります。

【前処理】


 画像を抽出したいPDFファイルを「Abobe Acrobat Professional」で開きます。

 メニューバーの[文書]⇒[OCRテキスト認識]⇒[OCRを使用してテキストを認識]
[テキスト認識]のダイアログが開くので、[OK]を押して認識を開始します。

【画像の抽出】

[アドバンスト]⇒[文書処理]⇒[すべての画像を書き出し]

 これで、PDFファイルの中にある画像(として認識されたもの)を全て抽出できます。


【Abobe Acrobat Professionalを持っていない人のために】
 
 「Abobe Acrobat Professional」でできるのは知っているよ。無料で抽出する方法を探しているんだ、という方のために、別の方法をご紹介します。

 「OpenOffice」というフリーソフトを使います。このソフトは以前ご紹介したので、説明は省略します。
 
1.PDFファイルを「OpenOffice」で開きます。

2.画像の周囲でクリックして、ドローすると、画像ファイルとして認識します。

OpenOffice01.gif


 下は、画像として認識されているのが分かると思います。
 後は、「OpenOffice」の表示画面を少し小さくして、この認識された画像をデスクトップにドロップします。

OpenOffice02.gif


 これで、画像を抽出できます。ただし、画像を一括抽出することはできません。1枚、1枚の抽出作業になります。

 「OpenOffice」は、こんな使い方もできる優れもののソフトです。このソフトは、古いバージョンが貴重なので、インストールファイルは保存しておいた方が良いと思います。


posted by ネコ師 at 00:07 | Comment(0) | 役立つ知識(PC編) | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
記事に関係ないコメント、宣伝的なコメントは削除させていただきます。
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。
※ブログオーナーが承認したコメントのみ表示されます。

▲ このページのTOPに戻る