PDFgear ユーザーガイド

OCRとは

OCR(光学文字認識)は、スキャンしたPDFや画像の中の文字を認識し、編集できる「テキスト」に変換する技術です。画像のままではなくなるため、通常のPDFと同じように検索、コピー、編集ができます。

PDFgear では、目的に応じて主に2つのOCR機能を使えます。

スキャンPDFを検索可能にする

この方法では、スキャンPDFに対してOCRを実行し、見た目はそのままに文字を選択、編集できる状態にします。次の操作が可能になります。

  • 単語やフレーズを検索する
  • テキストをハイライトしてコピーする
  • PDFエディターで内容を直接編集する
スキャンPDFを検索可能にする

スキャンPDFを検索可能にする

PDF内でそのまま作業を続けたい場合に最適です。

スキャンPDFからテキストを抽出

PDF自体を編集する必要はなく、内容の文字だけを取り出したい場合もあります。PDFgear は、OCRで認識したテキストをプレーンな内容として抽出することにも対応しています。ドキュメント全体だけでなく、選択した範囲のみを対象にすることもできます。

  • テキストをすばやくコピーする
  • 別ファイルとして保存、または書き出す
  • 打ち直しなしで内容を再利用する
スキャン画像からテキストを抽出

スキャン画像からテキストを抽出

スキャン文書のテキストをそのまま再利用したいときに最適な方法です。