OCRとは

OCR（光学文字認識）は、スキャンしたPDFや画像の中の文字を認識し、編集できる「テキスト」に変換する技術です。画像のままではなくなるため、通常のPDFと同じように検索、コピー、編集ができます。

PDFgear では、目的に応じて主に2つのOCR機能を使えます。

スキャンPDFを検索可能にする

この方法では、スキャンPDFに対してOCRを実行し、見た目はそのままに文字を選択、編集できる状態にします。次の操作が可能になります。

スキャンPDFを検索可能にする

PDF内でそのまま作業を続けたい場合に最適です。

PDF自体を編集する必要はなく、内容の文字だけを取り出したい場合もあります。PDFgear は、OCRで認識したテキストをプレーンな内容として抽出することにも対応しています。ドキュメント全体だけでなく、選択した範囲のみを対象にすることもできます。

スキャン画像からテキストを抽出

スキャン文書のテキストをそのまま再利用したいときに最適な方法です。