OCR (Reconhecimento Óptico de Caracteres) é a tecnologia usada para reconhecer texto em PDFs digitalizados ou imagens e transformá-lo em texto real e editável. Em vez de ficar preso a imagens “planas”, você pode pesquisar, copiar e editar o conteúdo como em um PDF normal.
O PDFgear oferece duas opções principais de OCR, dependendo da sua necessidade:
Com essa opção, o PDFgear executa OCR diretamente no seu PDF digitalizado. O arquivo mantém a mesma aparência, mas o texto passa a ser selecionável e editável. Você pode:

Tornar um PDF digitalizado pesquisável
Esta é a melhor opção se você quiser continuar trabalhando dentro do próprio PDF.
Às vezes você não precisa editar o PDF, só quer pegar o texto que está dentro dele. O PDFgear também permite executar OCR para extrair o texto reconhecido como conteúdo simples. Você pode fazer isso no documento inteiro ou em regiões específicas que selecionar.

Extrair texto de imagem digitalizada
Esta é a opção ideal quando você só quer reutilizar texto de um documento digitalizado.