Qu’est-ce que l’OCR ?

L’OCR (reconnaissance optique de caractères) est la technologie utilisée pour reconnaître le texte dans des PDF ou des images scannés et le transformer en vrai texte éditable. Au lieu d’être limité à des images plates, vous pouvez rechercher, copier et modifier le contenu comme dans un PDF classique.

PDFgear propose deux principales options OCR selon vos besoins :

Rendre un PDF scanné interrogeable

Avec cette option, PDFgear exécute l’OCR directement sur votre PDF scanné. Le fichier conserve son apparence, mais le texte devient sélectionnable et modifiable. Vous pouvez :

Rechercher des mots ou expressions
Surligner et copier du texte
Modifier le contenu directement dans l’éditeur PDF

Rendre un PDF scanné interrogeable

C’est le meilleur choix si vous souhaitez continuer à travailler dans le PDF lui-même.

Extraire le texte d’un PDF scanné

Parfois, vous n’avez pas besoin de modifier le PDF, mais uniquement de récupérer le texte qu’il contient. PDFgear permet également d’exécuter l’OCR pour extraire le texte reconnu sous forme de contenu brut. Vous pouvez le faire pour tout le document ou seulement pour des zones spécifiques.

Copier rapidement le texte
Le sauvegarder ou l’exporter vers un autre fichier
Réutiliser le contenu sans retaper

Extraire le texte d’une image scannée

C’est l’option idéale lorsque vous souhaitez simplement réutiliser le texte d’un document scanné.