Guide de l'utilisateur PDFgear

Qu’est-ce que l’OCR ?

L’OCR (reconnaissance optique de caractères) est la technologie utilisée pour reconnaître le texte dans des PDF ou des images scannés et le transformer en vrai texte éditable. Au lieu d’être limité à des images plates, vous pouvez rechercher, copier et modifier le contenu comme dans un PDF classique.

PDFgear propose deux principales options OCR selon vos besoins :

Rendre un PDF scanné interrogeable

Avec cette option, PDFgear exécute l’OCR directement sur votre PDF scanné. Le fichier conserve son apparence, mais le texte devient sélectionnable et modifiable. Vous pouvez :

  • Rechercher des mots ou expressions
  • Surligner et copier du texte
  • Modifier le contenu directement dans l’éditeur PDF
Rendre un PDF scanné interrogeable

Rendre un PDF scanné interrogeable

C’est le meilleur choix si vous souhaitez continuer à travailler dans le PDF lui-même.

Extraire le texte d’un PDF scanné

Parfois, vous n’avez pas besoin de modifier le PDF, mais uniquement de récupérer le texte qu’il contient. PDFgear permet également d’exécuter l’OCR pour extraire le texte reconnu sous forme de contenu brut. Vous pouvez le faire pour tout le document ou seulement pour des zones spécifiques.

  • Copier rapidement le texte
  • Le sauvegarder ou l’exporter vers un autre fichier
  • Réutiliser le contenu sans retaper
Extraire le texte d’une image scannée

Extraire le texte d’une image scannée

C’est l’option idéale lorsque vous souhaitez simplement réutiliser le texte d’un document scanné.