PDFgear 用户指南

什么是 OCR?

OCR(光学字符识别)是一种用于识别扫描 PDF 或图像中文本的技术,可将其转换为可编辑的真实文本。通过 OCR,你不再受限于静态图片,而是可以像处理普通 PDF 一样进行搜索、复制和编辑。

PDFgear 根据不同需求提供两种主要的 OCR 功能:

让扫描 PDF 可搜索

使用此功能,PDFgear 会直接对扫描版 PDF 进行 OCR 处理。文件外观保持不变,但文本将变为可选中和可编辑状态。你可以:

  • 搜索单词或短语
  • 高亮并复制文本
  • 在 PDF 编辑器中直接修改内容
让扫描 PDF 可搜索

让扫描 PDF 可搜索

如果你希望继续在 PDF 文件内部进行编辑,这是最佳选择。

从扫描 PDF 中提取文本

有时你不需要编辑整个 PDF,只想获取其中的文字内容。PDFgear 支持运行 OCR 并将识别出的文本提取为纯文本内容。你可以对整个文档或选定区域进行提取。

  • 快速复制文本
  • 保存或导出为其他文件
  • 无需重新输入即可重复使用内容
从扫描图像中提取文本

从扫描图像中提取文本

当你只需重复利用扫描文档中的文本时,这是更合适的选项。