OCR(光学字符识别)是一种用于识别扫描 PDF 或图像中文本的技术,可将其转换为可编辑的真实文本。通过 OCR,你不再受限于静态图片,而是可以像处理普通 PDF 一样进行搜索、复制和编辑。
PDFgear 根据不同需求提供两种主要的 OCR 功能:
使用此功能,PDFgear 会直接对扫描版 PDF 进行 OCR 处理。文件外观保持不变,但文本将变为可选中和可编辑状态。你可以:

让扫描 PDF 可搜索
如果你希望继续在 PDF 文件内部进行编辑,这是最佳选择。
有时你不需要编辑整个 PDF,只想获取其中的文字内容。PDFgear 支持运行 OCR 并将识别出的文本提取为纯文本内容。你可以对整个文档或选定区域进行提取。

从扫描图像中提取文本
当你只需重复利用扫描文档中的文本时,这是更合适的选项。