扫描 PDF OCR 识别

在本地对扫描 PDF 运行 OCR,叠加一层可搜索的文本层,源文件无需上传。

可选项

v1 版本本地内置英文 OCR 语言数据。

可选全部页面或指定的页码范围。

保留原始图像,并叠加不可见的可搜索文字层。

可在 OCR 之前对扫描进行可选清理,并提供尽力矫正倾斜的说明。

如何对 PDF 做 OCR

  1. 上传 PDF上传一份扫描 PDF 或以图像为主的 PDF 文件。
  2. 选择参数选择英文 OCR、目标页码、DPI 以及清理选项。
  3. 运行 OCR在本地运行 OCR,等待每页进度完成。
  4. 下载下载可搜索的 PDF,并在任意 PDF 阅读器中测试搜索效果。

常见问题

扫描 PDF 会被上传吗?
不会。PDF 渲染、OCR 识别、文本层放置与导出都在你的浏览器内完成。
OCR 之后能搜索吗?
OCR 识别出文字后,输出文件会包含一层标准阅读器可以搜索的 PDF 文本层。
工具会用 AI 总结或阅读我的 PDF 吗?
不会。OCR 仅用于在 PDF 中生成可被搜索的文字内容。