扫描 PDF OCR 识别
在本地对扫描 PDF 运行 OCR,叠加一层可搜索的文本层,源文件无需上传。
可选项
v1 版本本地内置英文 OCR 语言数据。
可选全部页面或指定的页码范围。
保留原始图像,并叠加不可见的可搜索文字层。
可在 OCR 之前对扫描进行可选清理,并提供尽力矫正倾斜的说明。
如何对 PDF 做 OCR
- 上传 PDF — 上传一份扫描 PDF 或以图像为主的 PDF 文件。
- 选择参数 — 选择英文 OCR、目标页码、DPI 以及清理选项。
- 运行 OCR — 在本地运行 OCR,等待每页进度完成。
- 下载 — 下载可搜索的 PDF,并在任意 PDF 阅读器中测试搜索效果。
常见问题
- 扫描 PDF 会被上传吗?
- 不会。PDF 渲染、OCR 识别、文本层放置与导出都在你的浏览器内完成。
- OCR 之后能搜索吗?
- OCR 识别出文字后,输出文件会包含一层标准阅读器可以搜索的 PDF 文本层。
- 工具会用 AI 总结或阅读我的 PDF 吗?
- 不会。OCR 仅用于在 PDF 中生成可被搜索的文字内容。