发布时间:2021/02/23 13:56:08
PDF文档包含了图像型PDF(比如由扫描生成的文件,包含图像层)与文本型PDF(比如由word生成的文件)的文档类型,其区别在于是否可作文本的搜索。随着技术的发展以及人们需求的提升,很多人都需要从图像型PDF中获取文本信息,在这种情况下,双层PDF就应运而生了。
双层PDF实际上是在图像型PDF基础上,建立一个文本识别层,该文本层包含了可搜索的文本信息,我们可复制、搜索其中的文本。ABBYY FineReader PDF 15提供了制作双层PDF的功能,那么,该怎么使用呢?
一、使用OCR编辑器功能
双层PDF的制作,实际上就是进行图像智能文本识别的过程。因此,我们需要使用到ABBYY FineReader PDF 15的OCR智能文本识别技术。
如图2所示,在ABBYY FineReader PDF 15的创建任务页面使用“在OCR编辑器中打开”的功能,即可使用其“PDF文档和图像的高级转换功能”。
二、识别图像中的文本
使用OCR编辑器打开目标图像型PDF文件后,ABBYY FineReader PDF 15会自动开启OCR文本识别,该过程会花费一些时间。
待软件完成图像的文本识别后,如图4所示,就可以在软件右侧的文本识别区域获取到识别后的文本。
我们需要检查一下文本是否有识别错误。一般情况下,ABBYY FineReader PDF 15能达到很高的文本识别准确度,只有个别特殊符号可能会无法识别,但为了确保文档的严谨性,我们最好还是检查一下。
三、另存为可搜索PDF文档
确认文本识别无误后,如图5所示,打开文件菜单中的另存为选项,并选择其中的另存为“可搜索PDF文档”,即可创建双层PDF文档。
完成双层PDF文档的制作,如图6所示,打开PDF文档,可以看到,文本已经变为可选的状态,我们可对这些文本进行复制、搜索等。
四、小结
ABBYY FineReader PDF 15的智能OCR文本识别功能,可快速地将图像型的PDF文档转换为带有文本层的可搜索PDF文档,实现文档的更有效利用,避免了人工抄写的繁琐,是一个很实用的功能。
作者:泽洋
读者也喜欢这些内容:
office加密文件忘记了密码怎么办 office加密文件怎么去掉密码
为了便于保护个人隐私或防止文件泄露,我们通常会对自己的office文件进行加密。但是日常生活中需要使用密码的地方很多,不免会遗忘掉密码。那么大家知道office加密文件忘记了密码怎么办,office加密文件怎么去掉密码吗,下面就一起去下文中寻找答案吧!...
阅读全文 >
pdf转jpg怎么转 pdf转jpg后图像不清晰
为了能更好更直观地查阅较长的pdf文件,我们可以把pdf文件转换为jpg图片,那么问题来了,pdf转jpg怎么转,pdf转jpg后图像不清晰该怎么处理?话不多说,我们来看一下解决方法。...
阅读全文 >
双层pdf怎么生成双层 pdf转换软件有哪些
pdf文件在现在的生活上使用的非常广泛,但在使用的时候也经常碰到一些问题。例如:双层pdf怎么生成,双层pdf转换软件有哪些相关问题。Pdf文档包含了文本型pdf和图像型的pdf,这两种类型有一定的区别,文本型的pdf是可以在文本上搜索的,而图像型的pdf就不可以了。是不是就显得不方便呢,所以就有了双层pdf的诞生,这样就可以从图像型的pdf中获取文本信息了。但是双层pdf怎么生成呢?那这里小编就给大家推荐一款特别好用且功能强大的ocr文字识别和pdf编辑软件ABBYY FineReader,现在就跟着小编来实践操作一下吧!...
阅读全文 >
双层PDF和单层PDF怎么区分 双层PDF怎么转换
现如今在日常生活工作中经常会使用到PDF文件,但是很多人还是对双层PDF和单层PDF怎么区分以及双层PDF怎么转换的问题不是太清楚。。那么今天就跟着小编一起来学习下双层PDF和单层PDF怎么区分,双层PDF怎么转换!...
阅读全文 >