发布时间:2021-02-23 13: 56: 08
PDF文档包含了图像型PDF(比如由扫描生成的文件,包含图像层)与文本型PDF(比如由word生成的文件)的文档类型,其区别在于是否可作文本的搜索。随着技术的发展以及人们需求的提升,很多人都需要从图像型PDF中获取文本信息,在这种情况下,双层PDF就应运而生了。
双层PDF实际上是在图像型PDF基础上,建立一个文本识别层,该文本层包含了可搜索的文本信息,我们可复制、搜索其中的文本。ABBYY FineReader PDF 15提供了制作双层PDF的功能,那么,该怎么使用呢?

一、使用OCR编辑器功能
双层PDF的制作,实际上就是进行图像智能文本识别的过程。因此,我们需要使用到ABBYY FineReader PDF 15的OCR智能文本识别技术。
如图2所示,在ABBYY FineReader PDF 15的创建任务页面使用“在OCR编辑器中打开”的功能,即可使用其“PDF文档和图像的高级转换功能”。

二、识别图像中的文本
使用OCR编辑器打开目标图像型PDF文件后,ABBYY FineReader PDF 15会自动开启OCR文本识别,该过程会花费一些时间。

待软件完成图像的文本识别后,如图4所示,就可以在软件右侧的文本识别区域获取到识别后的文本。
我们需要检查一下文本是否有识别错误。一般情况下,ABBYY FineReader PDF 15能达到很高的文本识别准确度,只有个别特殊符号可能会无法识别,但为了确保文档的严谨性,我们最好还是检查一下。

三、另存为可搜索PDF文档
确认文本识别无误后,如图5所示,打开文件菜单中的另存为选项,并选择其中的另存为“可搜索PDF文档”,即可创建双层PDF文档。

完成双层PDF文档的制作,如图6所示,打开PDF文档,可以看到,文本已经变为可选的状态,我们可对这些文本进行复制、搜索等。

四、小结
ABBYY FineReader PDF 15的智能OCR文本识别功能,可快速地将图像型的PDF文档转换为带有文本层的可搜索PDF文档,实现文档的更有效利用,避免了人工抄写的繁琐,是一个很实用的功能。
作者:泽洋
展开阅读全文
︾
读者也喜欢这些内容:
怎么用ABBYY识别表格 ABBYY表格数据怎么提取
经常和各类文档打交道的用户应该都熟悉ABBYY FineReader。和只能提取纯文本的其他OCR工具不同,ABBYY FineReader能全面解析识别复杂文档结构,包括但不限于表格数据、手写内容、图片,还能保留文档的原始结构。为了让大家更好地掌握ABBYY FineReader的强大功能,本文将围绕怎么用ABBYY识别表格,ABBYY表格数据怎么提取的详细操作方法展开介绍。...
阅读全文 >
ABBYY怎么对齐图片 ABBYY图片怎么转向
ABBYY FineReader是一款专业的OCR文字识别软件,除了支持PDF文件、图片、扫描件中的文字识别之外,还可以对于图片上的内容进行整句整段的纠正,甚至调整方向,下面我们就来为大家演示一下ABBYY怎么对齐图片,ABBYY图片怎么转向的相关内容。...
阅读全文 >
ABBYY如何改语言 ABBYY如何设置中文
ABBYY FineReader是一款非常优秀的OCR文字识别工具,可以快速扫描、识别图片和PDF中的文字,同时它还支持多语言界面切换功能,满足不同用户的操作习惯,接下来就来大家了解一下ABBYY如何改语言,ABBYY如何设置中文的操作方法。...
阅读全文 >
ABBYY是免费的吗 ABBYY正版软件多少钱
在我们日常工作中,你是不是也经常遇到一些文字识别方面的问题,如果我们按照传统的方式,逐字逐句地手动输入将图文转化为文本,会浪费很多时间。所以,今天小编给大家推荐一款OCR文字识别软件,它就是ABBYY FineReader PDF 15。它可以自动扫描并提取图片上的文字内容,方便我们复制粘贴以及编辑。下面就讲讲大家关心的问题ABBYY是免费的吗,ABBYY正版软件多少钱。...
阅读全文 >