
发布时间:2021-06-25 15: 54: 57
当我们使用ABBYY FineReader PDF 15(Win系统)的PDF编辑器打开PDF文档时,ABBYY的背景识别功能将自动开启。我们可以直接搜索和复制没有文本图层的文本和图片,例如扫描的文档和从图像文件创建的文档。
背景识别功能会把临时文本图层添加到文档,让我们可以标记、复制和搜索文档中的文本内容,我们还可以替换PDF文档中现有的文本图层,或者把永久文本图层添加到PDF文档中,让使其他阅读者也可以使用这些功能。
图1:ABBYY自动进行的背景识别
在顶部工具栏上直接使用识别文档功能。或者在菜单“文件>识别文档>识别文档...”中使用这项功能。
图2:识别文档
在打开的对话框中,指定适当的OCR语言。
图3:OCR识别语言
默认为“简体中文和英语”,我们可以根据文档内容选择具体语言,还可以在“更多语言”中选择其他语言。
图4:自定义选择其他语言
如果想要提高OCR识别的质量,我们可以启用图像预处理设置,不过使用图像处理可能会导致文档部分内容的排版出现改动。
拆分对开页:ABBYY会自动将包含对开页的图像拆分为两个彼此只包含一个页面的图像。
纠正页面方向:ABBYY会检测文本方向并在必要时更正。
使用建议值以获得更佳OCR:ABBYY应用需要的预处理设置。
点开“显示自定义设置”按钮后会出现更多可勾选选项。
图5:更多自定义设置选项
在确定预设设置后,我们输出的文件就会包含可搜索的文本图层。
将页面从一个文件添加到一个 PDF 文档时,或扫描纸质文档时,我们也可以添加文本图层,点击“添加页面 > 图像处理设置”进行设置,指定文档的语言。
图6:图像处理设置
如果我们想要检查已识别的文本,可以进行识别并在OCR编辑器中验证。以上便是ABBYY FineReader PDF 15里的OCR功能在PDF文件中的使用方法。大家如果想要了解更多关于ABBYY的OCR识别技巧,尽情关注ABBYY中文网哟。
作者:∅
展开阅读全文
︾
读者也喜欢这些内容:
PDF转换为什么乱码 PDF转换后是乱码怎么办
很多时候,我们将PDF转换后,发现文档中竟出现了大量乱码,使得原本简单的工作变得复杂。那么PDF转换为什么乱码,PDF转换后是乱码怎么办?今天小编就给大家介绍一下如何处理这些问题。...
阅读全文 >
PDF文档转换成Word文档后如何编辑 PDF文档转换成Word文档后怎么清除回车号
PDF与Word都是办公上常见的文档,但有些小伙伴将PDF转换为Word后,发现编辑不了,这究竟是什么原因导致的呢,解决思路又是如何,看完下面的内容你就知道答案了。接下来咱们一起学习一下pdf文档转换成word文档后如何编辑,PDF文档转换成Word文档后怎么清除回车号,希望大家喜欢。...
阅读全文 >
ABBYY PDF Transformer+注册码-激活码-序列号地址
提到PDF,相信很多人都会很自然地想到ABBYY PDF Transformer+,它是一个新的,全面巧妙地解决PDF文档的工具,可以编辑PDF文档,在PDF文档中添加评论,添加密码保护,实现简单环保地阅读PDF文档,能够便捷地处理任何类型的PDF文件,非常有效地提高日常工作效率。...
阅读全文 >
pdf页边距怎么调不动 pdf页边距如何调整
相信许多朋友对于pdf页边距怎么调不动,pdf页边距如何调整的问题不太了解,下面就由我来给大家介绍一下如何处理这两个问题吧。...
阅读全文 >