发布时间:2021-04-08 11: 36: 37
尽管ABBYY FineReader PDF 15是一个识别度极高的OCR文字识别工具,但它在识别图片、PDF文件的时候还是会存在一定的遗漏和错误。其中,在识别表格的时候,有某些表格并不能完全识别出来。对于这种情况,很多小伙伴把识别的文件转换为Word文件后,再在Word软件中修改,这使工作量变得巨大。
实际上,在ABBYY的OCR编辑器中,通过调整对表格区域的识别,可以使表格的识别度达致百分百。下面小编通过一个实际的案例,讲述如何调整不能完全识别的表格。
首先,使用ABBYY Finder PDF 15软件打开一个通过扫描纸质表格生成的PDF文件。由于纸质表格的清晰度并不高,使到扫描形成的PDF文件的效果也不是很好,这会令ABBYY的OCR编辑器识别发生错误,这在实际使用中普遍发生的问题。

点击“识别”按钮,选择“识别并在OCR编辑器中验证”。

待识别结束后,在OCR编辑器界面中,检查右侧副本文件,发现表格并没有完全识别出来。例如:“登记号”左侧少了一条竖线;“非户籍学生……”缺失了左右两条竖线以及下面“签名”部分的表格都没有识别出来。此时注意,“保存格式”一定要选择“精确到副本”。

在左侧源文件上,删除处于表格内的文本框,在工具栏上点击“制表格区域”,通过调整、添加表格区域,重新对表格设置新的绘制表格区域。在设置的过程中,注意竖线对齐和横线重叠,避免识别后的表格边框出现不对齐以及粗细不一致的问题。

在源文件上重新绘制表格区域后,点击“识别页面”,对源文件进行重新识别。识别结束后,再次检查表格,发现副本的表格与原表格一致。

然后点击“验证”按钮,对识别错误的内容进行修改。错误修正后,源文件整个识别过程就完成了。

最后,把识别的文件保存为Word文档,实现了把扫描得到的表格转变为Word格式的电子文件。

总结
由于原纸质文件的清晰度以及扫描精度,都会导致形成的PDF文件里的内容模糊,从而令ABBYY FineReader PDF 15软件的OCR文字识别软件不能完全识别出表格的线条,使到表格产生缺失。但通过重新绘制表格区域后,再次识别基本就能获得完整的表格。
作者:东佛
展开阅读全文
︾
读者也喜欢这些内容:
ABBYY如何处理流式文档 ABBYY如何实现文档分类
现如今,如何高效处理各类文档已成为职场人士提升工作效率的重要环节,ABBYY FineReader作为一款强大的文档处理软件,不仅能实现精准的文字识别,还能对不同类型文档进行优化处理与智能分类。接下来我们就来看看ABBYY如何处理流式文档,ABBYY如何实现文档分类的相关介绍。...
阅读全文 >
ABBYY如何识别古文字体 ABBYY如何识别微缩文字
提到ABBYY FineReader OCR文字识别软件,对于经常需要处理文档的小伙伴来说肯定不会陌生,其实它不仅能识别现代印刷文字,还能识别古籍中的文字和微缩文字,支持批量上传文档并进行自动标点。下面我们就来介绍一下ABBYY如何识别古文字体,ABBYY如何识别微缩文字的相关内容。...
阅读全文 >
ABBYY怎么对齐图片 ABBYY图片怎么转向
ABBYY FineReader是一款专业的OCR文字识别软件,除了支持PDF文件、图片、扫描件中的文字识别之外,还可以对于图片上的内容进行整句整段的纠正,甚至调整方向,下面我们就来为大家演示一下ABBYY怎么对齐图片,ABBYY图片怎么转向的相关内容。...
阅读全文 >
ABBYY怎么提取PDF表格数据 ABBYY如何识别复杂表格
在日常工作中,我们经常会遇到需要复制PDF文档中表格的数据到Excel中的情况,特别是在处理财务报表过程中,如果直接将PDF表格中的内容进行复制粘贴,很容易出现数据错误。接下来我们将通过ABBYY FineReader OCR文字识别软件为大家演示一下ABBYY怎么提取PDF表格数据,ABBYY如何识别复杂表格的相关内容。...
阅读全文 >