OCR 文字识别软件

ABBYY桌面软件合作伙伴 > FineReader使用技巧 > 如何使用ABBYY获取网页上的表格数据?

如何使用ABBYY获取网页上的表格数据?

发布时间:2021/01/20

在一些政府公开信息分享网站或专业的数据分享机构网站,都会定期公开分享一些社会发展数据,或与当前时事相关的数据。这些数据往往会采用网页分享的形式,很少会提供文件下载。

如果直接将这些数据复制下来,将需要花费大量的时间进行数据排版。但借助ABBYY FineReader PDF 15 文字识别软件的帮助,可以快速识别为表格数据,并导出为可编辑的数据表格。接下来,一起来看看怎么操作吧。

一、网页表格数据截图

首先,打开相关数据网站,对数据表格区域进行截图操作。

图1:打开网页截图

如图2所示,截图过程中,建议尽量保持表格边框的完整性,提高ABBYY FineReader PDF 15识别的准确度。

图2:完成表格数据截图

二、使用OCR编辑器识别表格

接着,打开ABBYY FineReader PDF 15文本识别软件,并使用“在OCR编辑器中打开”功能,打开刚才在网站截取的表格数据。

图3:在OCR编辑器中打开图片

接着,待软件完成图像的文本识别。在识别过程中,为了提高文本识别的准确度,软件会对图像的分辨率或指定的OCR语言作建议。如果条件允许的话(如提高图像的分辨率),可按照建议修改相关的设置。

图4:完成OCR识别

完成了文本识别程序后,我们需要先在区域属性面板中检查表格标记的区域属性是否正确。如图5所示,可以看到,ABBYY FineReader PDF 15已正确地将该区域标记为表格区域。


图5:区域属性

接着,再看到软件的文本编辑面板。如图6所示,可以看到,文本已经呈现为电子表格的形式,可以在单元格中编辑文本。

图6:文本编辑器

三、导出为Excel表格

为了方便后续的数据处理,我们可以将识别后的电子表格另存为Excel文件。如图7所示,在文本编辑面板的上方选取Excel表格的保存格式后,就可以将当前文本导出为Excel文件。

图7:保存为Excel表格

打开导出的Excel文件,可以看到,ABBYY FineReader PDF 15不仅能准确地识别数据,而且还能将表格的格式“复制”下来,将数据很好地导出到各个单元格中。这种导出形式可以减少大量数据排版的时间。

图8:导出的Excel表格

四、小结

通过使用ABBYY文字识别软件的数据表格识别功能,我们可以快速地将图片中的表格转换为可编辑的电子表格,提高数据的使用效率。这么好用的功能,您get到了吗?

作者:泽洋

读者也访问过这里:
ABBYY FineReader
一款功能强大的OCR和PDF软件
立即购买
QQ 讨论群
ABBYY 官方交流群:892417659 立即加群
欢迎加入我们的ABBYY FineReader软件交流群,及时获取关于软件的动态和营销活动,共同探讨提高文档处理效率的方法。
400-8765-888
kefu@makeding.com
热门文章
ABBYY FineReader 12激活教程
安装完 ABBYY FineReader 12 之后,需要激活程序才能在完整模式下运行。在受限模式下,将根据您的版本和所在地区禁用一些功能。
2020-11-22
ABBYY FineReader 12注册码-激活码-序列号地址
ABBYY FineReader 12 OCR图文识别软件自2014年4月发布以来,屡获殊荣,是图像和文件识别以及办公的好帮手,那么对于这样一款用途广泛的软件来说,如何获取注册码、激活码或序列号想必是大家最关心的问题。
2020-11-22
ABBYY PDF Transformer+注册码-激活码-序列号地址
提到PDF,相信很多人都会很自然地想到ABBYY PDF Transformer+,它是一个新的,全面巧妙地解决PDF文档的工具,可以编辑PDF文档,在PDF文档中添加评论,添加密码保护,实现简单环保地阅读PDF文档,能够便捷地处理任何类型的PDF文件,非常有效地提高日常工作效率。
2020-11-22
几款常用的OCR文字识别软件
图片文字提取软件是什么呢?随着大家的办公需求的加大,现在已经有很多的办公软件出现了,那么,图片文字提取软件便是其中的一种,因为现在制作图片的要求也比较高,所以,在图片上加入文字也是很正常的事情,那么,怎么样才能够直接将图片中的文字提取出来呢?
2020-11-22
使用序列号激活ABBYY FineReader 14
安装完 ABBYY FineReader 14 之后,很多小伙伴会有这样的疑问,安装完成后不知道如何激活软件,找不到输入序列号的入口,本文对这一问题进行讲解。
2020-04-07
如何获取ABBYY FineReader 12注册码-激活码-序列号
提及OCR文字识别软件,相信不少人会脱口而出ABBYY FineReader,这款软件当前版本为FineReader 12,是市场领先的OCR图文识别软件。
2020-04-07