发布时间:2021/01/20 10:22:48
在一些政府公开信息分享网站或专业的数据分享机构网站,都会定期公开分享一些社会发展数据,或与当前时事相关的数据。这些数据往往会采用网页分享的形式,很少会提供文件下载。
如果直接将这些数据复制下来,将需要花费大量的时间进行数据排版。但借助ABBYY FineReader PDF 15 文字识别软件的帮助,可以快速识别为表格数据,并导出为可编辑的数据表格。接下来,一起来看看怎么操作吧。
一、网页表格数据截图
首先,打开相关数据网站,对数据表格区域进行截图操作。
如图2所示,截图过程中,建议尽量保持表格边框的完整性,提高ABBYY FineReader PDF 15识别的准确度。
二、使用OCR编辑器识别表格
接着,打开ABBYY FineReader PDF 15文本识别软件,并使用“在OCR编辑器中打开”功能,打开刚才在网站截取的表格数据。
接着,待软件完成图像的文本识别。在识别过程中,为了提高文本识别的准确度,软件会对图像的分辨率或指定的OCR语言作建议。如果条件允许的话(如提高图像的分辨率),可按照建议修改相关的设置。
完成了文本识别程序后,我们需要先在区域属性面板中检查表格标记的区域属性是否正确。如图5所示,可以看到,ABBYY FineReader PDF 15已正确地将该区域标记为表格区域。
接着,再看到软件的文本编辑面板。如图6所示,可以看到,文本已经呈现为电子表格的形式,可以在单元格中编辑文本。
三、导出为Excel表格
为了方便后续的数据处理,我们可以将识别后的电子表格另存为Excel文件。如图7所示,在文本编辑面板的上方选取Excel表格的保存格式后,就可以将当前文本导出为Excel文件。
打开导出的Excel文件,可以看到,ABBYY FineReader PDF 15不仅能准确地识别数据,而且还能将表格的格式“复制”下来,将数据很好地导出到各个单元格中。这种导出形式可以减少大量数据排版的时间。
四、小结
通过使用ABBYY文字识别软件的数据表格识别功能,我们可以快速地将图片中的表格转换为可编辑的电子表格,提高数据的使用效率。这么好用的功能,您get到了吗?
作者:泽洋
读者也喜欢这些内容:
office加密文件忘记了密码怎么办 office加密文件怎么去掉密码
为了便于保护个人隐私或防止文件泄露,我们通常会对自己的office文件进行加密。但是日常生活中需要使用密码的地方很多,不免会遗忘掉密码。那么大家知道office加密文件忘记了密码怎么办,office加密文件怎么去掉密码吗,下面就一起去下文中寻找答案吧!...
阅读全文 >
文档字体间距大小怎么调整 文档字体底部有颜色怎么去掉
在对pdf文件进行编辑时,字体是一个大的编辑项,字体的种类,大小,字体间距等都是需要根据需求去选择,好的字体编辑会有一个更精美的pdf,那在编辑pdf时怎么去调整字体间距大小呢?如果字体底部有颜色,又怎么去掉呢?接下来就和小编一起来了解文档字体间距大小怎么调整,文档字体底部有颜色怎么去掉。...
阅读全文 >
pdf扫描件模糊如何处理清晰 pdf显示模糊处理办法
在图片扫描成pdf文件的过程中时常会有图片模糊导致pdf扫描件的文本内容不清晰,甚至影响人们阅读的情况出现。所以今天我就为大家介绍一下pdf扫描件模糊如何处理清晰,pdf显示模糊处理办法,感兴趣的话请继续看下去吧。...
阅读全文 >
PDF怎么删除文件自带的页码 怎么批量删除PDF页码
PDF文档在不同的操作系统和不同的软件中所呈现的内容都是一致的,因此发送和分享文档时,我们通常会使用PDF格式。这种格式很常见,但很多人都不知道怎么编辑它。下面就为大家介绍PDF怎么删除文件自带的页码,怎么批量删除PDF页码的相关问题。...
阅读全文 >