发布时间:2017-02-16 11: 36: 06
ABBYY Recognition Server作为一种功能强大的自动识别系统,可以自动转换纸质文档、图像和电子文档,并将它们保存为压缩的归档文件,如PDF或PDF/A。ABBYY Recognition Server的自动化文档处理过程包括六个阶段,这些阶段可以在单独的工作流程中进行配置,每个工作流有其特定的设置和优先级,且彼此独立运行,本文将具体讲讲ABBYY Recognition Server自动化处理文档的流程。


图像可以由操作者在扫描站扫描后发送到Recognition Server或者通过Recognition Server从输入文件夹(网络文件夹、FTP文件夹、SharePoint库或邮箱)自动导入,该应用程序根据优先级和可用计算资源自动处理在队列中的图像文件。
作为批次扫描的图片, ABBYY Recognition Server提供几种内置文档分割方式可选:空白页、条码或者页面上的粘贴以及打印条码,同时还支持脚本方式书写以外的客户规则。
ABBYY Recognition Server的OCR识别是在处理站自动运行的。如果同时安装多个处理站在系统中,这些文件将这些处理站之间均匀分布,以获得高性能,安装多个处理站能够加快OCR识别速度。
ABBYY Recognition Server的OCR和条码识别技术提供了无与伦比的精确性,支持多种类型文本,以及流行的1D/2D条码。Recognition Server支持198多种语言,包括拉丁文、西里尔文、希腊和其他脚本,中文、日语、韩语、越南语、希伯来语、意第绪语和泰国等,欧洲的古体语言也支持。
为保留文档版面, ABBYY Recognition Server使用Adaptive Document Recognition Technology (ADRT)技术,在保存成DOC和RTF时很好地保留文档的原始版面,包括页眉、页脚、表格内容等。
在某些情况下,例如书籍数字化时,验证识别结果可能是必要的。验证站能够让操作者检查所有的文件或者只检查低于一定精确度的文件。
执行批量扫描或导入的时候,将涉及到文件分离。文件可以用空白分隔页,条形码或每个文档页面固定数目分开的,分离也可以根据脚本规则进行。
ABBYY Recognition Server是一个强大的索引软件。文件索引可以通过脚本自动完成或者由操作员在索引站手动选择文件类型并指定文件属性,操作员也可以检验由脚本自动导出的数据。文档类型的探测、分类和索引可以通过Java或者VB自动实现。
文件处理的最后阶段,ABBYY Recognition Server将文件输出到其最终储存处(网络文件夹、SharePoint文件库或电子邮件)。此外,输出的文件还可以应用于智能路由或发送至基于文档属性和特性的ECM系统。
识别服务器可以将图片转换成不同的可搜索的文件格式:PDF、PDF/A、RTF、TXT、DOC(X)、XLS(X)、XML。
更多有关ABBYY Recognition Server的内容,请点击访问ABBYY教程了解更多。
展开阅读全文
︾
读者也喜欢这些内容:
ABBYY如何识别化学公式 ABBYY怎么识别复杂文档
ABBYY FineReader的OCR识别功能非常好用,可以高精度识别各种格式的文本,如果大家在工作中经常要处理复杂的文档或者化学公式,就可以通过它来搞定。那么ABBYY如何识别化学公式,ABBYY怎么识别复杂文档呢?本期我们就给大家介绍一下相关的内容。...
阅读全文 >
ABBYY如何提取图片表格 ABBYY如何提取手写批注
在工作中,大家是否遇到过需要提取图片中表格内容或手写字体的情况。要知道,图片上的表格内容无法直接编辑复制,需要先将图片中的内容识别出来,再转换为可编辑的文本。ABBYY FineReader是一款专业的OCR光学字符识别软件,以高精度的识别率深受大家欢迎,下面我们就借助ABBYY FineReader,来为大家演示ABBYY如何提取图片表格,ABBYY如何提取手写批注的相关内容。...
阅读全文 >
ABBYY如何使用 ABBYY支持哪些输出格式
ABBYY FineReader是一款非常优秀的PDF转换工具,不仅支持超百余种语言的文字识别,还能将扫描件、PDF或图片内容快速提取并转换为可编辑的格式,对我们的学习、工作非常有帮助。接下来本文将详细为大家介绍ABBYY如何使用, ABBYY支持哪些输出格式的相关内容,助力大家快速上手ABBYY FineReader文字识别软件。...
阅读全文 >
pdf编辑器怎么删除页码 pdf编辑器怎么删除部分内容
PDF编辑器是一种用于编辑PDF文档的软件工具,用户可以在其中对PDF文档进行各种操作,比如修改、添加、删除文本和图像,以及调整页面布局、插入注释和标记等。页码是文档页面的编号,通常显示在每页的底部或顶部。...
阅读全文 >