ABBYY Recognition Server

FineReader下载 FineReader购买
ABBYY > 产 品 > Recognition Server

ABBYY Recognition Server是一款功能强大的解决方案,自动识别系统,能将文档转换成可搜索的文件格式。凭借其可扩展的架构,客户可以轻松地部署任何规模的文件处理项目,显著的节省时间和成本。ABBYY Recognition Server可以提高任何规模的公司的工作效率。

功能介绍

ABBYY Recognition Server的设计到大量的纸质文件或文档图像自动转换成完全可搜索的电子文本适用于业务流程,如文件归档,电子搜索,企业搜索。

该产品实现自动化,无人值守的文件处理,它可以集中管理,并从组织内部或远程多点访问。

识别服务器与后端系统与第三方应用的集成,通过各种脚本,XML,一个Web服务API,或基于COM的API也可以连接。

得益于荣获了多项奖项的ABBYY OCR技术,ABBYY Recognition Server能高质量识别超过190种的文档语言,包括阿拉伯语和亚洲各语系。

主要特点

  • 文件自动转换

    文件自动转换

     

    在公司信息技术背景下创建并设置好Recognition Server,运行程序后几乎无需用户交互处理文件。

  • PDF智能处理

    PDF智能处理

     

    由于注入的文字层扫描的PDF文件被转换成可搜索的PDF和PDF/A文件格式。已经包含可搜索文本的电子PDF文件可以在处理前检测并移动到输出文件夹(Output Folders)。

  • 利用MRC技术的优秀的PDF压缩技术

    利用MRC技术的优秀的PDF压缩技术

     

    利用MRC改进后的压缩算法技术,Recognition Server可以创建更小的PDF文件以节省存储空间和带宽,并保证文件达到最佳的视觉效果。

  • 将原始文件夹结构复制至可搜索格式文件

    可搜索格式文件

     

    Recongnition Server 能将任何数字化程序库中的文件夹和子文件夹按现有结构完全复制。当数字文档和其他文件被完全复制时,图像文件将转换成指定的格式。

  • 与Microsoft® SharePoint直接连接

    与Microsoft® SharePoint直接连接

     

    Recognition Server可以将Microsoft SharePoint的任何文件或整个程序库转换成可搜索的格式,并储存于SharePoint,这样就能轻松在库中查找到所需文件。

  • 多种输出格式

    多种输出格式

     

    被扫描的文件可以同时转换成PDF、PDF/A、XML 和 Microsoft Office等输出格式。

主要优点

  • 提高效率

    提高效率

     

    Recognition Server能将所有的纸质和图像文件转换成可搜索格式并储存在数字档案库中,这样便能快速检索到任何位置的相关文件。

  • 轻松集成

    轻松集成

     

    ABBYY Recognition Server具有强大的兼容性,能够与任何型号的扫描仪或多功能打印机连接,并能将数据输出到ECM系统和基于API界面的COM系统组件中,这意味着,它在任何IT环境中都能轻松实现一体化。

  • 独特的可扩展性

    独特的可扩展性

     

    基于可扩展的产品架构以及可变更的授权选项您可以设置在某一时间内的最大文件处理数量。而且您无需重装软件就能随时可以扩大授权范围,增加文件处理量。

  • 值得信赖的结果

    值得信赖的结果

     

    得益于荣获了多项奖项的ABBYY OCR技术,ABBYY Recognition Server能高质量识别超过190种的文档语言,包括阿拉伯语和亚洲各语系。

  • 投资保护

    投资保护

     

    ABBYY技术专家从试用阶段起便向用户提供专业的技术支持。软件维护和升级保障可以确保软件的定期升级,而技术支持服务更能持续保证用户获得最优化的软件使用体验。

  • 快速投资回报率

    快速投资回报率

     

    由于ABBYY Recognition Server配置简捷,管理简单以及自动化的工作程序,您无需额外的学习就能立即使用软件,该解决方案的运用能使您的文件处理成本显著下降。

处理只读文档和文档库

 

ABBYY Recognition Server 4允许管理员设置一个现有的归档文件夹或SharePoint文档库作为输入文件的来源。存储其中的原始文件无论如何都不会被移动,删除或改变。另外,也可将输入文件的来源与转换文件的位置设定在同一SharePoint文件库中。在这种情况下,通过Recognition Server处理的文件(例如可搜索的PDF文件)可以取代原文件,并可按照您的设定另存为新名字和新版本。然后,您只需选定需转换的图像和PDF文件的现有存档,Recognition Server就会将其转换成可搜索的PDF文件。

处理只读文档和文档库

增强稳健性

 

由于外增了一个SQLite数据库与容错机制的增强,ABBYY Recognition Server变得更加强大,一旦安装就能够始终如一地承担高工作负载和多用户运行。这使得该软件可以在无人值守模式下处理大量文档,并妥善完成任务。

增强稳健性

故障24/7的保护运行

 

ABBYY Recognition Server拥有的集群架构可以确保24/7关键业务项目的运行。此外,处理站、服务器管理器和授权管理器现在可以自动将问题报告发到故障转移群集环境。如果任一的服务器组件停止工作,Recognition Server将自动切换到备份节点继续处理文档。

故障24/7的保护运行

包含文本图层的PDF文件的智能处理

 

Recognition Server 4在进行文件处理时可以跳过已转换为可搜索的PDF文件(如包含文本图层的PDF文件),也能智能地选择需要再次识别的文件。后一种情形下,Recognition Server会检测每个PDF文件的文本图层,检查其质量并决定是否应该把原始文档按原本格式导出的或者用新的识别文本取代之前的文本。该智能算法可以使可搜索的PDF文件保持原有格式以减少总转换时间。

包含文本图层的PDF文件的智能处理

保留原PDF文件的既有特点

 

将PDF转换为PDF或PDF/A的情况下,Recognition Server能够保持PDF文档的所有的原始功能(如书签,元数据和附件)并且只添加OCR识别结果的文本图层。因此,使用Recognition Server转换PDF文件能使源文件功能和图像质量保持不变。

保留原PDF文件的既有特点

支持转换最新的PDF/A规格

 

Recognition Server已经支持PDF/A-1a和PDF/A-1b规格的转换,Recognition Server 4.0版本进行了部分升级,该版本需要的储存空间更少,支持透明效果和图层,还支持创建PDF/A-2a, PDF/A-2b 和 PDF/A-2u。

支持转换最新的PDF/A规格

使SharePoint库成为可搜索的

 

Recognition Server与SharePoint的集成因Recognition Server 的“一键连接至SharePoint”( “capture to SharePoint”)变得更容易。Recognition Server可以在现有的SharePoint库中处理PDF文件和图像,并可将转换后的可搜索的PDF添加至搜索索引中。

使SharePoint库成为可搜索的

通过掩码筛选需处理的文件

 

新版本的Recognition Server拥有只处理符合指定掩码(mask)文件的功能。你可以在"1.Input"选项卡的“选择处理文件”区域指定一个或多个分号分隔的文件掩码,然后为不合掩码要求的文件选择处理方式。这类不合要求的文件可以被放至“待处理”(Exceptions)文件夹或保持原样移动到“输出”(Output)文件夹或者留在原文件夹。

通过掩码筛选需处理的文件

技术图纸的特殊处理模式

 

技术图纸的新处理模式可以处理包含大量的图形细节和直体字的文件。该模式能保证需处理的图形源文件不会发生改变,所有的文字将从三个方向进行识别确认:主要方向,顺时针旋转方向和逆时针旋转方向。因此,在图纸上的所有文字将被精确识别。

技术图纸的特殊处理模式

在索引站动态导入的值列表

 

索引字段的可能值的列表可以从外部文件或数据库中导入。由于此功能,列表现在可以与第三方系统自动更新或者同步。

在索引站动态导入的值列表

构造

ABBYY Recognition Server按照工作流程处理每个图像文件。工作流程是由管理员预定义的处理参数。ABBYY Recognition Server可以同时处理参数不同的多个工作流程。每个工作流对应独特的输入源(文件夹,SharePoint库或邮箱)。所有在来源显示的图像均按照相应的工作流参数进行处理。

文件处理

ABBYY Recognition Server由几个部分组成,它可以在一个局域网上的相同或不同的计算机上安装。是:
•服务器管理器 - 中央服务组件,它控制文件处理队列和站之间分配任务
•处理站 - 执行识别和文档转换服务
•扫描站 - 为客户批量扫描和图像处理前站
•索引站 - 客户站的文件索引和分类
•管理控制台 - 用于配置和监控识别服务器的客户端控制台

Recognition Server 其主要成分

工作流程

ABBYY Recognition Server的自动化文档处理包括六个阶段,这些阶段可以在单独的工作流程进行配置。每个工作流有其特定的设置和优先级,且彼此独立运行。

文件处理的六个阶段

文件处理的六个阶段

1.图像扫描/导入

图像可以由操作者在扫描站扫描后发送到Recognition Server或者通过Recognition Server从输入文件夹(网络文件夹,FTP文件夹,SharePoint库或邮箱)自动导入的。该应用程序根据优先级和可用计算资源自动处理在队列中的图像文件。

扫描站点

扫描站点提供批量扫描和图像预处理的功能:

  • 通过TWAIN, WIA和 ISIS扫描;
  • 快速图片预览
  • 图片预处理(旋转、去杂、去噪等)
  • 通过条码、空白页面和页面固定数字进行文档分割。

从网络/FTP输入
泰比 (ABBYY) Recognition Server可以自动从以下网络途径输入图片:

  • 网络文件夹
  • FTP 文件夹
  • Email文件夹

作为批次扫描的图片,泰比 (ABBYY) Recognition Server可以提供几种内置文档分割方式可选:空白页、条码或者页面上的粘贴以及打印条码。同事还支持脚本方式书写另外的客户规则。

2.识别

Recognition Server的OCR识别是在处理站自动运行的。如果同时安装多个处理站在系统中,这些文件将这些处理站之间均匀分布的以获得最大性能。安装多个处理站能够加快OCR识别速度。

Recognition Server中的OCR和条码识别技术提供了无语匹敌的精确性,支持多种类型文本,以及最流行的1D/2D条码。OCR支持198多种语言,包括拉丁文,西里尔文希腊其他脚本中文,日语,韩语,越南语,希伯来语意第绪语泰国。 欧洲的古体语言也支持。

为了保留文档版面,泰比 (ABBYY) Recognition Server使用Adaptive Document Recognition Technology  (ADRT)技术,它可以在保存成DOC和RTF时很好保留文档原始版面,包括页眉、页脚、表格内容等。

3.验证(可选)

在某些情况下,例如书籍数字化时,验证识别结果可能是必要的。验证站使操作者能够检查所有的文件或者只检查低于一定精确度的文件。

4.文件分离(可选)

执行批量扫描或导入的时候,将涉及到文件分离。文件可以用空白分隔页,条形码或每个文档页面固定数目分开的。分离也可以根据脚本规则进行。

5.分类和索引(可选)

泰比 (ABBYY) Recognition Server是一个强大的索引软件。文件索引可以通过脚本自动完成或者由操作员在索引站手工选择文件类型并指定文件属性。操作员也可以检验由脚本自动导出的数据。

文档类型的探测、分类和索引可以通过Java或者VB自动实现。

6.发布

文件处理的最后阶段,Recognition Server将文件输出到其最终储存处(网络文件夹,SharePoint®文件库或电子邮件)。此外,输出文件还可以应用于智能路由或发送至基于文档属性和特性的ECM系统。

识别服务器可以将图片转换成不同可以搜索的文件格式:PDF、PDF/A, RTF, TXT, DOC(X), XLS(X), XML。

通过内置PDF创建功能,RS可以提供以下扩展:

  • 文档安全
  • MRC压缩技术,保留视觉效果的同事创建小尺寸文件。
  • 网页优化
  • PDF标签
  • 增加页眉、页脚和印章
  • 创建PDF和PDF/A兼容的文件。

管理

Recognition Server管理通过基于Microsoft管理控制台方便的界面。它允许系统管理员配置和监控其活动:设置加工参数,许可证管理,站,用户的权限,处理队列中,并查看日志。
与优先级管理和调度的功能,管理员可以控制在其中文件的处理顺序和有效在晚上时间或周末时间里使用的OCR调度站的硬件资源。

整合

泰比 (ABBYY) Recognition Server与其他应用集成提供了一个应用程序编程接口(API)。 API可以用来传递图像文件和工艺参数识别服务器,获取有关工作完成的通知,并获得转换后的文件。

参数ABBYY Recognition Server技术参数

服务器管理器

  • PC: 最低500 MHz的Intel®Pentium®/Celeron®/ Xeon™/ Core™,AMD K6 / Athlon™/ Duron™/ Sempron™/ Opteron™或兼容处理器
  • 操作系统:Microsoft® Windows® 8, Windows Server® 2012, Windows Server® 2008 R2 SP1, Windows Server® 2008 SP2, Windows Vista® SP2
  • 内存:1 GB RAM
  • 硬盘空间:20 MB为安装,1 GB为程序运行*
  • 下面的注册表分支应该是从服务器管理器访问:HKEY_CLASSES_ROOT 、HKEY_LOCAL_MACHINE\Software\ABBYY和 HKEY_CURRENT_USER\Software\ABBYY
  • 将文件保存到Microsoft SharePoint Server需要Microsoft .NET Framework 2.0或4.0
  • 需要Microsoft Outlook 2000或更高版本才能通过Microsoft Exchange Server处理和发送电子邮件

扫描工作站

  • PC: 最低2 GHz的Intel®Core™2/2 Quad /Pentium®/Celeron®/ Xeon™,AMD K6 / Turion™/ Athlon™/ Duron™/ Sempron™处理器或兼容处理器
  • 操作系统:Microsoft Windows® 8, Windows Server® 2012+Decstop Experience, Windows Server® 2008 R2 SP1+Decstop Experience, Windows® 7 SP1, Windows Server® 2008 SP2+Decstop Experience, Windows® Vista® SP2
  • 内存:1 GB
  • 硬盘空间: 1 GB (包括125 MB 为安装)
  • 支持TWAIN, WIA 或ISIS扫描仪
  • 视频卡和显示器(最小分辨率1024x768)
  • 键盘,鼠标或其他输入设备

处理工作站

  • PC: 最低500 MHz的Intel Pentium / Celeron / Xeon / Core,AMD K6 / Athlon / Duron / Sempron / Opteron或兼容处理器
  • 操作系统:Microsoft Windows® 8, Windows Server® 2012, Windows Server® 2008 R2 SP1, Windows Server® 2008 SP2, Windows Vista® SP2
  • 内存:512 MB RAM,再每一个处理操作要额外300 MB
  • 硬盘空间:600 MB 为安装,1 GB为程序运行*

验证工作站

  • PC: 1 GHz或更高Intel Pentium / Celeron / Xeon / Core,AMD K6 / Athlon / Duron / Sempron / Opteron或其他兼容处理器
  • 操作系统:Microsoft® Windows® 8, Windows Server® 2012, Windows Server® 2008 R2 SP1, Windows® 7 SP1, Windows Server® 2008 SP2, Windows Vista® SP2
  • 内存:1024 MB RAM。 在多处理器系统中,每个附加处理器需要额外的512 MB RAM
  • 硬盘空间: 1 GB (包括125 MB 为安装)
  • 视频卡和显示器(最小分辨率1024x768)
  • 键盘,鼠标或其他输入设备

索引工作站

  • PC: 500 MHz或更高Intel Pentium / Celeron / Xeon / Core,AMD K6 / Athlon / Duron / Sempron / Opteron或其他兼容处理器
  • 操作系统:Microsoft Windows® 8, Windows Server® 2012, Windows Server® 2008 R2 SP1, Windows® 7 SP1, Windows Server® 2008 SP2, Windows Vista® SP2
  • 内存:768 MB RAM
  • 硬盘空间:500 MB为安装,1 GB为程序运行*

管理控制台

  • PC: 最低200 MHz的Intel Pentium / Celeron / Xeon / Core,AMD K6 / Athlon / Duron / Sempron / Opteron或兼容处理器
  • 操作系统:Microsoft Windows® 8, Windows Server® 2012, Windows Server® 2008 R2 SP1, Windows® 7 SP1, Windows Server® 2008 SP2, Windows Vista® SP2
  • 内存:128 MB RAM
  • 硬盘空间:30 MB
  • 将文件保存到Microsoft SharePoint Server需要Microsoft .NET Framework 2.0或4.0

COM-based API

  • PC: 最低200 MHz的Intel Pentium / Celeron / Xeon / Core,AMD K6 / Athlon / Duron / Sempron / Opteron或兼容处理器
  • 操作系统:Microsoft Windows® 8, Windows Server® 2012, Windows Server® 2008 R2 SP1, Windows Server® 2008 SP2, Windows Vista® SP2
  • 内存:128 MB RAM
  • 硬盘空间:15 MB

Web Service

  • PC: 最低200 MHz的Intel Pentium / Celeron / Xeon / Core,AMD K6 / Athlon / Duron / Sempron / Opteron或兼容处理器
  • 操作系统:Microsoft Windows® 8, Windows Server® 2012, Windows Server® 2008 R2 SP1, Windows® 7 SP1, Windows Server® 2008 SP2, Windows Vista® SP2
  • 内存:128 MB RAM
  • 硬盘空间:15 MB为安装,100 MB为程序运行*
  • Microsoft IIS 5.1 或更高
  • Microsoft .NET Framework 2.0或4.0

Google Search Appliance Connector

  • PC: 最低500 MHz的Intel Pentium / Celeron / Xeon / Core,AMD K6 / Athlon / Duron / Sempron / Opteron或兼容处理器
  • 操作系统:Microsoft Windows® 8, Windows Server® 2012, Windows Server® 2008 R2, Windows® 7, Windows Server® 2008, Windows Vista®
  • 内存:128 MB RAM
  • 硬盘空间:编程操作所需的硬盘空间取决于图像的复杂性和数量

Microsoft Search IFilter

  • PC: 最低500 MHz的Intel Pentium / Celeron / Xeon / Core,AMD K6 / Athlon / Duron / Sempron / Opteron或兼容处理器
  • 操作系统:Microsoft Windows® 8, Windows Server® 2012, Windows Server® 2008 R2 SP1, Windows® 7 SP1, Windows Server® 2008 SP2, Windows Vista® SP2
  • 内存:128 MB RAM
  • 硬盘空间:10 MB用于安装ABBYY Recognition Server IFilter,程序操作所需的硬盘空间取决于映像的复杂性和数量

用户界面语言

  • 英语
  • 法语
  • 葡萄牙语
  • 简体中文
  • 德语
  • 俄语
  • 繁体中文
  • 匈牙利语
  • 西班牙语
  • 捷克语
  • 意大利语
  • 波兰语

识别语言

  • 43个主要语言字典支持,133其他语言没有字典支持
  • 5东亚语言:简体中文,繁体中文,朝鲜语,韩语字母音节,日语
  • 6种语言为识别旧欧洲文件和哥特式字体(18-20世纪印刷的书)
  • 4人工语言:世界语,IDO,国际语,西方语言
  • 6编程语言:基本的C / C ++和COBOL,FORTRAN,JAVA,帕斯卡尔
  • 简单的化学公式
  • 数字

打印类型

  • 普通,传真(低分辨率文本的模式),打字机,针式打印机,OCR-A,OCR-B,MICR(E13B),哥特式

条码类型

  • 1D: Check Code 39, Check Interleaved 25, Code 128, Code 39, EAN 13, EAN 8, Interleaved 25, CODABAR (without checksum), UCC Code 128, Code 2 of 5 (Industrial, IATA, Matrix), Code 93, UPC-A, UPC-E, Patch Code and Postnet;
  • 2D: PDF 417, Aztec, Data Matrix, QR Code.

支持的输入格式

  • TIFF / Multipage TIFF
  • 压缩方法:无压缩, CCITT Group 3, CCITT Group 3 FAX(2D), CCITT Group4, PackBits, JPEG, ZIP, LZW
  • JPEG, JPEG 2000
  • PDF
  • DjVu
  • BMP
  • PNG
  • PCX, DCX

支持的输出格式

  • PDF, PDF/A-1a, PDF/A-1b, PDF/-2a, PDF/A-2b, PDF/A-2u
  • RTF
  • DOC, DOCX
  • XLS, XLSX
  • TXT, CSV
  • HTML
  • TIFF
  • JPEG, JPEG 2000
  • JBIG2
  • PNG
  • EPUB
  • XML, Alto XML
  • FineReader 内部格式(FineReader Engine兼容的)




购买咨询