来自ABBYY开发人员对FineReader的解读

发布时间：2015-09-22 16: 17: 43

作为ABBYY OCR产品识别技术的开发人员，笔者将以ABBYY最有名的识别技术软件FineReader为例来解读现代OCR技术的专业用途。

笔者认为的“技术”是什么意思呢?——有时候，所有的技术模块(软件可见的终端用户的部分)都包含在“识别引擎”这个定义之中，这并不完全正确：这些模块不仅识别字符，还有其他的功能，我将在后文中加以介绍。

FineReader软件有哪些功能?

目前任何电脑端FineReader版本都可以自动完成所有步骤：从使用扫描仪或相机拍摄图像开始，或从图像文件开始，到将处理结果导出为某种文件格式或导出到指定软件之中，都不需要用户在屏幕上进行操作。该程序自身能够“识别”(笔者沿用了这种说法，因为FineReader会定义文本段落和图片的位置，对图像中的图像文字部分进行OCR处理，生成一个文件，并将该文件保存为用户指定的文件格式)出用户的全部需求。

界面截图

运行界面

那么，用户需要做什么呢?

事实上，用户通常什么都不用做：他(她)只需要给软件下达指令，然后就可以得到结果了。有时用户不满意自动处理的结果，但用户通常会这样想：“真倒霉…算了。”

不幸的是，他们有些人并不知道，除了运行程序时显示的“快速任务”窗口，还可以通过若干其他方法来管理软件的性能。这些方法借助人类智慧，能够克服该程序在人工智能方面的缺陷和不足(有时候是根本性的缺陷)。

如何才能学会这些方法呢?下面几种途径都是可行的，必要时可以结合使用多种途径：

· 阅读简短的《用户手册》、《用户手册》全本和在线帮助——它们无疑都很长，但它们相当有用。

· 通读这篇文章。它简短得多，而且作者保证会消除用户对该软件的恐惧，唤醒他们的兴趣，让他们去体验这款软件。

试用该程序(您无法绕过这个阶段)——即便是通过免费试用版，您也可以体验下述实际应用所需的每项功能。

如何开始?

首先，您应该养成习惯，将文档不仅保存为最终需要的格式，还要保存为FineReader文档格式。这样，在处理大型文档时，您不必一步到位，而是可以分步进行，等方便的时候再回头处理已经识别和核对过的文件，进行自定义导出设置等操作。所有FineReader文档操作都整合在“文件”菜单中。

打开文件

没有什么比一个好的理论更实用了，或者说“识别”包含哪些流程

看着那些简短的快捷任务名，如“扫描到PDF”，您很难想象，“扫描”和“PDF”之间涉及多少流程(也就是“到”的含义)。让我们来细探究竟。“将光栅图像转换为可编辑文本”(不只是“识别”)任务包含着以下几个主要步骤：

1. 获取单页或多页图像(从扫描仪、相机或文件获得)，将其转换成特殊的内部格式，以简化和加速后续操作)。总之，此时程序使用了图像处理子系统，这个系统可以识别、读取和编辑众多的外部格式。

2. 准备图像(失真校正，将双页图像分割成单页，这些都可在“选项”菜单中定制)，这也是由图像处理子系统完成的。

3. 分割或页面布局分析。当确定要识别哪些内容以后，分析子系统会进行分割或页面布局分析。

4. 识别(终于到这一步了!)。由识别子系统(真是个巨大的惊喜，不是吗?)完成。它会生成由若干片段(未来的单词)组成的文本字符串，片段中包含若干无格式符号(甚至没有分段，只有文本字符串)。如果您对技术细节非常感兴趣，那么可以告诉您，除了所有其他组件，识别子系统还采用了词法子系统和可训练识别机制，它可以识别FineReader不认识(有时会出现这种情况)的装饰字体和符号。

5. 文件合成(它包括两个阶段：对于页面来说，在识别完单页以后开始;对于文件来说，它是在识别完所有页面之后开始)。正是在这个阶段，定义了文字(除了符号代码)布局和整体结构，生成了整个文件。这是由合成子系统完成的。

6. 预览和编辑页面图像、区域结构、和识别结果，由Program Cover(程序封面)和编辑子系统完成(可执行文件FineReader.exe就是这个cover)。您可以查看和编辑处理过程中产生的大量信息(从块结构开始)。当然，用户并不能编辑各个子系统生成的所有信息。最主要的原因是，要显示出自动过程中找到的所有信息，以及它们的功能和关系，用户接口会变得非常复杂，使用起来很不方便。

将生成的文档转换成各种外部格式，是由导出子系统(这正是我的专长所在)来完成的。在导出之前，子系统并不知道处理结果要导出为哪种格式，或采用哪种导出方案。因此，文件合成时会同时生成各种导出格式/变体可能需要的若干方式，而Cover会将它们显示出来，就像结果在合适软件中显示的那样。这会给开发过程带来很大的麻烦：由于相关子系统之间联系紧密，当某个漏洞或功能处于两个子系统的边界之时，职责划分会变得复杂。但我们可以处理这种情况。

为什么有这么多的模块(子系统)?

我们首先要强调的是，笔者在这里只列出了重要的模块，还有一些模块没有列出。例如，扫描子系统的开发过程不是一两天的事情，而是积年累月的过程。不过我们还是说回正题。

首先，10多年来，大批人员开发了“识别技术”项目，并在此基础上开发了众多复杂产品：他们的工作需要进行结构和技术区分，使各自的开发具有或多或少的独立性，同时又能详细地描述各个过程以及其衔接规则，以便它们能够在逻辑上交互配合。

其次，有些产品并没有采用所有的处理阶段(以及实现它们的子系统)，只是采用了其中部分阶段。例如，识别子系统具有其自身的印刷和手写文字识别子模块，每个子模块又有下属子模块，如处理复杂语言的下属子模块。这种情况与条形码识别模块以及几种图像格式编解码器类似：有些产品完全不需要它们。

结果是什么?为什么用户需要它?

如果您不留心这个问题，即便完全正确的OCR结果也可能会让您不满意：此时所有的字符都被找到并正确识别出来，但总体来说，结果并非您所期望的那样。下面我来列出运用FineReader及其功能的常见情况。

将映像文件档案转换成数字格式，在一定程度地保留布局的同时，更轻松地搜索和引用文字片段

在这种情况下，通常将经过处理的文档转换成PDF文件，既保留可见的页面图像(可能并非原始状态，但尽量接近原始状态)，同时增加隐藏的识别文字层，您可以在各种PDF查看器中搜索、突显、摘引和复制文字。这种存储文件称为“双层PDF”，它是流行的格式，但此外还有其他三种格式。我将在以后的文章中介绍所有其他格式。熟悉DjVu格式的用户也可以使用类似的存储模式。

“图像遮盖文本”模式的主要优点是，它不需要太多有关被保存文本的结构信息，因为它只是使用原始图像上的坐标信息，将符号和页面的确切位置联系起来。因此，如果表格没有被准确地自动检测出来(即将它们分成多个毫无关联的文本字符串)，或者文本形成不合逻辑的段落，这都无关紧要：反正您能够找到全部或绝大多数所需信息;重要的是，字符被正确识别出来了，构成了正确的单词。

利用任何一种常用的文字编辑器，创建类似于原件的格式文件(Microsoft Word、Open Office、LibreOffice Writer等)，以便对新文件中的大段文字进行后续编辑和重复使用。

保存为RTF、DOCX(针对MS Word)和ODT(针对Writer)格式时支持四种配置，它们彼此各不相同，或侧重于“精确保留原始布局”，或侧重于“易于编辑和修订内容”。日后我将详细介绍它们之间的差异，但要得到理想的处理结果，关键在于，FineReader要正确地解读文档的布局，理解各个区块及其特性。

扫描纸质书籍来制作电子书

这非常类似于前一种方案，但由于电子书格式文件通常要简单得多，其编辑方法更有限，经过FineReader处理之后查看更为复杂，有时需要更多地关注某些功能。

这些知识有什么用?

您可能已经知道了，理解所有这些合乎逻辑但逻辑不那么明显的细节，用户就能更轻松地获得(从用户的角度来讲)的FineReader处理结果。

更多关于ABBYY FineReader的相关信息，可点击进入ABBYY中文服务中心，查看您需要的信息。

展开阅读全文

︾

标签：ABBYY FineReader 12，OCR文字识别，文件扫描识别软件

读者也访问过这里:

ABBYY FineReader

一款功能强大的OCR和PDF软件

立即购买

联系客服：

400-8765-888

kefu@makeding.com

最新文章

abbyy finereader需要付费吗 abbyy软件有免费的吗

ABBYY是一家全球领先的技术公司，专注于开发和提供智能文档处理和数据捕获解决方案。ABBYY的主要产品包括ABBYY FineReader，这是一款流行的OCR软件，可将扫描的文档和图像转换为可编辑的文本格式。

2024-04-10

为什么word转PDF图片模糊 word转pdf怎么保持图片清晰度

将Word文档转换为PDF格式可以提高文档的安全性、兼容性和可读性，同时方便打印、分享和浏览。但是在将Word文档转换为PDF格式之后，有时原先的图片会变得模糊，这是为什么呢？下面一起来了解为什么word转PDF图片模糊，word转pdf怎么保持图片清晰度的相关内容。

2024-04-09

电脑OCR文字识别软件哪个好识别图片文字转化为文本

OCR是Optical Character Recognition的缩写，中文名为光学字符识别，是指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程。随着技术的不断发展，OCR技术的识别率和速度都有了很大的提高，已经成为了一种非常常见的技术。下面一起来了解电脑ocr文字识别软件哪个好，识别图片文字转化为文本的相关内容。

2024-03-01

PDF编辑器怎么用橡皮擦 PDF编辑器怎么擦除文字

擦除工具可以帮助你删除文档中的错误或不需要的信息，或者是要遮盖敏感内容，又或者是想在一份已有的文档上进行再创作。那在PDF编辑器中具体该怎么使用擦除工具呢？下面一起来了解pdf编辑器怎么用橡皮擦，pdf编辑器怎么擦除文字的相关内容。

2024-03-01

识别模糊图片上的文字软件有哪些如何识别模糊图片的文字

识别图片中的文字可以帮助人们更高效地获取和处理信息，提高工作效率，实现数字化转型，并促进信息的传播和共享。那有哪些软件可以识别图片上的文字呢？下面一起来了解识别模糊图片上的文字软件有哪些，如何识别模糊图片的文字的相关内容。

2024-02-22

ABBYY怎么修改PDF里面的文字 ABBYY怎么修改页面大小

ABBYY FineReader是一款专业的OCR文字识别软件，该软件具有先进的OCR技术，能够准确识别各种语言的文本，并提供多种导出选项。它可以帮助用户快速准确地将文档和图像中的文本转换为可编辑的文字，提高工作效率和生产力。那在ABBYY FineReader软件中怎么修改pdf文件中的文字呢？下面一起来了解abbyy怎么修改pdf里面的文字，abbyy怎么修改页面大小的相关内容。

2024-02-22

微信公众号

欢迎加入ABBYY产品的大家庭，立即扫码关注，获取更多办公软件动态和资源福利。

读者也喜欢这些内容: