abbyychina官方网站 > FineReader使用技巧 > FineReader 12打印的文档包含非标准的字体

FineReader 12打印的文档包含非标准的字体

发布时间:2015/08/11 14:32:18

如果您使用FineReader 12打印的文档包含非标准字体,那么首先使用训练模式可提高含有装饰字体的文档或包含特殊字符(例如数学符号)文档的 OCR 质量。我们会在下文向您讲解怎样提高非标准字体的打印质量。

注意:不推荐在其他情况下使用训练模式,因为相对于在训练上所花费的时间和精力,识别质量的提升并不显著。

在训练模式中,可创建一种对整篇文本执行 OCR 操作时使用的用户模式。

⊙使用用户模式

⊙创建和训练用户模式

⊙选择用户模式

⊙编辑用户模式

要使用一种模式来识别文档:

1. 打开选项对话框(工具>选项…),然后单击 读取选项卡。

2. 在训练下,选择 仅使用用户模式选项。

注:如果选择 使用内置和用户模式,ABBYY FineReader 12 将同时使用用户模式及厂商预设模式执行 OCR 操作。

3. 单击模式编辑器… 按钮。

4. 在模式编辑器对话框中选择所需模式,然后单击确定。

5. 在 ABBYY FineReader 主窗口中单击读取按钮。

创建和训练用户模式

要训练用户模式以识别新字符和连字:

1. 打开选项对话框(工具>选项…),然后单击 读取选项卡。

2. 在训练下,选择 使用内置和用户模式或仅使用用户模式。

3. 选择通过训练读取选项。

4. 单击模式编辑器… 按钮。 注:亚洲语系不支持模式训练。

5. 在模式编辑器对话框中,单击新建...

6. 将打开创建模式对话框。键入用户模式名称并单击确定。

7. 关闭模式编辑器和选项对话框,其方式是单击这两个对话框中的确定按钮。

8. 在图像窗口顶部的工具栏中单击读取。 现在,如果 ABBYY FineReader 遇到未知字符,则该字符将会显示在 ДЈКЅСμБ·对话框中。

训练模式

9. 教授程序读取新字符和连字。

连字是两个或三个“粘合”字符的组合(如 fi、fl、ffi 等),程序很难将之分开。实际上,更好的方式是将它们视为一个合成字符。 注:选择效果下的对应选项,可在已识别文本中保留文本中用粗体、斜体打印的词或用上标/下标表示的词。 要返回至上一训练字符,请单击上一步按钮。画面将跳到上一位置,并从模式中删除最后训练的“字符图像–键盘字符”对应项。上一步按钮在一个单词的字符间浏览,而不会在单词之间浏览。

重要!

可仅训练 ABBYY FineReader 使其阅读识别语言字母中所包含的字符。要训练该程序读取那些无法用键盘输入的字符,可使用两个字符的组合来表示这些不存在字符,或从ІеИлЧЦ·ы对话框(单击更多可打开该对话框)中复制所需字符。

每个模式最多可包含 1,000 个新字符。 但请避免创建过多连字,因为这样可能会影响 OCR 质量。

选择用户模式

ABBYY FineReader 允许使用模式来提高 OCR 质量。

1. 在工具菜单中,单击模式编辑器...。

2. 在模式编辑器对话框中,从可用模式列表中选择所需模式,然后单击 设置为活动。

应记住的要点:

1. ABBYY FineReader 无法区分一些相似但又不同的字符,而是将它们识别为相同的字符。 例如,直引号 (')、左引号 (‘) 和右引号 (’) 在模式中都将存储为一个字符(直引号)。这意味着即使您尝试对左引号和右引号进行训练,它们还是不会用在已识别的文本中。

2. 对于某些字符图像,ABBYY FineReader 将视上下文内容来选择相应的键盘字符。例如,对于小圈图像,如果其周围为字母,它将被识别为字母 O,而如果紧挨着其周围的为数字,则会被识别为数字 0。

3. 仅当文档具有与创建模式的文档相同的字体、字号和分辨率时,方可对该文档使用此模式。

4. 要稍后使用模式,请将该模式保存到文件。

5. 要识别以不同字体设置的文本,请选择仅使用内置模式选项(在工具>选项… > 读取中)

编辑用户模式

启动 OCR 过程前可编辑新建的模式。 错误的训练模式可能影响 OCR 质量。模式应仅包含完整字符或连字。应从模式中删除边缘缺失的字符和对应字母错误的字符。

1. 在工具菜单中,单击 模式编辑器...。

2. 将打开 模式编辑器对话框。选择所需的模式,然后单击编辑...按钮。

3. 在打开的用户模式对话框中,选择字符,然后单击属性...按钮。

在打开的对话框中:

o 输入与字符字段相对应的字母

o 在效果字段中指定所需字体效果(斜体、粗体、上标和下标)。

在用户模式中单击删除按钮以删除错误训练的字符。

如遇到字体字符识别错误的问题,请参考解决ABBYY字体和字符识别错误的问题

如果还有其他相关问题,请参考ABBYY中文服务中心所给您提供的信息,祝您使用愉快。

ABBYY FineReader
一款功能强大的OCR和PDF软件
立即购买
QQ 讨论群
ABBYY 官方交流群:892417659 立即加群
欢迎加入我们的ABBYY FineReader软件交流群,及时获取关于软件的动态和营销活动,共同探讨提高文档处理效率的方法。
400-8765-888
kefu@makeding.com
热门文章
ABBYY FineReader 12激活教程
安装完 ABBYY FineReader 12 之后,需要激活程序才能在完整模式下运行。在受限模式下,将根据您的版本和所在地区禁用一些功能。
2020-11-22
ABBYY FineReader 12注册码-激活码-序列号地址
ABBYY FineReader 12 OCR图文识别软件自2014年4月发布以来,屡获殊荣,是图像和文件识别以及办公的好帮手,那么对于这样一款用途广泛的软件来说,如何获取注册码、激活码或序列号想必是大家最关心的问题。
2020-11-22
几款常用的OCR文字识别软件
图片文字提取软件是什么呢?随着大家的办公需求的加大,现在已经有很多的办公软件出现了,那么,图片文字提取软件便是其中的一种,因为现在制作图片的要求也比较高,所以,在图片上加入文字也是很正常的事情,那么,怎么样才能够直接将图片中的文字提取出来呢?
2020-11-22
ABBYY PDF Transformer+注册码-激活码-序列号地址
提到PDF,相信很多人都会很自然地想到ABBYY PDF Transformer+,它是一个新的,全面巧妙地解决PDF文档的工具,可以编辑PDF文档,在PDF文档中添加评论,添加密码保护,实现简单环保地阅读PDF文档,能够便捷地处理任何类型的PDF文件,非常有效地提高日常工作效率。
2020-11-22
使用序列号激活ABBYY FineReader 14
安装完 ABBYY FineReader 14 之后,很多小伙伴会有这样的疑问,安装完成后不知道如何激活软件,找不到输入序列号的入口,本文对这一问题进行讲解。
2020-04-07
如何获取ABBYY FineReader 12注册码-激活码-序列号
提及OCR文字识别软件,相信不少人会脱口而出ABBYY FineReader,这款软件当前版本为FineReader 12,是市场领先的OCR图文识别软件。
2020-04-07
最新文章
ocr文字识别软件是干什么的 图片ocr文字识别软件如何修改文字
相信许多小伙伴都用过ocr文字识别软件,那么,对于ocr文字识别软件是干什么的,图片ocr文字识别软件如何修改文字这两个问题,相信大家都很有兴趣,下面我们一起来探讨一下吧。
2022-12-15
pdf印章怎么扣出来 pdf印章怎么覆盖在文字上面
许多重要的pdf文件中都会加入印章,那么pdf印章怎么扣出来,pdf印章怎么覆盖在文字上面,相信许多小伙伴对于这两个问题不太了解,下面就让我们一起来研究研究吧。
2022-12-15
转换word的软件有哪些 如何把pdf转换成word文档
word和pdf是办公中常用的两种文件格式,我们有时候需要将word转换为pdf,也有的时候需要将pdf转为word,那么转换word的软件有哪些,如何把pdf转换成word文档,接下来我们一起来了解一下吧。
2022-12-15
编辑pdf怎么让两边对齐 编辑pdf怎么增加页
我们知道,pdf的内容是不能直接编辑的,如果我们需要对pdf的内容进行修改,就需要用到专业的pdf编辑器,下面以ABBYY Finereader PDF 15为例,给大家讲解一下如何使用这款工具编辑pdf文档的吧,并解决了编辑pdf怎么让两边对齐,编辑pdf怎么增加页这两个问题。
2022-12-15
文档转换成pdf文件怎么设置格式 文档转换PDF不能修改解决办法
许多时候我们需要将文档转换为pdf格式,但转换时偶尔会出现格式丢失或错乱的情况,导致转换失真。接下来,我们就来一起了解一下文档转换成pdf文件怎么设置格式,文档转换PDF不能修改解决办法吧。
2022-12-14
pdf转换后字体怎么不一样了 pdf转换后字体如何统一
很多用户在工作过程中需要频繁转换文件格式,pdf转换后会遇到各种问题,比如:pdf转换后字体不一样了?造成这种问题的原因一般是编辑器的功能不成熟导致的,使用强大的、专业的PDF转换器即可避免这种问题。如果你想要统一pdf字体,本文还会为大家介绍pdf转换后字体如何统一。
2022-12-14

微信公众号

欢迎加入ABBYY产品的大家庭,立即扫码关注,获取更多办公软件动态和资源福利。

读者也喜欢这些内容: