ABBYY > 服务 > OCR&PDF知识库 > ABBYY FineReader诞生历程(上)
服务中心 PDF&OCR 知识库 FineReader 使用技巧 PDF Transformer使用技巧 新闻资讯 媒体测评 在线客服咨询

ABBYY FineReader诞生历程(上)

FineReader,ABBYY的光学字符识别(OCR)应用程序,目前在全球拥有数百万用户,从南极到格陵兰岛和北极,在OCR市场占据着领先地位,至今年,已经走过23个年头了。

ABBYY FineReader

对比ABBYY的另一款鲜为人知的产品—Lingvo字典应用程序(ABBYY公司的第一款产品),FineReader相对年轻一点,BIT软件(那时候这样称呼ABBYY)的年轻开发人员刚好在启动字典应用程序之后开始研发OCR技术,这看起来似乎有点奇怪,但事实上,并非巧合。

FineReader最早应追溯回90年代早期,那时BIT软件正开始开发一种称为Lingvo(有关Lingvo字典的相关知识,请参阅ABBYY Lingvo字典与iPhone的完美结合)系统的解决方案,能够让用户扫描文档并翻译成不同的语言,由四部分组成,其中只有Lingvo由ABBYY制造,其他三个组成部分提供来自第三方的OCR、文本校对和翻译功能。

ABBYY Lingvo字典

Lingvo系统的输出翻译非常粗糙,但一般还是能满足读者的。当涉及到OCR时,事情就差强人意得多了,程序在实施文本识别之前需要进行广泛的训练,无论何时在图像中遇到特殊字体的新字符,都需要用户确认正确的结果,经过几次这样的确认之后,才能确保以相同的字体和大小打印出来,但如果字体和大小发生改变,训练过程就得从头开始,而且,即便训练了识别结果质量,仍有很多有待改进之处。

至于这一点,ABBYY并非追求高质量OCR的唯一公司,对于这种技术的市场需求也正式起动,能满足这种需求的产品注定迟早会出现,因此ABBYY面临着这样一种选择:要么等别人提供合适的技术,要么自己开发。

到了1992年,OCR问题变得越来越迫切:销售额受损,竞争更加残酷。于是那年11月ABBYY做出了开发的决定,截止时间定在1993年5月,在如此短的时间里从零开始开发这种技术是不大可能的,因此他们取得了一种原型OCR程序,这个程序是一名年轻的科学家爱好之余在家里开发而成的。这位科学家可谓前途无量,因为他的技术仅仅是他自己在业余时间里创建而成,绝不是一种商业目的。该程序开发用于MS DOS,只能处理未压缩的BMP图像,而我们需要它在Windows环境下工作,并且至少能处理一些能够广泛使用的图像格式,比如TIFF。

如今ABBYY FineReader已经升级到12版本了,更多关于ABBYY FineReader的内容,请点击进入ABBYY教程,查找您需要的信息。

标签:ABBYY FineReader,OCR图文识别软件,ABBYY FineReader 12,如何诞生,23年

读者也访问过这里: