20世纪70年代初,日本的学者开始研究汉字识别,并做了大量的工作。在OCR技术方面的研究工作起步较晚,在70年代才开始对数字、英文字母及符号的识别进行研究,70年代末开始进行汉字识别的研究,到1986年,我国提出“863”高新科技研究计划,汉字识别的研究进入一个实质性的阶段,清华大学的丁晓青和中科院分别开发研究,相继推出了中文OCR产品,现为汉字OCR技术。
早期的OCR软
OCR字符识别好不好
20世纪70年代初,日本的学者开始研究汉字识别,并做了大量的工作。在OCR技术方面的研究工作起步较晚,在70年代才开始对数字、英文字母及符号的识别进行研究,70年代末开始进行汉字识别的研究,到1986年,我国提出“863”高新科技研究计划,汉字识别的研究进入一个实质性的阶段,清华大学的丁晓青和中科院分别开发研究,相继推出了中文OCR产品,现为汉字OCR技术。

早期的OCR软件,由于识别率及产品化等多方面的因素,未能达到实际要求。同时,由于硬件设备成本高,运行速度慢,也没有达到实用的程度。只有个别部门,如信息部门、新闻出版单位等使用OCR软件。进入20世纪90年代以后,随着平台式扫描仪的广泛应用,以及我国信息自动化和办公自动化的普及,大大推动了OCR技术的进一步发展,使OCR的识别正确率、识别速度满足了广大用户的要求。软件结构编辑由于扫描仪的普及与广泛应用,OCR软件只需提供与扫描仪的接口,利用扫描仪驱动软件即可。因此,OCR软件主要是由下面几个部分组成。

图像输入、预处理:图像输入:对于不同的图像格式,有着不同的存储格式,不同的压缩方式,目前有OpenCV,CxImage等开源项目 。预处理:主要包括二值化,噪声去除,倾斜较正等二值化:对摄像头拍摄的图片,大多数是彩像,彩像所含信息量巨大,对于图片的内容,我们可以简单的分为前景与背景,为了让计算机更快的,更好的识别文字,我们需要先对彩进行处理,使图片只前景信息与背景信息,可以简单的定义前景信息为黑色,背景信息为白色,这就是二值化图了。

MVOL视觉开放实验室
维视智造拥有15年机器视觉解决方案行业经验,多年来工业视觉产品的和服务得到业界普遍认可。本次MVOL视觉开放实验室展区现场建议看点包括MV-E系列7000万像素高分辨率工业相机、MV-HS系列高速工业相机、BT-MP5系列500万像素工业镜头等;其中7000万像素工业相机具有图像超清晰、低噪声、性能稳定等特点。

(作者: 来源:)