影像预处理:影像预处理是OCR系统中,须解决问题的一个模块。影像须先将图片、表格及文字区域分离出来,甚至可将文章的编排方向、文章的提纲及内容主体区分开,而文字的大小及文字的字体亦可如原始文件一样的判断出来。对待识别图像进行如下预处理,可以降低特征提取算法的难度,并能提高识别的精度。二值化:由于彩像所含信息量过于巨大,在对图像中印刷体字符进行识别处理前,需要对图像进行二值化处理,条码检测器,