用于冠字号识别的字符污染去除方法

文档序号:9598201阅读:784来源:国知局
用于冠字号识别的字符污染去除方法
【技术领域】
[0001] 本发明属于数字图像处理领域,尤其涉及一种用于冠字号识别的字符污染去除方 法。
【背景技术】
[0002] 纸币作为流通币,在人们的日常生活中起着举足轻重的作用。在流通过程中,可能 会出现不同程度的污染,如纸币自身的红色油墨污染,铅笔的涂写,纸币使用时间久了开始 破旧,纸币图像采集过程中光照不均以及无法避免的噪声等各种原因给冠字号识别带来一 定的困难。
[0003] 纸币冠字号识别要求识别结果准确,为了能有效地对纸币冠字号进行识别,在冠 字号分割的过程中,需要利用计算机视觉技术和图像处理技术对污染的纸币冠字号区域进 行处理,有效去除污染,得到可以识别的冠字号。
[0004]目前国内外纸币冠字号识别的方法很多,主要是针对七成新以上的纸币,没有对 冠字号污染的纸币作处理的操作。有的对冠字号污染的纸币处理,但只通过二值操作以及 中值滤波去噪等简单的方法,不能有效的去除污染。目前针对污染过的冠字号纸币还没有 一种行之有效的方法,导致旧的污染纸币冠字号识别率不高,影响程序的可靠性。

【发明内容】

[0005] 针对现有技术的不足,本发明提供一种用于冠字号识别的字符污染去除方法,能 够有效的去除冠字号的污染,提高冠字号的识别率。
[0006] 本发明解决其技术问题所采用的技术方案如下,用于冠字号识别的字符污染去除 方法,包括以下步骤:
[0007] a)在冠字号所在区域的图像I上确定11条分界线,使得相邻的两条分界线间有且 仅有单个冠字号的图像;
[0008] b)初步确定相邻分界线之间的区域中单个冠字号图像的外接矩形框;
[0009] c)对单个冠字号的高度和宽度分别进行异常处理,从而最终确定10个冠字号的 外接矩形框。
[0010] 进一步的,所述在冠字号所在区域的图像I上确定11条分界线,使得相邻的两条 分界线间有且仅有单个冠字号的图像具体包括模板构建过程与实际计算过程,其中模板构 建过程包括如下步骤:
[0011] al)取一张纸币,使用自适应阈值方法,计算无污染图像I的二值图,其中白色为 前景,黑色为背景;
[0012] a2)计算二值图的垂直投影,此垂直投影为一向量,记为pv= [Pl,p2,…pw],其中W 为图像I的宽度;
[0013] a3)人工判断图像I中第一个冠字号的最左端离图像左端的像素距离,记为s,另 外,当图像的分辨率确定后,冠字号的总像素宽度是确定的,记为1,则抽取向量pv中第S个 到第 s+1-l 个元素,记为 pv' = [ps,ps+1,*"ps+11];
[0014] a4)重复步骤al) _a3),获得\个p v',并将np个p v'求平均,则获得一个模板m ;
[0015] a5)在9个间隔处将数值最低的位置进行标记,再加上头尾两处,一共可找到11条 分界线,将其横坐标记为:b = [b。,h,…b1Q],其中bQ= 0, b 1Q= 1 ;
[0016] a6)每次取不同的纸币,重复步骤al)-a5)nni次,获得个不同的模板,记作 (岬,2,…,)和与之对应的不同的分界线,记作汍62;
[0017] 实际计算过程包括如下步骤:
[0018] a7)取一张纸币,使用自适应阈值方法,计算无污染图像I的二值图,其中白色为 前景,黑色为背景;
[0019] a8)计算二值图的垂直投影,此垂直投影为一向量,记为pv= [Pl,p2,…pw],其中W 为图像I的宽度;
[0020] a9)分别计算pv与模板的相关系数,并记录其结果为 (^2,"、<^>其中,(;1,1 = 1,一,11|11为一个长度为评-1+1的向量;
[0021] alO)分别寻找(C2,…,q)中的最大值,记为并找到这些最大 值中的最大值,记其对应的下标号为i,则应选取的模板为1?,分界线为b1;
[0022] all)查找Cf"在^中的位置,并将其位置记为j,则可知第一条分界线离图像左端 的距离为j,因此,图像中真正的分界线为匕+j,从而确定了这11条分界线的位置。
[0023] 进一步的,所述步骤b)初步确定相邻分界线之间的区域中单个冠字号图像的外 接矩形框,具体包括:
[0024] bl)将11条分界线所隔的10个区域编号为…名:,每个区域中都有且仅 有一个冠字号图像的外接矩形框,设之为?5·.·^,对于任意<,/= 1,…,10,都有四个表 征其在图像中位置的属性,即(1,r,u,b),分别表示该矩形的左、右、上、下边到图像I左、 右、上、下端的距离,初始时将其设为-1 ;
[0025] b2)对于任意民,将其左边所在的区域记为礞,其右边所在的区域记为<,若 = <,则跳转至b4),否则跳转至b3);
[0026] b3)将&在分界线b i,…A i处分裂,分裂为r-1+l个区域/?;,···,_/?广+1,对于分裂 而成的任意矩形框,分别执行步骤b4)的操作;
[0027] b4)若 < 对应的 < 的(1,r,u,b)都为-1,则将i?f的(1,r,u,b)设为民的 (1丄1!,13),若<的(l,r,u,b)不为-1,则新的先的(l,r,u,b)值被分别设为原来的政和 民中的(l,r,u,b)的较小值;
[0028] b5)最后,查看中的每一个外接矩形的四个属性,看其是否都非-1,若 都非-1,则10个冠字号的外界矩形框/广/匕…/C成功建立,否则说明图像I并非冠字号图 像,不予处理。
[0029] 进一步的,步骤c)所述对单个字符宽度的异常处理采用第一宽度异常处理方法 或第二宽度异常处理方法,对单个字符的高度的异常处理采用第一高度异常处理方法或第 二高度异常处理方法。
[0030] 进一步的,所述第一高度异常处理方法具体包括如下步骤:
[0031] dl)确定切割范围:若第1至第4个字符中的某个字符超过其右侧字符的高度,则 说明该字符存在污染,第1个字符可根据右侧字符来限定切割范围,第2至4个字符可根 据其左侧与右侧字符的高度来限定切割范围,同样的,若第7至第10个字符中的某个字符 超过其左侧字符的高度,则说明该字符存在污染,第10个字符可根据左侧字符来限定切割 范围,第7至9个字符可根据其左侧与右侧字符的高度来限定切割范围,对于中间的两个字 符,取第四个与第七个字符之和加上5后再除以2取整后的值作为上限,上限减去2作为下 限;
[0032] d2)在切割范围的行数内,计算各行的代价函数:
[0033] Breakcost = (out_value-in_value)X (cur_row-least_row+2)/out_num
[0034] 其中,out_value为当前行的暗色点(局部阈值)平均灰度,in_value为当前行内 侧相邻行的暗色点(局部阈值)平均灰度,cur_row为当前去除的行数,least_row为估计 得到的至少需要去除的行数,〇ut_num为当前行暗色点(局部阈值)的个数;
[0035] d3)比较所有得到的代价值,从最大的代价值所对应的行数开始切割字符。
[0036] 进一步的,所述第二高度异常处理方法具体包括如下步骤:
[0037] el)当纸币的横向分辨率和纵向分辨率都确定后,对于十个单独的字符图像,设定 其期望高度h。,…h9;
[0038] e2)对于任意第i个字符图像,设投票数vote_y = 0 ;
[0039] e3)计算异常字符的垂直中心与10个字符的平均垂直中心,若异常字符的垂直中 心较平均中心小,则 vote_y: = vote_y+l,否则 vote_y: = vote_y_l ;
[0040] e4)计算异常字符的垂直中心矩,若字符的垂直中心小于中心矩,则vote_y:= vote_y_l,否则 vote_y: = vote_y+l ;
[0041] e5)计算最上面一行和最下面一行的黑点的平均灰度,若最下面一行的黑点平均 灰度小于最上面的,则 v〇te_y: = vote_y_l,否则 vote_y: = vote_y+l ;
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1