钢材图像编号的提取与分割方法
【专利摘要】本发明提出了一种复杂背景下钢材图像编号的提取和分割方法。采用HSV颜色空间,并以饱和度为主区分前景和背景,再综合运用数学形态学运算及边界跟踪技术提取出钢块的有效区域;对灰度钢材图像进行二值化、梯度锐化、去离散噪声等预处理,运用多投影直方图分割法对钢材区域的编号进行行、列分割,并解决了干扰、字符粘连等问题,实现了编号的精确定位分割。本发明的抗干扰能力较强,分割效果良好。
【专利说明】
钢材图像编号的提取与分割方法
技术领域
[0001] 本发明属于图像处理技术,具体地说,是涉及钢材图像编号的提取和分割方法。
【背景技术】
[0002] 在钢厂,每块钢材成型后都有一个编号。这个编号一般用喷涂设备或手工加在钢 块的侧面。当钢块送到其它流程(库存、质量管理等)进一步处理时,需要将它辨别出来。 目前识别的环苄基本上靠工人手工定时完成。人为登记既降低了工作效率,也不太安全,还 易发生错误。因此迫切需要对钢材编号实现自动识别。
[0003] 在钢材编号的识别过程中,钢材区域定位、字符分割是关键技术。由于钢材区域的 背景复杂,如图1所示,拍摄的图像除了钢材区域外,还有轨道、钢管、窗户、标语甚至工作 人员等影响钢材编号识别的物体。而且在钢材区域内,钢材的堆放也没有特定的规律。由 于拍摄的角度,不同的钢块的倾斜度不同,图片上的编号大小也不一。加上还有噪声、光线 等外部条件的影响。这些给识别带来了相当的难度。
[0004] 若用常规的灰度图像阈值化的方法,由于钢材编号的颜色与背景相似,二值化后 如图2所示,有大量的干扰物体存在,不易于识别。所以要直接对彩色图像进行有效的分 割。
[0005] 对彩色图像进行分割,颜色空间的选取很重要。常见的颜色空间有RGB和HSV两 种。H、S、V分别代表颜色的色调、饱和度和亮度。HSV颜色模型去掉了亮度成分在图像中 与颜色信息的联系,色调饱和度成分与人们获得颜色的方式密切相关;且HSV颜色模型用 Munsell三维空间坐标系统表示,坐标可以独立感知各颜色分量的变化。仿照灰度直方图的 定义方法,在HSV空间中,可将色调、饱和度直方图定义为:
[0008] 这里,NQO、N(Sl)分别是色调为 hji = 0, ? ? ?,255)、饱和度为 Sl(i = 0, ? ? ?, 255)的象素个数。当 Hue = 时,f(x,y) = 1。当 Saturation = s ;时,f(x,y) = 1〇
[0009] 二值化求解阈值的方法很多,如直方图变换法、最大类间方差法、共生矩阵法、迭 代法。迭代法基本思想是:首先计算图像灰度直方图,选取图像灰度范围的中值作为初始阈 值T。(设共有L级灰度),然后按下式进行迭代:
[0011] 其中匕是灰度为1值的像素个数。迭代一直进行到T 1+1= T i结束,取结束时的T i 为最终分割阈值并按1\二值化。
【发明内容】
[0012] 本发明旨在克服现有技术缺陷,目的在于提供一种钢材编号提取与分割技术的方 法。该方法先在彩色图像中提取出钢材区域,然后将钢材编号按行粗分割,最后精确定位字 符。
[0013] 为实现上述目的,本发明采用的技术方案是:
[0014] 第一步、钢材区域提取
[0015] (1)在彩色图像中将前景和背景区分;
[0016] 采集到的图像一般是RGB格式,因此先将图像进行格式转换,转换成HSV格式。需 要指出的是色调是循环结构。为了更清楚表示,将色调直方图左移。左移后色调直方图、饱 和度直方图分别如图3、图4所示(滤波后)。
[0017] 从左移后的色调直方图可以看出色调比较多,不利于直接分割;而饱和度直方图 呈现明显的双峰,很容易将前景和背景区分开。本发明采用Otsu方法求取分割阈值,并按 阈值完成图像的二值化。
[0018] (2)钢材区域与其它背景区域分开成独立的连通域;
[0019] 尽管已经有效将钢材区域标识出来,但背景中仍然有杂物和大量零散点的存在。 针对零散点,使用结构元素进行先膨胀后腐蚀运算,得到图5。从图5可见,钢材区域与其它 背景区域已经分开成独立的连通域了。
[0020] (3)从彩色图像对应的灰度图中裁剪出相应的钢材图像。
[0021] 图5中的钢材区域比较明显,但仍有少数细小的连通区域,必须去掉。本文采用边 界跟踪的方法,将周长最大的部分确定为钢材区域。边界跟踪用到了 Freeman链法则。具 体的跟踪规则如图6所示。得到边界跟踪后的区域后标识出其邻接矩形。并从彩色图像对 应的灰度图中裁剪出相应的图像。结果如图7所示。
[0022] 第二步、字符分割定位
[0023] (1)二值化、梯度锐化、去离散噪声;
[0024] 用迭代法对第一步得到的钢材图像灰度图进行二值化。由于需要处理的图像编号 边缘比较模糊,对识别造成了一定的困难。在这里采用Roberts梯度算子进行锐化使图像 的边缘变得清晰起来。图像可能在拍摄过程中夹带了噪声。系统采用的是去除杂点的方法 来进行去噪声处理的。锐化、去噪后的图像如图8所示。
[0025] ⑵行划分
[0026] X轴方向投影直方图公式?K = 2^.,/U2,…,匕⑷
[0027] Y轴方向投影直方图公式4,"?,尤⑶
[0028] X1= X01,…,X1= X01+i_l,…,Xn= X02;
[0029] Y1=Y01,...,Y1=Y 01+i-l,...,Yn=Y02;
[0030] 其中(XQ1,YQ1),(XQ2, YQ2)分别为区域左上角、右下角的坐标。
[0031] 按公式(4)先对图像8进行水平投影,得到图9。因为钢材编号的间隔比较大,水 平投影会出现投影轮廓的谷点且不同行编号的投影不会重叠。找出在Y轴方向的谷点,根 据谷点沿X轴方向切分图像得到不同的行。若这时将切分行的高度与已知待识别的字符的 高度比较,从而得到目标图像行,将会遇到两个问题,一是由于拍摄角度,每行编号大小不 一且部分行编号存在明显的倾斜;二是干扰的存在,尤其是干扰区高度与钢材编号接近时。 [0032] (3)每行倾斜度自动测量
[0033] 调整的方法主要是根据图像上左右两边的黑色象素的平均高度来的。
[0034] (4)字符的精确定位
[0035] 在调整倾斜度后的各行中,先要判定字符区的存在,来排除干扰行。对含有字符的 行,确定字符区的起始位置,然后对各个字符水平分割。
[0036] 1)确定含有字符的行
[0037] 通过观察字符区域,可以看到每行的钢材编号前后为两个字母,中间为十个数字。 按公式(5)对图9中第4行(从下往上)进行垂直投影可得图10,投影值发生零值跳变的 位置有T (此处T = 24)处。对每行投影值零值跳变点个数进行统计,大于或等于T/2的保 留,小于T/2认为是干扰行。
[0038] 2)精确定位
[0039] 下面对含有字符区域的行确定字符区域的精确位置。
[0040] 在图11中,字符区上边有两道斜线,两块黑点,左侧有一块黑点,构成了干扰。
[0041] 按式⑷得到X方向的投影直方图PY,如图12所示。在PY中,存在k个结果区域 (k = 2),图中标出PYwp ?¥*2两个结果区域。
[0042] 先求出直方图中PY投影区的平均高度
[0044] 其中,m为PY中不为零的行数。
[0045] 再根据PY求出每个区域的宽度PYWl (i = 1~k)和每个区域的平均高度PYh (i =1~k)。(这里区域数k = 2)。
[0046] 根据两个条件来得到字符区域的高度。
[0047] I)PYWl中取出最大值作为PYw,为候选字符区,即区域宽度最大值;
[0048] II)求出PY&对应的区域平均高度PYh "要满足:。
[0049] 第一个条件是说明字符区域的高度范围内的水平方向黑色象素点最多。第二个条 件为了排除直线。
[0050] 这样,字符区的高度完全可确定。并可由此切分出高度上的干扰。结果如图13所 示。作垂直投影可得图14。
[0051 ] 本发明对字符的粘连进行了处理。
[0052] 现在可以把字符区域中的字符独立的分割出来。
[0053] 在已知的每个字符比较精确的宽度范围内,先自下向上对图像进行逐行扫描直至 遇到第一个黑色的象素点。记录下来。然后再由上向下对图像进行逐行扫描直至找到第一 个黑色象素,这样就找到每个字符精确的高度范围。效果如图15表示。
【附图说明】
[0054] 图1是本发明第一步中钢材编号原始彩色图;
[0055] 图2是本发明第一步中钢材编号直接二值化后黑白图;
[0056] 图3是本发明第一步中左移后色调直方图;
[0057] 图4是本发明第一步中饱和度直方图;
[0058] 图5是本发明第一步中膨胀、腐蚀后效果图;
[0059] 图6是本发明第一步中8近邻轮廓线跟踪过程;
[0060] 图7是本发明第一步中钢材区域的灰度图;
[0061] 图8是本发明第二步中锐化、去噪后的效果图;
[0062] 图9是本发明第二步中水平投影图;
[0063] 图10是本发明第二步中垂直投影图;
[0064] 图11是本发明第二步中含干扰的一行字符图;
[0065] 图12是本发明第二步中投影直方图PY ;
[0066] 图13是本发明第二步中去除高度上的干扰后效果图;
[0067] 图14是本发明第二步中垂直投影图;
[0068] 图15是本发明第二步中定位分割后效果图。
【具体实施方式】
[0069] 下面结合附图和【具体实施方式】对本发明做进一步的描述,并非对其保护范围的限 制。
[0070] 第一步、钢材区域提取
[0071] (1)在彩色图像中将前景和背景区分;
[0072] 采集到的图像一般是RGB格式,因此先将图像进行格式转换,转换成HSV格式。需 要指出的是色调是循环结构。为了更清楚表示,将色调直方图左移,具体办法是将环形结构 的色调数据的〇点安置在像素最少的色调处。左移后色调直方图、饱和度直方图分别如图 3、图4所不(滤波后)。
[0073] 从左移后的色调直方图可以看出色调比较多,不利于直接分割;而饱和度直方图 呈现明显的双峰,很容易将前景和背景区分开。本发明采用Otsu方法即最大类间方差准则 下的最佳门限法求取分割阈值,并按阈值完成图像的二值化。
[0074] (2)钢材区域与其它背景区域分开成独立的连通域;
[0075] 尽管已经有效将钢材区域标识出来,但背景中仍然有杂物和大量零散点的存在。 '〇 1 〇' 针对零散点,使用结构元素1 0 1进行先膨胀后腐蚀运算,得到图5。从图5可见,钢材区
[0 1 0. 域与其它背景区域已经分开成独立的连通域了。
[0076] (3)从彩色图像对应的灰度图中裁剪出相应的钢材图像。
[0077] 图5中的钢材区域比较明显,但仍有少数细小的连通区域,必须去掉。本文采用边 界跟踪的方法,将周长最大的部分确定为钢材区域。边界跟踪用到了 Freeman链法则。具 体的跟踪规则如图6所示。得到边界跟踪后的区域后标识出其邻接矩形。并从彩色图像对 应的灰度图中裁剪出相应的图像。结果如图7所示。
[0078] 第二步、字符分割定位
[0079] (1)二值化、梯度锐化、去离散噪声;
[0080] 用迭代法对第一步得到的钢材图像灰度图进行二值化。由于需要处理的图像编号 边缘比较模糊,对识别造成了一定的困难。在这里采用Roberts梯度算子进行锐化使图像 的边缘变得清晰起来。图像可能在拍摄过程中夹带了噪声。系统采用的是去除杂点的方法 来进行去噪声处理的。具体方法如下:扫描整个图像,当发现一个黑色点的时候,就考察和 该黑色点间接或者直接相连接的黑色点的个数有多少,如果大于一定的值,那就说明该点 不是离散点,否则就是离散点,把它去掉。在考察相连的黑色点的时候用的是递归的方法。 锐化、去噪后的图像如图8所示。
[0081] (2)行划分
[0082] X轴方向投影直方图公式Pf == (4)
[0083] Y轴方向投影直方图公式户;=⑶
[0084] Xi= X01,…,Xf X01+i-l,…,Xn= XwYf Y01,…,Yf Y01+i-l,…,Yn = YD2;其中(XQ1,YQ1),(XQ2,Y Q2)分别为区域左上角、右下角的坐标。
[0085] 按公式⑷先对图像8进行水平投影,得到图9。因为钢材编号的间隔比较大,水 平投影会出现投影轮廓的谷点且不同行编号的投影不会重叠。找出在Y轴方向的谷点,根 据谷点沿X轴方向切分图像得到不同的行。若这时将切分行的高度与已知待识别的字符的 高度比较,从而得到目标图像行,将会遇到两个问题,一是由于拍摄角度,每行编号大小不 一且部分行编号存在明显的倾斜;二是干扰的存在,尤其是干扰区高度与钢材编号接近时。
[0086] (3)每行倾斜度自动测量
[0087] 调整的方法主要是根据图像上左右两边的黑色象素的平均高度来的。具体来说, 首先要分别计算图像左半边和右半边的象素的平均高度,然后求得斜率,根据斜率重新组 织图像。
[0088] (4)字符的精确定位
[0089] 在调整倾斜度后的各行中,先要判定字符区的存在,来排除干扰行。对含有字符的 行,确定字符区的起始位置,然后对各个字符水平分割。
[0090] 1)确定含有字符的行
[0091] 通过观察字符区域,可以看到每行的钢材编号前后为两个字母,中间为十个数字。 按公式(5)对图9中第4行(从下往上)进行垂直投影可得图10,投影值发生零值跳变的 位置有T (此处T = 24)处。对每行投影值零值跳变点个数进行统计,大于或等于T/2的保 留,小于T/2认为是干扰行。
[0092] 2)精确定位
[0093] 下面对含有字符区域的行确定字符区域的精确位置。
[0094] 在图11中,字符区上边有两道斜线,两块黑点,左侧有一块黑点,构成了干扰。
[0095] 按式⑷得到X方向的投影直方图PY,如图12所示。在PY中,存在k个结果区域 (k = 2),图中标出PYwp ?¥*2两个结果区域。
[0096] 先求出直方图中PY投影区的平均高度
[0098] 其中,m为PY中不为零的行数。
[0099] 再根据PY求出每个区域的宽度PYWl (i = 1~k)和每个区域的平均高度PYh (i =1~k)。(这里区域数k = 2)。
[0100] 根据两个条件来得到字符区域的高度。
[0101] I)PYWl中取出最大值作为PYwit为候选字符区,即区域宽度最大值;
[0102] II)求出PY&对应的区域平均高度PYh "要满足:PYhm>pW/3。
[0103] 第一个条件是说明字符区域的高度范围内的水平方向黑色象素点最多。第二个条 件为了排除直线。
[0104] 这样,字符区的高度完全可确定。并可由此切分出高度上的干扰。结果如图13所 示。作垂直投影可得图14。
[0105] 如图14所示,在PX投影区中从左至右依次将每个候选字符的起始坐标找出。可 表示为Ui = 1~k ;j = 1,2)
[0106] 每个字符的区域宽度为:PXWl= X y-Xu
[0107] 区域间隙宽度:(^= X m-Xw;
[0108] 区域总宽度:SW1= X m-X^;
[0109] 判断是否干扰的条件为
[0110] ①区域间隙宽度大于区域宽度:CWi> PXw1;
[0111] ②区域总宽度大于某个阈值別,T ;
[0112] 第一个条件说明间隙太大,可能是干扰信号。第二个条件是为了排除码号的第一 个字符为" 1"的情况。当码号的第一个字符为" 1"时,可能会满足第一种情况,但总宽度不 会太小。
[0113] 这样,可以精确定出字符区域的水平位置。
[0114] 下一步还需要注意的问题是字符的粘连。
[0115] 如图13和图14,第二个字符"4"和第三个字符"2"投影区连在一起,第四个字符 "9"和第五个字符"4 "直接粘连。若再对图像进行梯度锐化,即使消除了粘连,也会造成图 像的边缘彳目息损失。故米用如下的方法:
[0116] ①计算区域宽度的平均值AveWidth(由水平位置的总宽度/字符个数,这里字符 个数为14)
[0117] ②依次比较每个字符区域宽度311与宽度的平均值AveWidth。
[0118] 若SWi< 1. 5*AveWidth,转入下一个字符,重复步骤②直至结束。
[0119] 若SWiS 1. 5*AveWidth,则认为发生了粘连,执行步骤③。
[0120] ③切分字符,其中点位置为X^+SWi/2。
[0121] ④比较切分后字符的宽度SW^ (为切分前字符宽度的一半)与AveWidth的关系。
[0122] 若 SWi ' < 1 ? 5*AveWi dth,转入步骤②。
[0123] 若SW/彡1. 5*AveWidth,则需要再次切分,执行步骤③。
[0124] 现在可以把字符区域中的字符独立的分割出来。
[0125] 在已知的每个字符比较精确的宽度范围内,先自下向上对图像进行逐行扫描直至 遇到第一个黑色的象素点。记录下来。然后再由上向下对图像进行逐行扫描直至找到第一 个黑色象素,这样就找到每个字符精确的高度范围。效果如图15表示。
【主权项】
1. 一种钢材图像编号的提取和分割方法,其特征在于先在彩色图像中提取出钢材区 域,然后将钢材编号按行粗分割,最后精确定位字符,该方法的步骤包括: 第一步、钢材区域提取 (1) 在彩色图像中将前景和背景区分; 采集到的图像由RGB格式转换成HSV格式;并用饱和度直方图区分前景和背景;用 Otsu方法求取分割阈值,并按阈值完成图像的二值化; (2) 钢材区域与其它背景区域分开成独立的连通域; 针对背景中的零散点,使用结构元素进行先膨胀后腐蚀运算; (3) 从彩色图像对应的灰度图中裁剪出相应的钢材图像; 确定为钢材区域从彩色图像对应的灰度图中裁剪出相应的图像; 第二步、字符分割定位 (1) 二值化、梯度锐化、去离散噪声; 用迭代法对第一步得到的钢材图像灰度图进行二值化;采用Roberts梯度算子进行锐 化使图像的边缘变得清晰起来;;采用去除杂点的方法来对图像进行去噪声处理的; (2) 行划分 按投影法对图像进行行划分; (3) 每行倾斜度自动测量 根据图像上左右两边的黑色象素的平均高度来进行倾斜度调整; (4) 字符的精确定位 在调整倾斜度后的各行中,先要判定字符区的存在,来排除干扰行;对含有字符的行, 确定字符区的起始位置,然后对各个字符水平分割。2. 根据权利要求1所述的钢材图像编号的提取和分割方法,其特征是,采用Freeman链 法则边界跟踪的方法,将周长最大的部分确定为钢材区域,去掉零散连通区域;得到边界跟 踪后的区域后标识出其邻接矩形;并从彩色图像对应的灰度图中裁剪出相应的图像。3. 根据权利要求1所述的钢材图像编号的提取和分割方法,其特征是对钢材图像进行 水平投影,找出在Y轴方向的谷点,根据谷点沿X轴方向切分图像得到不同的行。4. 根据权利要求1所述的钢材图像编号的提取和分割方法,其特征是通过观察字符区 域,统计字符总数,对每行投影值零值跳变点个数进行统计,大于或等于字符总数一半的保 留,小于一半认为是干扰行。5. 根据权利要求1所述的钢材图像编号的提取和分割方法,其特征是先求出直方图中 投影区的平均高度,再根据直方图求出每个区域的宽度和每个区域的平均高度,根据区域 宽度最大值和每个区域的平局高度的大小关系来确定字符区的高度。
【文档编号】G06T7/00GK105894487SQ201410430728
【公开日】2016年8月24日
【申请日】2014年8月25日
【发明人】李俊
【申请人】武汉科技大学