本发明涉及图像处理领域,涉及一种图像校正方法。
背景技术:
图像实际操作中受人为因素影响,图像可能是横向也可能是竖向放入扫描仪作扫描,为了后续处理的一致性,必须将所有图像恢复为横向放置。由于待处理图像数量繁多及人工放置时的视觉误差会导致扫描后的图像不可避免的存在角度倾斜问题,校正图像的问题很难完成,因此,必须对图像的校正方法进行研究。
技术实现要素:
有鉴于此,本发明提供一种解决或部分解决上述问题的一种图像校正方法。
为达到上述技术方案的效果,本发明的技术方案为:一种图像校正方法,包含以下步骤:
(1)对图像进行分割;依据分割理论切割含上下左右边界的子图像,分割理论是统计图像的内容的边界的像素点位置以及图像的像素范围,图像的内容的边界的像素点位置包含上边界像素范围、下边界像素范围、左边界像素范围、右边界像素范围,上边界像素范围为图像的内容的上边界,下边界像素范围为图像的内容的下边界,左边界像素范围为图像的内容的左边界,右边界像素范围为图像的内容的右边界,图像的像素范围包含行像素范围、列像素范围,行像素范围即为图像的行数,列像素范围为图像的列数;图像的内容包含图像中的文字、图片、表格;
(2)依据第(1)步图像分割的结果,以下边界像素范围以及左边界像素范围的交点为原点,建立图像的坐标,横坐标为下边界像素范围,纵坐标为左边界像素范围,取上边界像素范围与左边界像素范围的交点(x1,y1)、下边界像素范围与右边界像素范围的交点(x2,y2),经过两点的直线为y=ax+b,其与左边界像素范围以及下边界像素范围构成了封闭的三角形范围,在封闭的三角形范围中取16个离散值,使用累加器对离散值的坐标进行相加,即横坐标之间相加,纵坐标之间相加,得到新的坐标值(m1,n1);
(3)在图像的边缘上,取图像的内容的右边界点与上边界点,图像的内容的右边界点以及上边界点的计算方法为:以图像的下边缘与图像的左边缘的交点为坐标的原点,图像的下边缘为坐标的X坐标,图像的左边缘为Y坐标,图像的右边界点以及上边界点分别为图像的内容与下边缘的交点中X坐标最大的点、图像的内容与左边缘的交点中Y坐标最大的点,将图像的右边界点与上边界点连接,经过两点的直线为y=a1x+b1,求得直线y=ax+b与直线y=a1x+b1的斜率,并计算出两个直线倾斜角θ1与倾斜角θ2,求得两个倾斜角的差;在图像的下边缘、图像的左边缘、直线y=a1x+b1构成的空间内取16个值,将它们的X坐标、Y坐标分别相加,得到坐标值(m2,n2),将新的坐标值(m1,n1)与坐标值(m2,n2)连接,求得经过两点的直线为y=a2x+b2,直线y=a2x+b2的倾斜角θ3,比较两个倾斜角的差与倾斜角θ3,如果两者的差小于10°,将两个倾斜角的差作为图像的校正角度。
本发明的有益成果是:本发明一方面采用了自动识别技术以减少人工的投入、简化工作流程,另一方面在研究本发明的过程中,针对不同的识别对象采用了不同的算法,在本发明的研究基础上,可以对类似的处理对象触类旁通,对图像的位置进行调整以此作为图像处理的前期处理过程。
具体实施方式
为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚明白,以下结合实施例,对本发明进行详细的说明。应当说明的是,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明,能实现同样功能的产品属于等同替换和改进,均包含在本发明的保护范围之内。具体方法如下:
实施例1:由于在输入进扫描仪时人工放置的随意性,即图像可以是横向或竖向输入到扫描仪中,为了保证后续的角度倾斜校正中对图像切割时位置的统一性,先将图像全部统一为横向图。因为图像是一个长方形形状,所以把图像的高宽比以及之间的大小比较结果作为判断图像是否需要旋转90°的依据,如果高宽比大于等于则认为图像是纵向输入的,此时需要旋转;如果高宽比较小,则认为图像是横向输入的,此时保持原状就好,这里定义的旋转是沿着顺时针方向。由于人工放置时视觉误差或者扫描仪本身存在的一些机械缺陷等原因,会造成扫描后的图像出现一定程度的角度倾斜,正因为避免不了这些客观因素的存在,所以角度的倾斜校正是预处理里必须进行的环节,后续对图像图像的定位、切割及识别都要以相对正立,无倾斜的图像图像为处理基础。
本发明采用了改进的Hough变换方法进行图像的校正,在图像处理、机器视觉等领域有着广泛的应用,这是因为Hough变换原理简单、易于理解,其基本思想是将图像从一个坐标平面变换到另一个坐标平面,通过这种变换使得在原来笛卡尔坐标平面内不容易被检测到的那些直线特征会在另一个极坐标平面内以局部极大值的形式表现出来,通过对局部极大值的求取获得原坐标平面内直线的主要信息,从而实现角度检测。由上述检测过程可知,变换对于噪声的敏感度不够,即对噪声具有较强的抗干扰能力,同时它又擅长于并行处理,正因为这些优点,才使得变换在各个领域和方向都得到极大的应用。
一方面,本改进方法以切割下的四个子图像作变换,从而避免二元变换需要计算整张图像像素点的缺陷,而且在经过分析后确定±30°的倾斜角度变化范围后,会减小变换空间中需要遍历的数组个数,即通过分析后作出的处理减小了算法的时间复杂度;另一方面,去除最大值和最小值并取中间两数的平均数作为计算结果,此法源于中值滤波思想,与原始变换求得一个倾斜角度作为检测结果相比更准确可靠,并且能更有效的控制误差,使校正结果更加可靠。
实施例2:在图像校正的第一步横向放置中,当检测出图像为竖向放置时,所作的旋转90°处理是沿着顺时针方向,所以这可能会造成旋转后的图像右部所示为倒立状态为了后续定位处理,需要把图像统一称为正立状态,为此需要对图像是否正立放置作判断,选择红色矩形框区域内黑像素所占整个矩形框像素的比例作为图像是否立的判据。通过统计分析发现,对于所标注的红色区域,如果图像是正立的,那在红色区域内的像素信息将十分多,因为它包含图像名称以及红章信息,此时矩形框内黑色像素所占据整个矩形框像素的比例明显大于当图像是倒立时红色区域内黑色像素所占比例。在程序实现时,判断红色标注区域内黑色像素比例大于的图像为正立,否则判定图像为倒立,此时需要将图像绕中心点旋转180°,完成从倒立到正立图像的转变。经过预处理流程后得到相对倾斜角度为,正立的二值图像。
一种图像校正方法,包含以下步骤:
(1)对图像进行分割;依据分割理论切割含上下左右边界的子图像,分割理论是统计图像的内容的边界的像素点位置以及图像的像素范围,图像的内容的边界的像素点位置包含上边界像素范围、下边界像素范围、左边界像素范围、右边界像素范围,上边界像素范围为图像的内容的上边界,下边界像素范围为图像的内容的下边界,左边界像素范围为图像的内容的左边界,右边界像素范围为图像的内容的右边界,图像的像素范围包含行像素范围、列像素范围,行像素范围即为图像的行数,列像素范围为图像的列数;图像的内容包含图像中的文字、图片、表格;
(2)依据第(1)步图像分割的结果,以下边界像素范围以及左边界像素范围的交点为原点,建立图像的坐标,横坐标为下边界像素范围,纵坐标为左边界像素范围,取上边界像素范围与左边界像素范围的交点(x1,y1)、下边界像素范围与右边界像素范围的交点(x2,y2),经过两点的直线为y=ax+b,其与左边界像素范围以及下边界像素范围构成了封闭的三角形范围,在封闭的三角形范围中取16个离散值,使用累加器对离散值的坐标进行相加,即横坐标之间相加,纵坐标之间相加,得到新的坐标值(m1,n1);
(3)在图像的边缘上,取图像的内容的右边界点与上边界点,图像的内容的右边界点以及上边界点的计算方法为:以图像的下边缘与图像的左边缘的交点为坐标的原点,图像的下边缘为坐标的X坐标,图像的左边缘为Y坐标,图像的右边界点以及上边界点分别为图像的内容与下边缘的交点中X坐标最大的点、图像的内容与左边缘的交点中Y坐标最大的点,将图像的右边界点与上边界点连接,经过两点的直线为y=a1x+b1,求得直线y=ax+b与直线y=a1x+b1的斜率,并计算出两个直线倾斜角θ1与倾斜角θ2,求得两个倾斜角的差;在图像的下边缘、图像的左边缘、直线y=a1x+b1构成的空间内取16个值,将它们的X坐标、Y坐标分别相加,得到坐标值(m2,n2),将新的坐标值(m1,n1)与坐标值(m2,n2)连接,求得经过两点的直线为y=a2x+b2,直线y=a2x+b2的倾斜角θ3,比较两个倾斜角的差与倾斜角θ3,如果两者的差小于10°,将两个倾斜角的差作为图像的校正角度。
以上所述仅为本发明之较佳实施例,并非用以限定本发明的权利要求保护范围。同时以上说明,对于相关技术领域的技术人员应可以理解及实施,因此其他基于本发明所揭示内容所完成的等同改变,均应包含在本权利要求书的涵盖范围内。
本发明的有益成果是:本发明一方面采用了自动识别技术以减少人工的投入、简化工作流程,另一方面在研究本发明的过程中,针对不同的识别对象采用了不同的算法,在本发明的研究基础上,可以对类似的处理对象触类旁通,对图像的位置进行调整以此作为图像处理的前期处理过程。