基于多方法去噪和连通区域分析的甲骨拓片单字定位方法与流程

文档序号:11476135阅读:633来源:国知局
基于多方法去噪和连通区域分析的甲骨拓片单字定位方法与流程

本发明涉及图像处理技术领域,特别涉及基于多方法去噪和连通区域分析的甲骨拓片单字定位方法。



背景技术:

甲骨文是商朝后期用龟甲兽骨进行记事和占卜的文字,甲骨文契刻在龟甲与兽骨之上,距今已有三千多年。龟甲和兽骨上的甲骨文包含大量有用的信息,是研究中国古代语言、文化、历史的基础。因此,如何整理这些甲骨文字,从中提取出有用的甲骨文字,进而得到更有用的历史文化信息,是甲骨文研究的重点。

近几年在计算机处理甲骨文方面,很多研究机构开始建设甲骨文字库,极大地方便了甲骨文研究者的研究工作。目前国内许多学者对于甲骨文的数字化也做了很多研究,开发了一系列的软件和系统,如甲骨文输入法、甲骨文字库、甲骨文的编码技术、甲骨文的辅助考试研究等。这些研究成果很大程度上方便了甲骨学者对甲骨文的分析和研究,对古文字的分析和研究进入一个新的时代。然而在进行甲骨文的研究时,很多学者还是通过手工提取甲骨拓片上的文字做进一步研究,误差大效率低,并且甲骨文字与现代汉字无论在字形还是语义语法上都存在着显著的区别。首先,研究对象为拓片上的甲骨文,拓片年代久远,很多已经破损,字迹模糊;第二,拓片字形外部轮廓不齐,具有图画特征,大小不一甚至有些只剩笔画;第三,拓片受扫描分辨率的影响会引起不少的质量问题;而普通汉字一般具有标准的笔画。

因此尽管目前在不同类型图像中汉字的定位与分割已提出了许多有效的方法,如基于纹理的定位方法,基于连通域的定位方法和基于边缘的定位方法,将上述几种方法相结合也是目前一种有效的研究思路,但这类方法有时候难以提取有效的文字特征。为了使算法更具稳定性,很多情况下将基于机器学习的方法与上面的方法结合起来。基于机器学习的分类算法主要通过机器学习强调文本区域与非文本区域的区别来实现分类,但检测效果对训练样本的选择有一定的依赖性。然而上述方法并不一定能全部应用于甲骨文字。如何从拓片上识别出甲骨文字会比手写汉字识别更困难。

目前有部分对拓片上甲骨文字进行识别的,如周新伦等提出采用拓扑结构来识别甲骨文字;吕肖庆等提出一种基于曲率直方图的傅里叶描述子,实现了小范围甲骨文的分类;栗青生等利用字形动态描述的方法实现了甲骨文的输入;顾绍通将数学形态学应用到拓片文字进行特征提取。而所有的这些研究均需建立在对拓片上的单个甲骨文字定位的基础上,目前关于甲骨文字定位的相关研究还较少。目前虽然提出了基于阈值分割和形态学的甲骨单字定位方法,但该方法在某些复杂背景或噪声比较严重的拓片图像中,定位效果不太理想,因此,如何在甲骨拓片上准确的定位并提取单个甲骨文字是所有研究的基础。



技术实现要素:

本发明实施例提供了基于多方法去噪和连通区域分析的甲骨拓片单字定位方法,用以解决现有技术中存在的问题。

基于多方法去噪和连通区域分析的甲骨拓片单字定位方法,所述方法包括:

使用数学形态学中的开运算对输入的原始图像进行处理,去除所述原始图像中的背景图像,对获得的图像调整对比度,得到增强图像;

使用中值滤波算法对所述增强图像进行去噪处理,获得去噪图像;

利用大津法选取合适的分割阈值,使用该分割阈值对所述去噪图像进行分割,并对分割后的图像进行二值化处理,获得分割后的二值化图像;

使用数学形态学中的开运算对所述分割后的二值化图像进行去噪处理,得到开运算处理后的二值化图像;

使用bwlabel函数,按照8连通将所述开运算处理后的二值化图像中的各个连通区域标记出来,并用矩形框选,利用regionprops函数计算各个连通区域的面积,将所述连通区域中面积小于经验值的连通区域删除,然后将相邻两个连通区域的间距小于预定的行间最小间距的上下两个连通区域合并,对于合并后的连通区域,接着计算每个连通区域的最小外接矩形的宽高比,将宽高比小于预定阈值的连通区域删除,得到框选图像;

将所述框选图像中的矩形框按照在所述框选图像中的位置对应到所述原始图像中,对所述原始图像中的单字进行定位,获得定位图像。

优选地,在对所述原始图像进行开运算处理时,使用imopen函数和一个半径为16的圆盘型结构元素对输入的所述原始图像进行形态学开运算,去掉不包含在所述圆盘型结构元素中的点,从而实现对所述原始图像背景亮度的估计,接着根据对所述背景亮度的估计将背景图像从所述原始图像中去除,从而得到背景一致的图像,对该背景一致的图像调节对比度,获得所述增强图像。

优选地,利用regionprops函数计算各个连通区域的面积时,regionprops函数实际求得的是各个连通区域实际的像素点数,所述连通区域的面积通过以下公式计算获得:

式中,m为图像的水平像素数,n为图像的垂直像素数。

本发明的有益效果在于:本发明提出的方法实验结果为:准确率0.73,召回率0.61,综合结果为0.63,从实验结果可以看出,由于本发明首先使用中值滤波,接着,先对处理过的图片二值化,然后针对甲骨拓片文字特征继续用形态学进行去噪,这种方法去除了尽可能多的噪声,将所有的文字区及噪声区分割为白色,整个拓片背景分割为黑色,使得各个文字区基本不会遗漏,可获得较高的召回率。然后再用连通域进行标注并进一步分析,几乎排除了所有的噪声点,具有较高的准确率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的基于多方法去噪和连通区域分析的甲骨拓片单字定位方法使用的原始图像;

图2为对图1中原始图像进行开运算处理后的增强图像;

图3为对图2中增强图像进行中值滤波后的去噪图像;

图4为对图3中去噪图像使用大津法进行分割后的二值化图像;

图5为对图2中增强图像使用大津法分割后的二值化图像;

图6为对图4中二值化图像进行开运算处理后的二值化图像;

图7为对图6中二值化图像中的连通区域使用矩形框选后的图像;

图8为使用图7中的矩形框对图1中原始图像进行单字定位后的定位图像。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

在介绍本发明的技术方案前,首先需要对一些技术术语进行说明:

1、开运算和闭运算:在数学形态学中,结构元素是最重要最基本的概念。结构元素在形态变换中的作用相当于信号处理中的“滤波窗口”。用b代表结构元素,对输入图像e中的每一点x或y,腐蚀和膨胀的定义为:

腐蚀:

膨胀:

用b对e进行腐蚀的结果就是把结构元素b平移后使b包含于e的所有点构成的集合,该集合表示为x。用b对e进行膨胀的结果就是把结构元素b平移后使b与e的交集非空的点构成的集合,该集合表示为y。先腐蚀后膨胀的过程称为开运算。它具有消除细小物体,在纤细处分离物体和平滑较大物体边界的作用。先膨胀后腐蚀的过程称为闭运算。它具有填充物体内细小空洞,连接邻近物体和平滑边界的作用。

2、中值滤波:对一个数字信号序列xj(-∞<j<+∞)进行滤波处理时,首先要定义一个长度为奇数的l长窗口,l=2n+1,n为正整数。设在某一个时刻,窗口内的信号样本为x(i-n),…,x(i),…,x(i+n),其中x(i)为位于窗口中心的信号样本值。对这l个信号样本值按从小到大的顺序排列后,其中值在i处的样值,便定义为中值滤波的输出值。

3、大津法:大津法(otsu)是由大津于1979年提出,对图像i,记t为前景与背景的分割阈值,前景点数占图像比例w0,平均灰度u0;背景点数占图像比例w1平均灰度值为u1。图像的总平均灰度为:u1=w0×u0+w1×u1,从最小灰度到最大灰度遍历t,当t使得方差σ2=w0×(u0-ut)2+w1×(u1-ut)2最大时,t即为分割的最佳阈值。方差为灰度分布均匀性的一种度量,方差值越大,说明构成图像的两部分差别越大,当部分前景错分为背景或部分背景错分为前景都会导致两部分差别变小,因此,使方差最大的分割意味着错分概率最小。

4、bwlabel函数:bwlabel函数的功能是对连通对象进行标注,主要对二维二值图像中各个分离部分进行标注。l=bwlabel(bw,n)返回一个和bw大小相同的l矩阵,包含了标记了bw中每个连通区域的类别标签,这些标签的值为1、2、num(连通区域的个数)。n的值为4或8,表示是按4连通寻找区域,还是8连通寻找,默认为8。8连通是图像处理里的基本概念:指的是一个像素,如果和其他像素在上、下、左、右、左上角、左下角、右上角或右下角连接着,则认为他们是连通的。如:

按照8连通标记,连通区域个数为2,就是有2个不同的连接区域。

[l,num]=bwlabel(bw,8)

这里num=2。

本发明实施例提供了基于多方法去噪和连通区域分析的甲骨拓片单字定位方法,该方法包括:

第一步骤,使用数学形态学中的开运算对输入的原始图像进行处理,去除所述原始图像中的背景图像,对获得的图像调整对比度,得到增强图像;

具体地,使用imopen函数和一个半径为16的圆盘型结构元素对输入的所述原始图像进行形态学开运算,如图1所示,去掉不包含在所述圆盘型结构元素中的点,从而实现对所述原始图像背景亮度的估计。接着根据对背景亮度的估计将背景图像从所述原始图像中去除,从而得到背景较一致的图像。对该背景较一致的图像调节对比度,获得所述增强图像,如图2所示。

第二步骤,使用中值滤波算法对所述增强图像进行去噪处理,获得去噪图像,如图3所示;

第三步骤,利用大津法选取合适的分割阈值,使用该分割阈值对所述去噪图像进行分割,并对分割后的图像进行二值化处理,获得分割后的二值化图像,如图4所示;

可以看出,虽然第二步骤中的去噪方法对所述增强图像未能完全去噪,但经过去噪之后再采用大津法阈值二值化处理后的图像已经比不去噪直接阈值分割效果好了很多,未进行去噪直接使用大津法分割的二值化图像如图5所示。

第四步骤,使用数学形态学中的开运算对所述分割后的二值化图像进行去噪处理,得到开运算处理后的二值化图像,如图6所示;

第五步骤,使用bwlabel函数,按照8连通将所述开运算处理后的二值化图像中的各个连通区域标记出来,并用矩形框选,利用regionprops函数计算各个连通区域的面积,将所述连通区域中面积小于经验值的连通区域删除,得到的图像如图7所示。删除小面积连通区域后,将相邻两个连通区域的间距小于预定的行间最小间距的上下两个连通区域合并,对于合并后的连通区域,计算每个连通区域的最小外接矩形的宽高比,将宽高比小于预定阈值的连通区域删除,得到框选图像;

其中,regionprops函数实际求得的是各个连通区域实际的像素点数,连通区域的面积通过以下公式计算获得:

式中,m为图像的水平像素数,n为图像的垂直像素数。

第六步骤,将所述框选图像中的矩形框按照在所述框选图像中的位置对应到所述原始图像中,对所述原始图像中的单字进行定位,获得定位图像,如图8所示。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1