从彩色文档图像中提取特定区域的方法和设备的制造方法

文档序号：10665858阅读：616来源：国知局

从彩色文档图像中提取特定区域的方法和设备的制造方法
【专利摘要】本发明公开了从彩色文档图像中提取特定区域的方法和设备。根据本发明的从彩色文档图像中提取特定区域的方法包括：根据所述彩色文档图像，获得第一边缘图像；利用彩色通道的不均一性，获取二值化图像；合并所述第一边缘图像和所述二值化图像，以得到第二边缘图像；以及根据所述第二边缘图像，确定所述特定区域。根据本发明的方法和设备，能够以较高的精度和鲁棒性将彩色文档图像中的图片区域、半色调区域、被线框起来的封闭区域与普通文本区域分离。
【专利说明】
从彩色文档图像中提取特定区域的方法和设备
技术领域
[0001] 本发明一般地涉及图像处理领域。具体而言，本发明涉及一种能够以较高的精度和鲁棒性从彩色文档图像中提取特定区域的方法和设备。
【背景技术】
[0002] 近年来，扫描仪相关的技术取得了飞速的发展。例如，在扫描文档图像的背透检测和去除、文档版面分析、光学字符识别等技术方面，技术人员已经做出许多工作以提高处理效果。然而，仅仅针对这些技术本身进行改进是不够的。如果能够对上述技术的预处理步骤，即扫描文档图像的区域划分，进行改进，则对于扫描文档图像的各种处理的整体效果提升可以起到事半功倍的作用。
[0003] 扫描文档图像由于内容的丰富性，提高了处理的难度。例如，扫描文档图像经常是彩色的、文字与图片混排的，有时还有封闭框。这些区域具有彼此不同的特性，在过去难以用统一的方法进行处理。然而又需要将各种区域精确地、鲁棒地提取出来，以利于提高后级处理的效果。图1示出了彩色扫描文档图像的示例，其中具体的彩色细节将在下文中描述。
[0004] 传统的区域分割提取算法往往针对非常具体问题设计，不具有通用性，所以一旦应用于不同的具体问题，就难以实现高精度和高鲁棒性的区域提取。这显然难以满足区域分割提取方法作为背透检测和去除、文档版面分析、光学字符识别等技术的前处理的需要。
[0005] 因此，期望一种从彩色文档图像尤其是彩色扫描文档图像中提取特定区域的方法和设备，其能够高精度、高鲁棒性地提取彩色文档图像中的特定区域，尤其是图片区域、半色调区域、被线框起来的封闭区域，能够将这些区域与文字区域相区分。

【发明内容】

[0006] 在下文中给出了关于本发明的简要概述，以便提供关于本发明的某些方面的基本理解。应当理解，这个概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的关键或重要部分，也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念，以此作为稍后论述的更详细描述的前序。
[0007] 本发明的目的是针对现有技术的上述问题，提出了一种能够高精度、高鲁棒性地提取彩色文档图像中的特定区域的方法和设备。
[0008] 为了实现上述目的，根据本发明的一个方面，提供了一种从彩色文档图像中提取特定区域的方法，该方法包括：根据所述彩色文档图像，获得第一边缘图像；利用彩色通道的不均一性，获取二值化图像；合并所述第一边缘图像和所述二值化图像，以得到第二边缘图像；以及根据所述第二边缘图像，确定所述特定区域。
[0009] 根据本发明的另一个方面，提供了一种从彩色文档图像中提取特定区域的设备，该设备包括：第一边缘图像获取装置，被配置为：根据所述彩色文档图像，获得第一边缘图像；二值化图像获取装置，被配置为：利用彩色通道的不均一性，获取二值化图像；合并装置，被配置为：合并所述第一边缘图像和所述二值化图像，以得到第二边缘图像；以及区域确定装置，被配置为：根据所述第二边缘图像，确定所述特定区域。
[0010] 根据本发明的再一方面，提供了一种扫描仪，其包括如上所述的从彩色文档图像中提取特定区域的设备。
[0011] 另外，根据本发明的另一方面，还提供了一种存储介质。所述存储介质包括机器可读的程序代码，当在信息处理设备上执行所述程序代码时，所述程序代码使得所述信息处理设备执行根据本发明的上述方法。
[0012] 此外，根据本发明的再一方面，还提供了一种程序产品。所述程序产品包括机器可执行的指令，当在信息处理设备上执行所述指令时，所述指令使得所述信息处理设备执行根据本发明的上述方法。
【附图说明】
[0013] 参照下面结合附图对本发明实施例的说明，会更加容易地理解本发明的以上和其它目的、特点和优点。附图中的部件只是为了示出本发明的原理。在附图中，相同的或类似的技术特征或部件将采用相同或类似的附图标记来表示。附图中：
[0014] 图1示出了彩色文档图像的示例；
[0015] 图2示出了根据本发明的实施例的从彩色文档图像中提取特定区域的方法的流程图；
[0016] 图3示出了第一边缘图像的示例；
[0017] 图4示出了二值化图像的示例；
[0018] 图5示出了第二边缘图像的示例；
[0019] 图6示出了第三边缘图像的示例；
[0020] 图7示出了一种确定特定区域的方法的流程图；
[0021] 图8示出了外接矩形围绕区域的示例；
[0022] 图9示出了一种确定特定区域的方法的流程图；
[0023] 图10示出了与所提取的特定区域对应的掩膜图像；
[0024] 图11示出了根据本发明实施例的从彩色文档图像中提取特定区域的设备的结构方框图；以及
[0025] 图12示出了可用于实施根据本发明实施例的方法和设备的计算机的示意性框图。
【具体实施方式】
[0026] 在下文中将结合附图对本发明的示范性实施例进行详细描述。为了清楚和简明起见，在说明书中并未描述实际实施方式的所有特征。然而，应该了解，在开发任何这种实际实施方式的过程中必须做出很多特定于实施方式的决定，以便实现开发人员的具体目标，例如，符合与系统及业务相关的那些限制条件，并且这些限制条件可能会随着实施方式的不同而有所改变。此外，还应该了解，虽然开发工作有可能是非常复杂和费时的，但对得益于本公开内容的本领域技术人员来说，这种开发工作仅仅是例行的任务。
[0027] 在此，还需要说明的一点是，为了避免因不必要的细节而模糊了本发明，在附图中仅仅示出了与根据本发明的方案密切相关的装置结构和/或处理步骤，而省略了与本发明关系不大的其他细节。另外，还需要指出的是，在本发明的一个附图或一种实施方式中描述的元素和特征可以与一个或更多个其它附图或实施方式中示出的元素和特征相结合。
[0028] 本发明的基本思想是结合使用彩色和边缘（如梯度）的信息来从彩色文档图像中提取图片区域、半色调区域、被线框起来的封闭区域等特定区域。
[0029] 本发明的方法和设备的输入是彩色文档图像。图1示出了彩色文档图像的示例。其中，左上角的"TOP 3人物"既是封闭框围起来的区域，又是半色调区域。"TOP 3人物"下方的人像既是半色调区域，也是图片区域。人像下方的"人语"及其下方的四段文字既是封闭框围起来的区域，又是半色调区域。右侧中间的"中国普天信息产业集团公司"图片及右下角的五个人物所在的图片既是半色调区域，也是图片区域。左上角的"埃斯内"、中间上方的"新帅普天"、中心附近的"Bechtolsheim"均为彩色文字。其它内容均为白底黑字文字、白色空白、黑色非封闭的线条。本发明的目标是提取出"TOP 3人物"、人像、"人语"及其下方的四段文字、"中国普天信息产业集团公司"图片及右下角的五个人物所在的图片所属的区域，与剩余的普通文本区域相区分。其中，彩色文字"埃斯内"、"新帅普天"、"Bechtolsheim" 应归为普通文本区域。
[0030] 从图1可以看出，待处理的图像是复杂的，图像的构成元素丰富多样，特征各异，因此处理难度较大。
[0031] 本发明所希望提取的特定区域包括：图片区域、半色调区域、被线框起来的封闭区域中的至少一个区域。如上针对图1所描述的那样，有的区域属于上述三种区域中的一种、或同时属于上述三种区域中的两种或三种。特定区域不包括非图片的、非彩色的、非封闭区域，即使这样的区域的部分边缘存在线条。比如，图1中的人像下方左侧的文本块的左侧和右侧均存在竖线，但是该区域并不封闭，应被判断为普通文本区域。
[0032] 下面将参照图2描述根据本发明的实施例的从彩色文档图像中提取特定区域的方法的流程。
[0033] 图2示出了根据本发明的实施例的从彩色文档图像中提取特定区域的方法的流程图。如图2所示，根据本发明的实施例的从彩色文档图像中提取特定区域的方法包括如下步骤：根据所述彩色文档图像，获得第一边缘图像（步骤S1);利用彩色通道的不均一性，获取二值化图像（步骤S2);合并所述第一边缘图像和所述二值化图像，以得到第二边缘图像（步骤S3);以及根据所述第二边缘图像，确定所述特定区域（步骤S4)。
[0034] 在步骤S1中，根据所述彩色文档图像，获得第一边缘图像。
[0035] 步骤S1的目的是获得图像的边缘信息，因此，步骤S1可以利用本领域已知的提取边缘的方法实现。
[0036] 根据本发明的优选实施例，可以通过如下步骤S101-S103实现步骤S1。
[0037] 首先，在步骤S101中，将所述彩色文档图像转换为灰度图像。该转换步骤为本领域技术人员所熟知，在此不再赘述。
[0038] 然后，在步骤S102中，利用卷积模板，根据所述灰度图像，获得梯度图像。
[0039] 具体地，利用第一卷积模板，扫描所述灰度图像，以得到第一中间图像。第一卷积模板例如另
第一卷积模板对齐灰度图像的左起第一列从上往下的前五个像素，这五个像素的像素值，即灰度值，分别与第一卷积模板对应的权值28、125、206、125、28相乘后取平均，作为这五个像素中心点，即灰度图像第一列从上往下数第三个像素对应的第一中间图像上的对应点的取值。将第一卷积模板相对于灰度图像向右侧移位一个像素位置，即使得第一卷积模板对应于灰度图像的左起第二列从上往下的前五个像素，继续上述计算，以得到灰度图像第二列从上往下数第三个像素对应的第一中间图像上的对应点的取值。依次类推，直至第一卷积模板扫描了灰度图像的第一至第五行。接着，再使第一卷积模板扫描灰度图像的第二至第六行。依次类推，直至第一卷积模板扫描了灰度图像的倒数第一至第五行。这样，就得到了第一中间图像。
[0040] 应注意，此处的第一卷积模板、下面利用的第二卷积模板、第三卷积模板、第四卷积模板均为示例。卷积模板的大小和权值均为示例，本发明不限于此。
[0041] 然后，再利用第二卷积模板，扫描所述第一中间图像，以得到水平方向梯度图像。第二卷积模板例如是
[0042] 接着，利用第三卷积模板，扫描所述灰度图像，以得到第二中间图像。第三卷积模板例如逼
[0043] 接着，利用第四卷积模板，扫描所述第二中间图像，以得到垂直方向梯度图像。第四卷积模板例如是
第二、第三、第四卷积模板的扫描过程类似于第一卷积模板的扫描过程。
[0044] 然后，比较所述水平方向梯度图像和所述垂直方向梯度图像对应点的绝对值，利用其中较大的绝对值构成所述梯度图像。
[0045] 最后，在步骤S103中，将所述梯度图像中的点进行归一化和二值化，以得到第一边缘图像。归一化和二值化步骤为本领域技术人员所熟知，在此不再赘述。二值化阈值可由本领域技术人员灵活设置。
[0046] 根据本发明的优选实施例，也可以通过如下步骤S111-S113实现步骤S1。
[0047] 在步骤S111中，将所述彩色文档图像转换为R、G、B单通道图像。
[0048] 在步骤S112中，利用卷积模板，根据所述R、G、B单通道图像，获得R、G、B单通道梯度图像。由于R、G、B单通道图像中的每个图像都类似于彩色文档图像，因此，可采用与上述步骤S101、S102类似的方式，实现步骤S112。
[0049] 在步骤S113中，针对所述R、G、B单通道梯度图像中的每个对应点做二范数，并进行归一化和二值化，以得到第一边缘图像。也就是通过将R、G、B单通道梯度图像中的对应点的三个值合并为一个值来合并三个单通道梯度图像，并转换为第一边缘图像。
[0050] 至此，经过步骤S1，从彩色文档图像，得到了第一边缘图像。图3示出了第一边缘图像的示例。二值化中高于二值化阈值的像素点对应的第一边缘图像中的点取〇,否则取 1。当然，也可相反设置。
[0051] 第一梯度图像可以反映彩色文档图像中的大多数边缘，尤其是黑、白、灰色像素的边缘。但是第一梯度图像难以反映彩色文档图像中的彩色较浅的部分（例如，图1右下角5 个人身后的背景是彩色的，但比较浅，导致在图3中被归为背景，但是在下面介绍的步骤S2 所产生的图4中被归为前景），因为这样的部分的灰度特征不锐利。因此，需要利用彩色的固有特性来提取半色调区域、彩色图片区域等。
[0052] 如上所述，本发明结合彩色和边缘（梯度）的信息来从彩色文档图像中提取特定区域，因此还需获取彩色信息。
[0053] 彩色文档图像具有多种格式。例如，RGB格式、YCbCr格式、YUV格式、CMYK格式等。下文以RGB格式为例进行描述。应当理解，其它格式的彩色图像可以利用本领域公知的转换方式转换为RGB格式，以进行如下例示的处理。
[0054] 在步骤S2中，利用彩色通道的不均一性，获取二值化图像。
[0055] 这一步骤的目的是获取彩色图像的彩色信息，更具体地说，确定彩色文档图像中的彩色像素。利用的原理是R、G、B三个彩色通道的值相同或差异较小时，呈现的颜色是灰色（均为〇时为纯黑色，均为255时为纯白色），R、G、B三个彩色通道的值差异较大时，呈现的颜色是彩色。差异的大小可以根据设定的差异阈值来衡量。
[0056] 具体地，可以首先比较所述彩色文档图像中每一个像素点的R、G、B三通道的差异。例如，对于每一个像素点（r。，g。，b。)，计算该像素点的三通道值：d Q= r Q-(gQ+bQ)/2 ;山 =&T(r〇+b〇)/2 ;d2= bo-Cro+g。)/^。接着，计算 max(abs(d。），absWi), abs(d2))，其中 max() 表示取最大值，abs ()表示取绝对值，即计算d。、山、(12的绝对值中的最大值来表征该像素点的R、G、B三通道的差异。
[0057] 然后，根据所述差异是否大于第一差异阈值，确定与该像素点对应的、所述二值化图像中的点的取值。也就是说，如果彩色文档图像中一个像素点的R、G、B三通道的差异大于第一差异阈值，则二值化图像中与该像素点对应的点例如取〇,否则取1。当然，也可相反设置。需注意的是要保证步骤S1获得的第一边缘图像中的前景与步骤S2获得的二值化图像中的前景采用同样的数值表示，以确保在步骤S3中能够合并第一边缘图像与二值化图像中的前景。图4示出了二值化图像的示例。
[0058] 由于只要是彩色像素，像素的R、G、B三通道就存在较大差异，所以步骤S2能够提取出步骤S1难以提取的浅的彩色像素。同时，由于步骤S2利用的是彩色通道的不均一特性，因此难以处理黑白灰像素。因此，在步骤S1中利用边缘信息重点处理黑白灰像素。可见，通过结合彩色和边缘信息能够取得整体更好的区域提取效果。
[0059] 在步骤S3中，合并所述第一边缘图像和所述二值化图像，以得到第二边缘图像。
[0060] 具体地，如果所述第一边缘图像和所述二值化图像中的对应点中的至少一个是特定像素点（前景），则将所述第二边缘图像中的对应点确定为特定像素点。否则，即如果所述第一边缘图像和所述二值化图像中的对应点两者都不是特定像素点（前景），则将所述第二边缘图像中的对应点确定为非特定像素点（背景）。
[0061] 具体地，如果在第一边缘图像和二值化图像中，前景被表示为0(黑色），则将第一边缘图像和二值化图像中的对应点的值进行与操作。如果在第一边缘图像和二值化图像中，前景被表示为1(白色），则将第一边缘图像和二值化图像中的对应点的值进行或操作。进行与操作/或操作后所得到的图像就是第二边缘图像。图5示出了第二边缘图像的示例。
[0062] 进行完步骤S3之后，就可以基于第二边缘图像，提取特定区域了（步骤S4)。
[0063] 在步骤S4中，根据所述第二边缘图像，确定所述特定区域。
[0064] 值得一提的是，根据优选的实施例，还可以在第二边缘图像的基础上，生成第三边缘图像，然后在第三边缘图像的基础上，执行步骤S4中的后续步骤，以提高处理效果。
[0065] 可以通过连接所述第二边缘图像中的局部的孤立点，以得到第三边缘图像。
[0066] 这些局部的孤立点的出现是因为有些彩色部分掺杂有白色背景，所以在前面的步骤S2中提取的不完全，形成局部孤立点。实际上应该将其整体提取出来，因此需要将局部孤立点连接进前景部分中。
[0067] 具体地，可以利用连接模板如5X5的模板来扫描第二边缘图像。如果模板内的特定像素点（前景）的数量大于预定的连接阈值，则将连接模板的中心对应的点也设定为特定像素点（前景）。当然，5X5的模板仅为示例。连接阈值可由本领域技术人员灵活设置。这样，可以将第二边缘图像中的局部点连接起来，以得到第三边缘图像。
[0068] 此外，还可以针对第二边缘图像直接进行图像去噪处理，或者针对局部点连接后的第二边缘图像进行图像去噪处理，以得到第三边缘图像。
[0069] 图6示出了第三边缘图像的示例。
[0070] 上述连接局部孤立点的步骤为可选步骤。在步骤S4中，既可以直接以第二边缘图像为基础，也可以以第三边缘图像为基础，确定特定区域。以下，以第三边缘图像为例进行描述。
[0071] 图7示出了一种确定特定区域的方法的流程图。
[0072] 由于本发明希望提取的是区域，而不是点，所以，如图7所示，首先，在步骤S71中，对所述第三边缘图像进行连通域分析，以得到多个候选连通域。连通域分析是本领域常用的图像处理手段，在此不再赘述。
[0073] 然后，在步骤S72中，获得所述多个候选连通域中尺寸大的候选连通域的外接矩形。去掉尺寸小于特定尺寸阈值的候选连通域是因为尺寸太小的候选连通域可能是个别字，而不是要提取的区域。例如，图1中的彩色文字"埃斯内"、"新帅普天"、"Bechtolsheim"。根据候选连通域获得其外接矩形是本领域常用的图像处理手段，在此不再赘述。图8示出了外接矩形围绕区域的示例。
[0074] 最后，在步骤S73中，将与所述外接矩形围绕的区域对应的、所述彩色文档图像中的区域确定为所述特定区域。
[0075] 外接矩形是在第三边缘连通域中的，而所要提取的特定区域是在原始彩色文档图像中的。因此，需要确定外接矩形围绕的区域对应的彩色文档图像中的区域，将这样的区域作为所提取的特定区域。
[0076] 图9示出了另一种确定特定区域的方法的流程图。
[0077] 在步骤S91中，对所述第三边缘图像进行连通域分析，以得到多个候选连通域。在步骤S92中，获得所述多个候选连通域中尺寸大的候选连通域的外接矩形。在步骤S93中，将与所述外接矩形围绕的区域对应的、所述彩色文档图像中的区域确定为待定区域。在步骤S94中，提取所述外接矩形内边缘紧邻的、所述彩色文档图像中的边缘连通域。在步骤 S95中，仅将边缘连通域中预定条件的边缘连通域确定为所提取的特定区域。
[0078] 其中步骤S91-S93与步骤S71-S73相同，只是S93的确定结果还需要微调，所以称之为待定区域。步骤S94和S95针对外接矩形边缘内侧紧邻的部分进行分析，判断其是否满足预定条件，从而判断是否将这部分提取出来作为特定区域。
[0079] 具体地，在步骤S94中，提取所述外接矩形内边缘紧邻的、所述彩色文档图像中的边缘连通域。
[0080] 应注意此步骤的边缘连通域的提取是针对原始彩色文档图像进行的。
[0081] 根据边缘连通域是否满足预定条件来判断外接矩形内边缘紧邻的边缘连通域是否需要去除。
[0082] 在步骤S95中，从所述待定区域中去除不满足预定条件的边缘连通域，即仅将边缘连通域中符合预定条件的边缘连通域保留为所提取的特定区域。
[0083] 预定条件限定了边缘连通域中的像素与周围背景的差异、以及边缘连通域自身的一致性。例如，预定条件包括：所述边缘连通域中的所有像素值的方差高于方差阈值或所述边缘连通域中的所有像素值的均值与所述外接矩形外部的相邻像素的均值之间的差异大于第二差异阈值。方差阈值和第二差异阈值可由本领域技术人员灵活设置。外接矩形外部的相邻像素是指外接矩形外部区域中的与边缘连通域相邻近的像素。
[0084] 至此，经过步骤S4,提取了期望获得的特定区域。图10示出了与所提取的特定区域对应的掩膜图像。其中的黑色区域对应特定区域，白色区域对应文字区域。参见图1可知，左上角的黑框中，"TOP 3"的"3"的上半截的左右其实是背景，而非前景，但"3"本身是前景。在图8中，外接矩形围绕的区域包括了"3"上半截左右的背景像素。参见图10,经过步骤S94-S95，"3"上半截左右的非前景像素被排除出待定区域，"3"被保留为前景区域。另外，图8中的各个外接矩形的边缘横平竖直，在图10中，所提取的特定区域边缘存在毛刺，这也是通过对边缘连通域进行提取和分析导致的。可见，对于外接矩形的内边缘附近的边缘连通域进行再分析，可以更精确地提取特定区域。另外，如果彩色文档图像中存在被线框起来但未封闭的区域，这样的区域可能在步骤S3所得到的第二或第三边缘图像中示出为前景，但是通过步骤S94和S95仍能将这样的区域去除，使得最终提取的特定区域中包括的是被线框起来的封闭区域。
[0085] 下面，将参照图11描述根据本发明实施例的从彩色文档图像中提取特定区域的设备。
[0086] 图11示出了根据本发明实施例的从彩色文档图像中提取特定区域的设备的结构方框图。如图11所示，根据本发明的提取设备1100包括：第一边缘图像获取装置111，被配置为：根据所述彩色文档图像，获得第一边缘图像；二值化图像获取装置112,被配置为：利用彩色通道的不均一性，获取二值化图像；合并装置113,被配置为：合并所述第一边缘图像和所述二值化图像，以得到第二边缘图像；以及区域确定装置114,被配置为：根据所述第二边缘图像，确定所述特定区域。
[0087] 在一个实施例中，所述特定区域包括：图片区域、半色调区域、被线框起来的封闭区域中的至少一个区域。
[0088] 在一个实施例中，二值化图像获取装置112被进一步配置为：比较所述彩色文档图像中每一个像素点的R、G、B三通道的差异；根据所述差异是否大于第一差异阈值，确定与该像素点对应的、所述二值化图像中的点的取值。
[0089] 在一个实施例中，合并装置113被进一步配置为：在所述第一边缘图像和所述二值化图像中的对应点有一个是特定像素点的情况下，将所述第二边缘图像中的对应点确定为特定像素点。
[0090] 在一个实施例中，区域确定装置114包括：连通域分析单元，被配置为：对所述第二边缘图像进行连通域分析，以得到多个候选连通域；外接矩形获取单元，被配置为：获得所述多个候选连通域中尺寸大的候选连通域的外接矩形；区域确定单元，被配置为：将与所述外接矩形围绕的区域对应的、所述彩色文档图像中的区域确定为所述特定区域。
[0091] 在一个实施例中，区域确定装置114还包括：边缘连通域提取单元，被配置为：提取所述外接矩形内边缘紧邻的、所述彩色文档图像中的边缘连通域；所述区域确定单元被进一步配置为：仅将所述边缘连通域中满足预定条件的边缘连通域确定为所述特定区域的一部分。
[0092] 在一个实施例中，预定条件包括：所述边缘连通域中的所有像素值的方差高于方差阈值或所述边缘连通域中的所有像素值的均值与所述外接矩形外部的相邻像素的均值之间的差异大于第二差异阈值。
[0093] 在一个实施例中，区域确定单元还包括：连接单元，被配置为：连接所述第二边缘图像中的局部点，以得到第三边缘图像；所述区域确定单元被进一步配置为：根据所述第三边缘图像，确定所述特定区域。
[0094] 在一个实施例中，连接单元被进一步配置为：利用连接模板，扫描所述第二边缘图像；在所述连接模板内的特定像素点的数量超过连接阈值的情况下，将所述连接模板中心对应的像素点确定为所述特定像素点；根据上述确定结果，修改所述第二边缘图像，以得到所述第三边缘图像。
[0095] 在一个实施例中，一种扫描仪，包括如上所述的提取设备1100。
[0096] 由于在根据本发明的提取设备1100中所包括的各个装置和单元中的处理分别与上面描述的提取方法中所包括的各个步骤中的处理类似，因此为了简洁起见，在此省略这些装置和单元的详细描述。
[0097] 此外，这里尚需指出的是，上述设备中各个组成装置、单元可以通过软件、固件、硬件或其组合的方式进行配置。配置可使用的具体手段或方式为本领域技术人员所熟知，在此不再赘述。在通过软件或固件实现的情况下，从存储介质或网络向具有专用硬件结构的计算机（例如图12所示的通用计算机1200)安装构成该软件的程序，该计算机在安装有各种程序时，能够执行各种功能等。
[0098] 图12示出了可用于实施根据本发明实施例的方法和设备的计算机的示意性框图。
[0099] 在图12中，中央处理单元（CPU) 1201根据只读存储器（ROM) 1202中存储的程序或从存储部分1208加载到随机存取存储器（RAM) 1203的程序执行各种处理。在RAM 1203中，还根据需要存储当CPU 1201执行各种处理等等时所需的数据。CPU 120UR0M 1202和RAM 1203经由总线1204彼此连接。输入/输出接口 1205也连接到总线1204。
[0100] 下述部件连接到输入/输出接口 1205 :输入部分1206 (包括键盘、鼠标等等）、输出部分1207(包括显示器，比如阴极射线管（CRT)、液晶显示器（IXD)等，和扬声器等）、存储部分1208 (包括硬盘等）、通信部分1209 (包括网络接口卡比如LAN卡、调制解调器等）。通信部分1209经由网络比如因特网执行通信处理。根据需要，驱动器1210也可连接到输入 /输出接口 1205。可拆卸介质1211比如磁盘、光盘、磁光盘、半导体存储器等等可以根据需要被安装在驱动器1210上，使得从中读出的计算机程序根据需要被安装到存储部分1208 中。
[0101] 在通过软件实现上述系列处理的情况下，从网络比如因特网或存储介质比如可拆卸介质1211安装构成软件的程序。
[0102] 本领域的技术人员应当理解，这种存储介质不局限于图12所示的其中存储有程序、与设备相分离地分发以向用户提供程序的可拆卸介质1211。可拆卸介质1211的例子包含磁盘（包含软盘（注册商标））、光盘（包含光盘只读存储器（⑶-ROM)和数字通用盘 (DVD))、磁光盘（包含迷你盘（MD)(注册商标））和半导体存储器。或者，存储介质可以是 ROM 1202、存储部分1208中包含的硬盘等等，其中存有程序，并且与包含它们的设备一起被分发给用户。
[0103] 本发明还提出一种存储有机器可读取的指令代码的程序产品。所述指令代码由机器读取并执行时，可执行上述根据本发明实施例的方法。
[0104] 相应地，用于承载上述存储有机器可读取的指令代码的程序产品的存储介质也包括在本发明的公开中。所述存储介质包括但不限于软盘、光盘、磁光盘、存储卡、存储棒等等。
[0105] 在上面对本发明具体实施例的描述中，针对一种实施方式描述和/或示出的特征可以以相同或类似的方式在一个或更多个其它实施方式中使用，与其它实施方式中的特征相组合，或替代其它实施方式中的特征。
[0106] 应该强调，术语"包括/包含"在本文使用时指特征、要素、步骤或组件的存在，但并不排除一个或更多个其它特征、要素、步骤或组件的存在或附加。
[0107] 此外，本发明的方法不限于按照说明书中描述的时间顺序来执行，也可以按照其他的时间顺序地、并行地或独立地执行。因此，本说明书中描述的方法的执行顺序不对本发明的技术范围构成限制。
[0108] 尽管上面已经通过对本发明的具体实施例的描述对本发明进行了披露，但是，应该理解，上述的所有实施例和示例均是示例性的，而非限制性的。本领域的技术人员可在所附权利要求的精神和范围内设计对本发明的各种修改、改进或者等同物。这些修改、改进或者等同物也应当被认为包括在本发明的保护范围内。
[0109] fiiB
[0110] 1. -种从彩色文档图像中提取特定区域的方法，包括：
[0111] 根据所述彩色文档图像，获得第一边缘图像；
[0112] 利用彩色通道的不均一性，获取二值化图像；
[0113] 合并所述第一边缘图像和所述二值化图像，以得到第二边缘图像；以及
[0114] 根据所述第二边缘图像，确定所述特定区域。
[0115] 2.如附记1所述的方法，其中，所述特定区域包括：图片区域、半色调区域、被线框起来的封闭区域中的至少一个区域。
[0116] 3.如附记1所述的方法，其中利用彩色通道的不均一性，获取二值化图像包括：
[0117] 比较所述彩色文档图像中每一个像素点的R、G、B三通道的差异；
[0118] 根据所述差异是否大于第一差异阈值，确定与该像素点对应的、所述二值化图像中的点的取值。
[0119] 4.如附记1所述的方法，其中合并所述第一边缘图像和所述二值化图像，以得到第二边缘图像包括：如果所述第一边缘图像和所述二值化图像中的对应点中的至少一个是特定像素点，则将所述第二边缘图像中的对应点确定为特定像素点。
[0120] 5.如附记1所述的方法，其中根据所述第二边缘图像，确定所述特定区域包括：
[0121] 对所述第二边缘图像进行连通域分析，以得到多个候选连通域；
[0122] 获得所述多个候选连通域中尺寸大的候选连通域的外接矩形；
[0123] 将与所述外接矩形围绕的区域对应的、所述彩色文档图像中的区域确定为所述特定区域。
[0124] 6.如附记5所述的方法，还包括：
[0125] 提取所述外接矩形内边缘紧邻的、所述彩色文档图像中的边缘连通域；
[0126] 仅将所述边缘连通域中满足预定条件的边缘连通域确定为所述特定区域的一部分。
[0127] 7.如附记6所述的方法，其中所述预定条件包括：所述边缘连通域中的所有像素值的方差高于方差阈值或所述边缘连通域中的所有像素值的均值与所述外接矩形外部的相邻像素的均值之间的差异大于第二差异阈值。
[0128] 8.如附记1所述的方法，其中根据所述第二边缘图像，确定所述特定区域包括：
[0129] 连接所述第二边缘图像中的局部点，以得到第三边缘图像；
[0130] 根据所述第三边缘图像，确定所述特定区域。
[0131] 9.如附记8所述的方法，其中连接所述第二边缘图像中的局部点，以得到第三边缘图像包括：
[0132] 利用连接模板，扫描所述第二边缘图像；
[0133] 如果所述连接模板内的特定像素点的数量超过连接阈值，则将所述连接模板中心对应的像素点确定为所述特定像素点；
[0134] 根据上述确定结果，修改所述第二边缘图像，以得到所述第三边缘图像。
[0135] 10.如附记1所述的方法，还包括：将所述彩色文档图像中的除所述特定区域之外的区域确定为文字区域。
[0136] 11. -种从彩色文档图像中提取特定区域的设备，包括：
[0137] 第一边缘图像获取装置，被配置为：根据所述彩色文档图像，获得第一边缘图像；
[0138] 二值化图像获取装置，被配置为：利用彩色通道的不均一性，获取二值化图像；
[0139] 合并装置，被配置为：合并所述第一边缘图像和所述二值化图像，以得到第二边缘图像；以及
[0140] 区域确定装置，被配置为：根据所述第二边缘图像，确定所述特定区域。
[0141] 12.如附记11所述的设备，其中，所述特定区域包括：图片区域、半色调区域、被线框起来的封闭区域中的至少一个区域。
[0142] 13.如附记11所述的设备，其中所述二值化图像获取装置被进一步配置为：
[0143] 比较所述彩色文档图像中每一个像素点的R、G、B三通道的差异；
[0144] 根据所述差异是否大于第一差异阈值，确定与该像素点对应的、所述二值化图像中的点的取值。
[0145] 14.如附记11所述的设备，其中所述合并装置被进一步配置为：在所述第一边缘图像和所述二值化图像中的对应点有一个是特定像素点的情况下，将所述第二边缘图像中的对应点确定为特定像素点。
[0146] 15.如附记11所述的设备，其中所述区域确定装置包括：
[0147] 连通域分析单元，被配置为：对所述第二边缘图像进行连通域分析，以得到多个候选连通域；
[0148] 外接矩形获取单元，被配置为：获得所述多个候选连通域中尺寸大的候选连通域的外接矩形；
[0149] 区域确定单元，被配置为：将与所述外接矩形围绕的区域对应的、所述彩色文档图像中的区域确定为所述特定区域。
[0150] 16.如附记15所述的设备，所述区域确定装置还包括：
[0151] 边缘连通域提取单元，被配置为：提取所述外接矩形内边缘紧邻的、所述彩色文档图像中的边缘连通域；
[0152] 所述区域确定单元被进一步配置为：仅将所述边缘连通域中满足预定条件的边缘连通域确定为所述特定区域的一部分。
[0153] 17.如附记16所述的设备，其中所述预定条件包括：所述边缘连通域中的所有像素值的方差高于方差阈值或所述边缘连通域中的所有像素值的均值与所述外接矩形外部的相邻像素的均值之间的差异大于第二差异阈值。
[0154] 18.如附记11所述的设备，其中所述区域确定单元还包括：
[0155] 连接单元，被配置为：连接所述第二边缘图像中的局部点，以得到第三边缘图像；
[0156] 所述区域确定单元被进一步配置为：根据所述第三边缘图像，确定所述特定区域。
[0157] 19.如附记18所述的设备，其中所述连接单元被进一步配置为：
[0158] 利用连接模板，扫描所述第二边缘图像；
[0159] 在所述连接模板内的特定像素点的数量超过连接阈值的情况下，将所述连接模板中心对应的像素点确定为所述特定像素点；
[0160] 根据上述确定结果，修改所述第二边缘图像，以得到所述第三边缘图像。
[0161] 20. -种扫描仪，包括如附记11-19所述的设备。
【主权项】
1. 一种从彩色文档图像中提取特定区域的方法，包括：根据所述彩色文档图像，获得第一边缘图像；利用彩色通道的不均一性，获取二值化图像；合并所述第一边缘图像和所述二值化图像，以得到第二边缘图像；以及根据所述第二边缘图像，确定所述特定区域。2. 如权利要求1所述的方法，其中，所述特定区域包括：图片区域、半色调区域、被线框起来的封闭区域中的至少一个区域。3. 如权利要求1所述的方法，其中利用彩色通道的不均一性，获取二值化图像包括：比较所述彩色文档图像中每一个像素点的R、G、B三通道的差异；根据所述差异是否大于第一差异阈值，确定与该像素点对应的、所述二值化图像中的点的取值。4. 如权利要求1所述的方法，其中合并所述第一边缘图像和所述二值化图像，以得到第二边缘图像包括：如果所述第一边缘图像和所述二值化图像中的对应点中的至少一个是特定像素点，则将所述第二边缘图像中的对应点确定为特定像素点。5. 如权利要求1所述的方法，其中根据所述第二边缘图像，确定所述特定区域包括：对所述第二边缘图像进行连通域分析，以得到多个候选连通域；获得所述多个候选连通域中尺寸大的候选连通域的外接矩形；将与所述外接矩形围绕的区域对应的、所述彩色文档图像中的区域确定为所述特定区域。6. 如权利要求5所述的方法，还包括：提取所述外接矩形内边缘紧邻的、所述彩色文档图像中的边缘连通域；仅将所述边缘连通域中满足预定条件的边缘连通域确定为所述特定区域的一部分。7. 如权利要求6所述的方法，其中所述预定条件包括：所述边缘连通域中的所有像素值的方差高于方差阈值或所述边缘连通域中的所有像素值的均值与所述外接矩形外部的相邻像素的均值之间的差异大于第二差异阈值。8. 如权利要求1所述的方法，其中根据所述第二边缘图像，确定所述特定区域包括：连接所述第二边缘图像中的局部点，以得到第三边缘图像；根据所述第三边缘图像，确定所述特定区域。9. 如权利要求8所述的方法，其中连接所述第二边缘图像中的局部点，以得到第三边缘图像包括：利用连接模板，扫描所述第二边缘图像；如果所述连接模板内的特定像素点的数量超过连接阈值，则将所述连接模板中心对应的像素点确定为所述特定像素点；根据上述确定结果，修改所述第二边缘图像，以得到所述第三边缘图像。10. -种从彩色文档图像中提取特定区域的设备，包括：第一边缘图像获取装置，被配置为：根据所述彩色文档图像，获得第一边缘图像；二值化装置，被配置为：利用彩色通道的不均一性，获取二值化图像；合并装置，被配置为：合并所述第一边缘图像和所述二值化图像，以得到第二边缘图像；以及区域确定装置，被配置为：根据所述第二边缘图像，确定所述特定区域。
【文档编号】G06K9/00GK106033528SQ201510101426
【公开日】2016年10月19日
【申请日】2015年3月9日
【发明人】刘威, 范伟, 孙俊
【申请人】富士通株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘威;范伟;孙俊;
技术所有人：富士通株式会社;
我是此专利的发明人

上一篇：影像处理方法以及电子装置的制造方法
上一篇：一种基于梯度方向特征匹配算法定位条形码区域的方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。