一种图像中文本区域的检测方法

文档序号:10613269阅读:583来源:国知局
一种图像中文本区域的检测方法
【专利摘要】本发明公开一种图像中文本区域的检测方法,包括:将图像划分为多个子图像,所述多个子图像之间无重叠区域且所述多个子图像构成所述图像;基于预设的字符识别规则,确定各子图像的文本置信度;基于各子图像的文本置信度及预设的文本置信度门限,确定目标连通域,所述目标连通域用于确定所述图像中包含的各文本区域;基于预设的连通域确定规则,确定所述图像包含的各连通域;基于所述图像包含的各连通域以及所述目标连通域,确定所述图像中包含的各文本区域。相比现有技术,本发明提出的图像中文本区域的检测方法,通过划分图像为多个子图像,并确定各子图像的文本置信度来定位出背景相对复杂的图像中的文本区域,适用于具有复杂背景的图像。
【专利说明】
一种图像中文本区域的检测方法
技术领域
[0001] 本发明涉及图像处理技术领域,具体涉及一种图像中文本区域的检测方法。
【背景技术】
[0002] 目前常用的图像中文本区域的检测方法有基于连通域的方法、基于边缘特征的方 法和基于纹理特征的方法。各方法的具体说明如下:
[0003] 基于连通域的方法,假设同一区域的字符具有相似的颜色和亮度,并且与背景区 域的颜色存在较大差异的基础上,采用自底向上的方法从图像中提取连通区域,然后利用 几何约束构造启发式规则进行连通域分析,将子区域合并得到最终的文本区域。
[0004] 基于边缘特征的方法,是利用文本区域具有丰富的边缘信息这一特点进行文本区 域检测,首先采用某种边缘检测算子从原图像中检测出边缘,然后通过形态学方法将边缘 连接成本块,过滤不符合规则的非文本区域,得到最终的文本区域。
[0005] 基于纹理的方法,把文本区域看作是一种可与背景区分开的特殊的纹理,通常采 用Gabor变换、小波变换和傅里叶变换等方法检测图像中文本区域的纹理特征,并利用SVM 从候选的文本区域中验证真实的文本区域,对于背景复杂的图像取得了较好的效果。
[0006] 但是,对于具有复杂背景的图像,因为复杂背景对图像中文本区域产生的干扰大, 上述现有的图像中文本区域的检测方法均不适用。

【发明内容】

[0007] 鉴于上述问题,本发明提出了克服上述问题或者至少部分地解决上述问题的一种 图像中文本区域的检测方法。
[0008] 为此目的,本发明提出一种图像中文本区域的检测方法,包括:
[0009]将图像划分为多个子图像,所述多个子图像之间无重叠区域且所述多个子图像构 成所述图像;
[0010] 基于预设的字符识别规则,确定各子图像的文本置信度;
[0011] 基于各子图像的文本置信度及预设的文本置信度门限,确定目标连通域,所述目 标连通域用于确定所述图像中包含的各文本区域;
[0012] 基于预设的连通域确定规则,确定所述图像包含的各连通域;
[0013] 基于所述图像包含的各连通域以及所述目标连通域,确定所述图像中包含的各文 本区域。
[0014] 可选的,所述将图像划分为多个子图像,包括:
[0015] 将图像划分为尺寸一致的多个子图像。
[0016] 可选的,所述基于预设的字符识别规则,确定各子图像的文本置信度,包括:
[0017] 基于预设的字符识别规则,识别各子图像中的字符,并确定各子图像中各字符的 置信度;
[0018] 基于所述各子图像中各字符的置信度,确定各子图像的文本置信度。
[0019] 可选的,所述基于所述各子图像中各字符的置信度,确定各子图像的文本置信度, 包括:
[0020] 基于所述各子图像中各字符的置信度,通过文本置信度计算式,确定各子图像的 文本置信度;所述文本置信度计算式为:
[0021]
[0022] 其中,C为文本置信度,η为字符个数,ci为第i个字符的置信度。
[0023] 可选的,所述基于预设的字符识别规则,识别各子图像中的字符,并确定各子图像 中各字符的置信度,包括:
[0024] 基于光学字符识别0CR,识别各子图像中的字符,并确定各子图像中各字符的置信 度。
[0025] 可选的,所述基于各子图像的文本置信度及预设的文本置信度门限,确定目标连 通域,包括:
[0026] 基于预设的连通域提取规则,提取各目标子图像的连通域;所述目标子图像为文 本置信度大于预设的文本置信度门限的子图像;
[0027] 将所述各目标子图像的连通域进行连通域合并,得到目标连通域。
[0028] 可选的,基于所述图像包含的各连通域以及所述目标连通域,确定所述图像中包 含的各文本区域,包括:
[0029] 将所述图像包含的各连通域与所述目标连通域的重叠区域确定为所述图像中包 含的各文本区域。
[0030] 相比于现有技术,本发明提出的图像中文本区域的检测方法,通过划分图像为多 个子图像,并确定各子图像的文本置信度来定位出背景相对复杂的图像中的文本区域,从 而得到图像中相对重要的信息,便于后续的处理和应用,适用于具有复杂背景的图像。
【附图说明】
[0031] 图1为本发明实施例提供的一种图像中文本区域的检测方法流程图。
【具体实施方式】
[0032]为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例 中的附图,对本发明实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本发明 一部分实施例,而不是全部的实施例。
[0033] 如图1所示,本实施例公开一种图像中文本区域的检测方法,可包括以下步骤101 ~105:
[0034] 101、将图像划分为多个子图像,所述多个子图像之间无重叠区域且所述多个子图 像构成所述图像。
[0035]本实施例中,步骤101中,可将图像划分为尺寸一致的多个子图像。例如每个子图 像均为9X9。
[0036] 102、基于预设的字符识别规则,确定各子图像的文本置信度。
[0037] 本实施例中,可基于应用场景来选择字符识别规则所使用的字符识别集,有利于 提高识别效率。例如,对于金融领域的收费单图像,可选择字符识别规则所使用的字符识别 集为数字集合;对于医学领域的化验单图像,可选择字符识别规则所使用的字符识别集为 包含"血"、"胞"、"医"等化验常用字符所组成的集合。
[0038] 由于字符识别规则所使用的字符识别集基于应用场景来选择,因此,可以针对图 像所含不同的字符而对图像进行分类。
[0039] 本实施例中,步骤102具体包括图1中未示出的步骤1021和1022。
[0040] 1021、基于预设的字符识别规则,识别各子图像中的字符,并确定各子图像中各字 符的置信度。
[0041] 1022、基于所述各子图像中各字符的置信度,确定各子图像的文本置信度。
[0042]本实施例中,步骤1021中预设的字符识别规则为光学字符识别(Optical Character Recognition,0CR)〇
[0043] 本实施例中,步骤1021中可通过文本置信度计算式,确定各子图像的文本置信度; 所述文本置信度计算式为:
[0044]
[0045]兵干,U73 乂不直1目皮,η为字符个数,Ci为第i个字符的置信度。
[0046] 本实施例中,步骤1021中,当基于OCR识别各子图像中的字符后,OCR会提供各子图 像中各字符的置信度。
[0047] 103、基于各子图像的文本置信度及预设的文本置信度门限,确定目标连通域,所 述目标连通域用于确定所述图像中包含的各文本区域。
[0048] 本实施例中,步骤103具体包括图1中未示出的步骤1031和1032。
[0049] 1031、基于预设的连通域提取规则,提取各目标子图像的连通域;所述目标子图像 为文本置信度大于预设的文本置信度门限的子图像。
[0050] 1032、将所述各目标子图像的连通域进行连通域合并,得到目标连通域。
[0051] 104、基于预设的连通域确定规则,确定所述图像包含的各连通域。
[0052] 105、基于所述图像包含的各连通域以及所述目标连通域,确定所述图像中包含的 各文本区域。
[0053]本实施例中,步骤105具体为:将所述图像包含的各连通域与所述目标连通域的重 叠区域确定为所述图像中包含的各文本区域。
[0054] 可见,本实施例公开的图像中文本区域的检测方法,通过划分图像为多个子图像, 并确定各子图像的文本置信度来定位出背景相对复杂的图像中的文本区域,从而得到图像 中相对重要的信息,便于后续的处理和应用,适用于具有复杂背景的图像。
[0055] 本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包 括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之 内并且形成不同的实施例。
[0056] 虽然结合附图描述了本发明的实施方式,但是本领域技术人员可以在不脱离本发 明的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求 所限定的范围之内。
【主权项】
1. 一种图像中文本区域的检测方法,其特征在于,包括: 将图像划分为多个子图像,所述多个子图像之间无重叠区域且所述多个子图像构成所 述图像; 基于预设的字符识别规则,确定各子图像的文本置信度; 基于各子图像的文本置信度及预设的文本置信度口限,确定目标连通域,所述目标连 通域用于确定所述图像中包含的各文本区域; 基于预设的连通域确定规则,确定所述图像包含的各连通域; 基于所述图像包含的各连通域W及所述目标连通域,确定所述图像中包含的各文本区 域。2. 根据权利要求1所述的方法,其特征在于,所述将图像划分为多个子图像,包括: 将图像划分为尺寸一致的多个子图像。3. 根据权利要求1所述的方法,其特征在于,所述基于预设的字符识别规则,确定各子 图像的文本置信度,包括: 基于预设的字符识别规则,识别各子图像中的字符,并确定各子图像中各字符的置信 度; 基于所述各子图像中各字符的置信度,确定各子图像的文本置信度。4. 根据权利要求3所述的方法,其特征在于,所述基于所述各子图像中各字符的置信 度,确定各子图像的文本置信度,包括: 基于所述各子图像中各字符的置信度,通过文本置信度计算式,确定各子图像的文本 置信度;所述文本置信度计算式为:其中,C为文本置信度,η为字符个数,Cl为第i个字符的置信度。5. 根据权利要求3所述的方法,其特征在于,所述基于预设的字符识别规则,识别各子 图像中的字符,并确定各子图像中各字符的置信度,包括: 基于光学字符识别OCR,识别各子图像中的字符,并确定各子图像中各字符的置信度。6. 根据权利要求1所述的方法,其特征在于,所述基于各子图像的文本置信度及预设的 文本置信度口限,确定目标连通域,包括: 基于预设的连通域提取规则,提取各目标子图像的连通域;所述目标子图像为文本置 信度大于预设的文本置信度口限的子图像; 将所述各目标子图像的连通域进行连通域合并,得到目标连通域。7. 根据权利要求1所述的方法,其特征在于,所述基于所述图像包含的各连通域W及所 述目标连通域,确定所述图像中包含的各文本区域,包括: 将所述图像包含的各连通域与所述目标连通域的重叠区域确定为所述图像中包含的 各文本区域。
【文档编号】G06K9/00GK105975955SQ201610366284
【公开日】2016年9月28日
【申请日】2016年5月27日
【发明人】刘立, 刘艳洋, 吴诗展
【申请人】北京好运到信息科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1