文本提取方法和装置的制造方法_2

文档序号:8412845阅读:来源:国知局
br>[0042] 接下来,在步骤S220中,要确定用户感兴趣的文本的大小。
[0043] 将参考图3具体说明书确定用户感兴趣的文本的大小的过程。图3示出了确定图 像中的用户感兴趣的文本的大小的示例性流程图。
[0044] 在本发明中,采用多个级联窗口来自适应不同文本的大小,基于级联窗口来估计 文本大小。
[0045] 在步骤S310中,针对用户指定的图像上感兴趣的文本所在的区域,初始化多个尺 寸递增的级联窗口。例如,设置尺寸分别为80*80、160*160、240*240、320*320的多个级联 窗口。为了加速处理,优选地,可以将所有的窗口归一化到固定大小。例如,可以将所有的 窗口都归一化为80*80的尺寸。
[0046] 在步骤S320中,首先在第一级窗口中检测连通部件。如果当前窗口条件下没有检 测到文本,则将窗口扩大为下一级窗口来进行检测。
[0047] 在本发明中,优选地,可以使用Canny边缘检测来生成连通部件。具体地,Canny边 缘检测的高阈值和低阈值可以通过下面的方程1计算得到。
【主权项】
1. 一种文本提取方法,包括: 获取用户对图像上感兴趣的文本的指定; 确定所述文本的大小; 确定所述文本的排列方向; 估计所述文本的所述排列方向的偏移角度; 根据所述文本的大小、所述排列方向和所述偏移角度来确定包含所述文本的图像片 段; 对所述图像片段中的种子连通部件进行种子连通部件生长以提取所述用户感兴趣的 所述文本。
2. 根据权利要求1所述的文本提取方法,其中,所述确定所述文本的大小的步骤包括: 针对所述用户指定的所述图像上感兴趣的文本所在的区域,初始化多个尺寸递增的级 联窗口; 在所述窗口中检测连通部件; 在所述窗口中初始化文本检测子; 确定与所述文本检测子存在重叠的连通部件; 确定所述连通部件的宽度和高度; 将所述连通部件的所述宽度和所述高度与预定阈值进行比较,如果所述连通部件的所 述宽度或所述高度小于所述预定阈值,则放大所述文本检测子,并重复执行以上所述确定 与所述文本检测子重叠的连通部件的步骤和所述确定所述连通部件的宽度和高度的步骤, 直到确定所述连通部件的所述宽度和所述高度都大于所述预定阈值; 确定所述文本检测子与所述窗口的边界是否相临近,如果所述文本检测子与所述窗口 的边界相邻近,则将所述窗口放大为所述级联窗口中的下一级窗口,在该下一级窗口中检 测连通部件,并重复执行以上从在所述窗口中初始化文本检测子的步骤开始至确定所述文 本检测子与所述窗口的边界是否相邻近的步骤; 如果确定所述文本检测子与所述窗口的边界不邻近,将此时所确定的连通部件确定为 种子连通部件,将所述种子连通部件的宽度和高度中的较小者确定为所述文本的大小。
3. 根据权利要求2所述的文本提取方法,其中所述文本检测子被初始化为三个,包括 水平方向检测子、坚直方向检测子和正方形检测子,其中,所述确定与所述文本检测子存在 重叠的连通部件的步骤之后还包括: 根据所述文本的排列方向将所述文本检测子确定为水平方向检测子、坚直方向检测子 和正方形检测子中的一个。
4. 根据权利要求3所述的文本提取方法,其中确定所述文本的排列方向的步骤包括: 在所述文本检测子中选择两个连通部件:第一连通部件和第二连通部件; 如果所述第一连通部件和所述第二连通部件满足大小近似标准和水平方向重叠标准, 则所述文本的排列方向是水平型,并将所述文本检测子确定为水平方向检测子; 如果所述第一连通部件和所述第二连通部件满足大小近似标准和坚直方向重叠标准, 则所述文本的排列方向是坚直型,并将所述文本检测子确定为坚直方向检测子; 如果不能确定所述文本的排列方向,则将所述文本检测子确定为正方形检测子, 其中,所述大小近似标准是所述第一连通部件和所述第二连通部件的大小近似相等, 所述水平方向重叠标准是所述第一连通部件和所述第二连通部件在坚直方向上偏移的距 离小于预定偏移阈值,所述坚直方向重叠标准是所述第一连通部件和所述第二连通部件在 水平方向上偏移的距离小于预定偏移阈值。
5. 根据权利要求4所述的文本提取方法,其中所述水平方向重叠标准通过以下方式来 判断:所述第一连通部件的下边沿和所述第二连通部件的上边沿之间的距离与所述第一连 通部件的上边沿和所述第二连通部件的下边沿之间的距离中的较小者除以所述第一连通 部件的高度与所述第二连通部件的高度之和是否大于预定比例; 所述坚直方向重叠标准通过以下方式来判断:所述第一连通部件的左边沿和所述第二 连通部件的右边沿之间的距离与所述第一连通部件的右边沿和所述第二连通部件的左边 沿之间的距离中的较小者除以所述第一连通部件的宽度与所述第二连通部件的宽度之和 是否大于预定比例。
6. 根据权利要求5所述的文本提取方法,所述估计所述文本的所述排列方向的偏移角 度的步骤还包括:将与所述种子连通部件相邻且满足大小近似标准和水平方向重叠标准或 满足大小近似标准和坚直方向重叠标准的连通部件加入到所述种子连通部件来形成新的 种子连通部件,通过所述新的种子连通部件来确定所述文本的所述排列方向的偏移角度。
7. 根据权利要求6所述的文本提取方法,其中,所述估计所述文本的所述排列方向的 偏移角度的步骤包括: 将所选定的种子连通部件的中心作为坐标系的中心来建立世界坐标; 每隔预定角度α旋转所述世界坐标的坐标轴; θ=β 按照公式argmin ^ 十算投影能量值,将使得投影能量值最小的 θ=-β,θ+=οε 角度Θ确定为所述文本的所述排列方向的偏移角度,其中β表示最大偏移角度,# (νρ)表 示所述文本的边缘像素点投影到所述坐标轴上某一点的像素的个数;d表示该点的投影距 离。
8. 根据权利要求7所述的文本提取方法,其中,所述根据所述文本的大小、所述排列方 向和所述偏移角度来确定包含所述文本的图像片段的步骤包括: 根据所述文本的排列方向的偏移角度,通过所述种子连通部件的中心确定一条直线; 将所述直线与所述图像的边界的交点按照所述文本的大小向外进行扩展,来截取所述 图像片段。
9. 根据权利要求8所述的文本提取方法,其中,所述对所述图像片段中的种子连通部 件进行种子连通部件生长以提取所述文本的步骤包括: 对截取的所述图像片段按比例进行缩小,所述比例为所述文本的大小除以预定归一化 文本大小; 通过对缩小后的图像片段进行二值化得到全部的候选连通部件; 基于所述候选连通部件与所述种子连通部件的位置关系,对所述种子连通部件进行种 子连通部件生长,以提取所述文本。
10. -种文本提取装置,包括: 文本指定单元,所述文本指定单元被配置为获取用户对图像上感兴趣的文本的指定; 文本大小确定单元,所述文本大小确定单元被配置为确定所述文本的大小; 文本排列方向确定单元,所述文本排列方向确定单元被配置为确定所述文本的排列方 向; 排列方向偏移角度估计单元,所述排列方向偏移角度估计单元被配置为估计所述文本 的所述排列方向的偏移角度; 图像片段确定单元,所述图像片段确定单元被配置为根据所述文本的大小、所述排列 方向和所述偏移角度来确定包含所述文本的图像片段; 文本提取单元,所述文本提取单元被配置为对所述图像片段中的种子连通部件进行种 子连通部件生长以提取所述用户感兴趣的所述文本。
【专利摘要】本发明涉及一种文本提取方法和装置。一种文本提取方法,包括:获取用户对图像上感兴趣的文本的指定;确定文本的大小;确定文本的排列方向;估计文本的排列方向的偏移角度;根据文本的大小、排列方向和偏移角度来确定包含文本的图像片段;对图像片段中的种子连通部件进行种子连通部件生长以提取用户感兴趣的文本。
【IPC分类】G06K9-00, G06K9-46
【公开号】CN104732188
【申请号】CN201310705512
【发明人】汪留安, 胜山裕, 孙俊, 何源, 范伟, 堀田悦伸
【申请人】富士通株式会社
【公开日】2015年6月24日
【申请日】2013年12月19日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1